CN101411060B - 用于多声道音频信号的响度修改的方法和设备 - Google Patents

用于多声道音频信号的响度修改的方法和设备 Download PDF

Info

Publication number
CN101411060B
CN101411060B CN2007800110565A CN200780011056A CN101411060B CN 101411060 B CN101411060 B CN 101411060B CN 2007800110565 A CN2007800110565 A CN 2007800110565A CN 200780011056 A CN200780011056 A CN 200780011056A CN 101411060 B CN101411060 B CN 101411060B
Authority
CN
China
Prior art keywords
sound channel
loudness
perceived loudness
total
scaling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007800110565A
Other languages
English (en)
Other versions
CN101411060A (zh
Inventor
阿兰·杰弗里·西费尔特
迈克尔·约翰·史密瑟斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN101411060A publication Critical patent/CN101411060A/zh
Application granted granted Critical
Publication of CN101411060B publication Critical patent/CN101411060B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/02Manually-operated control
    • H03G3/04Manually-operated control in untuned amplifiers
    • H03G3/10Manually-operated control in untuned amplifiers having semiconductor devices
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/12Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices
    • H03G9/18Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers having semiconductor devices for tone control and volume expansion or compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

通过根据计算精确度和总感知响度缩放比例sm的期望精确度、以基本等于缩放所有声道的总感知响度的期望量sm的数量来缩放每个单独声道的感知响度Lc,从而以期望量sm来缩放多声道音频信号的总感知响度Lm,其中感知响度是信号功率P的非线性函数。每个单独声道的感知响度通过改变每个单独声道的增益来缩放,其中增益为声道功率的缩放比例。另外,可选地,可以修改被施加到每一声道的响度缩放比例,以减小实际的总响度缩放比例和期望的总响度缩放比例量之差。

Description

用于多声道音频信号的响度修改的方法和设备
技术领域
本发明涉及音频信号处理,具体涉及调整多声道音频信号的总感知响度,同时近似保持在所有声道之间的相对感知响度以保持感知的空间平衡。本发明不仅包括方法,也包括相对应的计算机程序和装置。
交叉参考
对于更好地理解本发明的各方面有用的、用于测量和调整感知(心理声学响度)的某些技术在以下申请和文献中作了描述:于2004年12月23日公布的Alan Jeffrey Seefeldt等人的、名称为“Method,Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal”的国际专利申请WO 2004/111994 A2;以及由Alan Seefeldt等人于2004年10月28日在Audio Engineering Society Convention Paper 6263上发表的“A New Objective Measure of Perceived Loudness”。该WO 2004/111994 A2申请和所述文献的全部内容通过引用结合于此。
对于更好地理解本发明的各方面有用的、用于测量和调整感知(心理声学响度)的某些其它技术在以下申请中作了描述:于2006年5月4日公布的Alan Jeffrey Seefeldt的国际专利申请WO 2006/047600,其名称为“Calculating and Adjusting the Perceived Loudness and/or thePerceived Spectral Balance of an Audio Signal”。该WO 2006/047600A1申请的全部内容通过引用结合于此。
背景技术
有很多方法用于客观地测量音频信号的感知响度。这些方法的例子包括A、B和C加权功率测量以及响度的心理声学模型,如“Acoustics-Method for calculating loudness level”,ISO 532(1975)以及所述PCT/US2005/038579申请。通过获得输入音频信号,应用已知的滤波器,该滤波器加重感知上较敏感的频率同时降低感知上较不敏感的频率,然后在预定时长上将滤波信号的功率平均,以执行加权功率测量。心理声学方法通常更复杂,且目的在于更好地模拟人耳的工作方式。它们将信号分为仿真频率响应及耳朵敏感度的若干频带,然后操作且整合这些频带,同时考虑心理声学现象如频率和时间掩蔽(temporal masking),以及随信号强度变化的响度的非线性感知。所有方法的目的都是得到接近符合该音频信号主观印象的数值测量。
对人耳听觉系统的非线性精确建模构成了响度的感知模型的基础。在二十世纪三十年代,Fletcher和Munson发现当声级增加时敏感度的相对变化减小。在二十世纪五十年代,Zwicher和Stevens在Fletcher和Munson的成果上构建并发展出更精确和现实的模型。由Zwicker公布的图1显示了1kHz音调和均匀的激发噪声(UEN,在所有临界频带内具有相等功率的噪声)二者的响度增长。对于低于通常称作“听觉阈”的信号级来说,没有响度被感知到。在该阈之上,被感知到的响度快速增长,直到响度随着信号级线性增长的渐近线。图1显示了1kHz音调的非线性特性,图2中ISO 226的等响度线显示了相同特性,但是为正弦曲线音调的频率的函数。该以10方(phon)为增量的等响度线显示了在被人耳感知为相同响度的频率上的声压级。最低线代表作为频率的函数的“听觉阈”。较低级的等响度线较紧密地压缩在一起,从而与较高级相比,相对较小的声压级变化引起感知响度的较显著变化。
人耳听觉系统的非线性及频率变化特性对于被感知的音频信号的音质及成像有直接影响。以特定声压级呈现的复杂宽频带音频信号(如音乐)被感知为具有特定频谱平衡或音质。如果相同的音频信号以不同的声压级呈现且如图2所示,感知响度的增长对于不同的频率是不同的,则该音频信号被感知的频谱平衡或音质将不同。复杂的宽频带多声道音频信号(被呈现在多个扬声器上)也被感知为具有特定的空间平衡。空间平衡指的是混音中声音成分的位置印象以及由两个或更多个扬声器之间音频信号的相对声级引起的混音的全面扩散。如果相同的多声道音频信号以不同的总声压级呈现,则感知响度的非线性增长以及频率上的响度的不同增长导致被感知的该多声道音频信号的空间平衡的变化,当声道间的声级存在重大差异时尤为明显。相对较响的声道而言,较安静的声道受到的影响不同,例如,其可导致在减小总声级时安静的声道降到听觉阈以下并且无法被听见。
在很多情况下,想要调整或缩放音频信号的感知响度。最明显的例子是出现在很多设备上的传统音量或声级控制,该装置包括消费类音乐播放器、家庭影院接收器/放大器和专业的混音控制台。该简单的音量或声级控制增益在不考虑人耳听觉系统的情况下调整音频信号且导致所感知的音质和空间平衡的变化。
最近,Seefeldt等人(所述WO 2004/111994 A2申请)和Seefeldt(所述PCT/US2005/038579申请)已公开了多个发明,其某些方面能够精确地缩放单声道音频信号的感知响度,且能够根据其实现是宽频带或是多频带来保持所感知的音质。依据这些发明的各方面,可实现期望的响度缩放比例或目标响度,其本质上是藉由转化响度测量模型并计算可施加到音频信号的宽频带增益或多频带增益。
尽管这些方法解决了调整单声道音频信号的响度问题,但如何调整多声道音频信号的响度的问题仍然存在。
多声道响度通常被计算为每一声道内功率之和的函数。对于如上述的A、B和C加权测量的加权功率方法,多声道响度是每一声道内加权功率的简单求和。一般对于响度的心理声学模型而言,首先针对每一声道计算临界频带功率频谱或激发频谱,然后在所有声道上对激发频谱求和以创建单一激发频谱。每一激发频带通过非线性,如图1,以创建每频带的响度测量,其被称为特定响度,并且在频率上对该特定响度求和以计算单一宽频带响度值。对于加权功率和心理声学方法二者而言,对每一声道内的功率求和函数可包括额外的每声道加权,以考虑头部相关转移函数(HRTF)影响。
因为可相对简单地计算出多声道信号的响度,因此可能计算出单一增益,当该单一增益被施加到所有声道时,引起响度的总的期望的变化。然而,该单一增益可能对该多声道呈现的其它属性具有非期望的影响。如果在该多声道呈现的声道之间的相对信号声级中存在差异,并且如果所有声道通过相同的增益缩放,则相对于较响的声道,较安静声道的响度具有较大的感知变化。这可引起所感知的空间平衡的变化,当一些声道将到听觉阈以下时是最差的。例如,在电影的很多5.1音频混音中,前面声道包含的信号级比环绕声道的高得多。特别是中央声道一般被用于重现对话。然而,较低声级的环绕声道可包含产生混音中扩散感觉的信号。例如,较低声级的环绕声道可包含对话的回响部分以模拟某人在大房间内说话的效果。因为通过对所有声道施加相同的增益而降低了信号的响度,因此环绕声道的响度比前面声道的响度降低的更快,最后降到听觉阈以下。该结果导致期望的扩散空间平衡的大幅崩溃。
依据本发明的各方面,多声道呈现的总感知响度的期望缩放比例可达到期望的精确度,同时将声道间的相对感知响度保持于期望的精确度以保持所感知的空间平衡或音质。
发明内容
本发明提供一种以期望量Sm缩放多声道音频信号的总感知响度Lm的方法,其中感知响度是信号功率P的非线性函数,其通过根据计算精确度及该总感知响度缩放比例Sm的期望精确度以基本等于缩放所有声道的总感知响度的期望量Sm的数量来缩放每个单独声道的感知响度。通过改变每个单独声道的增益,可以缩放每个单独声道的感知响度,其中增益为声道功率的缩放比例。
另外,可选地,施加到每一声道的响度缩放比例被修改,以便减小实际的总响度缩放比例和期望的总响度缩放比例量之差。
通过对每一声道的增益施加共同的乘数或通过对每一声道的缩放比例增加共同的缩放比例偏移量,可修改施加到每一声道的响度缩放比例。
每一声道的感知响度和总感知响度都可在多个频带的每一频带内被测量,且每一声道的振幅在该频带内被调整。这些频带可以是临界频带。可替选地,每一声道的感知响度和总感知响度都可在单一宽频频带内被测量。
在另一方面,本发明可通过适于执行上述方法中的任一方法的装置实现。
在又一方面,本发明可通过计算机程序实现,该计算机程序储存在计算机可读介质上,用于使计算机执行上述方法中的任一方法。
本发明还提供了一种以期望量sm来缩放多声道音频信号的总感知响度Lm的设备,其中所述总感知响度Lm是每声道信号功率Pc之和的非线性函数,该设备包括:用于根据以所述期望量sm进行总感知响度缩放的期望精确度,以等于缩放所述总感知响度的期望量sm的数量来缩放每个单独声道的感知响度Lc的缩放装置,其中每个单独声道的感知响度是单独声道的功率Pc的非线性函数。
附图说明
图1显示对于1kHz音调和均匀激发噪声(UEN)二者的响度的非线性增长;
图2显示ISO 226的等响度线。横坐标是以赫兹为单位的频率(以10为底的对数),纵坐标是以分贝为单位的声压级;
图3显示用于计算针对心理声学响度模型的激发信号的一组临界带通滤波器响应;
图4a-f描述了从修改多声道音频信号的特定响度中获得的特定响度谱和增益。
具体实施方式
一般而言,响度L的度量可描述为信号功率P的函数F。信号功率P是音频信号的功率度量,这可以是A、B或C加权功率或多频带激发频谱。例如,见ANSI S1.42-2001(R2006),用于听觉测量的加权网络的美国国家标准设计响应所示。函数F是非线性的,设计用来近似响度增长的变化。该函数可以象图1所示应用于单一宽频带功率度量的单一UEN函数那么简单,或者象响度的心理声学模型那么复杂,其中激发频谱通过不同的每频带非线性被转换为特定响度频谱,然后转换为单一响度值(如PCT/US2005/038579申请中所示)。应注意,尽管传统的加权功率响度度量(如A加权功率)尝试考虑人耳听觉系统的频变敏感度,但它们没有考虑声级敏感度的变化。因此使传统的加权功率量经历非线性(如上所描述的)是有用的。
L=F{P}                                     (1)
假定该响度函数是可逆的,则可计算出信号功率P的增益缩放比例g,从而该增益变化产生感知响度的特定期望缩放比例s。
s.L=F{g.P}                                 (2a)
g = F - 1 { s . L } P - - - ( 2 b )
因此,增益g是功率P的缩放比例,而s是响度L的缩放比例。
如果函数F是线性的,则方程式2a将简化成sL=gF{P}=gL,从而产生与信号功率P无关的平凡解g=s。然而,利用非线性函数F,一般而言,增益g是信号功率P的函数,如方程式2b所示。换句话说,不同的信号功率P对于相同的响度缩放比例s需要不同的增益g。
多声道音频信号的响度的总(所有声道)度量Lm实际上可被近似为该多声道音频信号内每一声道的每声道功率Pc之和的函数。声道总数为C。
L m = F { Σ c = 1 C P c } - - - ( 3 )
需注意每一声道功率之和可被加权,以考虑头部相关转移函数(HRTF)影响。也就是说,来自不同空间方向的信号可能具有稍微不同的相对感知响度。如果已知或假定收听者相对于重现该多个声道的扬声器的位置,则可建立到达收听者耳朵的信号模型,该模型为各个声道信号的函数(一般而言,是该声道信号的经滤波和求和的型式)。然后可从人耳信号计算出响度。然而,实际上对于大多数收听环境而言,执行声道信号功率和都适用。
现在再次假定响度函数是可逆的,可计算出施加于所有声道的单一增益gm,使得结果为总感知响度的期望缩放比例sm
s m . L m = F { g m Σ c = 1 C P c } - - - ( 4 a )
g m = F - 1 { s m . L m } Σ c = 1 C P c - - - ( 4 b )
然而,施加相同的增益缩放比例gm到所有声道可能非期望地影响被修改音频的空间平衡。特别是,该增益gm的计算将最受具有最大功率量的声道的影响。如果其他声道具有显著较小的功率,则与较高声级的声道相比,该增益gm可导致在这些较低声级的声道内的感知变化显著不同,这是由于人类响度感知的非线性引起的。如果缩放比例sm对应于响度的衰减,则太多衰减可能被施加到这些较低声级的声道。因此,这些低声级声道对混音的空间平衡的相对贡献将变小,且最差的情况是这些声道将变得完全听不见。
本发明解决了保持多声道音频信号的空间平衡问题,同时对其总响度给出了期望的改变。精确测量及表征多声道音频信号的空间平衡是非常复杂的。各声道的频谱部分可感知地融合成位于扬声器(声道通过它播放)之间的虚拟源,同时声道的其它部分可组合以形成对环绕收听者的扩散声场的感知。测量这些不同成分相对于其它成分的感知响度不是一个已被深刻理解的问题,因为其涉及某些音频信号成分部分掩蔽其它成分的复杂现象。掩蔽度是每个源的声级以及每个源的空间位置和扩散的函数。即使能够精确测量空间平衡的所有这些方面,则总响度被缩放时,尝试保持其相对度量将可能涉及复杂的非线性优化过程。
然而,考虑二声道信号的简单例子,其中每一声道包含不与另一声道内的信号在频谱上重迭的信号。然后,每一声道被感知为不同的源,其中任一源都不掩蔽另一源。在该简单情形下,很清楚,通过以相同的量缩放每个单独声道的响度(而不是每一声道的增益)可实现保持两个成分的相对响度。本发明人已发现将此解决方案一般应用到多声道信号中可帮助保持空间平衡,而不会引入任何不良的副作用。
本发明各方面的基本实现中,每个单独声道的感知响度Lc(孤立地)可以根据计算精确度和总感知响度缩放比例的期望精确度以缩放量sc缩放,该缩放量sc基本等于所有声道的总感知响度的期望缩放量sm。该解决方案减轻了上述由于较高声级声道的影响使较低声级声道降到听觉阈以下的问题。每个单独声道的感知响度Lc的该缩放可通过控制每个声道的单独增益gc来实现(此增益gc是该声道功率Pc的缩放比例)。注意,如下面将进一步讨论的,该单独声道增益gc一般不同于上述与方程式4a和4b关联的增益gm,例如通过参考方程式5a和5b可更好地理解这一点:
sm.Lc=F{gc.Pc}               针对C个声道的每个声道(5a)
或者
Figure GSB00000331974900071
其中sc=sm
尽管本发明的该基本实现基本上保持空间平衡且在许多应用中是有用的,但由于函数F的非线性,该实现方式不能确保实现多声道感知响度Lm的期望总缩放比例sm。由于函数F是非线性的,因此由方程式4b给出的增益gm一般不等于由方程式5b给出的增益gc。因此,将gm施加到所有声道后的所有声道的响度一般不等于将该增益gc施加到每一相应声道后的所有声道的响度:
F { Σ c = 1 C g m P c } ≠ F { Σ c = 1 C g c P c } - - - ( 6 a )
以方程式4a替换方程式6a的左手侧且以方程式5b替换gc产生等价的表达式:
s m . L m ≠ F { Σ c = 1 C F - 1 { s m . L c } } - - - ( 6 b )
因此,在以下两者之间可能存在差异或误差:(1)以期望的总感知响度缩放因子sm缩放每个单独声道的感知响度Lc所得到的所有声道的感知响度(例如由方程式6b右边部分所表示的);以及(2)直接以总响度缩放因子sm缩放所得到的所有声道的感知响度(例如由方程式6b左边部分表示的)。可将此误差表示为缩放比例差量Δsm,该缩放比例差量在与期望的总响度缩放比例sm求和时,将方程式6b转为一等式:
( s m + Δ s m ) L m = F { Σ c = 1 C F - 1 { s m L c } } - - - ( 6 c )
或重新整理为:
Δ s m = F { Σ c = 1 C F - 1 { s m L c } } L m - s m - - - ( 6 d )
对于实际模拟人类感知的非线性声级特性的任何函数F而言,该误差一般较小,因为在大的范围上响度的增长接近于线性。然而,为了最小化该误差,可能想要的是增加可选的校正到本发明的基本实现。不失一般性,可将这种校正表示为引入到每个单独声道的响度缩放比例中的缩放比例差量Δsm,使得方程式6d中的总响度缩放比例误差Δsm减小。一般而言,声道间的该缩放差量Δsm是不同的。将这些声道缩放比例差量Δsm合并进方程式6d,产生修改过的表达式:
Δ s m = F { Σ c = 1 C F - 1 { ( s m + Δ s c ) L c } } L m - s m - - - ( 6 e )
应用该校正的各个声道增益则可由以下方程式给出:
Figure GSB00000331974900091
在可忍受的范围内可使用任何适合的技术来得到声道缩放比例差量Δsm,从而方程式6e内的总响度缩放比例误差Δsm的绝对值比方程式6d内的小。因此,使得Δsm的绝对值较小。在以下给出的两个实现例子中,理想地,其可小到零。然而,Δsm绝对值的减小度相对于每一声道缩量比例差量Δsc的大小可进行折中,以便最小化听得见的响度变化赝象,在此情形下Δsm的理想值不是零。接下来在下文中描述实现校正的两个例子。
一种实现该校正的方式的例子是首先依据本发明基本实现方式如方程式5b所示计算各个声道增益gc,接着计算用于所有声道的单一校正增益G,其与每一声道增益gc相乘产生校正的声道增益
Figure GSB00000331974900092
计算增益G,使得在将增益施加到每一声道后,总响度等于以期望量缩放的原始总响度:
s m L m = F { Σ c = 1 C g c Δ P c } = F { G Σ c = 1 C g c P c } - - - ( 7 a )
解出G产生:
G = F - 1 { s m L m } Σ c = 1 C g c P c - - - ( 7 b )
此校正减小了总响度缩放比例误差Δsm的绝对值。理想地,如从察看方程式7a(没有Δsm因子——该缩放比例误差被设为零)明显看出,其被减小到零。在实际设置中,由于计算的精确度、信号处理时间滞后等,该缩放比例误差可能不为零。此外,如上所述,每一声道缩放比例差量Δsc的大小在限制该Δsm误差因子的减小度时可被考虑到。
相对应的声道缩放比例差量Δsc不被直接指定,而是经由计算G被隐含指定。给定G,可重新排列方程式6f以解出每一声道的缩放比例差量Δsc为:施加该校正的声道增益
Figure GSB00000331974900096
后该特定声道的响度与原始声道的响度之比减去期望的总响度缩放比例:
Δ s c = F { G g c P c } L m - s m - - - ( 7 c )
需注意的是不须解出Δsc(通过施加共同的G因子来调整每一声道的增益,从而实现对总(多声道)响度的期望的校正)。显示方程式7c是出于在解释该第一校正例子中进行说明的目的。
因为在实际中借助各个声道增益所得到的总响度缩放比例接近于期望的总响度缩放比例sm,因此产生的校正增益G通常接近于1,而相对应的声道缩放比例差量接近于零。因此,该校正不可能会引起任何不良的空间变化。
应用校正的另一方式的例子是找到所有声道共同的声道缩放比例差量Δs,从而对于所有声道而言Δsc=Δs,这导致总响度缩放比例误差Δsm的绝对值减小。理想地,如从察看方程式8(没有Δsm因子——该缩放比例误差被设为零)明显看出,其被减小至零。在实际设置中,由于计算的精确度、信号处理时间滞后等,该缩放误差可能不是零。将这些约束插入到方程式6e,产生以下情形:
s m L m = F { Σ c = 1 C F - 1 { ( s m + Δs ) L c } } - - - ( 8 )
可以利用方程式8解出Δs,然后利用方程式6f(其中对所有声道而言Δsc=Δs)计算出相对应的校正声道增益。实际上,利用方程式8解出Δs需要迭代数值技术,因此与已描述的第一校正实现方式相比较不理想。
上述两个校正例子的各方面可在下表中进行总结:
校正例子的总结
可以有其它技术用于近似地施加相同的响度缩放比例给多声道信号的每个单独声道,同时近似地施加期望的变化给总响度,本发明意在涵盖所有这些技术。
用于实现本发明的最佳模式
在Seefeldt等人的WO 2004/111994 A2申请和Seefeldt的PCT/US2005/038579申请中,除了别的以外,还揭示了根据心理声学模型的感知响度的客观测量。根据单声道音频信号x[n],该方法首先计算激发信号E[b,t],其对在时间区块t期间在临界频带b沿内耳基膜的能量分布进行近似。可从音频信号的短时离散傅立叶变换(STDFT)计算出该激发信号如下:
E [ b , t ] = λ b E [ b , t - 1 ] + ( 1 - λ b ) Σ k | T [ k ] | 2 | C b [ k ] | 2 | X [ k , t ] | 2 - - - ( 9 )
其中X[k,t]代表在时间区块t和k元(bin)时X[n]的STDFT,T[k]表示仿真经过外耳和中耳的音频传输的滤波器的频率响应,Cb[k]代表在对应于临界频带b的位置处的基膜的频率响应。图3描述一组适合的临界带通滤波器响应,其中四十个频带沿着等效矩形频宽(ERB)刻度被均匀隔开,如Moore和Glasberg所定义的(B.C.J.Moore,B.Glasberg,T.Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness,”Journal of the Audio Engineering Society,Vol.45,No.4,1997年4月,第224-240页)。每一滤波器的形状由取整指数函数(rounded exponential function)描述,且频带利用1 ERB的间距分布。最后,在方程式(9)中的平滑时间常数λb可被有利地选择为正比于在频带b内人类响度感知的积分时间。
利用如图2中描绘的等响度线,在每一频带上的激发被转换为可在1kHz产生相同响度的激发水平。然后,从该转换的激发E1kHz[b,t]通过压缩非线性而计算出特定响度(在频率和时间上分布的感知响度度量)。计算该特定响度的一个适合函数N[b,t]以下式给出:
N [ b , t ] = β ( ( E 1 kHz [ b , t ] TQ 1 kHz ) α - 1 ) - - - ( 10 )
其中TQ1kHz是在1kHz时的静音门限,常数β和α被选择以匹配如第1图中所示的响度数据的增长。最后,以单位宋(sone)表示的总响度L[t]通过在频带上对特定响度求和而计算出:
L [ t ] = Σ b N [ b , t ] - - - ( 11 )
为了调整音频信号,可能希望计算出宽频带增益g[t],该增益与音频信号相乘时,使得被调整音频的响度等于某个期望的目标响度
Figure GSB00000331974900122
,如由已描述的心理声学技术所测量的。该目标响度
Figure GSB00000331974900123
可以通过多种方式来计算。例如,在音量控制的情形下,其可被计算为该原始响度L[t]的固定缩放。或者,可以使用更为复杂的响度L[t]函数,如自动增益控制(AGC)或动态范围控制(DRC)。不管如何计算,对应的增益g[t]都以相同的方式来计算。令函数FL表示从激发到响度的转换,从而
L[t]=FL{E[b,t]}                              (12a)
计算增益g[t],从而
L ^ [ t ] = F L { g [ t ] E [ b , t ] } - - - ( 12 b )
重新整理(12a-b),可解出:
Figure GSB00000331974900126
其中s[t]是与
Figure GSB00000331974900127
有关的响度缩放比例,从而
s [ t ] = L ^ [ t ] L [ t ] - - - ( 12 d )
且反函数
Figure GSB00000331974900129
被约束以产生激发,其作为原始激发E[b,t]的宽频带缩放比例。由于函数FL的本性(非线性被施加于每一频带,接着在频带上求和),该反函数
Figure GSB000003319749001210
的封闭形式解不存在。相反地,在WO 2004/111994 A2申请中描述的迭代技术可用于解出增益g[t]。
替代计算宽频带增益g[t]来修改音频的方式,可计算多频带增益g[b,t],该增益在被施加到原始音频时产生经修改的音频信号,该经修改的音频信号的特定响度基本上等于某一期望的目标特定响度
Figure GSB000003319749001211
。通过计算多频带增益而不是宽频带增益,可实现音频的感知频谱平衡或音质的控制。例如,利用音量控制,目标特定响度可被计算为原始特定响度N[b,t]的频带无关性缩放比例,从而当音量改变时保持该音频的原始音质。在PCT/US2005/038579申请中,描述了用于计算作为N[b,t]的函数的
Figure GSB00000331974900131
的若干其它技术,包括AGC,多频带DRC以及动态EQ(DEQ)。令函数FN代表从激发到特定响度的转换,从而
N[b,t]=FN{E[b,t]}                        (13a)
计算增益g[b,t],从而
N ^ [ b , t ] = F N { g [ b , t ] E [ b , t ] } - - - ( 13 b )
重新整理(13a-b),从而解出:
g [ b , t ] = F N - 1 { s [ b , t ] N [ b , t ] } E [ b , t ] - - - ( 13 c )
其中s[b,t]是与
Figure GSB00000331974900134
有关的特定响度缩放比例,因此
s [ b , t ] = N ^ [ b , t ] N [ b , t ] - - - ( 13 d )
在PCT/US2005/038579申请中,描述了用于计算的数个技术,包括封闭形式表达式、查询表以及迭代搜索。
现在考虑多声道音频信号xc[n],c=1…C,从该信号可计算出针对每一声道c的激发Ec[b,t]。通过对所有的声道激发求和,可计算出该多声道信号的总激发Em[b,t]:
E m [ b , t ] = Σ c = 1 C E c [ b , t ] - - - ( 14 a )
且可依据下式从该总激发中计算出对应的总响度和特定响度:
Lm[t]=FL{Em[b,t]}                     (14b)
Nm[b,t]=FN{Em[b,t]}                  (14c)
同样地,每个单独声道的响度和特定响度可从每一声道激发中被计算出:
Lc[t]=FL{Ec[b,t]}                              (15a)
Nc[b,t]=FN{Ec[b,t]}                           (15b)
现在假定希望修改该多声道音频信号,使得总响度Lm[t]以sm[t]缩放,或总特定响度Nm[b,t]以sm[b,t]缩放。在第一种情形下,可解出宽频带增益gm[t]从而:
sm[t]Lm[t]=FL{gm[t]Em[b,t]}                    (16a)
在第二情形下,解出多频带增益gm[b,t],从而:
sm[b,t]Nm[b,t]=FN{gm[b,t]Em[b,t]}           (16b)
在两种情形下,相同的增益随后被施加到所有声道c,但如先前所讨论的,这可导致所感知的该多声道信号的空间平衡的失真。为了保持该空间平衡,可改为对每一声道计算增益gc[t]或gc[b,t],从而每个单独声道响度或特定响度以期望量进行缩放:
sm[t]Lc[t]=FL{gc[t]Ec[b,t]}                    (17a)
sm[b,t]Nc[b,t]=FN{gc[b,t]Ec[b,t]}           (17b)
这样,所有声道之间的相对响度或特定响度被保持。然而,当这些增益gc[t]或gc[b,t]被施加到原始多声道音频的对应声道时,产生的经修改多声道音频信号的总响度可能不是正好等于以期望量进行缩放的原始多声道音频信号的总响度。更具体地:
s m [ t ] L m [ t ] ≠ F L { Σ c = 1 C g c [ t ] E c [ b , t ] } - - - ( 18 a )
以及
s m [ b , t ] N m [ b , t ] ≠ F N { Σ c = 1 C g c [ b , t ] E c [ b , t ] } - - - ( 18 b )
在很多情形下,方程式18a和18b的两边几乎相等,因此对于某些应用而言,产生的误差可被忽视。然而,对手最佳的结果而言,可计算出施加到所有声道的校正增益G[t]或G[b,t],从而:
s m [ t ] L m [ t ] = F L { G [ t ] Σ c = 1 C g c [ t ] E c [ b , t ] } - - - ( 19 a )
以及
s m [ b , t ] N m [ b , t ] = F N { G [ b , t ] Σ c = 1 C g c [ b , t ] E c [ b , t ] } - - - ( 19 b )
这样,可实现期望的总响度缩放比例。在大多数情形下,校正增益G[t]或G[b,t]很小,因此多声道信号的空间平衡被大部分保持住。
在图4a-4f中,描述了对于多声道音频信号被修改后的特定响度和多频带增益曲线,该多声道音频信号由五个声道组成:左、中、右、左环绕以及右环绕。该特定音频信号由中央声道内的对话居主导地位,余下的四个声道包含非常低声级的周围信号(用于传达位于大厅内的效果)。对于这种特定情形,计算多频带增益gm[b,t]和gc[b,t](c=1…5),以针对所有频带b实现特定的响度缩放比例sm[b,t]=0.16。检查图4b中的中央声道(c=2),注意到通过施加对所有声道都相同的增益gm[b,t]以及声道特定增益g2[b,t]所得到的两个特定响度频谱几乎一样。这是因为中央声道包含该信号能量的绝大部分,因此从组合的激发Em[b,t]计算gm[b,t]主要受此声道影响。然而,检查余下的声道,注意到通过施加gm[b,t]和gc[b,t]得到的两个特定响度频谱之间存在巨大差异。在这些情形下,因为这些信号与中央声道的相比非常小,因此施加gm[b,t]导致经修改的特定响度远远小于期望的缩放比例0.16。对于很多频带而言,经修改的特定响度降到听觉阈以下,这在左环绕声道和右环绕声道(C=4和5)中最为明显。另一方面,施加gc[b,t]产生期望的特定响度缩放比例。图4f描述了在施加gm[b,t]到所有声道以及施加gc[b,t]到每一相应声道之后组合出的所有声道的特定响度。注意到,在第一种情形下,经修改的特定响度如期等于以期望量缩放的原始组合特定响度。施加gc[b,t]到每一相应声道产生接近该结果的经修改的特定响度,但在较低和较高的频带上存在小的误差。该误差通过进一步施加校正增益G[b,t]来消除,该增益对于大多数频带b来说接近于0dB。G[b,t]在频带上的平均绝对值为0.6dB,且G[b,t]的最大绝对值仅为3.7dB。返回图4a-4e,注意到施加校正增益对于每个单独声道的经修改的特定响度的影响很小。
实施
本发明可以硬件或软件或二者的组合(例如可编程逻辑阵列)来实施。除非另外指定,否则作为本发明的一部分而包括的算法和过程不与任何特定的计算机或其它设备固有地相关。具体地,各种通用机器可与按照本教导所写的程序一起使用,或者更为方便的是构建更专用的设备(例如,集成电路)来执行所需的方法步骤。因此,本发明可以利用在一个或多个可编程计算机系统上执行的一个或多个计算机程序来实现,每个计算机系统包括至少一个处理器、至少一个数据存储系统(包括易失和非易失记忆和/或存储元件)、至少一个输入设备或端口,以及至少一个输出设备或端口。程序代码被应用于输入数据以执行这里所描述的功能,并产生输出信息。该输出信息以公知方式应用于一个或多个输出设备。
每一此程序可通过任何期望的计算机语言来实现(包括机器、汇编、或高级过程、逻辑或面向对象的编程语言),以便与计算机系统通信。在任何情况下,该语言可以是编译或解释语言。
每个此计算机程序优选存储在或被下载到可被通用或专用目的可编程计算机可读的存储介质或设备(例如,固态存储器或介质、或者磁或光介质)上,用于当该存储介质或设备被计算机系统读取时配置并操作该计算机以执行这里所描述的程序。本发明系统还可考虑作为配置有计算机程序的计算机可读存储介质来实现,其中这样配置的存储介质使计算机系统以特定和预定义方式工作,从而执行这里所描述的功能。本发明的若干实施例已经描述。然而,应理解在不背离本发明的精神和范围的情况下可进行各种修改。例如,这里所描述的某些步骤是顺序无关的,因此可以以不同于所描述的顺序来执行。

Claims (20)

1.一种以期望量sm来缩放多声道音频信号的总感知响度Lm的方法,其中所述总感知响度Lm是每声道信号功率Pc之和的非线性函数,该方法包括:
根据以所述期望量sm进行总感知响度缩放的期望精确度,以等于缩放所述总感知响度的期望量sm的数量来缩放每个单独声道的感知响度Lc,其中每个单独声道的感知响度是单独声道的功率Pc的非线性函数。
2.如权利要求1所述的方法,其中,每个单独声道的感知响度通过改变每个单独声道的增益gc来缩放,其中增益为声道功率的缩放比例,使得依据下式,每个声道的增益gc与每个声道的功率Pc相关:
g c = F - 1 { s m L c } P c = F - 1 { s m F { P c } } P c
其中,F-1为将感知响度L相关到功率P的非线性函数F的反函数:
L=F{P}。
3.如权利要求2所述的方法,还包括:修改被施加到每一声道的响度缩放比例,以减小以下两者之差:[1]通过以sm来单独缩放每一声道的感知响度得到的总感知响度缩放比例;以及[2]总感知响度缩放比例的期望量sm
4.如权利要求3所述的方法,其中,所述差通过向每一声道功率的增益施加共同的乘数来减小。
5.如权利要求3所述的方法,其中,所述差通过向每一声道的响度的缩放比例增加共同的缩放偏移量来减小。
6.如权利要求4或5所述的方法,其中,所述差可表示为:
Δ s m = F { Σ c = 1 C F - 1 { s m L c } } L m - s m
其中Δsm为所述差,C为声道的总数。
7.如权利要求2至4中任一项所述的方法,其中,每一声道的感知响度以及总感知响度在多个频带的每一频带内测量,并且在这些频带内调整每一声道的增益。
8.如权利要求7所述的方法,其中所述频带与临界频带相当。
9.如权利要求1至5中任一项所述的方法,其中,每一声道的感知响度以及总感知响度在单一宽频频带内测量。
10.如权利要求6所述的方法,其中,每一声道的感知响度以及总感知响度在单一宽频频带内测量。
11.一种以期望量sm来缩放多声道音频信号的总感知响度Lm的设备,其中所述总感知响度Lm是每声道信号功率Pc之和的非线性函数,该设备包括:
用于根据以所述期望量sm进行总感知响度缩放的期望精确度,以等于缩放所述总感知响度的期望量sm的数量来缩放每个单独声道的感知响度Lc的缩放装置,其中每个单独声道的感知响度是单独声道的功率Pc的非线性函数。
12.如权利要求11所述的设备,其中,所述缩放装置被进一步配置为通过改变每个单独声道的增益gc来缩放每个单独声道的感知响度,其中增益为声道功率的缩放比例,使得依据下式,每个声道的增益gc与每个声道的功率Pc相关:
g c = F - 1 { s m L c } P c = F - 1 { s m F { P c } } P c
其中,F-1为将感知响度L相关到功率P的非线性函数F的反函数:
L=F{P}。
13.如权利要求12所述的设备,还包括:用于修改被施加到每一声道的响度缩放比例,以减小以下两者之差的修改装置:[1]通过以sm来单独缩放每一声道的感知响度得到的总感知响度缩放比例;以及[2]总感知响度缩放比例的期望量sm
14.如权利要求13所述的设备,其中,所述修改装置被配置为通过向每一声道功率的增益施加共同的乘数来减小所述差。
15.如权利要求13所述的设备,其中,所述修改装置被配置为通过向每一声道的响度的缩放比例增加共同的缩放偏移量来减小所述差。
16.如权利要求14或15所述的设备,其中,所述修改装置被配置为能够用下式表示所述差:
Δ s m = F { Σ c = 1 C F - 1 { s m L c } } L m - s m
其中Δsm为所述差,C为声道的总数。
17.如权利要求12至14中任一项所述的设备,其中,所述缩放装置被配置为在多个频带的每一频带内测量每一声道的感知响度以及总感知响度,并且在这些频带内调整每一声道的增益。
18.如权利要求17所述的设备,其中所述缩放装置被配置为使所述频带与临界频带相当。
19.如权利要求11至15中任一项所述的设备,其中,所述缩放装置被配置为在单一宽频频带内测量每一声道的感知响度以及总感知响度。
20.如权利要求16所述的设备,其中,所述缩放装置被配置为在单一宽频频带内测量每一声道的感知响度以及总感知响度。
CN2007800110565A 2006-04-04 2007-03-14 用于多声道音频信号的响度修改的方法和设备 Active CN101411060B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US78952306P 2006-04-04 2006-04-04
US60/789,523 2006-04-04
US85761706P 2006-11-07 2006-11-07
US60/857,617 2006-11-07
PCT/US2007/006444 WO2007123608A1 (en) 2006-04-04 2007-03-14 Loudness modification of multichannel audio signals

Publications (2)

Publication Number Publication Date
CN101411060A CN101411060A (zh) 2009-04-15
CN101411060B true CN101411060B (zh) 2011-04-13

Family

ID=38278892

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800110565A Active CN101411060B (zh) 2006-04-04 2007-03-14 用于多声道音频信号的响度修改的方法和设备

Country Status (8)

Country Link
US (4) US8019095B2 (zh)
EP (1) EP2002539B1 (zh)
JP (1) JP5006384B2 (zh)
CN (1) CN101411060B (zh)
AT (1) ATE490596T1 (zh)
DE (1) DE602007010912D1 (zh)
TW (1) TWI517562B (zh)
WO (1) WO2007123608A1 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
UA93243C2 (ru) 2006-04-27 2011-01-25 ДОЛБИ ЛЕБОРЕТЕРИЗ ЛАЙСЕНСИНГ КОРПОРЕЙШи Регулирование усиления звука c использованием основанного ha конкретной громкости выявления аккустических событий
KR101137715B1 (ko) 2006-10-20 2012-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 리셋을 사용하는 오디오 다이내믹스 프로세싱
CN101790758B (zh) 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
EP2232700B1 (en) * 2007-12-21 2014-08-13 Dts Llc System for adjusting perceived loudness of audio signals
KR101475724B1 (ko) * 2008-06-09 2014-12-30 삼성전자주식회사 오디오 신호 품질 향상 장치 및 방법
WO2010033384A1 (en) 2008-09-19 2010-03-25 Dolby Laboratories Licensing Corporation Upstream quality enhancement signal processing for resource constrained client devices
ATE552690T1 (de) 2008-09-19 2012-04-15 Dolby Lab Licensing Corp Upstream-signalverarbeitung für client- einrichtungen in einem drahtlosen kleinzellen- netz
WO2010075377A1 (en) * 2008-12-24 2010-07-01 Dolby Laboratories Licensing Corporation Audio signal loudness determination and modification in the frequency domain
US8761415B2 (en) 2009-04-30 2014-06-24 Dolby Laboratories Corporation Controlling the loudness of an audio signal in response to spectral localization
CN102414742B (zh) 2009-04-30 2013-12-25 杜比实验室特许公司 低复杂度听觉事件边界检测
TWI503816B (zh) 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
KR20110089020A (ko) * 2010-01-29 2011-08-04 주식회사 팬택 휴대용 단말기의 무선 헤드셋을 통한 음성 출력의 조절 방법 및 그 방법이 구현된 휴대용 단말기
US8855322B2 (en) * 2011-01-12 2014-10-07 Qualcomm Incorporated Loudness maximization with constrained loudspeaker excursion
EP2503800B1 (en) 2011-03-24 2018-09-19 Harman Becker Automotive Systems GmbH Spatially constant surround sound
US20130253923A1 (en) * 2012-03-21 2013-09-26 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Multichannel enhancement system for preserving spatial cues
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN109036443B (zh) 2013-01-21 2023-08-18 杜比实验室特许公司 用于在不同回放设备之间优化响度和动态范围的系统和方法
US9516418B2 (en) 2013-01-29 2016-12-06 2236008 Ontario Inc. Sound field spatial stabilizer
US9271100B2 (en) * 2013-06-20 2016-02-23 2236008 Ontario Inc. Sound field spatial stabilizer with spectral coherence compensation
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US10063207B2 (en) 2014-02-27 2018-08-28 Dts, Inc. Object-based audio loudness management
US9503803B2 (en) 2014-03-26 2016-11-22 Bose Corporation Collaboratively processing audio between headset and source to mask distracting noise
CN105336341A (zh) * 2014-05-26 2016-02-17 杜比实验室特许公司 增强音频信号中的语音内容的可理解性
US10842418B2 (en) 2014-09-29 2020-11-24 Starkey Laboratories, Inc. Method and apparatus for tinnitus evaluation with test sound automatically adjusted for loudness
EP4372746A2 (en) 2014-10-10 2024-05-22 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
US9590580B1 (en) 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
KR102622459B1 (ko) * 2016-07-04 2024-01-08 하만 베커 오토모티브 시스템즈 게엠베하 음성 신호를 포함하는 오디오 신호의 라우드니스 레벨의 자동 교정
US9860644B1 (en) 2017-04-05 2018-01-02 Sonos, Inc. Limiter for bass enhancement
CN109040885B (zh) * 2017-06-09 2019-08-20 中国科学院声学研究所 一种基于音量的个性化响度补偿方法及耳机均衡系统
US10389323B2 (en) 2017-12-18 2019-08-20 Tls Corp. Context-aware loudness control
EP3738325B1 (en) 2018-01-09 2023-11-29 Dolby Laboratories Licensing Corporation Reducing unwanted sound transmission
CN112750444B (zh) * 2020-06-30 2023-12-12 腾讯科技(深圳)有限公司 混音方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5907622A (en) * 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
WO2004111994A2 (en) * 2003-05-28 2004-12-23 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
CN1573930A (zh) * 2003-06-12 2005-02-02 阿尔派株式会社 语音修正装置
CN1624759A (zh) * 2003-12-03 2005-06-08 扬智科技股份有限公司 动态范围控制的混音输出装置及方法
CN1679082A (zh) * 2002-08-30 2005-10-05 杜比实验室特许公司 控制包含语音和其它类型音频素材的信号中的语音响度

Family Cites Families (135)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) * 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) * 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
DE3314570A1 (de) * 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4739514A (en) * 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) * 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US5043970A (en) * 1988-01-06 1991-08-27 Lucasarts Entertainment Company Sound system with source material and surround timbre response correction, specified front and surround loudspeaker directionality, and multi-loudspeaker surround
US4953112A (en) 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
US5027410A (en) * 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (zh) * 1989-03-08 1990-09-21
US5097510A (en) * 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) * 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
DE69210689T2 (de) * 1991-01-08 1996-11-21 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
DE69214882T2 (de) 1991-06-06 1997-03-20 Matsushita Electric Ind Co Ltd Gerät zur Unterscheidung von Musik und Sprache
US5278912A (en) * 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US5363147A (en) * 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
JPH06133390A (ja) * 1992-10-21 1994-05-13 Sony Corp 音質制御回路
GB2272615A (en) 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5548638A (en) 1992-12-21 1996-08-20 Iwatsu Electric Co., Ltd. Audio teleconferencing apparatus
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) * 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) * 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) * 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (zh) * 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) * 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
TW247390B (en) * 1994-04-29 1995-05-11 Audio Products Int Corp Apparatus and method for adjusting levels between channels of a sound system
US5574791A (en) 1994-06-15 1996-11-12 Akg Acoustics, Incorporated Combined de-esser and high-frequency enhancer using single pair of level detectors
US5500902A (en) * 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) * 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) * 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) * 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
EP0661905B1 (de) 1995-03-13 2002-12-11 Phonak Ag Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US6041295A (en) * 1995-04-10 2000-03-21 Corporate Computer Systems Comparing CODEC input/output to adjust psycho-acoustic parameters
US6301555B2 (en) * 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US5601617A (en) * 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) * 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) * 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) * 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6108431A (en) * 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6430533B1 (en) * 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09312540A (ja) * 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) * 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
DE59713033D1 (de) * 1996-07-19 2010-06-02 Bernafon Ag Lautheitsgesteuerte Verarbeitung akustischer Signale
JP2953397B2 (ja) * 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
US6570991B1 (en) * 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
JPH10284964A (ja) 1997-01-09 1998-10-23 Sony Corp 音量調節装置
US5862228A (en) * 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US5930373A (en) 1997-04-04 1999-07-27 K.S. Waves Ltd. Method and system for enhancing quality of sound signal
US6125343A (en) * 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) * 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) * 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) * 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
AU750877C (en) * 1997-09-05 2004-04-29 Lexicon, Inc. 5-2-5 matrix encoder and decoder system
US6088461A (en) * 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6055502A (en) * 1997-09-27 2000-04-25 Ati Technologies, Inc. Adaptive audio signal compression computer system and method
TW391148B (en) 1997-12-01 2000-05-21 Central Research Lab Ltd Stereo sound expander
US6233554B1 (en) * 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) * 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) * 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) * 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
US6201875B1 (en) 1998-03-17 2001-03-13 Sonic Innovations, Inc. Hearing aid fitting system
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
JP2002518912A (ja) * 1998-06-08 2002-06-25 コックレア リミティド 聴覚装置
EP0980064A1 (de) * 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
GB2340351B (en) * 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
US6351731B1 (en) * 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) * 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) * 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) * 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
DE69933929T2 (de) * 1999-04-09 2007-06-06 Texas Instruments Inc., Dallas Bereitstellen von digitalen Audio- und Videoprodukten
AU4278300A (en) * 1999-04-26 2000-11-10 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6263371B1 (en) * 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6985594B1 (en) * 1999-06-15 2006-01-10 Hearing Enhancement Co., Llc. Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US6778966B2 (en) * 1999-11-29 2004-08-17 Syfx Segmented mapping converter system and method
FR2802329B1 (fr) * 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) * 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) * 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
AUPQ952700A0 (en) * 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) * 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) * 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
ES2267457T3 (es) * 2000-11-09 2007-03-16 Koninklijke Kpn N.V. Medicion de la calidad de la voz de un enlace telefonico en una red de telecomunicaciones.
US7457422B2 (en) * 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
DE10107385A1 (de) * 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) * 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
US7194100B2 (en) * 2001-04-10 2007-03-20 Phonak Ag Method for individualizing a hearing aid
US7283954B2 (en) * 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7461002B2 (en) * 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
ATE318062T1 (de) 2001-04-18 2006-03-15 Gennum Corp Mehrkanal hörgerät mit übertragungsmöglichkeiten zwischen den kanälen
WO2003036621A1 (en) * 2001-10-22 2003-05-01 Motorola, Inc., A Corporation Of The State Of Delaware Method and apparatus for enhancing loudness of an audio signal
JP2003158800A (ja) * 2001-11-22 2003-05-30 Kenwood Corp 多チャンネルオーディオ再生装置
US20040037421A1 (en) * 2001-12-17 2004-02-26 Truman Michael Mead Parital encryption of assembled bitstreams
US7068723B2 (en) * 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
EP1881486B1 (en) 2002-04-22 2009-03-18 Koninklijke Philips Electronics N.V. Decoding apparatus with decorrelator unit
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
ATE447755T1 (de) 2003-02-06 2009-11-15 Dolby Lab Licensing Corp Kontinuierliche audiodatensicherung
DE10308483A1 (de) * 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
US20040146167A1 (en) 2003-10-21 2004-07-29 Sony Corporation/Sony Electronics Inc. Method and apparatus for processing audio from various sources
JP2005184154A (ja) * 2003-12-16 2005-07-07 Sony Corp 自動利得制御装置及び自動利得制御方法
SG10202004688SA (en) 2004-03-01 2020-06-29 Dolby Laboratories Licensing Corp Multichannel Audio Coding
GB2413906A (en) 2004-04-21 2005-11-09 Imagination Tech Ltd Radio volume control system
JP4557594B2 (ja) * 2004-04-26 2010-10-06 富士通テン株式会社 情報再生処理システム及びそのプログラム
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
JP4347153B2 (ja) * 2004-07-16 2009-10-21 三菱電機株式会社 音響特性調整装置
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
AU2005299410B2 (en) 2004-10-26 2011-04-07 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
WO2007120453A1 (en) 2006-04-04 2007-10-25 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8265295B2 (en) * 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
EP2002426B1 (en) 2006-04-04 2009-09-02 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
UA93243C2 (ru) 2006-04-27 2011-01-25 ДОЛБИ ЛЕБОРЕТЕРИЗ ЛАЙСЕНСИНГ КОРПОРЕЙШи Регулирование усиления звука c использованием основанного ha конкретной громкости выявления аккустических событий
KR101137715B1 (ko) 2006-10-20 2012-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 리셋을 사용하는 오디오 다이내믹스 프로세싱
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
EP2122828B1 (en) 2007-01-03 2018-08-22 Dolby Laboratories Licensing Corporation Hybrid digital/analog loudness-compensating volume control
JP5260561B2 (ja) 2007-03-19 2013-08-14 ドルビー ラボラトリーズ ライセンシング コーポレイション 知覚モデルを使用した音声の強調
US8213624B2 (en) 2007-06-19 2012-07-03 Dolby Laboratories Licensing Corporation Loudness measurement with spectral modifications

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5907622A (en) * 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
CN1679082A (zh) * 2002-08-30 2005-10-05 杜比实验室特许公司 控制包含语音和其它类型音频素材的信号中的语音响度
WO2004111994A2 (en) * 2003-05-28 2004-12-23 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
CN1573930A (zh) * 2003-06-12 2005-02-02 阿尔派株式会社 语音修正装置
CN1624759A (zh) * 2003-12-03 2005-06-08 扬智科技股份有限公司 动态范围控制的混音输出装置及方法

Also Published As

Publication number Publication date
CN101411060A (zh) 2009-04-15
DE602007010912D1 (de) 2011-01-13
JP2009532982A (ja) 2009-09-10
EP2002539B1 (en) 2010-12-01
US8731215B2 (en) 2014-05-20
US8019095B2 (en) 2011-09-13
ATE490596T1 (de) 2010-12-15
US20100202632A1 (en) 2010-08-12
US8600074B2 (en) 2013-12-03
US20120106743A1 (en) 2012-05-03
WO2007123608A1 (en) 2007-11-01
US9584083B2 (en) 2017-02-28
TW200810349A (en) 2008-02-16
JP5006384B2 (ja) 2012-08-22
US20110311062A1 (en) 2011-12-22
EP2002539A1 (en) 2008-12-17
TWI517562B (zh) 2016-01-11
US20140211946A1 (en) 2014-07-31

Similar Documents

Publication Publication Date Title
CN101411060B (zh) 用于多声道音频信号的响度修改的方法和设备
US10993062B2 (en) Loudness adjustment for downmixed audio content
CN101048935B (zh) 控制音频信号的单位响度或部分单位响度的方法和设备
CN102986136B (zh) 修改输入音频信号的装置及方法
CN101681618B (zh) 利用频谱修改的响度测量
CN101573866B (zh) 响度补偿音量控制方法和装置
CN101421781A (zh) 音频信号的感知响度和/或感知频谱平衡的计算和调整
CN103262409A (zh) 用于改进的感觉的频谱不平衡的音频信号的动态补偿
CN101819771A (zh) 用于计算和调节音频信号的感觉响度的方法和设备
CN102684628A (zh) 修正音频动态处理器的参数的方法以及执行该方法的设备
Seefeldt Loudness domain signal processing
CN116225360A (zh) 真实世界声音的校准增益

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20090415

Assignee: Lenovo (Beijing) Co., Ltd.

Assignor: Dolby Lab Licensing Corp.

Contract record no.: 2012990000553

Denomination of invention: Loudness modification of multichannel audio signals

Granted publication date: 20110413

License type: Common License

Record date: 20120731