CN101103525A - 用于音频信号声级的频率相关放大的信号处理设备和音频系统及其方法 - Google Patents
用于音频信号声级的频率相关放大的信号处理设备和音频系统及其方法 Download PDFInfo
- Publication number
- CN101103525A CN101103525A CNA2006800023045A CN200680002304A CN101103525A CN 101103525 A CN101103525 A CN 101103525A CN A2006800023045 A CNA2006800023045 A CN A2006800023045A CN 200680002304 A CN200680002304 A CN 200680002304A CN 101103525 A CN101103525 A CN 101103525A
- Authority
- CN
- China
- Prior art keywords
- sig
- audio signal
- threshold
- frequency
- sound level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03F—AMPLIFIERS
- H03F3/00—Amplifiers with only discharge tubes or only semiconductor devices as amplifying elements
- H03F3/68—Combinations of amplifiers, e.g. multi-channel amplifiers for stereophonics
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03F—AMPLIFIERS
- H03F2200/00—Indexing scheme relating to amplifiers
- H03F2200/39—Different band amplifiers are coupled in parallel to broadband the whole amplifying circuit
Landscapes
- Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本发明涉及一种用于音频信号的声级的频率相关放大的方法,在该方法中,至少在某个频率范围中,音频信号(Sig(f))被划分成多个(n个)频带(f1…f10),为每个频带(f1…f10)规定一特定的听觉阈(Th(f1)…Th(f10)),对于每个频带(f1…f10),该声级与相应的预定的听觉阈(Th(f1)…Th(f10))进行比较,以及至少在声级刚刚低于相应听觉阈(Th(f2),Th(f3),Th(f4))的那些频带(f2,f3,f4)中的音频信号(Sig(f2),Sig(f3),Sig(f4))被放大。本发明还涉及用于实施该方法的信号处理设备,以及具有这样的信号处理设备的音频系统。
Description
发明领域
本发明涉及用于音频信号声级的频率相关放大的方法。
本发明还涉及用于实施这样的方法的信号处理设备。
本发明还涉及具有这样的信号处理设备的音频系统。
发明背景
众所周知,人的听觉阈(auditory threshold)是频率的函数,人耳的最大灵敏度的范围是在约300Hz到3kHz的频率。在低频下,听觉阈是相对较高的(必须有高的声压),在较高的频率,它转而显示一个微小的上升-直至突然达到听觉的上限为止,这个上限值对于年轻人是在18kHz左右,并随年龄增加而下降。
而且还知道,谐波的感知对于声音或产生声音的乐器的真实感知是决定性的。
明显的现象是:在声音事件,诸如举例而言,低声级(sound level)的音乐的再现中,声波图(acoustic pattern)的分量,换句话说是某些谐波,在听觉阈之下变弱。收听者感受到声波图有“某些东西丢失”,音乐失去它的某些氛围,且声音似乎较沉闷。这些因素导致“太静地”听音乐的印象。
而且关于音乐的再现,只有一个真正正确的声级,即,相应于实际事件-例如音乐的录音-的声级。然而,由于在再现情形下人们常常有意选择比正确音量更低的音量(例如,为了避免打扰其它人),人们在真实性方面(比如说,在氛围方面)进行折衷。
为了修补这种限制,在许多音频和音频/视频装置中采用了所谓的“响度(loudness)”函数。这个响度函数代表均衡器上的一种预选择,其中处在低频的声音被较强地放大,高频声音多多少少被放大,而中间频率的声音根本不放大。这样,低频和高频部分即使在低音量下也听得见。用于与这个响度函数对应的音量控制的电路例如在Zastrow,Peter:“Phonotechnik”,1stedition,Frankfuter Fachverlag,1979,pp.132-139中被描述。
从根本上来说这个响度函数已经产生在声波图方面的改进,但远不能为用户创建完美的或接近完美的声波图。其问题在于,高的和低的声音的声级被分别改变固定的、预定的量,通过其并不能进而获得声波图的最佳真实性。
发明内容
本发明的目的是创建按照在第一段中阐述的类型的方法、按照在第二段中阐述的类型的信号处理设备和按照在第三段中阐述的类型的音频系统,其中达到了声波图的显著地更好的修改,通过它可以达到完美的或接近完美的,换句话说,显著地更真实的声波图。
为了达到上述的目的,在按照本发明的方法的情形下,提供了按照本发明的特性,使得按照本发明的方法可以以下面的方式来表征,即:
用于音频信号声级的频率相关放大的方法,在该方法中,至少在某个频率范围中,音频信号被划分成多个频带,以及为每个频带规定一特定的听觉阈,并且对于每个频带,比较该频带中音频信号的声级与相应的规定的听觉阈,以及在声级刚刚低于相应听觉阈的那些频带中的音频信号被放大成使得在这些频带中的放大的音频信号的声级高于听觉阈。
为了达到上述的目的,按照本发明的信号处理设备具有用于实施这样的方法的装置。
而且,为了达到上述的目的,按照本发明的音频系统具有如上所述的信号处理设备。
通过按照本发明的特性,得到以下优点:在按照本发明的放大音频信号的情形下,考虑用户的频率相关的听觉阈,以及音频信号的选择性放大是在取决于相应听觉阈的特定频率范围内发生,由此,比起在上述的所熟悉的响度函数的情形-其中放大只在固定的、预定的频率范围内发生,用户被提供以显著地更好的声波图。
原则上,音频信号可被分割成仅仅在声谱的一个特定频率范围或几个频率范围内的频带,并且如有必要的话,发生放大。但对于最佳放大的音频信号,如果基本上把全部可听见的谱范围分割成相应的频带且发生相应的放大,则是有利的。
在这一点,还应当指出,对于“频带中的声级”的概念,替换地,人们也可以使用频带内谱能量的概念。
原则上,对于本发明的目的,当音频信号“刚刚”低于相应的听觉阈时,如果把音频信号放大到高于听觉阈,则是足够的。从根本上而言,放大更加低于相应听觉阈的音频信号,当然同样也是可能的。然而,如果是这样的情形,则必须当心这些信号不被放大到高于听觉阈,因为否则声波图的真实性会可遭受损害。
然而,优选地,为了达到特别真实的声波图,还提供权利要求2的特征。
在本发明的情形下,如果实现权利要求3的措施,则是特别有利的。通过这些措施,可以发生显著地最佳化的放大,因为对于各个频带,进行相应于音频信号的相应声级的并考虑听觉阈的单独放大。
具体地,如果提供权利要求4的措施,则是有利的。通过这些措施,再一次有可能进行显著地更精确的放大,因为例如这样,人们便能够更好地考虑用户耳朵的灵敏度差异。
为了不放大一个音频信号的,具体地是该音频信号的每个通道的、在任何情形下都能很好听见的那些频率范围,还提供权利要求5的措施。
为了得到尽可能真实的声波图,让各个频率范围的放大对在这个频带的声级、听觉阈和阈值之间的关系进行最好的可能修正是必须的。这通过权利要求6的措施以最佳方式被考虑。
在这方面,还提供权利要求7的措施。
为了不太剧烈地改变总的音频信号(每个通道)的声级,还提供了权利要求8和具体地权利要求9的措施,由此,在总体特性连续保持相应于音频信号的“新的”放大的声波图时,通过均匀减小,该“新的”音频信号的总体声级被减小。具体地,通过权利要求9的措施,发生了“新的”音频信号到近似原始声级的标准化,由此,原始的和新的修改的音频信号的声级很难区分,或完全没有差别。
这些措施是基于以下事实,即:在正常的情形下,音频信号的(对于所讨论的通道的)总体声级基本上是由明显高于听觉阈的谱部分造成的。另一方面,在边界区域中的信号的放大对于总体声级没有任何重大的贡献。这意味着,对于这个“正常的”情形,上述的总体放大只需要被减小到可忽略的程度。
如果另一方面整个谱在处理之前是太安静的,且因此没有占主导的谱范围(例如,静默、安静的背景噪声、鼓掌等等),则可能发生将放大指定给所有的频带,然后这基本上在标准化步骤中倒转过来。然而,对于听觉而言这是恰当的并且是想要的。
频带宽度的选择可以分别适配于特定的情形,对于此的各种可能性在说明中给出。然而,如果包括权利要求10的措施,则是特别有利的,通过此措施,对有不同音量的相邻音符的特别好的区别对待变为可能的。
为了达到最高可能的真实性水平,还提供权利要求11的措施。按照这些措施,音频信号仅仅在声音事件显示比原始声音事件的原始声级更低的声级时才被放大,而在原始声级或更高的情形下不必进行放大。
原则上,对于按照本发明的方法,可以规定用于用户的典型听觉阈。然而,如果提供权利要求12的措施,则按照本发明的方法可以特别好地和个别地适配于用户。
如上所述,如果音频信号的每个通道被分开地放大,则是有利的。为此,如果还提供权利要求13的措施,则也是特别有利的,因为那样则除了该音频信号的每个通道以外,也为这个通道考虑用户的各自相关的个体听觉阈。
这里,听觉阈可以被最好地确立,因为最后提供了权利要求14的措施。
对于开头提到的音频系统,如果实现权利要求17的措施,则更是有利的。通过这种类型的音频系统,整个发明可以在单个系统中以紧凑的方式被实现,而不需要分开的部件。
通过参考此后描述的实施例将明白和阐述本发明的这些和其它方面。
附图说明
下面,将根据图上显示的设计例子来描述本发明,然而这些例子是非限制性的。
图1示意地显示对于具有正常听觉的年轻人的听觉阈的渐进(progression)做为频率的函数。
图2显示对于不同人的听觉阈的典型渐进做为在1kHz-6kHz范围内的频率的函数。
图3示意地显示:根据简化的例子,对于一个音频信号的通道的、在听觉阈、信号电平(音量)和最终得到的阈值之间的关系。
图4显示按照本发明的、音频信号的附加放大的示例性渐进。
图5显示一个音频信号的最大允许放大率的渐进做为音频信号的当前声级的函数的例子。
图6显示按照本发明的音频系统的示意性框图。
实施例描述
图1示意地显示对于具有正常听觉的年轻人的听觉阈的渐进作为频率的函数,正如已在引言中讨论的。声压p[dB]被显示为频率f[Hz]的函数。
在所熟悉的响度函数的情形下,正如已在引言中描述的,它没有考虑听觉阈的这种个体的渐进。总之,可以认为传统的响度函数没有考虑以下项:
a)用户的实际的听觉阈,具体地,没有将这个听觉阈考虑为频率的函数(例如,见图1);
b)在用户的左耳和右耳之间的听觉阈的差异;
c)用户的每个耳朵暴露到的当前绝对声压;
d)声音的不同的谱分量。
Re a)听觉阈随时间变化,换句话说,随用户的年龄变化,以及在左耳和右耳之间之间变化。影响听觉阈的其它影响因素是遗传倾向性和/或在较长的时间段内作用在用户上的噪声。然而,不能做出一般性综述,特别是没有涉及耳朵将开始失去灵敏度的时间点。图2显示对于不同人(Mx:M=男性,x=年龄;Wx:W=女性,x=年龄)的听觉阈的典型渐进作为在1kHz-6kHz的范围内频率的函数。
一般说来,耳朵中的灵敏度对于男性而言会比女性更早开始降低,这尤其可通过以下事实解释,即:男性更经常地工作在有噪声的工作场所。然而,正如已指出的,个体值的离散度范围是非常高的。
Re b)类似的考虑适用于用户的左耳和右耳之间的差异。在健康的年轻人的情形下,两个耳朵具有相似的灵敏度,但两个耳朵之间的差异可随时间而逐渐形成。在中年人中,左耳与右耳的听觉阈可以有高达10dB-20dB的差异。
Re c)如果在图2上观察对于平均60岁的老人在4kHz声音的情形下的听觉阈,耳朵被暴露于约40dB的声压p。如果这个人处在稍微远离声源以及声压电平例如仅仅30dB,则这个人将不再听见声音。
对于一个相对现实尽可能真实的校正,将必须根据绝对声压实行声音校正,而绝对声压进而又取决于源信号、可能地低音和高音放大、声音处理器的设置-例如对于环绕声-以及取决于扬声器效率、扬声器距收听者的距离、在室内的声音情形(反射增加了SPL)等等。而且,例如还必须考虑收听者是否在使用耳机。
然而,在所熟悉的响度函数的情形下,毫不考虑这一情形,因为这里的放大仅仅是在相对的基础上进行的,也就是说,只取决于声音事件的声级。
Re d)所熟悉的响度函数放大特定频率范围内的声音。这忽略了这样的事实:声音可包括具有很大变化的强度的许多分量。如果人们例如假设在4kHz处出现一个音符(note),连同有在5kHz处的弱音符,则在响度函数的情形下,两个音符都被放大某个固定的量,虽然4kHz音符即使不放大也容易听见。这是不利的,因为这样的放大似乎是不自然的和奇怪的。
通过本发明,上述的缺点现在可以大大地避免或全部避免,因为在放大音频信号的情形下,考虑了个人的个体听觉阈,以及在取决于相应听觉阈的特定频率范围内进行音频信号的选择性放大,因此导致比起上述所熟悉的响度函数的情形-其中放大只在固定的、预定的频率范围内发生-显著地更好的用于用户的声波图。
如果考虑音频系统SYS的每个通道(见图6),则特别有利,因为通过这些措施,再次使得有可能进行显著地更精确的放大,因为例如这样,便也有可能更好地考虑用户耳朵之间的灵敏度差异。
在这一点要指出,术语“音频系统”要被理解为是指用于重现音频信号的任何系统或设备,特别是还指音频/视频系统(A/V系统)。这样的音频系统SYS作为例子更详细地显示于图6。
下面根据图3到5,更详细地解释按照本发明的方法。对于图3到5和下面更详细的说明,应使用下面现在给出的定义。所有的变量以分贝(dB)计。
Th(f)__带有头戴耳机或扬声器的个人的个体听觉阈,相关于特定频率f(或对于围绕频率f的特定频带)的特定通道(左,右,环绕,...),相关于音频或音频-视频系统的(随机)dB刻度,其中也考虑音量控制的影响。
Sig(f)__按音频或音频-视频系统的dB刻度、在频率f处或围绕频率f的频带中的、音量控制后的音频信号(对于这个特定的通道)的信号电平(谱能量)。
MA__最大允许放大率,以dB计,(例如,放大“关”,10dB,20dB,30dB)。
ML__阈值;最终得到的阈值Th(f)+ML代表仍旧被放大的音频信号Sig(f)的最大信号强度(这个变量定义所谓的“淡出点”,在该处附加放大变为零)。
Amp(f)__在由频率f规定的频带中音频信号(对于一个通道)的附加(未校正的)的放大。
AmpC(f)__在频率f处或者在由频率f规定的频带中音频信号(对于一个通道)的附加的、校正的放大。
SE__在没有按照本发明的放大下由用户感知的、在所有频带上平均的总体谱能量(相应于音频信号的总声级,这里是对于一个通道而言)。
SEU__在按照本发明的未校正的放大下由用户感知的、在所有频带上平均的每频带的总体谱能量。
从根本上而言,本发明是基于这样的事实,即:对于音频信号Sig(f)的声级的频率相关放大,这个音频信号Sig(f)被划分成数目为n的频带f1...f10,且为每个频带f1...f10规定一个特定的听觉阈Th(f)。而且对于每个频带f1...f10,把声级与相应的规定的听觉阈Th(f1)...Th(f10)相比较,以及在声级接近于相应听觉阈的那些频带内放大音频信号。
图3现在显示对于音频系统的所说明通道的、音频信号Sig(f)的渐进作为频率f的函数,也就是说,无放大的、这个通道Sig(f)的当前谱作为频率f的函数。这里,频率f被记入20Hz与20kHz之间的范围内,按对数刻度。y轴记入的是信号电平或谱能量(每频率单位的音量)。图3还显示对于这个通道的用户的个人听觉阈Th(f)作为频率f的函数。按照本发明,频率范围现在被划分成特定数目为n的(窄)频带f1...f10,典型值例如是n=200。
典型地,在最简单的情形下,对数刻度下的频带(对数地看)是等宽的,因为这接近于耳朵的生理,也就是说,f(频带结束)=c*f(频带开始),其中因子c在整个听觉范围内保持为常数。如果是c=2的情形,则(不适当地)在每种情形下,一个八度音(octave)将被组合到一个频带中,对于c=1.0595...(2的12次方根),一个频带分别相应于一半音步长(semi-tone step),这确实代表了一个可觉察的分辨率。
替换地,可以规定:在那些人耳反应最灵敏的频率范围内,换句话说在约200Hz与3kHz之间,频带被保持为更密集。在3kHz以上和200Hz以下,为方便起见,频带可以被选择为多少更宽一些。
原则上,可以提供到这样的窄频带的分解,即:使得事实上频带仅仅由一个具体的频率组成。这种情形-换句话说是在相当具体的频率的情形下,发生Sig(f)和听觉阈Th(f)的比较,以及可能发生放大-也被包括在表述“频带”中。然而,考虑可得到的计算容量以及人耳的被限制的频率分辨率容量,如果“频带”实际上包括一个频率范围而不仅仅是一个频率,则是方便的。
在给出的另外的说明和方案中,为了简明起见,我们应假设频带有相等的宽度(按对数刻度)。而且,在图3中,假设只有n=10个频带f1...f10,以便使表示更为清晰。
或者是在音频系统SYS的数字信号处理器DSP中(见图6)如上所述地把音频信号Sig(f)划分成频率范围f1...f10,或者如果例如我们正处理压缩的音频信号,则这些已经以相应的形式给出。
如上所述,图3还显示个体听觉阈Th(f)的连续渐进-然而,通常这种渐进已经以同样示出的量化的形式Th(f1)...Th(f10)给出,这例如已经通过确定对于一个通道的用户的听觉阈而得出,正如下面更详细地说明的。
在个体频带中,现在检验音频信号Sig(f)是否接近于相应的听觉阈Th(f),以及如果必要的话,音频信号Sig(f)在相应的频带中,如图3中举例所示的,对于频率范围f2,f3,f4被放大。
相关于听觉阈Th(f)的术语“接近”要被理解为使得放大基本上是在这样的频率范围f中进行,即其中对于最大放大、信号Sig(f)低于听觉阈Th(f)至多达一个值MA。优选地,具体地是为了得到真实的声波图,也对其值直接处在听觉阈Th(f)处或“接近地”高于它的那些信号Sig(f)提供放大。向上,由术语“接近”规定的窗口可同样由值MA限制,这样,原则上,术语“接近”可以被表征为:Sig(f)的值大约处在Th(f)-MA与Th(f)+MA之间。
正如下面更详细地描述的,对于“接近”的上限值可以由阈值ML更好地规定,正如下面更详细地说明的。
在这一点应当提出,原则上自然也可能放大象低于听觉阈Th(f)多于最大放大MA的Sig(f)的值,然而其中这对于最终得到的声波图没有影响,因为在这些频率范围中,通过这样的放大,声级并没有被提升超出在这个范围中的听觉阈。
在这一点应当提出,通常是对所有的频带实行这种比较,以及如果必要的话,实行对应的放大。然而,原则上可以规定:仅仅在一个特定的频率范围中或在不同的频率范围中实行对应的比较,以及在其它频率范围中不实现比较或放大。
对于放大率Amp(f)的计算,提供了变量-在这种情形下是阈值ML。如果信号电平Sig(f)等于或大于听觉阈之上ML,则对于这个信号频带没有放大。图3上显示的是最终得到的阈值Th(f)+ML的量化的渐进,高于该阈值便不发生音频信号Sig(f)的进一步放大。
对于在频率f周围的频带的附加未校正放大率Amp(f)现在可以对于具体的实施例被描述为:
Amp(f)=(Th(f)+ML-Sig(f))*MA/(ML+MA)
对于Sig(f)<Th(f)+ML,
且
Amp(f)=0 对于Sig(f)≥Th(f)+ML.
未校正的放大的信号的渐进在图3的对数刻度上被显示为Sig(f)+Amp(f)。
在下面描述的推断标准化步骤之前的未校正放大率Amp(f)的渐进在图4中被显示为变量α。正如人们对于变量α可以看到的,取决于在听觉阈Th(f)处对于Sig(f)的值,放大率处于值MA,以及在最终得到的阈值Th(f)+ML处(以及对于在这个最终得到的阈值上的Sig(f)的值),放大率处于零。
朝向Sig(f)的较小的信号电平,Amp(f)的渐进显示了一个连续的上升。然而,与图4的例示相反,对于Sig(f)<Th(f)-MA,通常对于Amp(f)的值被设置为零,或者要选择Amp(f)的梯度,以使得对于放大的信号Sig(f)+Amp(f),声级不高于听觉阈Th(f)。
参数ML在这里经由通道的谱能量被规定为ML=c1*SE+c2,具有两个常数c1和c2。优选地,这些常数假设值c1=1和c2=0。参数ML因此是原始信号-也就是说没有按照本发明放大的信号-的感知的谱能量的函数。
通过参数ML对于谱能量的相依性,实现了在所有频率的情形下例如处在接近于或低于听觉阈的音频信号不被放大,使得一段音乐中的静默或安静的段落,或是两段音乐之间的暂停,不被放大或仅仅很弱地放大。
对于所示通道的音频信号的总体谱能量SE,且从而是这个通道的最后所得到的声级,是Sig(f)与Th(f)之间的差值,在所有频带上进行合计:
SE=∑x=1...n{[Sig(fx)-Th(fx)]/n} 对于Sig(fx)≥Th(fx),以及
SE=0 对于Sig(fx)<Th(fx),
其中n表明原始信号的谱被划分成的那些频带的数目,以及fx表征个体频带。对于SE的值在图3中以阴影区域显示。
最后,放大还被标准化为由用户感知的总体谱能量在放大之前和之后大约相同的效果,因为被放大的信号在所有频带中被减小相同的值。
这样得到的、在频带中被校正的(标准化的)放大然后产生:
AmpC(f)=Amp(f)+SE-SEU,
其中
SEU=∑x=1...n{[Sig(fx)+Amp(fx)-Th(fx)]/n}
对于Sig(fx)+Amp(fx)≥Th(fx),以及
SEU=0 对于Sig(fx)+Amp(fx)<Th(fx).
在所选择的对数表示中,放大的校正的信号然后得到为Sig(f)+AmpC(f)。
通过进行这个方法,得到相当小的校正,由此,不再需要借助迭代计算的放大的新近计算-在校正太强的情形下,其可能再次被剧烈地减小。
通过如上所述地确定音频信号的(音频信号的通道的)放大率Amp(f)以及校正的标准化的放大率AmpC(f),得到了非常良好的声音结果。
在多通道音频系统的情形下,原则上将有可能只放大如上所述的一个或几个通道。然而,自然地,最佳的和真实的结果是在音频信号的修改中达到的,具体地是当所有的通道都随之修改时,以及具体地对于每个通道来考虑用户的对应的个体听觉阈。
除了变量α以外,如图4所示,对于放大率Amp(f),显示了另一个可能的变量β。在这个变量β的情形下,对于Sig(f)=Th(f)-MA,放大率假设为值Amp(f)=MA。高于Th(f)-MA,Amp(f)便以线性方式减小趋向Th(f)+ML,以及在Th(f)+ML(和对于高于它的值),放大率变为零。
低于阈值Th(f)-MA,按照图4,放大率Amp(f)=MA。然而在这个范围内,对于用户而言,这个恒定的放大率MA对于声波图不再有任何可听见的影响,使得通常在这个范围内,不再进行放大,且因此Amp(f)=0适用于Sig(f)<Th(f)-MA。
对于特征曲线Amp(f)的选择的另一个变例(这里未示出)是:直接从值MA得出梯度,而不是如上所述的取决于ML而做出梯度,且对于高于Th(f)+ML的信号值的放大率再次变为零。然而,低于这个值,Amp(f)渐进不是由在点Th(f)-MA处的Amp(f)应当等于MA的条件规定,而是由一个梯度以固定的方式来规定,其中这个梯度由=c*MA给出,其中c是任何正的常数,这样,梯度绝不变得比-45°更陡,即使是在MA的最高可能值的情况下。
最后根据图5更详细地说明本发明的另外的有利补充方案。至今为止,还没有考虑声音事件--例如一段音乐--的“原始声级”的概念。正如在本说明的引言中早已提到的,如果声音或者声事件是以“原始音量”(例如,是在音乐厅内等等)被重现的话,则收听者会将声音或声事件感知为“自然的”。
所以特别有利的是按照本发明的音频信号的放大的实施例,其中这个放大完全自然地以原始声级(以及以高于原始声级的声级)来表现。这是如下地达到的:
当前,在音乐记录在紧凑盘(CD)等等的情形下,我们没有有关原始声级的信息。如果这样的信息是可得到的,当然最好可以使用这个原始声级。
如果这个信息不是自动可得到的,则收听者必须自己规定“原始声级”。换句话说,在实际收听音频系统上的记录之前,有利地,他将被播放一个高声的段落(没有进行谱处理),并且将设置音量控制器,以使得听觉印象对于他显现为真实的。高声的段落可以由音频系统例如以所熟悉的峰值搜索的方式,或通过更加快速的算法找出。该段落仅仅应当是相对高声的,以便于可靠地选择真实的声级。然而,它不必一定是绝对最高声的位置。由用户设置的对于原始声级Vol(OL)的值由音频系统SYS存储。
图5现在显示对于最大允许放大率的参数MA作为由音频系统SYS重现的当前声级Vol的函数。在开始确定的原始声级Vol(OL)和高于它的情形下,最大可能放大率MA变为零;在较低音量处,最大放大率MA增加到预定的最大值MAmax。图5显示对于这种上升的曲线的可能过程。
在本发明的情况中的中心点是考虑听觉阈Th(f)作为频率f的函数。原则上,可以规定对于听觉阈Th(f)的典型渐进。然而,考虑已对于用户个别地确定的听觉阈Th(f)要有利得多。
从根本上而言,听觉阈可以与音频系统SYS的个体通道无关地确定;尽管如果对于用户的听觉阈Th(f)是对于音频系统的所有通道来确立,以及按照本发明对于所有通道分开地实行放大要显著地更加有利-因为显然会得到更好的声学结果。这里,听觉阈的确定优选地可由具有音频系统SYS的用户(例如在家中)进行。
如果对于确定被指定给每个通道的频率相关的听觉阈,用户处在他以后喜欢进行收听的地方,则是特别有利的。这样,有利地把室内声学、声影和在用户与扬声器系统之间的距离的影响注入被确定的阈值中。
下面,更详细地概述听觉阈的确定。经由音频系统SYS播放一系列测试声音给用户。用户必须响应这些测试声音。在这个过程中,在音频系统SYS的所有通道之间进行区分。例如,对于图6所示的音频系统,在六个扬声器SPE之间进行区分,或者如果声音是经由耳机HPH重现的,则区分耳机HPH的左面和右面扬声器。换句话说,测试声音序列对于给出的每个通道重复进行。
测试系列也包含用于检验用户响应的有效性的声音。这样的用于确定听觉阈的测试在原则上是在临床领域熟知的。
任选地,可以产生几个数据组,并为用户请求以例如使按照本发明的放大功能对于各个收听位置可用,换句话说,是对于其中用户例如以保持恒定的质量收听音乐的不同位置可用。在这种情形下,当激活在本文档中描述的频率相关的放大功能时,用户也应当声明有关的收听位置。替换地,在音频系统例如可以定位通过其进行激活的遥控装置的条件下,音频系统本身也可以得出收听位置。
在每种情形下,测量值被按用户存储。特别有利的是对于系统的每个用户建立一个或多个数据记录。在这种情形下,当激活在本文档中描述的频率相关的放大功能时,用户也必须标识他自己。
当确定听觉阈时,不必检验在算法中使用的频带中的每个个体频带。记录某些参考点和外推其余参考点就足够了。
作为这样的外推的一种特定形式,可以应用耳声发射的评估。这个方法的优点在于,可以得到良好的频率分辨率,而不需要来自人主体的任何主动响应。该方法在临床领域是常见的,所以,这里不需要进一步说明。人们需要配备有处在听管(auditory canal)中的话筒的封闭的头戴耳机。
图6上显示的是音频系统SYS或A/V系统的示意性框图。在本例中,简略补充了用6个扬声器SPE经由6通道(Dolby5.1)的声音重现或经由立体声头戴耳机HPH(2通道)的声音重现。原则上,本发明可用于任意数量的通道。
这里显示的音频系统SYS包括一系列部件,它们并不一定需要全部出现在组合中,在某些情形下,可以只个别地出现。
具有相应存储器RAM、ROM的设置控制单元SET接管基本的控制任务,以及被连接到音频系统SYS的输入单元INP,以及红外接收机IR,从而与遥控装置通信。设置控制单元SET也激活该音频系统SYS的显示器DIS。
设置控制单元SET也控制该算法,以确定每通道的用户特定的听觉阈Th(f),以及确定如上所述的原始声级设置Vol(OL)。
显示的还有实时数据源RTD,诸如举例而言调谐器、互联网等等,以及另外的数据源DST,例如用于CD、DVD、硬盘、迷你盘等等的回放单元。设置控制单元SET同样激活这两个源RTD和DST。
这两个源RTD和DST像也被示出的外部话筒EMI那样(这个后者经由话筒放大器MAM),被连接到用于选择数据源的单元SSE。
这个单元SSE进而又对于数字数据直接地、或者对于模拟信号经由A/D转换器KON而被连接到数字信号处理设备DSP,这里DSP具有数字信号处理器的形式,这个信号处理器把音频信号经由放大器AMP供应到六个扬声器SPE,或经由另一个放大器AHP供应到头戴耳机HPH。
按照本发明的、用于放大音频信号Sig(f)的上述算法在这里由数字信号处理设备DSP执行,这个数字信号处理设备DSP随之而为此被编程。
藉助于设置控制单元SET被确定的、在听觉阈Th(f)方面的必需数据有利地被存储在设置控制单元SET的存储器RAM中。替换地,它们当然可被存储在数字信号处理设备DSP的存储器RAM或音频系统SYS的另一个可访问存储器中。在音频系统SYS可被连接到互联网的情形下,例如,为了把音频文件这样地下载到音频系统SYS上,可以提供:把与听觉阈Th(f)有关的相应数据从经由互联网可访问的存储器装载到音频系统SYS中。
如果在图6所示的音频系统SYS的情形下,人们假设它是“传统的”所熟悉的音频系统,则为了实现本发明,原则上仅仅需要为数字信号处理设备DSP改变软件来放大音频信号以及来产生用于确定听觉阈的测试系列,以及需要对设置控制单元SET的改变,具体地是控制测试程序和相关于用户接口。用于执行上述方法的信号处理设备DSP的、用于放大音频信号的装置因此是特定软件或是现有软件的扩展。
原则上,本发明可被使用于重现音频信号的任何系统的情形中,包括如上所述的A/V系统的情形。如果信号处理设备DSP是音频系统SYS的一个组成部分,则更是有利的。
原则上,可以规定:用于实施按照本发明的算法的信号处理设备是与音频系统分开设计的,作为分开的或外部的单元,这个外部单元然后被连接到音频系统,用于本发明的目的。显然,这个外部单元然后附加地被建立,用于确定用户的个体听觉阈。
在后者的情形下,可以设想各种可能性,这些可能性根据图6被概述为如下:
a)用于按照本发明的方法的外部单元包括如图所示的系统SYS,然而,其中省略源RTD、DST,并且用可连接传统的音频系统或A/V系统的模拟和/或数字输入代替。
b)在点a)下描述的变例可被进一步减小,因为放大器单元AMP,AHP也可以省略。在这种情形下,数字信号处理单元DSP的输出被连接到例如现有的音频放大器的输入。这里重要的一点是,音量控制经由外部单元影响,而不是经由现有的放大器影响。
c)在点b)下描述的变例可以是对于移动头戴耳机操作的设备进行最佳化,因为单元DST,RTD和SSE被省去。作为替代,外部单元被连接到移动音频设备的头戴耳机输出(或优选地被连接到数字输出,如果存在的话)。在本实施例的情形下,不应用放大器单元AMP。然而,数字信号处理设备DSP的下游是头戴耳机放大器AHP,这样,头戴耳机HPH可以直接连接到外部单元。
Claims (17)
1.一种用于音频信号的声级的频率相关放大的方法,在该方法中:
至少在某个频率范围中,音频信号(Sig(f))被划分成多个(n个)频带(f1…f10),以及
为每个频带(f1…f10)规定一特定的听觉阈(Th(f1)…Th(f10)),以及
对于每个频带(f1…f10),把该频带(f1…f10)中的音频信号(Sig(f))的声级与相应预定的听觉阈(Th(f1)…Th(f10))进行比较,以及
在声级刚刚低于相应个体听觉阈(Th(f2),Th(f3),Th(f4))的那些频带(f2,f3,f4)中的音频信号(Sig(f2),Sig(f3),Sig(f4))被放大,使得在这些频带(f2,f3,f4)中的被放大信号(Sig(f)+Amp(f))的声级高于听觉阈(Th(f))。
2.如权利要求1中要求的方法,其中在声级处在相应的听觉阈(Th(f2),Th(f3),Th(f4))或刚刚高于相应的个体听觉阈(Th(f2),Th(f3),Th(f4))的那些频带(f2,f3,f4)中的音频信号(Sig(f2),Sig(f3),Sig(f4))被放大。
3.如权利要求1或2中要求的方法,其中取决于相关于听觉阈Th(f)的音频信号Sig(f)的声级,在不同频带(f2,f3,f4)中的音频信号(Sig(f2),Sig(f3),Sig(f4))被更强或不太强地放大。
4.如权利要求1到3的任一项中要求的方法,其中对于音频信号Sig(f)的每个通道,规定相应的听觉阈(Th(f)),以及对于每个通道Sig(f)分开地实行音频信号的放大。
5.如权利要求1到4的任一项中要求的方法,其中在声级低于最终得到的阈值(Th(f)+ML)的所有频带中的音频信号(Sig(f))被放大。
6.如权利要求5中要求的方法,其中在声级最明显地低于最终得到的阈值(Th(f)+ML)的那些频带中的音频信号(Sig(f))被最强地放大,以及放大率随在最终得到的阈值(Th(f)+ML)与频带中的音频信号(Sig(f))的声级之间的减小的差值而减小。
7.如权利要求6中要求的方法,其中音频信号(Sig(f))的放大随着频带中的听觉阈(Th(f))被愈加超过而减小,并当达到和高于最终得到的阈值(Th(f)+ML)时变为零。
8.如权利要求1到7的任一项中要求的方法,其中进行在某些频带(f2,f3,f4)中的音频信号(Sig(f))的选择放大后,在所有的频率范围(f1…f10)中进行所放大信号(Sig(f)+Amp(f))的均匀减小。
9.如权利要求8中要求的方法,其中所放大的信号(Sig(f)+Amp(f))的减小被选择成使得由用户感知的音频信号(Sig(f))的总体谱能量(SE)实质上在放大之前和之后呈现相同值。
10.如权利要求1到9的任一项中要求的方法,其中频率范围(f1…f10)的宽度被选择成使得它约为人耳的频率分辨率能力的数量级。
11.如权利要求1到10的任一项中要求的方法,其中在音频信号(Sig(f))的原始声级Vol(OL)处和在高于音频信号(Sig(f))的原始声级Vol(OL)处,音频信号(Sig(f))的最大放大率(MA)变为零,以及在音频信号(Sig(f))的较低声级处,最大放大率(MA)上升到对于最大放大率(MA)的预定的最大值(MAmax)。
12.如权利要求1到11的任一项中要求的方法,其中对于不同的频率范围(f1…f10)的预定的听觉阈(Th(f))是通过确定个人的个体听觉阈而确立的。
13.如权利要求12中要求的方法,其中个体听觉阈(Th(f))是对于音频信号的每个通道(Sig(f))分开地确定的。
14.如权利要求12或13中要求的方法,其中在确定个体听觉阈(Th(f))为频率(f)的函数时,还考虑耳声发射。
15.一种信号处理设备(DSP),具有用于实施如权利要求1到14的任一项中要求的方法的装置。
16.一种具有如权利要求15中要求的信号处理设备(DSP)的音频系统(SYS)。
17.如权利要求16中要求的音频系统(SYS),包括用于确定用户的听觉阈(Th(f))的装置(SET;SPE,HPH)。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05100211.1 | 2005-01-14 | ||
EP05100211 | 2005-01-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101103525A true CN101103525A (zh) | 2008-01-09 |
Family
ID=36097089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800023045A Pending CN101103525A (zh) | 2005-01-14 | 2006-01-05 | 用于音频信号声级的频率相关放大的信号处理设备和音频系统及其方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2008527882A (zh) |
CN (1) | CN101103525A (zh) |
WO (1) | WO2006075264A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104247460A (zh) * | 2012-10-09 | 2014-12-24 | 松下知识产权经营株式会社 | 不舒适声压估计系统、处理器、方法及其计算机程序 |
CN104332050A (zh) * | 2014-10-27 | 2015-02-04 | 浙江省环境保护科学设计研究院 | 一种智能环境噪声与振动监测装置及监测方法 |
CN105450871A (zh) * | 2015-12-03 | 2016-03-30 | 广东欧珀移动通信有限公司 | 一种移动终端通话模式的切换方法和装置 |
CN110960224A (zh) * | 2019-12-31 | 2020-04-07 | 杭州耳青聪科技有限公司 | 听力阈值和/或听力状态检测系统及方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101356206B1 (ko) * | 2007-02-01 | 2014-01-28 | 삼성전자주식회사 | 자동 오디오 볼륨 기능을 갖는 오디오 재생 방법 및 장치 |
CN101937682B (zh) * | 2010-09-16 | 2012-11-21 | 华为终端有限公司 | 一种处理接听语音的方法和装置 |
DE102017218483A1 (de) * | 2017-10-16 | 2019-04-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur einstellung von parametern zur individuellen anpassung eines audiosignals |
NL2020909B1 (en) | 2018-05-09 | 2019-11-18 | Audus B V | Method for personalizing the audio signal of an audio or video stream |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0080538A1 (en) * | 1981-11-26 | 1983-06-08 | A.R.D. Technical Assistance And Engineering Services International Anstalt | Amplifier printed circuit board and mounting system therefor |
JPH01137710A (ja) * | 1987-11-24 | 1989-05-30 | Sumitomo Electric Ind Ltd | 広帯域増幅器 |
US5717773A (en) * | 1993-04-28 | 1998-02-10 | Night Technologies International | Sound system gain and equalization circuit |
JP2002141816A (ja) * | 2000-11-01 | 2002-05-17 | Nec Corp | 並列信号受信回路 |
EP1487100A1 (en) * | 2003-06-09 | 2004-12-15 | STMicroelectronics S.r.l. | Multi-channel power amplifier with channels independently self-configuring bridge or single-ended output, particulary for audio applications |
-
2006
- 2006-01-05 JP JP2007550887A patent/JP2008527882A/ja active Pending
- 2006-01-05 WO PCT/IB2006/050040 patent/WO2006075264A1/en not_active Application Discontinuation
- 2006-01-05 CN CNA2006800023045A patent/CN101103525A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104247460A (zh) * | 2012-10-09 | 2014-12-24 | 松下知识产权经营株式会社 | 不舒适声压估计系统、处理器、方法及其计算机程序 |
CN104247460B (zh) * | 2012-10-09 | 2017-08-25 | 松下知识产权经营株式会社 | 不舒适声压估计系统、处理器、方法及其记录介质 |
CN104332050A (zh) * | 2014-10-27 | 2015-02-04 | 浙江省环境保护科学设计研究院 | 一种智能环境噪声与振动监测装置及监测方法 |
CN104332050B (zh) * | 2014-10-27 | 2017-10-10 | 浙江省环境保护科学设计研究院 | 一种智能环境噪声与振动监测装置及监测方法 |
CN105450871A (zh) * | 2015-12-03 | 2016-03-30 | 广东欧珀移动通信有限公司 | 一种移动终端通话模式的切换方法和装置 |
CN110960224A (zh) * | 2019-12-31 | 2020-04-07 | 杭州耳青聪科技有限公司 | 听力阈值和/或听力状态检测系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2008527882A (ja) | 2008-07-24 |
WO2006075264A1 (en) | 2006-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1798452B (zh) | 实时补偿音频频率响应特性的方法和用该方法的声音系统 | |
US9943253B2 (en) | System and method for improved audio perception | |
TWI580180B (zh) | 用於改進感知頻譜失衡之音訊信號動態補償技術 | |
CN100555848C (zh) | 音频信号处理系统 | |
US9093968B2 (en) | Sound reproducing apparatus, sound reproducing method, and recording medium | |
US20190279652A1 (en) | Efficient drc profile transmission | |
Kates et al. | Using objective metrics to measure hearing aid performance | |
CN101103525A (zh) | 用于音频信号声级的频率相关放大的信号处理设备和音频系统及其方法 | |
JP2013521539A (ja) | 単一再生モードにおいてラウドネス測定値を合成するシステム | |
US20180098720A1 (en) | A Method and Device for Conducting a Self-Administered Hearing Test | |
JP2007043295A (ja) | 増幅装置及び振幅周波数特性調整方法 | |
US20170373656A1 (en) | Loudspeaker-room equalization with perceptual correction of spectral dips | |
KR20190005565A (ko) | 음향 출력 장치 및 그 신호 처리 방법 | |
US20090060209A1 (en) | Audio-signal processing apparatus and method | |
CN112019974B (zh) | 适应听力损失的媒体系统和方法 | |
JP5062055B2 (ja) | 音声信号処理装置及び方法 | |
JP3284176B2 (ja) | オーディオ装置 | |
US20190075395A1 (en) | Speaker Distortion Reduction | |
WO2011034520A1 (en) | System and method for modifying an audio signal | |
KR101405847B1 (ko) | 차량 오디오 시스템의 음질 향상을 위한 신호처리 구조 | |
US11368776B1 (en) | Audio signal processing for sound compensation | |
JP4644876B2 (ja) | 音声処理装置 | |
JP2522139B2 (ja) | 拡声装置 | |
KR102695320B1 (ko) | 헤드폰에서, 청취자의 청각적 인식 특성을 고려하여, 라이브 전관 방송을 수행하는 방법 | |
JP2012213114A (ja) | 音響信号処理装置及び音響信号処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |