CN101151800B - 处理音频数据的方法和装置、程序单元及计算机可读介质 - Google Patents
处理音频数据的方法和装置、程序单元及计算机可读介质 Download PDFInfo
- Publication number
- CN101151800B CN101151800B CN2006800100037A CN200680010003A CN101151800B CN 101151800 B CN101151800 B CN 101151800B CN 2006800100037 A CN2006800100037 A CN 2006800100037A CN 200680010003 A CN200680010003 A CN 200680010003A CN 101151800 B CN101151800 B CN 101151800B
- Authority
- CN
- China
- Prior art keywords
- components
- audio data
- mid
- amplitudes
- range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 title claims description 21
- 230000006835 compression Effects 0.000 description 22
- 238000007906 compression Methods 0.000 description 22
- 238000012546 transfer Methods 0.000 description 16
- 238000012937 correction Methods 0.000 description 13
- 230000009467 reduction Effects 0.000 description 12
- 238000001914 filtration Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 230000006978 adaptation Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
Landscapes
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Traffic Control Systems (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
一种用于处理音频数据(101)的装置(100),其中,该装置(100)包括中频滤波器单元(105),适于以如下方式对音频数据(101)的中频范围分量进行选择性滤波:对音频数据(101)的中频范围分量的不同频率子分量的幅度进行缩放,使得缩放后的幅度反映所述不同频率子分量的原始幅度之间的关系。
Description
技术领域
本发明涉及一种用于处理音频数据的装置。
除此之外,本发明涉及一种处理音频数据的方法。
此外,本发明涉及一种程序单元。
另外,本发明涉及一种计算机可读介质。
背景技术
电子娱乐设备变得越来越重要。具体地,越来越多的用户购买音频播放器以及其他娱乐设备,以在客车等交通工具中使用。
根据现有技术的电子娱乐设备的一个特征是可以以用户定义的方式来调节音频数据的可听再现的特性,例如,通过用户可控音量控制或者用户可控均衡器来调节。已知的音频播放器具备这样的特征。根据现有技术,用户手动对车载HiFi系统进行均衡。
US 2004/0264714 A1公开了一种音频归一化方法。当接收到播放音频文件的请求时,可以从媒体库中或者从音频文件中检索音量归一化参数,并且可以在播放音频文件时应用这些参数。
发明内容
本发明的目的是提供一种处理音频数据的系统,允许以适当质量来再现音频内容。
为了实现上述目的,提供了根据独立权利要求的用于处理音频数据的装置、处理音频数据的方法、程序单元和计算机可读介质。
根据本发明的示例性实施例,提供了一种用于处理音频数据的装置,其中,该装置包括中频滤波器单元,适于以如下方式对音频数据的中频范围分量进行选择性滤波:对音频数据的中频范围分量的不同 频率子分量的幅度进行缩放,使得缩放后的幅度反映所述不同频率子分量的原始幅度之间的关系。
另外,根据本发明的另一示例性实施例,提供了一种处理音频数据的方法,包括如下步骤:以如下方式对音频数据的中频范围分量进行选择性滤波:对音频数据的中频范围分量的不同频率子分量的幅度进行缩放,使得缩放后的幅度反映所述不同频率子分量的原始幅度之间的关系。
除此之外,根据本发明的另一示例性实施例,提供了一种计算机可读介质,其中存储有处理音频数据的计算机程序,该计算机程序在由处理器执行时,适于控制或执行上述方法步骤。
此外,根据本发明的又一示例性实施例,提供了一种处理音频数据的程序单元,该程序单元在由处理器执行时,适于控制或执行上述方法步骤。
根据本发明对音频数据的处理可以通过计算机程序,即软件来实现,或者可以通过使用一个或多个专用电子优化电路,即硬件来实现,或者可以以混合形式,即利用软件组件和硬件组件来实现。
根据本发明的特征尤其具有如下优点:可以提供中频滤波器单元,其可以用作一种均衡器,尤其是工作于中频音频数据的范围中。该滤波器能够以如下方式对该中频范围中的子分量(例如,子频带或单个频率)进行单独缩放(尤其是缩小):缩放后的幅度反映不同频率子分量的原始幅度之间的关系。也就是说,在修改后的幅度中至少部分保留子分量之间的原始幅度差。因此,可以通过再缩放(rescaling)方案考虑不同子分量之间的幅度关系,这允许维持原始中频音频数据的声音特性,同时剪裁中频范围以改进声音质量。
根据本发明示例性实施例的缩放方案可以确保将中频范围保持在特定的预定幅度范围内。可选地,与中频域不同的频率区域可以或可以不根据相同或不同的滤波方案来滤波。可以以如下方式执行中频范围的再缩放:维持该频率范围的子分量中的原始幅度之间的比例。
因此,根据本发明的示例性实施例,提供了一种平滑且有效的中频范围滤波算法,在播放自动均衡的音频内容时,能够实现适当的聆 听质量和自然的声音。可以以合理低的计算负担来实现滤波算法。由处理后的音频数据产生的声音可以具有自然特性,因为可以至少部分保持不同中频范围子部分中的原始幅度关系。
根据本发明的示例性实施例,可以实现使用中频范围增强(boost)压缩(具体地是利用线性缩放)的自动均衡。具体地,这可以允许在车载HiFi系统中以自动且高质量的方式执行均衡。
根据本发明的一个方面,可以根据均衡算法来处理要由扬声器系统再现的音频数据,该均衡算法可以对音频数据进行处理以改进聆听质量。根据这种算法,可以计算需要插入信号路径中的滤波器,以在聆听位置实现适当的声音质量。然后可以对音频数据的不同频率范围单独修改该滤波器。
具体地,可以执行中频范围中的校正。术语“中频范围”可以具体地表示音频频率的中间频带,并且可以覆盖例如约310Hz和约8kHz之间(更具体地,700Hz和4kHz之间的范围)的频率。中频范围也可以根据原始频谱通过将其分为低频域(如果需要,可以进一步分为两个子范围)、中频域和高频域来定义。换句话说,术语中频范围可以定义为夹在低频域和高频域之间的频率范围。然后,与较低和较高频率相比,可以根据单独的滤波算法来处理中频域。
根据US 6,381,334 B1,中频范围频带具体地可以覆盖500Hz和5kHz之间的频率。
根据本发明实施例的中频范围校正可以简单地将整个中频范围设置为恒定的增强目标等级(例如,3dB)。然而,更精细的解决方案还可以限制中频范围增强等级(boost level),但是可以保留不同中频范围频率子带彼此之间的比例。更为精细的方案可以对中频范围区域上的缩小因子进行线性缩放。
可选地,除了中频范围滤波之外,低音(低频)和高音(高频)频带也可以优化。对于低音范围中的极低频,可以执行削减(cut)。较高的低音频率可以根据增强限制(例如,8dB)来调整。高音频率可以固定到恒定值(例如,对于车载声音系统的前扬声器为3dB,对于车载声音系统的后扬声器为-3dB)。
根据本发明的示例性实施例,实现了在具有高反射表面的小容量车箱中的自动均衡。在这种声学环境中,声场可以受到声源奇异位置的严重影响。尤其对于中频范围,可以获得良好平衡和明亮的声音。
根据本发明的系统的示例性应用领域是有限房间(如车箱)中的扬声器系统。
根据本发明的一个方面,提供了一种自动均衡器,具有保留彼此比例关系的中频范围增强压缩以及线性缩放。因此,可以提供音频均衡器,使用线性缩放技术来增强中频范围。
根据本发明示例性实施例的中频范围增强压缩方案可以作用于谱数据(根据本发明的示例性实施例,不是作用于时域数据),并且最初目的不是通过防止限幅来增加音量。与此相反,根据本发明的系统的目的是使声音均衡,同时保留FFT(快速傅立叶变换)元(bin)即谱带彼此之间的比例。
根据本发明,实现了自动扬声器均衡,具体地是自动中频范围增强压缩。因此,可以大大改进扬声器(例如,扩音器)再现的声音。
根据本发明示例性实施例的系统因此可以允许自动均衡,尤其在汽车中。为此目的,滤波器可以适于以单独且不同的方式来处理不同频域。为了确定滤波器的参数,可以测量该系统要实现的声学环境中的声音,并且由系统执行滤波器适配,使得声音可以被均衡。根据本发明的装置的滤波器可以针对汽车中的驾驶员位置或者针对副驾驶员的位置而调节。可选地,可以通过对汽车中所有乘客的所有位置进行插值来执行滤波器适配,使得可以获得对汽车中所有乘客平均而言提供最优声音(在不同需求之间折中)的滤波器。
一种可能性是汽车制造商测量车内的声学特性,并执行一次滤波计算。然后,可以在车中实现该计算且优化的滤波器,而不再次改变滤波器配置。可选地,车中的音频系统可以向用户提供调节作为缺省值的滤波器参数的机会。为此,可以通过调节过程引导用户,例如,通过用户界面,在该用户界面中,用户可以输入框架条件的参数的希望值。然后,可以考虑用户定义的规范,来执行滤波计算。此外,如果需要,用户可以重复滤波器优化过程,例如用来针对修改的框架条 件而调节滤波器参数。根据本发明的另一示例性实施例,可以提供这样的系统,其中麦克风检测车中一个或多个特定位置(例如,靠近驾驶员的位置)处的声音,并以自适应的方式执行滤波器参数的在线或实时适配。
参考从属权利要求,描述本发明进一步的示例性实施例。
接着,将描述用于处理音频数据的装置的示例性实施例。这些实施例也可以应用于处理音频数据的方法,应用于计算机可读介质和程序单元。
在该装置中,中频滤波器单元可以适于以如下方式对音频数据的中频范围分量进行选择性滤波:将音频数据的中频范围分量的不同频率子分量的幅度缩小,使得缩小后的幅度反映所述不同频率子分量的原始幅度之间的关系或比例。换句话说,通过缩小中频范围,可以避免中频音频分量过度扩大,而过度扩大会导致恶劣或奇怪的声音。因此,所述实施例实现了中频分量幅度的限制以及中频域中不同子频带之间关系的维持。
根据另一实施例,中频滤波器可以适于以如下方式对音频数据的中频范围分量进行选择性滤波:对作为音频数据的中频范围分量的不同频率子分量的1/3八度音程(octave)频带的幅度进行缩放,使得缩放后的幅度反映1/3八度音程频带的原始幅度之间的关系。通过将每个八度音程分为3个频带,获得了足够精细而对处理资源而言复杂度可接受的中频范围滤波。这也可以允许滤波器参数的实时处理和自适应更新。采取这种措施,实现了快速计算过程以及足够精细的分析。然而,虽然选择1/3八度音程足够精细同时复杂度可接受,但是如果希望或有必要的话,这种选择当然可以更加精细或者粗略。
另外,中频滤波器单元可以适于以如下方式对音频数据的中频范围分量进行选择性滤波:对音频数据的中频范围分量的不同频率子分量的幅度进行缩放,保留所述不同频率子分量的幅度之间的比例。通过保留不同子带之间的比例或相对强度比例,可以使声音不会修改太多,从而不会恶化聆听者的声学体验。
除此之外,该装置可以包括缩放单元,适于通过估计不同频率子 分量的最大幅度,以及基于所估计的最大幅度与指示幅度上限的预定阈值,来计算用于对音频数据的中频范围分量的不同频率子分量的幅度进行缩放的缩放因子。在这种情况下,首先可以确定不同中频范围子频带中哪个具有最高音频幅度。然后,可以将该最高幅度与最大允许的阈值相比较,并且如果超出阈值,则减小幅度,以确保再缩放的幅度不会超过预定阈值。然后可以对中频域的所有子频带采取这种缩小因子,以将它们缩小,但是维持原始比例。
仍然参考前述实施例,中频滤波器单元可以适于以如下方式对音频数据的中频范围分量进行选择性滤波:根据所计算的缩放因子,将音频数据的中频范围分量的所有不同频率子分量的幅度缩小。换句话说,可以应用缩放因子来对所有不同中频子带分量进行相应地缩小。
具体地,中频滤波器可以适于以如下方式对音频数据的中频范围分量进行选择性滤波:根据所计算的缩放因子,将音频数据的中频范围分量的不同频率子分量的幅度按对数缩小。
另外,该装置可以可选地包括缩放因子调节单元,该单元可以适于对每个不同频率子分量单独调节先前计算的缩放因子。换句话说,在计算了基本公共缩放因子之后,可以对中频域中的每个子频带单独调节缩放因子,以进一步改进处理过的音频数据在再现时的主观质量,并使分析精细。
具体地,缩放因子调节单元可以适于通过对不同频率子分量线性缩放所计算的缩放因子,来调节所计算的缩放因子。这种线性缩放技术采用子带的频率作为参数,其影响特定子域中调节后缩放因子的值。
例如,缩放因子调节单元可以适于调节所计算的缩放因子,使得针对第一频率子分量的调节后缩放因子高于针对第二频率子分量的调节后缩放因子,其中第一频率子分量可以包括比第二频率子分量高的频率。根据该实施例,子范围的频率越高,缩放因子可以越大。具体地,调节后的缩放因子可以与每个子范围的频率线性相关。
另外,中频滤波器单元可以适于对音频数据中在作为中频范围的约0.3kHz和约8kHz之间的频率范围中的分量进行选择性滤波。然而,所指出的频率范围仅是示例性的,并且可以扩展到较小频率或较大频 率。
根据本发明示例性实施例的装置还可以包括高频滤波器单元,可以适于以如下方式对音频数据的高频范围分量进行选择性滤波:将音频数据的高频范围分量的不同频率子分量的幅度固定到恒定的预定值。也就是说,可以将中频范围之上的所有频率分量设置为固定的幅度值。原因可能是,在例如大于8kHz的高频,在许多情况下不需要进行平衡校正以拉平色彩(coloring)。因此,可以对这些增强等级实施相对的硬限制。这种方案可以允许以低计算负担,并因此以非常迅速的方式来计算高频校正值。
高频滤波器单元可以适于对音频数据中在中频范围之上的频率范围中的分量进行选择性滤波。具体地,高频域可以覆盖约8kHz之上的所有频率分量。
另外或者可选地,该装置可以包括极低频滤波器单元,适于以如下方式对音频数据的极低频范围分量进行选择性滤波:削减极低频范围分量。极低频,例如约40Hz之下的频率,可能是扬声器系统不能再现的。因此,可以简单地将这些频率值滤除。因此,可以在信号路径中省略任何极低频滤波器。
极低频单元具体地可以适于对音频数据中在约40Hz之下的频率范围中的分量进行选择性滤波。
根据本发明的另一示例性实施例,该装置可以包括低频滤波器单元,适于以如下方式对音频数据的低频范围分量进行选择性滤波:对极低频范围分量进行调整,使得未超过预定最大阈值的幅度保持不变;而且超过预定最大阈值的幅度被减小到最大阈值。这种低频滤波器单元可以适于对极低频范围和中频范围之间(例如,40Hz和310Hz之间)的频率分量进行滤波或处理,在没有超出最大幅度时可以保持不受滤波处理的影响。然而,如果是这种情况,则将幅度限制到预定值
根据本发明的装置还可以包括再现单元,用于再现处理后的音频数据。换句话说,输入音频数据可以被提供给该装置,可以由滤波器进行处理,然后可以作为处理过的音频数据提供给再现单元,用于以可由聆听者听见的方式来再现处理过的音频数据。因此,用于再现处 理过的音频数据的装置可以是扬声器或耳机。
根据本发明的系统的主要应用领域在于处理音频数据。然而,该系统可以嵌入场景(scenario)中,其中除了音频数据外,还处理另外的数据,例如与可视内容相关的数据。因此,本发明可以以视频数据处理系统的框架来实现。
根据本发明的装置还可以实现为包括如下各项的组中的一项:车载音频系统、便携式音频播放器、便携式视频播放器、头戴显示器、移动电话、DVD播放器、CD播放器、基于硬盘的媒体播放器、互联网无线设备、公共娱乐设备、以及MP3播放器。术语“车载音频系统”可以具体表示安装或适于安装在任何种类交通工具(例如,小汽车、货车、卡车、轮船、飞机、或火车)中的音频系统。然而,优选的应用领域是客车,其中可能具有特别的声学特性,可以利用根据本发明的系统对此进行极好的处理。虽然上述设备涉及本发明的主要应用领域,但是其他应用也是可能的。
根据下文将描述的实施例示例,本发明的上述方面和其他方面将显而易见,并且参考这些实施例示例进行描述。
附图说明
电子娱乐设备变得越来越重要。具体地,越来越多的用户购买音频播放器以及其他娱乐设备,以在客车等交通工具中使用。
根据现有技术的电子娱乐设备的一个特征是可以以用户定义的方式来调节音频数据的可听再现的特性,例如,通过用户可控音量控制或者用户可控均衡器来调节。已知的音频播放器具备这样的特征。根据现有技术,用户手动对车载HiFi系统进行均衡。
US 2004/0264714 A1公开了一种音频归一化方法。当接收到播放音频文件的请求时,可以从媒体库中或者从音频文件中检索音量归一化参数,并且可以在播放音频文件时应用这些参数。
下文将参考如下附图中的示例性实施例,更加详细地描述本发明:
图1示出了根据本发明示例性实施例的用于处理输入音频数据的 装置的示意图。
图2示出了根据本发明示例性实施例的算法的示意图。
图3示出了说明传递函数“左前扬声器-驾驶员位置处的麦克风”的FFT(快速傅立叶变换)的曲线图。
图4示出了说明缩放后的传递函数“左前扬声器-驾驶员位置”的曲线图。
图5示出了说明按1/3八度音程频带的缩放后传递函数“左前扬声器-麦克风”的曲线图。
图6示出了说明图5的传递函数的反转的曲线图。
图7示出了说明低音增强调整的曲线图。
图8示出了说明对图7所示的中频范围增强进行硬限制的曲线图。
图9示出了原始传递函数、利用理论均衡的传递函数以及利用实际均衡的传递函数的比较。
图10示出了说明保留彼此比例关系的中频范围增强压缩的结果的曲线图。
图11示出了说明利用线性缩放的中频范围压缩的结果的曲线图。
图12示出了没有进行中频范围压缩时线性缩放对低中频带的影响。
图13示出了进行中频范围压缩时线性缩放对低中频带的影响。
图14示出了进行中频范围压缩和线性缩放时线性缩放对低中频带的影响。
图15示出了说明高频校正的曲线图。
图16示出了说明根据本发明实施例的滤波器操作的概观的曲线图。
具体实施方式
附图中的图示都是示意性的。在不同附图中,相似或相同的单元具有相同的标记。
下面参考图1,描述根据本发明示例性实施例的用于处理输入音 频数据101的装置100的示意图。
装置100包括存储单元102,其中存储待播放的音频内容,包括输入音频数据101。在本示例中,存储单元102被设计为插入在CD播放器中。但是,存储单元102可以是存储有MP3文件的硬盘等。
将输入音频数据101提供给滤波器单元,用于获得输出音频数据109。滤波器单元具体的是可选的极低频滤波器单103、低频滤波器单元104、中频滤波器单元105和高频滤波器单元106。
极低频滤波器单元103适于以如下方式对输入音频数据101中频率低于40Hz的频率分量进行选择性滤波:削减即消除这些极低频分量。因为该极低频范围分量在许多情况下不会对输出音频数据109做出重大贡献(因为扬声器110可能不能够再现该频率范围中的音频分量),所以极低频滤波器单元104可以在图1中简单地省略。但是,在再现单元也能再现极低频分量或者极低频范围中的分量应该在输出音频数据109中实现时的另一情况中,可以相应地调节该极低频滤波器单元103。
低频滤波器单元104可以适于对输入音频数据101中40Hz和310Hz之间频率范围中的分量进行选择性滤波。在该频率域中,低频滤波器单元104可以按照对低频范围分量进行调整的方式来对输入音频数据101的该低频范围分量进行选择性滤波。更具体地,这些分量在其幅度没有超出其最大阈值(例如,8dB)时可以维持不变,而在该分量幅度超过最大阈值时可以减小到8dB的最大阈值。
另外,图1示出了中频滤波器单元105,该中频滤波器单元105适于以如下方式对输入音频数据101中的中频范围分量,具体的是310Hz和8kHz之间频率范围中的分量进行选择性滤波:对输入音频数据101的中频范围分量的不同频率子分量的幅度进行缩放,使得缩放后的幅度反映不同频率子分量的原始幅度之间的关系或比例。例如,可以将中频划分为预定数目的子带或区间,例如分为十五(15)个区间。然后,可以对十五(15)个区间中的幅度进行缩放(缩小),使得一般地保持他们原始的关系。为此,可以将中频频带分为1/3八度音程(1/3-octave)频带,并且可以执行缩小,使得不同频率子分量的幅 度之间的比例可以得到保留。
具体地,中频滤波器单元105可以包括缩放单元107,该缩放单元107可以适于基于不同频率子分量的最大幅度以及基于指示幅度上限的预定阈值,计算用于对输入音频数据101的中频范围分量的不同频率子分量的幅度进行缩放的缩放因子。例如,估计十五(15)个频带中哪个具有最高幅度。然后将该幅度按照特定缩小因子进行缩小,该特定缩小因子可以基于预定阈值和所估计的最大幅度之间的比例来确定。
然后,缩放因子调节单元(18)可以进一步调节缩放因子(例如,可以为四(4)),使得针对十五(15)个频率子分量中每个一来单独调节所计算的缩放因子。具体地,这可以通过对不同频率子分量来线性缩放所计算的缩放因子而得以执行。下面将更加详细地描述该过程。
高频滤波器单元106适于以如下方式对音频数据101中的高频范围分量(例如,高于8kHz的分量)进行选择性滤波:将音频数据101的高频范围分量的不同频率子分量的幅度固定为恒定的预定值,例如3dB。
由滤波单元103至106滤波后的分量可以求和,并可以作为输出音频数据109提供给扬声器110,扬声器110然后例如可以在车载环境中以可听的方式再现处理过的音频数据109。
下面将参考图2至图16更加详细地描述根据本发明的系统的示例性实施例。
根据本发明的一个方面,提供了一种算法,设计用于对扬声器系统进行自动均衡。这可以实现用于车厢中,但是不限于这种应用。这里,声场可以受到声源奇异位置的严重影响。另外,车厢的体积较小以及某些表面可能是高度反射性的事实可能产生明显的共振,这可以导致频率响应的较大改变。
下面,参考图2,示意性地描述根据本发明示例性实施例的算法200。
算法200包括两部分,即测量和测量调整部分201以及随后的逆滤波计算和滤波调整部分202。
首先,将更加详细地描述测量和测量调整部分201。
对每个声道,可以通过相应的扬声器播放以48kHz采样的白噪声信号并可以通过聆听位置处的麦克风来记录。可以使记录通过算法200的另一部分,该部分通过截止频率为40Hz的二阶Butterworth高通滤波器来对这些记录滤波,以去除直流(DC)分量。此后,可以估计噪声生成与待解释的第一有用样本之间的延时。不是代表性的样本可以去除。
下面,将更加详细地描述逆滤波计算和滤波调整部分202。
首先,可以进行FFT(快速傅立叶变换)和基准计算。
对于每个声道(例如,常规汽车中的四个声道),可以计算快速傅立叶变换(FFT)。FFT长度可以设为16.384点。可能需要该频率分辨率(±3Hz)以具有适宜的低端精度。
图3示出了说明传递函数“左前扬声器-驾驶员位置处的麦克风”的FFT的曲线图300。
沿曲线图300的横坐标301,按Hz以对数标度绘制了频率。沿曲线图300的纵坐标302绘制了以dB计的幅度。
为了确定基准(例如0dB),可以利用50Hz和1000Hz之间的能量的平均来缩放FFT。该频带中的能量可能与头部周围的麦克风位置无关。
图4示出了说明缩放后的传递函数“左前扬声器-驾驶员位置”的曲线图400。
精确的低端分辨率所需的相对大的FFT长度还意味着准确而不必要的高端分辨率。具有大的高端分辨率的均衡滤波器可能由于可能出现的尖锐峰值而导致不可避免的“振荡”。因此,FFT可以分为25Hz至20kHz范围中的1/3八度音程。第一1/3八度音程值可以是25Hz、31.5Hz、40Hz、50Hz和63Hz。这可以解释为什么之前可以适当地选择3Hz的频率精度。
图5示出了说明按照1/3八度音程频带的缩放后传递函数“左前扬声器-麦克风”的曲线图500。
下面将更加详细地描述逆滤波计算。
需要插入信号部分中以在聆听位置具有平坦响应的滤波器可以是传递函数的反转,见图5。
图示曲线图600的图6中示出了该“原始”反转。
接着,将描述低频校正。
图1中的滤波器103、104可以实现该低频校正。然而,极低频滤波器103可以从信号路径中省略,因为均衡滤波器不必增强扬声器系统不能再现的频率。作为替代,可以将25Hz、31.5Hz和40Hz频带中的信号削减12dB。这可以给信号提供额外的净空(headroom)。取决于需要均衡的扬声器响应,需要削减更多或更少的低频带。此外,需要减小大的增强等级,以避免失真。最大低音增强等级可以调节。根据缺省,可以将值设置为8dB,并且可以限制低音增强直到250Hz。
图7示出了低音调整的结果,其中图7图示了曲线图700,用于示出低音增强调整。
接着,将解释中频范围校正。
图7示出了在约700Hz和约4kHz之间的频域中的较大中频范围增强,这是应该避免的。直接的解决方案是硬限制增强等级。聆听试验证明该等级应该最大为3dB。现在,滤波器是简单的中频范围增强,而非均衡滤波器。这在图8的曲线图800中示出。
换句话说,图8示出了曲线图800,用于说明对700Hz和4kHz之间的频域中的中频范围进行硬限制。
声音现在可能更明亮,但是可能不是非常平衡。理论上,均衡的目标是在聆听位置获得平坦的传递函数。由于大的增强等级,这通常不能实现。具体地,均衡可以通过精细的校正,拉平相邻频率或频带的幅度差。
这在图9中进行了说明,图9示出了理论均衡相对实际均衡。
图9示出了第一曲线图900,该曲线图用于说明原始传递函数。
第二曲线图901涉及理论均衡,并且示出了传递函数。
第三曲线图902示出了实际均衡,并且示出了传递函数。
下面,将描述保留彼此比例关系的中频范围增强压缩。
准备了专门的系统,该系统通过保留1/3八度音程频带彼此之间 的比例,限制(具体地,压缩)中频范围增强等级。该过程可以自动进行,并且将在下面进行描述。
可以在310Hz和8kHz之间的频带中搜索最大(中频范围)增强。可以将该最大值与目标值(设为3dB的标准)相比较,以得到用于整个中频范围的缩小因子。
例如,参考图7,最大中频范围增强是12dB(1.25kHz)。可以将缩小因子计算为12/3=4。
现在,可以利用该因子以对数方式对整个中频范围区域进行缩小。这实际上是对增强等级的压缩,因为对数领域的除法可以对应于线性领域的n次幂方根。
在保留彼此比例关系的同时,大增强被减小的幅度可以大于小增强被减小的幅度:24dB(16)变为6dB(2),6dB(2)变为1.5dB(1.2)。
图10所示的曲线图1000示出了中频范围缩放的结果,如前所述。
然而,根据图10的中频范围增强压缩或中频范围校正可以被进一步优化,尤其是由于如下两个原因:
首先,可以对310Hz频带进行缩放,而不对250Hz频带进行缩放。假设250Hz和310Hz频带需要增强10dB。由于中频范围缩放,310Hz例如可以被缩放至2.5dB。于是,过渡增强等级的差异可能太大。
其次,感觉上,可以使低中频带增强的幅度大于高中频带,然后听起来比较强烈。因此,可能不必将低中频增强等级减小与高中频增强等级一样大的幅度,这样获得“更平坦”的声音。
下面,将描述利用线性缩放的中频范围增强压缩。
由于上述方面的原因,可以引入调节系统,该系统可能能够在整个中频范围区域上线性缩放缩小因子。中频范围区域可以设置在310Hz和8kHz之间,包含了总共15个频带(310Hz到400Hz,400Hz到500Hz,500Hz到630Hz,…,5000Hz到6300Hz,6300Hz到8000Hz)。
原始缩小因子通过使用如下公式,可以适配频带:
“每频带的缩放因子=1+(缩放因子-1)*频带号/频带数”
假设固定的缩小因子为4,则得到如下结果:
对310Hz频带,缩小因子变为1+(4-1)*1/15=18/15,
对400Hz频带,缩小因子变为1+(4-1)*2/15=21/15,
对8kHz频带,缩小因子变为1+(4-1)*15/15=60/15=4。
310Hz频带可以缩小,但是不多。这样,从250Hz频带的原始过渡可以保持几乎不变。此外,高中频带增强的幅度可以小于低中频带,这可以得到不那么强烈的声音。
这意味着只有在8kHz处出现标称最大增强时才可以达到原始目标值,因为在该处缩小因子达到其完全的大小。实际上,大多数扬声器系统可能具有向着较高频率的自然滚降(roll-off),因此,最大增强等级在这些较高频率处出现的机会相当大。因此一般而言,对高中频带获得的最大增强等级不会与假定的目标值相差太多。
图11示出了曲线图1100,用于说明利用线性缩放的中频范围压缩。
可能不是非常容易将图11和图10进行直观比较,因为在700Hz以下无增强(削减(cut)没有被压缩,因此保持不变)。
因此,根据图12至图14的曲线图示出了线性缩放对低中频带的影响的例子。原始滤波器根据右声道传递函数测量得出。
具体地,图12示出了未经中频范围压缩的曲线图1200。
未经中频范围压缩,声音可能是强烈的(大的增强等级)。
图13示出了曲线图1300,用于说明中频范围压缩。
利用中频范围压缩,高中频声音将被良好地平衡,但是低中频声音仍然可以改进。
下面,参考图14,描述曲线图1400,用于说明利用线性缩放的中频范围压缩。
利用中频范围压缩和线性缩放,可以实现最优中频范围均衡。可以在低中频声音中获得最大平坦的声音,因为压缩保留彼此的比例关系,向着低音(增强)具有完美的交叉。在高中频声音中,由于线性缩放,以精细且按比例的方式将峰谷拉平,得到良好平衡、不强烈的声音。频率切点(cut)保持不变。
下面,参考图15所示的曲线图1500,描述高频校正。
在8kHz以上,可能需要平衡校正,以拉平色彩(coloring)。因 此,可以对这些增强等级施加硬限制。8kHz以上的小增强可以显著地加宽立体声像。因为在车中,对于常规立体声,前后扬声器相同地播放,可以对前声道施加固定的高音增强(如果必要的话),并且对后声道施加固定的削减。这可以将声音像拉到聆听者前方。
前声道中的增强可以固定为+3dB,并且后声道的削减可以固定为-3dB(在前后声道之间给出6dB的差异)。
图15所示的曲线图1500示出了所述的高频校正(对于前声道)。
图16示出了曲线图1600,给出了根据本发明的上述实施例的滤波器操作的概观。
频域分为低音域1601、中间域1602和高音域1603。低音域1601进一步分为极低频区域和低频区域。参考低音域1601,削减极低频区域(-12dB)。利用最大8dB的增强限制来处理低频区域。在中间域1602,执行利用线性缩放的中频范围压缩。在高音域1603,对汽车的前扬声器,幅度固定为+3dB,而对汽车的后扬声器,幅度固定为-3dB。
应该注意,术语“包括”并不排除其他单元或步骤,并且单数形式不排除复数形式。此外,结合不同实施例描述的单元可以组合。
还应注意,权利要求中的附图标记不应理解为对权利要求范围的限制。
Claims (17)
1.一种用于处理音频数据(101)的装置(100),其中,
该装置(100)包括中频滤波器单元(105),该中频滤波器单元(105)适于以如下方式对音频数据(101)的中频范围分量进行选择性滤波:对音频数据(101)的中频范围分量的不同频率子分量的幅度进行缩放,使得缩放后的幅度反映所述不同频率子分量的原始幅度之间的关系;
其中,中频滤波器单元(105)包括缩放单元(107),该缩放单元(107)适于通过估计不同频率子分量的最大幅度,以及基于所估计的最大幅度与指示幅度上限的预定阈值,来计算用于对音频数据(101)的中频范围分量的不同频率子分量的幅度进行缩放的缩放因子;
其中,中频滤波器单元(105)包括缩放因子调节单元(108),该缩放因子调节单元(108)适于对每个所述不同频率子分量单独调节所计算的缩放因子;
其中,缩放因子调节单元(108)适于通过对不同频率子分量线性缩放所计算的缩放因子,来调节所计算的缩放因子。
2.根据权利要求1所述的装置(100),其中,将音频数据(101)的中频范围分量的不同频率子分量的幅度缩小。
3.根据权利要求1所述的装置(100),其中,对作为音频数据(101)的中频范围分量的不同频率子分量的1/3八度音程频带的幅度进行缩放,使得缩放后的幅度反映1/3八度音程频带的原始幅度之间的关系。
4.根据权利要求1所述的装置(100),其中,对音频数据(101)的中频范围分量的不同频率子分量的幅度进行缩放,保留所述不同频率子分量的幅度之间的比例。
5.根据权利要求1所述的装置(100),其中,根据所计算的缩放因子,将音频数据(101)的中频范围分量的所有不同频率子分量的幅度缩小。
6.根据权利要求1所述的装置(100),其中,根据所计算的缩放因子,将音频数据(101)的中频范围分量的不同频率子分量的幅度按对数方式缩小。
7.根据权利要求1所述的装置(100),其中,缩放因子调节单元(108)适于调节所计算的缩放因子,使得针对第一频率子分量的调节后缩放因子高于针对第二频率子分量的调节后缩放因子,所述第一频率子分量包括比第二频率子分量高的频率。
8.根据权利要求1所述的装置(100),其中,中频滤波器单元(105)适于对音频数据(101)中在作为中频范围的0.3kHz和8kHz之间的频率范围中的分量进行选择性滤波。
9.根据权利要求1所述的装置(100),包括高频滤波器单元(106),该高频滤波器单元(106)适于以如下方式对音频数据(101)的高频范围分量进行选择性滤波:将音频数据(101)的高频范围分量的不同频率子分量的幅度固定到恒定的预定值。
10.根据权利要求9所述的装置(100),其中,高频滤波器单元(106)适于对音频数据(101)中在中频范围之上的频率范围中的分量进行选择性滤波。
11.根据权利要求1所述的装置(100),包括极低频滤波器单元(103),该极低频滤波器单元(103)适于以如下方式对音频数据(101)的极低频范围分量进行选择性滤波:削减极低频范围分量。
12.根据权利要求11所述的装置(100),其中,极低频滤波器单元(103)适于对音频数据(101)中在0.04kHz之下的频率范围中的分量进行选择性滤波。
13.根据权利要求1所述的装置(100),包括低频滤波器单元(104),该低频滤波器单元(104)适于以如下方式对音频数据(101)的低频范围分量进行选择性滤波:对低频范围分量进行调节,使得
未超过预定最大阈值的幅度保持不变;而且
超过预定最大阈值的幅度被减小到最大阈值。
14.根据权利要求13所述的装置(100),其中,低频滤波器单元(104)适于对音频数据(101)中在极低频范围和中频范围之间的频率范围中的分量进行选择性滤波。
15.根据权利要求1所述的装置(100),包括再现单元(110),该再现单元(110)适于再现处理后的音频数据(109)。
16.根据权利要求1所述的装置(100),被实现为包括如下各项的组中的一项:车载音频系统、便携式音频播放器、便携式视频播放器、头戴显示器、移动电话、DVD播放器、CD播放器、基于硬盘的媒体播放器、互联网无线设备、公共娱乐设备、以及MP3播放器。
17.一种处理音频数据(101)的方法,其中,该方法包括如下步骤:
以如下方式对音频数据(101)的中频范围分量进行选择性滤波:
对音频数据(101)的中频范围分量的不同频率子分量的幅度进行缩放,使得缩放后的幅度反映所述不同频率子分量的原始幅度之间的关系;
其中,
通过估计不同频率子分量的最大幅度,以及基于所估计的最大幅度与指示幅度上限的预定阈值,来计算用于对音频数据(101)的中频范围分量的不同频率子分量的幅度进行缩放的缩放因子;
对每个所述不同频率子分量单独调节所计算的缩放因子;以及
通过对不同频率子分量线性缩放所计算的缩放因子,来调节所计算的缩放因子。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05102801.7 | 2005-04-08 | ||
EP05102801 | 2005-04-08 | ||
PCT/IB2006/051019 WO2006106479A2 (en) | 2005-04-08 | 2006-04-04 | A method of and a device for processing audio data, a program element and a computer-readable medium |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101151800A CN101151800A (zh) | 2008-03-26 |
CN101151800B true CN101151800B (zh) | 2012-03-28 |
Family
ID=36660203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800100037A Active CN101151800B (zh) | 2005-04-08 | 2006-04-04 | 处理音频数据的方法和装置、程序单元及计算机可读介质 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8335323B2 (zh) |
EP (1) | EP1869766B1 (zh) |
JP (1) | JP2008535436A (zh) |
CN (1) | CN101151800B (zh) |
AT (1) | ATE435523T1 (zh) |
DE (1) | DE602006007564D1 (zh) |
WO (1) | WO2006106479A2 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009039897A1 (en) | 2007-09-26 | 2009-04-02 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
CN101897118A (zh) * | 2007-12-11 | 2010-11-24 | Nxp股份有限公司 | 防止音频信号限幅 |
CN102016995B (zh) | 2008-07-29 | 2013-07-10 | Lg电子株式会社 | 用于处理音频信号的设备及其方法 |
US8538043B2 (en) | 2009-03-08 | 2013-09-17 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
CN102208901B (zh) * | 2010-03-31 | 2014-04-23 | 安凯(广州)微电子技术有限公司 | 一种mp3解码过程中实现均衡器的方法 |
CN102013879B (zh) * | 2010-09-10 | 2014-09-03 | 建荣集成电路科技(珠海)有限公司 | Mp3音乐均衡调节装置及方法 |
CN104244121B (zh) * | 2014-09-26 | 2019-09-17 | 广州市华维世电子科技有限公司 | 一种可改变声音风格的麦克风 |
DE102016006328A1 (de) * | 2016-05-24 | 2017-11-30 | GM Global Technology Operations LLC (n. d. Ges. d. Staates Delaware) | Verfahren und Vorrichtung zum Überprüfen eines Sauerstoffsensors |
CN109889954A (zh) * | 2019-03-26 | 2019-06-14 | 苏州全频智能科技有限公司 | 全频多级校正网络补偿器 |
CN115529521A (zh) * | 2022-08-12 | 2022-12-27 | 苏州智莱欣声学科技有限公司 | 一种超宽频响播放器 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4185168A (en) * | 1976-05-04 | 1980-01-22 | Causey G Donald | Method and means for adaptively filtering near-stationary noise from an information bearing signal |
DE3131193A1 (de) * | 1981-08-06 | 1983-02-24 | Siemens AG, 1000 Berlin und 8000 München | Geraet zur kompensation von gehoerschaeden |
US4454609A (en) * | 1981-10-05 | 1984-06-12 | Signatron, Inc. | Speech intelligibility enhancement |
US4701953A (en) * | 1984-07-24 | 1987-10-20 | The Regents Of The University Of California | Signal compression system |
US5027410A (en) | 1988-11-10 | 1991-06-25 | Wisconsin Alumni Research Foundation | Adaptive, programmable signal processing and filtering for hearing aids |
US6115475A (en) * | 1998-07-23 | 2000-09-05 | Diaural, L.L.C. | Capacitor-less crossover network for electro-acoustic loudspeakers |
WO2000047014A1 (en) * | 1999-02-05 | 2000-08-10 | The University Of Melbourne | Adaptive dynamic range optimisation sound processor |
US7272235B2 (en) * | 2003-06-26 | 2007-09-18 | Microsoft Corporation | Method and apparatus for audio normalization |
-
2006
- 2006-04-04 JP JP2008504894A patent/JP2008535436A/ja not_active Withdrawn
- 2006-04-04 DE DE602006007564T patent/DE602006007564D1/de active Active
- 2006-04-04 WO PCT/IB2006/051019 patent/WO2006106479A2/en not_active Application Discontinuation
- 2006-04-04 US US11/910,974 patent/US8335323B2/en active Active
- 2006-04-04 CN CN2006800100037A patent/CN101151800B/zh active Active
- 2006-04-04 EP EP06727818A patent/EP1869766B1/en active Active
- 2006-04-04 AT AT06727818T patent/ATE435523T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JP2008535436A (ja) | 2008-08-28 |
WO2006106479A2 (en) | 2006-10-12 |
DE602006007564D1 (de) | 2009-08-13 |
ATE435523T1 (de) | 2009-07-15 |
EP1869766A2 (en) | 2007-12-26 |
US8335323B2 (en) | 2012-12-18 |
EP1869766B1 (en) | 2009-07-01 |
CN101151800A (zh) | 2008-03-26 |
WO2006106479A3 (en) | 2007-02-15 |
US20080181428A1 (en) | 2008-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101151800B (zh) | 处理音频数据的方法和装置、程序单元及计算机可读介质 | |
EP2377121B1 (en) | Gain control based masking | |
EP2530835B1 (en) | Automatic adjustment of a speed dependent equalizing control system | |
EP2394360B1 (en) | Adjusting dynamic range for audio reproduction | |
KR101914312B1 (ko) | 감지된 스펙트럼 불균형의 개선을 위한 오디오 신호의 동적 보상 | |
US8116465B2 (en) | Measuring apparatus and method, and recording medium | |
CA2628524C (en) | Sound tuning method | |
JP5295238B2 (ja) | 音響処理装置 | |
KR20140116152A (ko) | 베이스 강화 시스템 | |
JP2013102411A (ja) | 音声信号処理装置、および音声信号処理方法、並びにプログラム | |
US9414156B2 (en) | Reducing resonance | |
US20140105418A1 (en) | Frequency domain multiband dynamics compressor with spectral balance compensation | |
KR20080034734A (ko) | 청각특성을 이용한 저음 음향 신호 보강 처리 방법 및 장치 | |
JP6104740B2 (ja) | 音場補正装置、音場補正フィルタ生成装置および音場補正フィルタ生成方法 | |
KR20190056486A (ko) | 오디오 시스템 및 그 제어 방법 | |
JP2018537892A (ja) | 自動車におけるステレオ変調再生の新しい方法 | |
JP3594910B2 (ja) | 音声処理装置及び該音声処理装置を有する電子機器 | |
CN118335041A (zh) | 人声音效处理方法、控制器、可读存储介质及智能设备 | |
CN116778949A (zh) | 个性化响度补偿方法、装置、计算机设备和存储介质 | |
Chiu et al. | A perceptually transparent audio power reduction algorithm for loudspeaker power management | |
Miller | Coping with road noise: A DSP solution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |