CN110574289A

CN110574289A - 用于调整音频信号的方法和装置以及音频系统

Info

Publication number: CN110574289A
Application number: CN201780090206.XA
Authority: CN
Inventors: 马桂林; 陈哲
Original assignee: Crown Audio Inc
Current assignee: Crown Audio Inc
Priority date: 2017-05-04
Filing date: 2017-05-04
Publication date: 2019-12-13
Anticipated expiration: 2037-05-04
Also published as: EP3619808A4; EP3619808A1; US20200195214A1; CN110574289B; WO2018201374A1; US10965265B2

Abstract

提供一种用于调整音频信号的方法和装置以及一种音频系统。所述方法包括：获得候选音频信号(S1)；获得环境中的当前噪声信号(S2)；计算所述候选音频信号与所述当前噪声信号之间的响度的第一多个差值(S3)；用多个目标因数来修改所述第一多个差值，其中所述多个目标因数是基于多个测试噪声信号和对应的多个测试音频信号而获得(S4)；用修改后的第一多个差值来修改所述候选音频信号以获得目标音频信号(S5)。因此，可以补偿由于噪声信号导致的所感知到的音频信号的响度损失，并且可以解决过度补偿的问题。

Description

用于调整音频信号的方法和装置以及音频系统

技术领域

本发明大体上涉及音频信号处理领域，并且更明确地说，涉及调整音频信号的方法、用于调整音频信号的装置，以及音频系统。

背景技术

在环境噪声存在的情况下，收听者感知到的音频回放装置的音频信号响度可能会受到竞争的噪声声音影响。由于音频响度是音频信号的物理强度的心理声学相关，因此所感知到的音频响度可能会随着竞争声级增加而减小。音频响度的更多理论基础可以参考Moore、Brian C.J.等在JAES VOLUME 45第4期pp.224-240(注明日期是1997年4月)发布的文章。

已采取措施来在声学上优化音频系统，但在不良的声学环境中对实现良好声学效果具有有限的作用。

因此，需要一种用于在嘈杂环境下改善音频回放装置的声学性能的方法。

发明内容

根据本发明的一个实施方案，提供一种获得用于调整音频信号的多个目标因数的方法。所述获得用于调整音频信号的多个目标因数的方法包括：获得测试音频信号和测试噪声信号，其中所述测试噪声信号具有覆盖预设数目个巴克的频带；获得所述测试音频信号与所述测试噪声信号之间的响度的多个差值；以及确定用于修改所述多个差值的、所述多个目标因数中的针对特定巴克的特定目标因数，其中所述特定目标因数的范围是从0到1并且是基于预定要求而确定。

在一些实施方案中，所述方法还包括：重复以上步骤，直到基于多个测试噪声信号和对应的多个测试音频信号获得针对第一预定数目个巴克的第一预定数目个目标因数为止。

在一些实施方案中，所述方法还包括：通过使用线性内插法基于所述第一预定数目个目标因数和所述第一预定数目个巴克来获得针对第二预定数目个巴克的第二预定数目个目标因数。

在一些实施方案中，获得所述测试音频信号与所述测试噪声信号之间的响度的所述多个差值包括：分别计算频域中的所述测试音频信号的功率谱密度(Power SpectralDensity，PSD)以及所述频域中的所述测试噪声信号的PSD；分别用心理声学掩蔽模型来处理所述频域中的所述测试音频信号的所述PSD以及所述频域中的所述测试噪声信号的所述PSD，以获得巴克域中的按分贝(dB)标度的音频信号以及获得所述巴克域中的按所述dB标度的噪声信号；以及通过在所述巴克域中的按所述dB标度的所述测试音频信号与所述巴克域中的按所述dB标度的所述测试噪声信号之间执行减法来计算所述巴克域中的按所述dB标度的所述多个差值。

在一些实施方案中，确定用于修改所述多个差值的针对所述特定巴克的所述特定目标因数包括：用特定因数来修改所述巴克域中的按所述dB标度的所述多个差值，其中所述特定因数在0与1之间变动；基于所述巴克域中的按所述dB标度的所述修改后的多个差值来获得频域中的多个线性增益值；用所述多个线性增益值来修改所述测试音频信号；监测所述修改后的测试音频信号的回放；以及调整针对处于所述测试噪声信号的频带的中心的所述特定巴克的所述特定因数，直到所述修改后的测试音频信号满足所述预定要求为止。

在一些实施方案中，所述测试噪声信号具有与所述测试音频信号的频带的至少部分重叠的频带。

在一些实施方案中，所述测试噪声信号具有覆盖3至5个巴克的频带。

根据本发明的一个实施方案，还相应地提供一种用于获得用于调整音频信号的多个目标因数的装置。所述用于获得用于调整音频信号的多个目标因数的装置包括：第一获得电路，所述第一获得电路被配置成获得测试音频信号和测试噪声信号，其中所述测试噪声信号具有覆盖预设数目个巴克的频带；第二获得电路，所述第二获得电路被配置成获得所述测试音频信号与所述测试噪声信号之间的响度的多个差值；以及确定电路，所述确定电路被配置成确定用于修改所述多个差值的、所述多个目标因数中的针对特定巴克的特定目标因数，其中所述特定目标因数的范围是从0到1并且是基于预定要求而确定。

根据本发明的一个实施方案，提供一种调整音频信号的方法。所述调整音频信号的方法包括：获得候选音频信号；获得环境中的当前噪声信号；计算所述候选音频信号与所述当前噪声信号之间的响度的第一多个差值；用多个目标因数来修改所述第一多个差值，其中所述多个目标因数是基于多个测试噪声信号和对应的多个测试音频信号而获得；以及用所述修改后的第一多个差值来修改所述候选音频信号以获得目标音频信号。

在一些实施方案中，基于所述多个测试噪声信号和所述对应的多个测试音频信号来获得所述多个目标因数包括：获得针对第一预定数目个巴克的第一预定数目个目标因数，以便获得所述第一预定数目个目标因数与所述第一预定数目个巴克之间的关系，其中所述第一预定数目个巴克中的每一者都是处于测试噪声信号的频带的中心；以及通过使用线性内插法基于所述第一预定数目个目标因数与所述第一预定数目个巴克之间的所述关系来获得与巴克域中的不在所述多个测试噪声信号的频带的中心的第二预定数目个巴克对应的第二预定数目个目标因数。

在一些实施方案中，获得所述预定数目个目标因数中的针对所述预定数目个巴克中的特定巴克的特定目标因数包括：获得测试噪声信号和测试音频信号，其中所述测试噪声信号具有覆盖预设数目个巴克的频带；通过在所述测试噪声信号与所述测试音频信号之间执行减法来获得巴克域中的按dB标度的第二多个差值；用特定目标因数来修改所述巴克域中的按所述dB标度的所述第二多个差值，其中所述特定目标因数在0与1之间变动；基于所述巴克域中的按所述dB标度的所述修改后的第二多个差值来获得频域中的第二多个线性增益值；用所述第二多个线性增益值来修改所述测试音频信号；监测所述修改后的测试音频信号的回放；以及调整针对处于所述测试噪声信号的所述频带的中心的所述特定巴克的所述特定目标因数，直到所述修改后的测试音频信号满足预定要求为止。

在一些实施方案中，通过以下步骤来获得所述候选音频信号与所述当前噪声信号之间的响度的所述第一多个差值：分别获得频域中的所述候选音频信号的PSD以及所述频域中的所述当前噪声信号的PSD；分别用心理声学掩蔽模型来处理所述频域中的所述候选音频信号的所述PSD以及所述频域中的所述当前噪声信号的所述PSD，以获得巴克域中的按dB标度的候选音频信号以及所述巴克域中的按所述dB标度的当前噪声信号；以及通过在所述巴克域中的按所述dB标度的所述候选音频信号与所述巴克域中的按所述dB标度的所述当前噪声信号之间执行减法来计算所述巴克域中的按所述dB标度的所述第一多个差值。

在一些实施方案中，用所述修改后的第一多个差值来修改所述候选音频信号以获得所述目标音频信号包括：使用线性内插法将所述巴克域中的按所述dB标度的所获得的第一多个差值变换为所述频域中的按所述dB标度的第三多个差值；基于所述频域中的按所述dB标度的所述第三多个差值来获得所述频域中的第一多个线性增益值；以及在所述候选音频信号与所述频域中的所述第一多个线性增益值之间执行乘法，以获得所述频域中的所述目标音频信号。

在一些实施方案中，所述调整音频信号的方法还包括：将所述目标音频信号从所述频域变换到时域；以及输出所述时域中的所述目标音频信号。

在一些实施方案中，所述调整音频信号的方法还包括：对所述频域中的所述当前噪声信号的所述PSD接连着执行时间和频率平滑以及非线性平滑；以及在分别用所述心理声学掩蔽模型处理所述频域中的所述候选音频信号的所述PSD和所述频域中的所述当前噪声信号的所述PSD之前，对所述频域中的所述候选音频信号的所述PSD执行所述时间和频率平滑。

在一些实施方案中，所述调整音频信号的方法还包括：在分别用所述心理声学掩蔽模型处理所述频域中的所述候选音频信号的所述PSD和所述频域中的所述当前噪声信号的所述PSD之前，对所述频域中的所述当前噪声信号的所述PSD执行音调校正；其中所述音调校正是基于对多个子带的平面度测量而获得。

在一些实施方案中，所述候选音频信号是时域中的多声道音频信号，所述方法还包括：将所述多声道音频信号从所述时域变换到所述频域；以及对所述频域中的所述多声道音频信号求平均以获得所述频域中的单声道音频信号以便计算所述频域中的所述单声道音频信号的PSD作为所述频域中的所述候选音频信号的所述PSD。

根据本发明的一个实施方案，提供一种音频系统。所述音频系统包括：音频回放装置，所述音频回放装置被配置成播放音频信号；麦克风，所述麦克风被配置成检测环境中的噪声信号；存储装置，所述存储装置被配置成存储多个目标因数，其中所述多个目标因数适于修改音频信号；以及处理器，所述处理器被配置成：获得将通过所述音频回放装置播放的候选音频信号；获得通过所述麦克风检测到的当前噪声信号；计算所述候选音频信号与所述当前噪声信号之间的响度的第一多个差值；用所述多个目标因数来修改所述第一多个差值；用所述修改后的第一多个差值来修改所述候选音频信号以获得目标音频信号；以及控制所述音频回放装置来播放所述目标音频信号。

在一些实施方案中，根据上述的获得用于调整音频信号的多个目标因数的方法来获得所述多个目标因数。

在一些实施方案中，所述音频回放装置是头戴式耳机。

在一些实施方案中，所述麦克风是所述头戴式耳机的内嵌麦克风。

在一些实施方案中，所述存储装置和所述处理器集成在所述音频回放装置中。

在一些实施方案中，所述音频系统还包括主装置，其中所述音频回放装置与所述主装置通信，并且所述存储装置和所述处理器集成在所述主装置中。

与常规技术比较，本发明具有以下优点。

在环境中存在噪声信号的情况下，计算候选音频信号与当前噪声信号之间的响度的第一多个差值并且用多个目标因数来修改所述第一多个差值，并且随后用修改后的第一多个差值来修改候选音频信号以获得目标音频信号，使得可以补偿由于噪声信号的竞争声音而导致的所感知到的音频信号的响度损失。基于多个测试噪声信号以及覆盖宽频带的对应的多个测试音频信号来获得多个目标因数，这样使所述多个目标因数适应于环境中的几乎所有的噪声信号。

另外，针对巴克域中的每个巴克获得多个目标因数，使得可以在每个巴克处修改第一多个差值，并且可以精确地调整候选音频信号以尽可能避免过度补偿。

附图说明

结合附图，从以下描述和所附权利要求中本发明的前述特征和其他特征将变成更完全地显而易见。应理解，这些图式仅绘示了根据本发明的若干实施方案并且因此不会被认为是限制其范围，将通过使用附图来更具体地并且更详细地描述本发明。

图1示意性地示出根据本发明的一个实施方案的用于调整候选音频信号的方法的流程图；

图2示意性地示出根据本发明的另一个实施方案的用于调整候选音频信号的方法的流程图；

图3示意性地示出根据本发明的一个实施方案的用于获得多个目标因数的方法的流程图；

图4示意性地示出根据本发明的一个实施方案的用于调整候选音频信号的装置；

图5示意性地示出根据本发明的一个实施方案的音频系统；以及

图6示意性地示出根据本发明的另一个实施方案的音频系统。

具体实施方式

在以下详细描述中，参看附图，所述附图形成本发明的一部分。在图式中，类似的符号通常标示类似的部件，除非上下文另有指示。在详细描述、图式和权利要求书中描述的说明性实施方案不打算是限制性的。在不脱离本文中呈现的主题的精神或范围的情况下，可以利用其他实施方案，并且可以进行其他改变。将容易地理解，如本文中大体地描述以及在图式中示出的本发明的方面可以按各种不同的配置来布置、替代、组合和设计，所述配置全部被明确地涵盖并且构成本发明的部分。

参看图1，图1示意性地示出根据本发明的一个实施方案的用于调整候选音频信号的方法的流程图。所述方法包括步骤S1、S2、S3、S4和S5。

在S1中，获得所述候选音频信号。在一些实施方案中，所获得的候选音频信号是在时域中。

在S2中，获得环境中的当前噪声信号。具体地说，当前噪声信号可以指环境中的干扰相关音频信号的任何竞争声音。

如前所述，收听者感知到的音频信号的响度可能会受到环境中的噪声信号影响。在本发明的一些实施方案中，可以用候选音频信号与当前噪声信号之间的响度的第一多个差值来调整所述候选音频信号，以便在心理声学模型中弥补当前噪声信号对候选音频信号产生的掩蔽效应。

在S3中，计算候选音频信号与当前噪声信号之间的响度的第一多个差值。

然而，发明人的研究表明，如果直接应用候选音频信号与当前噪声信号之间的响度的绝对差值来补偿候选音频信号，那么所述候选音频信号将会被过度补偿。

为了解决过度补偿问题，在S4中，用多个目标因数来修改所述多个差值，其中所述多个目标因数是基于多个测试噪声信号和对应的多个测试音频信号而获得。在一些实施方案中，所述多个目标因数大于零并且小于一以便减小所述第一多个差值。

在S5中，用修改后的第一多个差值来修改候选音频信号以获得目标音频信号。

在一些实施方案中，用修改后的第一多个差值来修改候选音频信号包括：基于所述修改后的第一多个差值来获得第一多个线性增益值；以及在所述候选音频信号与频域中的所述第一多个线性增益值之间执行乘法以获得频域中的目标音频信号。

在一些实施方案中，图1中所示的调整候选音频信号的方法还可以包括：将目标音频信号从频域变换到时域，并且输出时域中的目标音频信号。

在其他实施方案中，用修改后的第一多个差值来修改候选音频信号可以包括：基于所述修改后的第一多个差值来获得第一多个线性增益值；以及在所述候选音频信号与时域中的所述第一多个线性增益值之间执行卷积以获得时域中的目标音频信号。随后，所述调整候选音频信号的方法还可以包括输出时域中的目标音频信号。

参看图2，图2示意性地示出了根据本发明的另一个实施方案的用于调整候选音频信号的方法的流程图。所述方法包括以下步骤。

在S31a和S31b中，分别获得环境中的时域中的当前噪声信号以及时域中的候选音频信号，其中所述候选音频信号是多声道音频信号。

在S32a和S32b中，分别将当前噪声信号和多声道音频信号从时域变换到频域。具体地说，可以使用例如快速傅里叶变换(Fast Fourier Transform，FFT)方法来将多声道音频信号和当前噪声信号从时域变换到频域。

在S33中，对频域中的多声道音频信号求平均以获得频域中的单声道音频信号。具体地说，对频域中的多声道音频信号执行求和运算，并且随后得到频域中的所述和的算术平均值。对所述单声道音频信号执行对候选音频信号的所有接下来的处理。在其他实施方案中，可以根据心理声学模型对多声道音频信号执行更准确的响度求和。请注意，在候选音频信号是单声道音频信号时，可以省去步骤S33。

在S34a和S34b中，分别计算频域中的当前噪声信号的PSD以及频域中的单声道音频信号的PSD。

在S35a和S35b中，分别对频域中的当前噪声信号的PSD和频域中的单声道音频信号的PSD执行时间和频率平滑，以便模拟人类对各种噪声声音的感知。发明人已发现，具有不同频率的噪声信号需要不同的平滑因数。具体地说，应向高频噪声信号应用重度平滑，而应向低频噪声信号应用轻度平滑，使得平滑强度与每个巴克中的频率分辨率成反比。

在S36中，对频域中的当前噪声信号的PSD执行非线性平滑，使得当检测到噪声信号时，可能不会过于容易地触发补偿，并且当噪声信号结束时，需要即刻终止补偿。

在S37中，对频域中的当前噪声信号的PSD执行音调校正，其中所述音调校正是基于对多个子带的平面度测量而获得。

具体地说，参考心理声学模型，音调校正(即，衰减)通过下式来量化：

音调偏移＝锐度*(14.5+巴克)+(1-锐度)*5.5 (1)

其中“14.5+巴克”和“5.5”分别是理想音调(锐度＝1)和理想白噪声(锐度＝0)的按分贝(dB)计的校正值，锐度是通过平面度测量而得到，与不同巴克对应的锐度的值通常被正规化在0与1之间。

考虑到将要通过方程式(1)校正的噪声通常具有相当宽的带宽，而当前实施方案中的噪声信号相对较窄，因此应修改用于确定音调校正的方程式(1)。

在一些实施方案中，音调校正通过下式来量化：

音调偏移＝锐度*(14.5+巴克+1+30)+(1-锐度)*5.5 (2)

其中锐度是通过平面度测量而得到，对多个子带执行平面度测量，所述多个子带是通过将完整的带分割成许多子带而得到。在一个实施方案中，首先将覆盖从20Hz至20000Hz的频带的噪声的完整的带分割成八个至10个子带，并且随后测量所述八个至十个子带中的每一者的平面度。然而，从完整的带分割而成的子带的数目将不限于此。子带的带宽取决于具体应用。

具体地说，对于每个子带，测量与噪声的最大振幅对应的平面度和频率，并且将测得的频率变换成巴克域中的巴克。使用测得的平面度和巴克以及方程式(2)，可以得到音调偏移。

在其他实施方案中，为了实现从低频到高频的更平滑修改，可以测试其他校正选项，其中一者是：

音调偏移＝锐度*(14.5+巴克*2+1)+(1-锐度)*5.5 (3)

在S38a和S38b中，使用心理声学掩蔽模型来分别处理频域中的当前噪声信号的PSD以及频域中的单声道音频信号的PSD，使得可以得到当前噪声信号与单声道音频信号之间的心理声学掩蔽关系，并且可以获得巴克域中的按dB标度的当前噪声信号以及巴克域中的按dB标度的单声道音频信号。

本领域的技术人员将了解，心理声学模型通常用于研究声音感知以及信号与掩蔽声之间的掩蔽效应。在下文将不会详细地论述通过心理声学掩蔽模型在巴克域中对噪声信号的PSD和单声道音频信号的PSD进行的具体处理。

在S39中，通过在S38a和S38b中获得的在巴克域中的按dB标度的单声道音频信号与巴克域中的按dB标度的当前噪声信号之间执行减法来计算巴克域中的按dB标度的第一多个差值。

然而，如前所述，如果直接应用所述第一多个差值来补偿候选音频信号，那么所述候选音频信号将会被过度补偿。为了解决所述过度补偿的问题，应用多个目标因数来修改所述第一多个差值以便减小所述第一多个差值。

在S40中，用巴克域中的多个目标因数来相应地修改巴克域中的按dB标度的第一多个差值，其中巴克域中的多个目标因数是基于多个测试噪声信号和对应的多个测试音频信号而获得。

在一些实施方案中，巴克域中的多个目标因数大于零并且小于一。

在一些实施方案中，人工地调整所述多个目标因数，所述多个目标因数并不是实时自适应的。

在S41中，基于巴克域中的按dB标度的修改后的第一多个差值来获得频域中的与不同巴克对应的第一多个线性增益值。

具体地说，使用线性内插法将巴克域中的按dB标度的修改后的第一多个差值变换为频域中的按dB标度的第三多个差值，并且随后将频域中的按dB标度的第三多个差值变换为频域中的第一多个线性增益值。

在一些实施方案中，当一频率点处的候选音频信号的响度大于或等于所述频率点处的当前噪声信号的响度时，可能不再需要补偿所述频率点处的候选音频信号。因此，当一频率点处的差值大于或等于零，也就是说，在所述频率点处候选音频信号大于或等于当前噪声信号时，那么将所述频率点处的增益值设为1；并且当一频率点处的差值小于零，也就是说，在所述频率点处候选音频信号小于当前噪声信号时，那么将所述频率点处的增益值设为大于1的数字。

其后，在S42中，用频域中的第一多个线性增益值来修改多声道音频信号中的每一者以便获得目标多声道音频信号。

在一些实施方案中，首先将多声道音频信号从时域变换到频域，并且随后将频域中的多声道音频信号中的每一者乘以频域中的第一多个线性增益值以便获得频域中的目标多声道音频信号。

在一些实施方案中，将目标多声道音频信号从频域变换到时域并且随后输出时域中的目标多声道音频信号。

在其他实施方案中，将第一多个线性增益值从频域变换到时域，并且随后用时域中的第一多个线性增益值对时域中的多声道音频信号中的每一者进行卷积以便获得时域中的目标多声道音频信号，其中所述卷积可以通过无限脉冲响应(Infinite ImpulseResponse，IIR)滤波器或有限脉冲响应(Finite Impulse Response，FIR)滤波器来实现。随后，可以输出时域中的目标多声道音频信号。

发明人的研究表明，处于不同频率的候选音频信号将不同地进行补偿，因此，在一些实施方案中，针对巴克域中的每个巴克单独地确定多个目标因数。

本领域的技术人员将了解，在巴克域中存在25个巴克。因此，将计算针对25个巴克中的每一者的25个目标因数。

在一些实施方案中，获得25个目标因数包括：获得针对第一预定数目个巴克的第一预定数目个目标因数，以便获得所述第一预定数目个目标因数与所述第一预定数目个巴克之间的关系，其中所述第一预定数目个巴克中的每一者处于测试噪声信号的频带的中心；以及基于所述第一预定数目个目标因数与所述第一预定数目个巴克之间的关系来获得所述25个目标因数中的与巴克域中的第二预定数目个巴克对应的第二预定数目个目标因数，其中所述第二预定数目个目标因数是所述25个目标因数中的除所述第一预定数目个目标因数以外的剩余数目个目标因数，使得可以获得与巴克域中的每个巴克对应的多个目标因数。

请注意，第一预定数目个目标因数取决于对测试精度和测试复杂性的具体要求。第一预定数目个目标因数可以是在2个至25个的范围中。本发明不对第一预定数目个目标因数施加限制。

参看图3，图3示意性地示出根据本发明的一个实施方案的用于获得多个目标因素的方法的流程图。所述方法包括以下步骤。

在S381中，将变量i设为1。

随后，在步骤S382中，确定变量i是否小于25。如果是，那么将所述方法引导到步骤S383；否则，将所述方法引导到步骤S390。

在步骤S383中，获得测试噪声信号和测试音频信号，其中所述测试噪声信号覆盖从巴克(i)到巴克(i+a)的频带，其中a是预设数字，使得可以降低心理声学掩蔽模型中的扩展函数的影响，并且可以调整音频信号中的整体音色印象和歌唱部分。

本领域的普通技术人员已知，自然环境中的噪声信号通常是多种多样的并且具有宽频带。在当前实施方案中，可以模拟覆盖不同频带的多个测试噪声信号并且应用所述多个测试噪声信号来确定多个目标因数，因此，所述多个目标因数也将适应于自然环境中的噪声信号，所述噪声信号可以被认为是多个测试噪声信号的各种组合。

在一些实施方案中，使用带通滤波器通过白噪声来模拟测试噪声信号。任选地，可以在测试噪声信号的两个截止频率处应用低通滤波器和高通滤波器以增加频率选择性。

鉴于在测试噪声信号的频率带宽增加时可以降低心理声学模型中的扩展函数的影响并且将调整乐器的总体音色印象以及音乐中的歌唱部分，测试噪声信号不应覆盖过窄的频带。另一方面，如果测试噪声信号的频率带宽过大，那么所确定的多个目标因数将不会足够准确。因此，被测试噪声信号覆盖的频带不应过宽。因此，被测试噪声信号覆盖的第一预定数目个巴克不应过少或过多，即，需要适中的预设数目a。

在一些实施方案中，预设数目a可以被设为2。也就是说，测试噪声信号覆盖三个巴克：巴克(i)、巴克(i+1)和巴克(i+2)。

在其他实施方案中，预设数目a可以被设为4。也就是说，测试噪声信号覆盖五个巴克。

随后，需要获得测试音频信号与测试噪声信号之间的响度的第二多个差值。

在S384中，通过在测试噪声信号与测试音频信号之间执行减法来获得巴克域中的按dB标度的第二多个差值。

在一些实施方案中，用于获得巴克域中的按dB标度的第二多个差值的方法包括：分别计算频域中的测试音频信号的PSD以及频域中的测试噪声信号的PSD；分别用心理声学掩蔽模型来处理频域中的测试音频信号的PSD以及频域中的测试噪声信号的PSD，以获得巴克域中的按dB标度的音频信号以及获得巴克域中的按dB标度的噪声信号；以及通过在巴克域中的按dB标度的测试音频信号与巴克域中的按dB标度的测试噪声信号之间执行减法来计算巴克域中的按dB标度的第二多个差值。

用于获得巴克域中的按dB标度的第二多个差值的方法可以参考图2中所示的步骤S32a至S38a、步骤S32b至S38b以及步骤S39，在下文将不会对此进行详细论述。

在步骤S385中，用中心巴克(i+a/2)处的目标因数TF(i+a/2)来修改所述第二多个差值，其中TF(i+a/2)的范围是从0到1。在一些实施方案中，使用初始目标因数TF(i+a/2)＝1。请注意，步骤S385与图2中所示的步骤S40不同，在步骤S40中用多个目标因数来修改所述第一多个差值。

在步骤S386中，基于巴克域中的按dB标度的修改后的第二多个差值来获得频域中的第二多个线性增益值。

用于获得第二多个线性增益值的方法可以参考图2中所示的方法中的步骤S41，在下文将不会对此进行详细论述。

在S387中，用第二多个线性增益值来修改测试音频信号。用于修改测试音频信号的具体方法可以参考图2中所示的方法中的步骤S42，在本文中将不会对此进行详细论述。

在步骤S388中，监测修改后的测试音频信号的回放并且同时调整中心巴克(i+a/2)处的目标因数TF(i+a/2)，直到修改后的测试音频信号满足预定要求为止。

在一些实施方案中，预定要求是修改后的测试音频信号听起来自然或听起来像没有噪声信号存在。

在其他实施方案中，预定要求是可以在几乎整个带中稍稍补偿修改后的测试音频信号以改善所感知到的信噪比。

在一些实施方案中，当a是奇数时，测试音频信号的频带的中心是巴克(i+(a-1)/2)或巴克(i+(a+1)/2)；并且当a是偶数时，测试音频信号的频带的中心是巴克(i+a/2)。

在S389中，i递增a+1，并且将所述方法引导到S382。

当i被确定为大于或等于25时，将所述方法引导到S390。

请注意，在步骤S390之前，获得针对第一预定数目个巴克的第一预定数目个目标因数，其中所述第一预定数目个巴克中的每一者都是处于测试噪声信号的频带的中心，使得可以获得所计算出的第一预定数目个目标因数与第一预定数目个巴克之间的关系。

在S390中，使用线性内插法基于所计算出的第一预定数目个目标因数与第一预定数目个巴克之间的关系来计算与巴克域中的不在所述多个测试噪声信号的频带的中心的第二预定数目个巴克对应的第二预定数目个目标因数，因此对于不在测试噪声信号的频带的中心的巴克，可以根据在测试噪声信号的频带的中心附近的邻近巴克对所述巴克的对应目标因数进行线性内插。

请注意，在用于获得多个目标因数的上述方法中，首先计算第一预定数目个目标因数，并且随后基于所述第一预定数目个目标因数来计算第二预定数目个目标因数，应用所述方法来简化计算。实际上，为了确定所述多个目标因数中的每个目标因数，可以应用步骤S381至S389中所示的方法。

在一些实施方案中，预设数目a可以是二、三、四或五等等。

在一些实施方案中，第一预定数目a在图3中所示的方法的每次循环中都可能不同。

在一些实施方案中，应用多个测试噪声信号和多个测试音频信号来反复地调整所述多个目标因数，使得所确定的多个目标因数适应于大部分的噪声信号和音频信号。举例来说，为图3中所示的方法的每次循环提供三个测试音频信号和三个测试噪声信号，如果时间准许，那么每次循环中的步骤S383至S388可以被执行3加3次，使得通过使用所述三个测试音频信号与所述三个噪声信号的各种组合来确定特定的目标因数。

具体地说，将巴克之间的扩展函数考虑在内，可以针对每个巴克确定从0.7至0.9的多个目标因数，这样可以减少来自邻近巴克的积聚增益。请注意，不会针对各种音频信号、噪声信号和参考收听水平来广泛地测试从0.7至0.9的目标因数的范围。因此，在其他实施方案中，对于不同的音频信号、不同的噪声信号以及不同的参考收听水平，所述多个目标因数可以具有不同的范围。本发明不限于此。

通过图3中所示的方法，分别计算巴克(i)的多个TF(i)，其中i的范围是从1至25。随后可以应用巴克域中的25个目标因数来如图1和图2中所述般修改第一多个差值。

如图3中所示，在流程图的每次循环中，都使用测试噪声信号和测试音频信号。因此，所述多个目标因数是基于多个测试噪声信号和对应的多个测试音频信号而获得。

在一些实施方案中，所述多个测试噪声信号的频带的范围是从低频到高频。

在其他实施方案中，所述多个测试噪声信号的频带的范围是从高频到低频。

在一些实施方案中，测试噪声信号具有与测试音频信号的频带的至少部分重叠的频带。

在一些实施方案中，在调整每个频带的测试噪声信号的目标因数期间，对测试音频信号是带通的，但是可能更难以判断原始音频信号的音色印象。

请注意，对于低频与高频测试噪声信号，需要具有宽频谱覆盖的测试音频信号，以防测试音频信号无法覆盖频带中的测试噪声信号，因此无法调整低频区或高频区中的测试噪声信号的目标因数。

在一些实施方案中，选择一些经典音乐信号作为所述多个测试音频信号。在一些实施方案中，来自鼓或大提琴的声音或男声可以用作测试音频信号，并且低频噪声可以用作测试噪声信号。在其他实施方案中，来自钢琴或小提琴的声音或女声可以用作测试音频信号，并且高频噪声可以用作测试噪声信号。

另外，在本发明中还提供了一种用于调整音频信号的装置。参看图4，图4示意性地示出根据本发明的一个实施方案的用于调整音频信号的装置40。

装置40包括第一获得电路401、第二获得电路402、计算电路403、第一修改电路404以及第二修改电路405。其中第一获得电路401被配置成获得候选音频信号；第二获得电路402被配置成获得环境中的当前噪声信号；计算电路403被配置成计算候选音频信号与当前噪声信号之间的响度的第一多个差值；第一修改电路404被配置成用多个目标因数修改所述第一多个差值，其中所述多个目标因数是基于多个测试噪声信号和对应的多个测试音频信号而获得；并且第二修改电路405被配置成用修改后的第一多个增益值来修改候选音频信号以获得目标音频信号。

在一些实施方案中，将所述多个目标因数预存储在存储装置中，并且第一修改电路404还被配置成从所述存储装置载入所述多个目标因数，以便修改所述第一多个差值。

第一获得电路、第二获得电路、计算电路、第一修改电路和第二修改电路中的每一者的功能可以对应地参考关于如上文在图1至图2中论述的用于调整音频信号的方法的描述，在本文中将不会对此进行详细描述。

在一些实施方案中，所述用于调整候选音频信号的装置可以是处理器，诸如中央处理单元(Central Processing Unit，CPU)、数字信号处理器(Digital SignalProcessor，DSP)或现场可编程门阵列(Field Programmable Gate Array，FPGA)等。

另外，在本发明中还提供了一种音频系统，用于控制音频回放。

参看图5，图5示意性地示出根据本发明的一个实施方案的音频系统50。

在一些实施方案中，音频系统50可以包括主装置51和音频回放装置52，其中主装置51包括多媒体信号源510、处理器511和存储装置512，所述音频回放装置52装备有麦克风521，并且音频回放装置52与主装置51通信。音频回放装置52与主装置51之间的通信方式可以是有线或无线形式。

在一些实施方案中，音频回放装置52是头戴式耳机，并且主装置51是移动电话或计算机。

具体地说，多媒体信号源510被配置成提供多媒体数据。在一些实施方案中，多媒体信号源510可以是移动电话或计算机中的多媒体播放器。

音频回放装置52被配置成播放所述多媒体数据的音频信号。在一些实施方案中，音频回放装置52可以是头戴式耳机。在其他实施方案中，外部扩音器或耳塞可以用作音频回放装置52。

麦克风521被配置成检测环境中的噪声信号。在一些实施方案中，麦克风521可以是与音频回放装置52分离的麦克风。在其他实施方案中，音频回放装置52是头戴式耳机，并且麦克风521可以是通过音频线集成在头戴式耳机中的内嵌麦克风。

请注意，通过音频回放装置52播放的音频信号与麦克风521在声学上隔离。可以通过在音频回放装置52与麦克风521之间设置足够远的距离以及对音频回放装置的泄漏的良好控制来实现所述隔离。如果音频回放装置52是在音频线上具有内嵌麦克风的头戴式耳机，那么需要通过参考麦克风来在声学上校准所述头戴式耳机与所述内嵌麦克风。

存储装置512被配置成存储巴克域中的多个目标因数，其中所述多个目标因数是基于多个测试噪声信号和对应的多个测试音频信号而获得。所述存储装置可以是安全数字(Secure Digital，SD)卡、光盘或磁盘等。用于获得多个目标因数的方法可以参考图3，在本文中将不会对此进行详细论述。

处理器511被配置成：获得将通过音频回放装置52播放的候选音频信号；获得通过麦克风521检测到的当前噪声信号；计算所述候选音频信号与所述当前噪声信号之间的响度的第一多个差值；用存储在存储装置512中的多个目标因数来修改所述第一多个差值；用修改后的第一多个差值来修改候选音频信号以获得目标音频信号；以及控制音频回放装置52来播放目标音频信号。处理器511可以是CPU、DSP或FPGA等。

在一些实施方案中，在处理器511用所述多个目标因数修改第一多个差值之前，处理器511还被配置成从存储装置512载入所述多个目标因数。

处理器511的功能可以相应地参考关于图1至图2中所示的方法以及图4中所示的用于调整音频信号的装置的描述，在本文中将不会对此进行详细论述。

参看图6，图6示意性地示出根据本发明的另一个实施方案的音频系统60。

应用于控制音频回放的音频系统60包括主装置61和音频回放装置62，其中音频回放装置62装备有处理器620、存储装置621和麦克风622，主装置61与音频回放装置62通信，并且被配置成提供多媒体信号源610。

在一些实施方案中，音频回放装置62可以是头戴式耳机，处理器620可以是嵌入于所述头戴式耳机中的芯片，存储装置621可以是所述头戴式耳机中的存储卡，并且麦克风622可以是通过音频线集成在头戴式耳机中的内嵌麦克风。

在一些实施方案中，主装置61可以是计算机。在其他实施方案中，主装置61可以是移动电话。主装置61通过有线或无线形式与音频回放装置62通信。

处理器620、存储装置621、麦克风622、音频回放装置62和多媒体信号源610的功能可以参考图5中所示的对应元件，在本文中将不会对此进行详细论述。

本领域的普通技术人员将了解，可以借助于软件或硬件来执行上文描述的实施方案的各种方法中的全部或一部分的步骤。所述软件可以包括Visual Studio 2010或以上、Audiomulch、使用Visual Studio的除错、独立试样唱片和使用声卡的校准/记录设置。响应于一些计算机程序的硬件可以包括Fireface UC声卡、麦克风输入端口、头戴式耳机输出端口、具有内嵌麦克风的参考头戴式耳机、用于声校准的参考麦克风、用于现实噪声环境模拟的外部扩音器等等。计算机程序可以存储在计算机可读存储介质中。所述存储介质可以是光盘、磁盘、只读存储器(Read Only Memory，ROM)或随机存取存储器(Random AccessMemory，RAM)等。

请注意，参考麦克风不是用户终端产品的一部分，而是用于校准头戴式耳机的音频回放装置以及用于检测噪声的麦克风(诸如内嵌麦克风)并且用于校准音频回放装置与用于检测噪声的麦克风之间的声传递功能的装置。

请注意，为了准确地估计音频信号和噪声信号，应先对用于调整候选音频信号的方法中涉及的硬件应用声校准，再开始所述方法。具体地说，将对音频回放装置、麦克风以及麦克风与音频回放装置之间的噪声路径进行声校准。另外，应测量音频回放装置与麦克风信号之间的串音程度以评估串音程度对噪声估计的影响，因为用于使音乐和噪声平滑化的时间常数是不同的，并且麦克风灵敏度校准可能会放大串音程度。

总而言之，本发明具有以下优点。

虽然已在本文中公开了各种方面和实施方案，但是其他方面和实施方案将是本领域的技术人员显而易见的。本文中公开的各种方面和实施方案是用于说明并且不意欲为限制性的，真正的范围和精神由以下权利要求书指示。

Claims

1.一种获得用于调整音频信号的多个目标因数的方法，其特征在于，所述方法包括：

获得测试音频信号和测试噪声信号，其中所述测试噪声信号具有覆盖预设数目个巴克的频带；

获得所述测试音频信号与所述测试噪声信号之间的响度的多个差值；以及

确定用于修改所述多个差值的、所述多个目标因数中的针对特定巴克的特定目标因数，其中所述特定目标因数的范围是从0到1并且是基于预定要求而确定。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

重复以上步骤，直到基于多个测试噪声信号和对应的多个测试音频信号获得针对第一预定数目个巴克的第一预定数目个目标因数为止。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

通过使用线性内插法基于所述第一预定数目个目标因数和所述第一预定数目个巴克来获得针对第二预定数目个巴克的第二预定数目个目标因数。

4.根据权利要求1所述的方法，其特征在于，获得所述测试音频信号与所述测试噪声信号之间的响度的所述多个差值包括：

分别计算频域中的所述测试音频信号的功率谱密度(Power Spectral Density，PSD)以及所述频域中的所述测试噪声信号的PSD；

分别用心理声学掩蔽模型来处理所述频域中的所述测试音频信号的所述PSD以及所述频域中的所述测试噪声信号的所述PSD，以获得巴克域中的按分贝(dB)标度的音频信号以及获得所述巴克域中的按所述dB标度的噪声信号；以及

通过在所述巴克域中的按所述dB标度的所述测试音频信号与所述巴克域中的按所述dB标度的所述测试噪声信号之间执行减法来计算所述巴克域中的按所述dB标度的所述多个差值。

5.根据权利要求4所述的方法，其特征在于，确定用于修改所述多个差值的针对所述特定巴克的所述特定目标因数包括：

用特定因数来修改所述巴克域中的按所述dB标度的所述多个差值，其中所述特定因数在0与1之间变动；

基于所述巴克域中的按所述dB标度的所述修改后的多个差值来获得频域中的多个线性增益值；

用所述多个线性增益值来修改所述测试音频信号；

监测所述修改后的测试音频信号的回放；以及

调整针对处于所述测试噪声信号的频带的中心的所述特定巴克的所述特定因数，直到所述修改后的测试音频信号满足所述预定要求为止。

6.根据权利要求1所述的方法，其特征在于，所述测试噪声信号具有与所述测试音频信号的频带的至少部分重叠的频带。

7.根据权利要求1所述的方法，其特征在于，所述测试噪声信号具有覆盖3至5个巴克的频带。

8.一种用于调整音频信号的方法，其特征在于，所述方法包括：

获得候选音频信号；

获得环境中的当前噪声信号；

计算所述候选音频信号与所述当前噪声信号之间的响度的第一多个差值；

用多个目标因数来修改所述第一多个差值，其中所述多个目标因数是基于多个测试噪声信号和对应的多个测试音频信号而获得；以及

用所述修改后的第一多个差值来修改所述候选音频信号以获得目标音频信号。

9.根据权利要求8所述的方法，其特征在于，基于所述多个测试噪声信号和所述对应的多个测试音频信号来获得所述多个目标因数包括：

获得针对第一预定数目个巴克的第一预定数目个目标因数，以便获得所述第一预定数目个目标因数与所述第一预定数目个巴克之间的关系，其中所述第一预定数目个巴克中的每一者都是处于测试噪声信号的频带的中心；以及

通过使用线性内插法基于所述第一预定数目个目标因数与所述第一预定数目个巴克之间的所述关系来获得与巴克域中的不在所述多个测试噪声信号的频带的中心的第二预定数目个巴克对应的第二预定数目个目标因数。

10.根据权利要求9所述的方法，其特征在于，获得所述预定数目个目标因数中的针对所述预定数目个巴克中的特定巴克的特定目标因数包括：

获得测试噪声信号和测试音频信号，其中所述测试噪声信号具有覆盖预设数目个巴克的频带；

通过在所述测试噪声信号与所述测试音频信号之间执行减法来获得所述巴克域中的按分贝(dB)标度的第二多个差值；

用特定目标因数来修改所述巴克域中的按所述dB标度的所述第二多个差值，其中所述特定目标因数在0与1之间变动；

基于所述巴克域中的按所述dB标度的所述修改后的第二多个差值来获得频域中的第二多个线性增益值；

用所述第二多个线性增益值来修改所述测试音频信号；

监测所述修改后的测试音频信号的回放；以及

调整针对处于所述测试噪声信号的所述频带的所述中心的所述特定巴克的所述特定目标因数，直到所述修改后的测试音频信号满足预定要求为止。

11.根据权利要求10所述的方法，其特征在于，所述测试噪声信号具有与所述测试音频信号的频带的至少部分重叠的频带。

12.根据权利要求10所述的方法，其特征在于，所述测试噪声信号具有覆盖3至5个巴克的频带。

13.根据权利要求8所述的方法，其特征在于，通过以下步骤来获得所述候选音频信号与所述当前噪声信号之间的响度的所述第一多个差值：

分别获得频域中的所述候选音频信号的功率谱密度(Power Spectral Density，PSD)以及所述频域中的所述当前噪声信号的PSD；

分别用心理声学掩蔽模型来处理所述频域中的所述候选音频信号的所述PSD以及所述频域中的所述当前噪声信号的所述PSD，以获得巴克域中的按dB标度的候选音频信号以及所述巴克域中的按所述dB标度的当前噪声信号；以及

通过在所述巴克域中的按所述dB标度的所述候选音频信号与所述巴克域中的按所述dB标度的所述当前噪声信号之间执行减法来计算所述巴克域中的按所述dB标度的所述第一多个差值。

14.根据权利要求13所述的方法，其特征在于，用所述修改后的第一多个差值来修改所述候选音频信号以获得所述目标音频信号包括：

使用线性内插法将所述巴克域中的按所述dB标度的所获得的第一多个差值变换为所述频域中的按所述dB标度的第三多个差值；

基于所述频域中的按所述dB标度的所述第三多个差值来获得所述频域中的第一多个线性增益值；以及

在所述候选音频信号与所述频域中的所述第一多个线性增益值之间执行乘法，以获得所述频域中的所述目标音频信号。

15.根据权利要求14所述的方法，其特征在于，所述方法还包括：

将所述目标音频信号从所述频域变换到时域；以及

输出所述时域中的所述目标音频信号。

16.根据权利要求13所述的方法，其特征在于，所述方法还包括：

对所述频域中的所述当前噪声信号的所述PSD接连着执行时间和频率平滑以及非线性平滑；以及

在分别用所述心理声学掩蔽模型处理所述频域中的所述候选音频信号的所述PSD和所述频域中的所述当前噪声信号的所述PSD之前，对所述频域中的所述候选音频信号的所述PSD执行所述时间和频率平滑。

17.根据权利要求13所述的方法，其特征在于，所述方法还包括：

在分别用所述心理声学掩蔽模型处理所述频域中的所述候选音频信号的所述PSD和所述频域中的所述当前噪声信号的所述PSD之前，对所述频域中的所述当前噪声信号的所述PSD执行音调校正；

其中所述音调校正是基于对多个子带的平面度测量而获得。

18.根据权利要求13所述的方法，其特征在于，所述候选音频信号是时域中的多声道音频信号，所述方法还包括：

将所述多声道音频信号从所述时域变换到所述频域；以及

对所述频域中的所述多声道音频信号求平均以获得所述频域中的单声道音频信号以便计算所述频域中的所述单声道音频信号的PSD作为所述频域中的所述候选音频信号的所述PSD。

19.一种音频系统，其特征在于，所述音频系统包括：

音频回放装置，所述音频回放装置被配置成播放音频信号；

麦克风，所述麦克风被配置成检测环境中的噪声信号；

存储装置，所述存储装置被配置成存储多个目标因数，其中所述多个目标因数适于修改音频信号；以及

处理器，所述处理器被配置成：

获得将通过所述音频回放装置播放的候选音频信号；

获得通过所述麦克风检测到的当前噪声信号；

用所述多个目标因数来修改所述第一多个差值；

用所述修改后的第一多个差值来修改所述候选音频信号以获得目标音频信号；以及

控制所述音频回放装置来播放所述目标音频信号。

20.根据权利要求19所述的音频系统，其特征在于，所述多个目标因数是根据权利要求1至7中任一项而获得。

21.根据权利要求19所述的音频系统，其特征在于，所述音频回放装置是头戴式耳机。

22.根据权利要求21所述的音频系统，其特征在于，所述麦克风是所述头戴式耳机的内嵌麦克风。

23.根据权利要求19所述的音频系统，其特征在于，所述存储装置和所述处理器集成在所述音频回放装置中。

24.根据权利要求19所述的音频系统，其特征在于，所述音频系统还包括主装置，其中所述音频回放装置与所述主装置通信，并且所述存储装置和所述处理器集成在所述主装置中。