CN107615651B

CN107615651B - 用于改善的音频感知的系统和方法

Info

Publication number: CN107615651B
Application number: CN201680028813.9A
Authority: CN
Inventors: Y·拉茨
Original assignee: Innovo IP LLC
Current assignee: Innovo IP LLC
Priority date: 2015-03-20
Filing date: 2016-03-11
Publication date: 2020-09-29
Anticipated expiration: 2036-03-11
Also published as: CN107615651A; WO2016153825A1; US9943253B2; US20160277855A1

Abstract

本发明描述了用于最佳地收听音乐的音频信号个性化增强的方法。在音频装置中联合地实施听力测试、音频信号补偿和信号处理算法的组合。在可听频率的整个范围内对音频信号进行处理和调谐，以针对收听装置的特性以及收听者的特定听力特性两者进行主动补偿，从而得到改善得多的音乐收听体验。在跨越可听频谱的多个频率上，在预选的动态音量范围内，使用随机化的自测试算法来分析用户的每只耳朵的听力能力。

Description

用于改善的音频感知的系统和方法

相关申请

本申请要求2015年3月20日提交的美国临时专利申请No.62/177631的优先权权益，通过引用将其公开内容全文并入本文。

技术领域

本发明属于音频信号处理的技术领域，并且更具体而言，涉及对音频信号进行处理，以补偿用户听力的听力变化。

背景技术

听力图是显示由听力计测量的针对标准化频率的可听阈值的图表。Y轴表示以分贝为单位测量的强度，并且X轴表示以赫兹为单位测量的频率。听力的阈值是相对于表示“正常”听力的标准化曲线以dB(HL)来绘制的。

可以通过使用行为听力测试或者生理测试找到人或其它动物的听力阈值。可以使用被称为测听术的行为听力测试来获得听力图。对于人类而言，所述测试涉及以特定频率(音高)和强度(响度)呈现的不同音调。在人听到所述声音时，他们举手或者按下按钮，以使测试者知道他们已经听到了该声音。记录他们能够听到的最低强度的声音。

理想地，听力图将显示直线，但是在实践当中每个人稍有不同，并且小的变化被认为是正常的。较大的变化(尤其是标准以下的)可以指示听力损伤，听力损伤可能在某种程度上随着年龄的增大而发生，但是有可能由于长期暴露于相当高的噪声水平下而恶化，例如，由于生活在机场或者交通繁忙的道路附近，由于工作关系而暴露于高噪声下，或者由于短时间内暴露于非常高的声音水平(例如暴露于射击或者很响的乐队或俱乐部和酒吧中的音乐)下。听力损伤也可能是某些疾病(例如，CMV或Ménière's症)的后果，并且可以从听力图的形状对这些疾病做出诊断。

除了听力损伤之外，即使最贵的扬声器或个人收听装置，例如，具有近乎完美的动态特性和谱频率特性的高保真立体声耳机也将因个体的不同而产生相差悬殊的结果，具体取决于这些人各自的听力能力。现有的放大器或媒体播放器未被配备为提供针对收听者的特定听力限制而进行补偿的收听体验。用户通常只能调整播放装置的低频和高频信号水平(即，低音和高音控制)，并且在更完善的播放器中，可以使用简单的均衡器根据收听者的个人品味和主观“感受”来重塑音频信号。上述方法中的任何方法都存在若干关键性的缺陷。

一般而言，用户不知道如何调节每个控制，因为用户不知道他/她的听力特性的细节。尽管听力灵敏度往往仅在高频或低频下开始降低，但是在所有年龄段的人群当中缺口(窄频谱范围内的灵敏度损失)和两耳的不均等听力特性都是相当常见的。在图1的听力图中示出了这种听力特性的示例，该听力图示出了左右全频谱听力曲线(hearing profile)。在图1的示图中，能够容易地识别出被绘制为以KHz计量的测试信号频率(X轴)的函数的以dB计量的灵敏度损失(Y轴)。

此外，播放装置中的现有技术均衡器的调整范围在频率范围、可调整带的数量和宽度以及音量水平方面是非常有限的。类似地，现有技术播放装置除了使用平衡功能和音量的相对(左右声道)调整之外不允许对每只耳朵进行专用设置。

尽管常用的声音均衡器能够在一定程度上补偿一些听力灵敏度损失，但是即使通过高质量耳机用播放装置听音乐也可能给具有听力限制的用户带来不满和挫折的情况也是真是存在的。为了补偿降低的听仪器声和人声的能力(往往处于窄频谱范围内或者部分地在一只耳朵内)，很多消费者以大大提高的音量听音乐，这无意中产生了进一步导致听力下降的风险。仅抵抗受影响的频带内的特定听力限制的音频信号的个性化频谱补偿提供了一种更加有效并且安全的方案来处理中等的听力下降，并得到极大改善的听力体验。

在各种医学研究(例如，“Screening and Management of Adult Hearing Lossin Primary Care”,Scientific Review,The Journal of the American MedicalAssociation,Bevan Yueh等人,2003；289(15):1976-1985)中很好地论述了人的听力能力随着年龄的增长而逐渐下降。值得注意的是，大多数35岁及以上的人表现出了一定程度的自然听力下降，其可能引起对音乐的欣赏减弱。此外，最近的研究(例如，The Journal ofThe American Medical Association,Vol.304,No.7,2010)表明在美国每五个十几岁的青少年中就有一个患有听力下降，其被认为是由个人播放装置的激增和不适当使用所引起的。个人的听力能力可能因很多变量而发生变化，包括听力阈值和噪声环境、对特定声音的灵敏度、对大声信号的动态响应、听力损伤的物理性质、以及诸如声音背景等心理-声学因素。听力损失机制可能是传导的(由外耳或中耳中的问题引起)、感觉神经的(由耳蜗中的问题引起)、或者由听神经或者大脑的听觉通路/皮层中的问题所引起的神经性的。

在很多听力损害情况下，量身定制的助听器往往是最佳解决方案。选择助听器的过程要求使用复杂的设备和受到过高度培训的人员在听力专家办公室内进行详细的测试。在典型的听力图中，使用受限的四到八个基本频带来测量听力灵敏度响应，其重点在于在噪声环境下理解人类语言。从背景中过滤掉噪声和/或有选择地放大感兴趣的信号对于助听器设计而言具有根本的重要性。因此，助听器一般擅长对重点在对应于人类语音的3KHz-4KHz频带上的相对窄的频率范围进行矫正，而平均的人类听觉范围从20Hz延伸至16KHz以上。此外，助听器装置与播放装置存在固有的区别，因为它们被构建为在开放环境中使用，而不能与耳机或听筒一起使用用来听音乐。

Internet的出现为各种在线听力测试以及考虑个人听力曲线的个性化技术的发展开放了可能性。近年来已经提供了很多测试体系和方法，然而，很少能够成功地提供可以在日常使用中的常见播放装置中实际实施的有效的自动化声音个性化。在当今的播放装置中常用的各种声音增强和补偿方法包括被动噪声衰减、对感兴趣信号的选择性放大、统计性信号滤波、自动增益控制(AGC)、主动噪声消除、或其任何组合。

在Pavlovic等人的最近专利(美国专利No.8112166)中，作者总结出本领域的工作尚未成功地提供用于有效并且快速地生成个人听力曲线的系统，摘引如下：“对个人听力曲线的最普遍的使用仍然停留在助听器领域，在该领域中一定程度的听力损伤使得介入成为必要的”。

在另一个专利示例(美国专利No.6944474和No.7529545)中，Rader等人尝试了基于个人的听力曲线、个人偏好和环境噪声因素来使音频信号个性化的方法。在该示例中，例如包括控制电路和逻辑的智能电话等个人通信装置用于使用从标准的年龄相关的外部存储听力曲线得到的参数对音频信号应用多频带压缩。在该方案中，还基于个人的耳朵的感知灵敏度来调整信号效果。然而，发明人并未教导测量听力损伤的确切方法，也没有解释如何使用由于给定频率上的损伤而导致的提高的可听度阈值来修改专利中提出的全频动态压缩(FFDC)算法和对应的自动增益控制(AGC)。作者渴求通过对声音进行压缩以使音频信号在听觉系统中不再失真来复制健康耳蜗的功能。已经在单耳蓝牙收听装置中提出该方案，单耳蓝牙收听装置通常不用来听音乐。

在另一组专利公开文献(US 2014/0334644 A1、US 2014/0309549 A1和US 2014/0314261 A1中，Selig等人描述了几种“用于增强听力的方法”。在一种变型中，移动装置在其听力测试中输出音调。基于对该音调的用户响应，所述方法将信号限定为特定音频类型(基于预先定义的曲线)，并基于所述曲线对音频信号进行处理。该方法的一种变型基于音频装置的位置选择适当的曲线。另一种变型则尝试通过向用户输出两种音调并记录用户的音量调整而从预先定义的听力模型中做出选择。这些方法的主要限制在于它们尝试将用户的听力曲线最佳地匹配至一组预先定义并存储的曲线。尽管该方法能够提供可听结果，但是其不能提供对用户的听力曲线和缺陷的完美匹配，因而不能真正地补偿全部的用户特定听力缺陷，也不能提供对所使用的播放装置的动态和频率响应的完美匹配。

发明内容

包括本公开的下述发明内容以提供对本发明的一些方面和特征的基本理解。该发明内容不是对本发明的宽泛概述，因而其既非旨在特别地识别本发明的重要或关键要素，也并非旨在划定本发明的范围。其唯一目的是以简化形式呈现本发明的一些构思，作为下文呈现的更详细的说明的前序。

所公开的本发明的实施例解决了现有技术的限制，并且对具有常见听力曲线和定制听力曲线的广泛听众都能够实现音频信号补偿。

根据所公开的实施例，使用通过日常听音乐所用的实际扬声器、耳机或耳塞实施的空气传导测试来测量听力下降的个体曲线和水平。所述测试是简单的自动化的测试，并且由播放装置来传送。

本发明的实施例提出了特定个性化测试方法，继而提出了用于使用特定的收听耳麦基于收听者的听力灵敏度来增强音频信号的信号处理方法。所述方法可以在使用任何音频源的消费者音频收听装置(播放装置)中实施，所述装置包括但不限于放大器、媒体播放器、蜂窝电话、汽车和家用音频系统、耳机、扬声器系统和乐器。使用测试的结果来生成用户—音响对所特有的信号处理曲线。因而，特定用户可以具有针对用户所使用的每个音响的一个曲线，例如，针对个人耳机的一个曲线和针对个人汽车的一个曲线。

本发明的实施例允许对音频信号进行个性化校正和增强，以使装置的用户能够具有与听力良好的年轻人相似的收听体验。具体而言，其包括两耳中的均等的听力、对低频和高频上的部分听力损失的补偿、对中间频率上的窄带损失(“缺口”)的补偿以及对所述校正的程度的精细控制以及继而对收听体验的精细控制。

在所公开的示例中，所述方法是通过两步测试并且然后使用测试的结果进行放大校正而实施的。在这些实施例中，分两个步骤对用户的听力进行测试：使用初始测试来确定初始动态音量范围。使用初始测试的结果来执行第二测试，第二测试用于确定个体频率上的灵敏度阈值。存储测试的结果作为受到测试的个人的个人参数。这些参数然后被用作声音个性化和增强算法的输入参数。

在一些实施例中，通过按照可听频谱内的上升的频率和/或下降的频率播放一系列音调来执行初始测试。使用用户对这些音调的响应来确定用户听力的初始动态音量范围。同样，使用用户的响应来设置第二测试的参数。在所公开的实施例中，通过在由预编程过程控制的音量水平上播放个体随机化单频率音调，来执行第二测试。使用用户对这些单个音调的响应来确定个体频率上的灵敏度阈值。一个人单独在每个频率上以每只耳朵能够听到的最轻的音量水平被定义为相应的耳朵的该特定频率的灵敏度阈值。每个频率上的听力灵敏度阈值和动态范围值作为个人参数被存储到装置的存储器中，并被用作作为所述方法的一部分的声音个性化和增强算法的输入参数。

在该方面中，最佳结果是在使用与由特定用户用来听音乐的音响相同的音响来执行测试时取得的。在本说明书中，术语“音响”被用作简称，以表示特定的放大—驱动器组合，例如，具有

Solo2耳机的

具有

-Z313 2.1-声道扬声器系统的膝上型电脑等等。

本发明的实施例提供了一种用于声音再现的设备，其包括：被配置为接收用户输入并且生成用户听力数据的个性化模块，所述个性化模块可以包括音调发生器、动态范围计算模块和听力数据计算模块；用于存储所述用户听力数据的存储器；均衡器设计模块，其可以包括被配置为对用户听力数据进行内插以生成系数数据的内插器以及被配置为将系数数据变换为FIR系数的变换器；以及均衡器引擎，其包括FIR滤波器并且被配置为接收声音信号输入并将使用所述FIR系数的FIR滤波器应用于所述声音信号输入，由此生成均衡化的声音信号输出。

在各种实施例中，音调发生器可以包括正弦波发生器、合成器或抽样器之一。所述音调发生器可以被配置为生成一系列音调并将其输出到动态范围计算模块，每个音调处于预定频率和可调整的幅度，并且所述音调发生器可以被配置为生成单个音调并将其输出到听力数据计算模块，每个音调处于预定频率和可调整的幅度。所述音调发生器被配置为根据从用户接收的输入来调整所述一系列音调的幅度以及所述单个音调的幅度。

在一些实施例中，所述设备还可以包括压缩器，所述压缩器被配置为应用压缩因子，由此减小均衡化声音信号输出的动态范围。而且，所述变换器可以包括逆快速傅里叶变换。

附图说明

通过参考以下附图做出的具体实施方式，本发明的其它方面和特征将变得显而易见。应当领会，具体实施方式和附图提供了由所附权利要求限定的本发明的各种实施例的各种非限制性示例。

并入本说明书中并构成本说明书的一部分的附图对本发明的实施例进行了例示，并且所述附图与说明一起用来解释并示出本发明的原理。附图旨在以示意图的方式示出示例性实施例的主要特征。附图并非旨在描绘实际实施例的每一个特征，也并非旨在描绘所描绘的元件的相对尺寸，并且也不是按比例绘制的。

图1是左右全频谱听力曲线的示例性曲线图。

图2是示出在利用四个模块的本发明的实施例中的信号处理流程的块图。

图3是示出在本发明的实施例中利用的各种模块的块图。

图4是在本发明的实施例中使用的装置主状态图。

图4A-图4D是示出根据本发明的各种实施例的过程的流程图。

图5A-图5F是示出在基于用户听力数据设计均衡器时的各种步骤的频率响应图。

图6是示出N阶的直接形式离散时间FIR滤波器的块图。顶部是具有N+1个抽头(系数)b₀到b_n的N级延迟线。Z^-1是一个抽样时间(1/Fs)的延迟级。X[n]表示输入数据样本，并且y[n]是经滤波的输出。

具体实施方式

现在将参考本发明的特定实施例描述本发明的各种特征和方面。所公开的实施例可以实施成硬件、软件以及硬件和软件的组合。硬件可以是通用可编程或可控制硬件，或者可以是专门设计的硬件。所公开的实施例可以利用由标准放大器通电的标准扬声器或耳机。在所公开的实施例中，存储个性化曲线，以使得如果多个用户使用同一音频设备，则将使用每个用户的特定个性化曲线来操纵音频信号。

所公开的本发明的实施例包括适用于任何音频信号格式(模拟和/或数字)以及任何源或收听装置的方法，例如，所述装置包括：数字音乐播放器、智能电话、麦克风、常规数字或模拟音频娱乐系统(例如收音机、电视、CD播放器等)。所述方法可以被实施为由计算机程序驱动的硬件装置，或者可以由在现有装置(例如，智能电话)上运行的计算机程序实施。

在一些实施例中，硬件装置可以是独立的专用装置、现有装置的附件(例如，附加装置)、集成到现有硬件装置中的硬件子系统(例如，包括个人耳机、音频系统、个人/桌面扬声器)等等。

计算机程序可以在不同的装置类型上实施，所述装置类型包括但不限于蜂窝电话、个人计算机、膝上型计算机/笔记本计算机、电子阅读器以及家庭/汽车音频系统。

根据本发明的一个实施例，实施由多带信号音量水平选择和自动化阈值灵敏度检测算法构成的自测试以生成在高达20KHz的完整可听频率范围内绘制出的用户听力曲线。自测试被实施为通过播放装置应用的空气传导测试。自测试是自动化的并且被设计为有利于简单的用户接口以及使用播放装置的自测试。本发明的另一要素包括一组信号压缩和处理算法，所述算法用以结合用户定义的偏好来补偿上述测量的听力曲线。本发明的最后一个要素由专用消费装置构成，所述装置被设计为实施服从所提出的方法的测试、补偿和声音增强。

本发明的具体实施方式可以包括以下组成部分：

听力自测试

本发明的该组成部分包括通过音响传送并且由用户在第一次使用装置时至少一次执行的自动化听力测试。对每只耳朵单独执行一系列(优选为三次)经修改的空气传导测试。整个可听频率范围内的个人听力曲线是在20Hz到20000Hz的范围内的20到24个不同频率上针对每只耳朵记录的。每个测试频率上的听力灵敏度阈值和动态音量范围是基于用户反馈定义的。记录每只耳朵的听力曲线并将其存储在装置中。可以存储很多针对各种用户和/或各种音响的曲线。

个性化

本发明的该组成部分允许播放装置根据在听力自测试期间确定并记录的收听者的听力曲线特性来创建个性化算法，以对来自音响的声音进行量身定制(个性化)。通常在第一次使用特定音响时执行一次针对该用户的个人设置。然而，其也可以在需要时重复进行，并且所述设置在播放装置被置于未供电状态时总是被记住，即使是很长时间。

补偿计算算法

本发明的该组成部分使用用户的个性化信息(由上文的“个性化”模块计算的个性化算法)，并且然后计算在播放期间在所提出的信号补偿算法中使用的针对每只耳朵的所需补偿参数。

播放

在完成上述三个步骤之后，可以将音响用于个性化的音乐收听。在播放期间，所述装置使用由前一模块计算的补偿参数来生成针对每只耳朵的有效率的均衡器。来自音频源的左/右音乐信号被所生成的均衡器单独均衡，并由附加的量身定制算法进行实时处理，并且然后被传送至对应的收听装置，例如耳机、听筒或扬声器。

声学模拟

如前文指出的，现有的播放装置不提供针对特定听力缺陷的补偿，所述的具体听力缺陷针对个体收听者进行匹配和优化。下文的公开内容包括如下实施例：其为用户提供了快速并且精确的方式来测量他/她的听力曲线，以根据他/她的特定听力特性对源自于播放装置的音频信号进行调节(经由个性化模块)，并在使用所述装置进行播放期间提供所需的信号补偿。所得到的收听体验与具有接近“理想听力”的体验相似。

示例1

下文是以针对用户进行个性化设计的方式调整音频播放器的均衡的示例。所涉及的操作包括：执行动态范围计算，以针对多个预定频率确定用户的动态听力范围；执行听力数据计算，以针对用户的每只耳朵单独地确定所述多个预定频率中的每者的上端水平和下端水平；使用听力数据计算的输出调整音频播放器的均衡，以获得用户量身定制的均衡；以及在向用户播放音频文件之前将用户量身定制的均衡应用于音频信号。

图2示出了用于实施该特定实施例的信号流的块图。在该实施例中，音频信号个性化包括若干定制构建块或模块。所述模块可以使用数字信号处理(DSP)和适当的算法来实施。图2示出了该实施例的实施方式的一个示例，其示出了信号通路。如图2所示，处理链包括下述关键算法/处理块：

1.测试个性化模块205，

2.均衡器设计者模块215，

3.均衡器引擎模块220，以及

4.用于存储用户的个性化数据或者用户音响数据以及对应的均衡器控制参数的专用非易失性存储器模块210。

在该示例中，个性化模块205使用用户输入来生成个性化听力参数，所述参数是针对用户进行个性化的，并且对于用户的每只耳朵而言是特定且独立的。这些听力参数对于用来进行测试的音响而言也可以是特定且个性化的。为了生成这些个性化听力参数，个性化模块205可以包括动态范围计算模块和听力数据计算模块。而且，可以包括音调发生器，以生成在听力测试期间使用的音调。所述音调发生器可以是抽样器、合成器或者简单的正弦波发生器。

个性化听力参数被存储到非易失性存储存储器210中。如下文将更加充分地讨论的，在一些实施例中，用户具有通过(例如)根据所存储的参数控制均衡效果来对均衡器的设计进行量身定制的选项。其在文中被称为压缩因子。在实施该选项时，将用户输入提供给均衡器设计215，以将压缩因子应用于量身定制的均衡，由此降低量身定制的均衡的动态范围。

一旦完成了均衡器引擎的设置，就通过均衡器引擎使音频输入均衡，以便提供针对用户—音响对特别量身定制的均衡的音频输出。

示例2

根据该实施例，本发明的模块被实施成图3中所示的特定硬件布置。图3是根据该特定示例的装置300的硬件块图。在该示例中，所述装置能够接受各种类型的输入：

·模拟输入

·数字输入

·USB音频输入

通往所述装置的模拟输入被传输到缓冲放大器，缓冲放大器之后是A/D(模拟到数字)转换器，如310所指示的。A/D转换器的输出作为数字流被发送至CPU/DSP 320。

所述装置还能接受来自各种源(例如，S/PDIF连接、光学或同轴电缆)的纯数字音频流，以及经由USB音频接口305通过USB连接接受音频流。这些流传输通过适当的缓冲/调节电路抵达CPU/DSP 320。

所有的接口部件325(按钮、小键盘、开关、指示器和显示器)连接至适当的接口。这些部件又会提供与CPU/DSP 320的适当连接。

CPU/DSP 320连接至总体上被指示为储存器315的三个存储器类型：闪速存储器、EEPROM(被称为非易失性存储器)以及SRAM或DRAM。一些CPU/DSP装置提供片上闪存和SRAM存储器，因而使得包括外部闪存/SRAM部件变得没有必要。闪存和EEPROM存储器存储在掉电的情况下必须是非易失性的所有程序、参数和数据。SRAM在装置处于操作当中时存储参数和数据。

CPU/DSP 320的输出可以包括若干数字音频流。这些流被馈送至D/A(数字到模拟)转换器，并从那里被馈送至被统一指示为330的模拟音频驱动器。在一个示例中，D/A转换器具有与A/D转换器相同数量的位和抽样频率。

CPU/DSP 320还能够输出专用数字音频流，以允许连接至能够接受这些类型的流的任何音频播放装置。

CPU/DSP 320负责运行提供所述装置的功能的所有软件。CPU代码存储在板上/片上非易失性存储器(闪存)中。

在一个示例中，实现本发明的方面的操作被体现在存储于存储器315中的程序中，所述程序在被执行时使CPU/DSP 320执行包括下述操作的操作：执行动态范围计算，以针对多个预定频率确定用户的动态听力范围；执行听力数据计算，以针对用户的每只耳朵单独地确定所述多个预定频率中的每者的上端水平和下端水平；使用听力数据计算的输出来调整音频播放器的均衡，以获得用户量身定制的均衡；以及在向用户播放音频文件之前将用户量身定制的均衡应用于音频信号。

示例3

该示例示出了本发明的实施例的逻辑操作。图4是主状态图，其解释了所公开的实施例的逻辑操作。从图4可以看出，所述方法具有两种逻辑操作状态：个性化和播放。在个性化状态中，能够针对用户或者用户—音响对来对装置进行个性化。用户可以通过经由装置用户接口(例如，图3中的接口325)启动个性化操作的过程而在必要时经常重复所述个性化操作。在个性化程序结束时，装置“适用于”用户或用户—音响对，以使声音处理算法是在整个频率范围内针对两只耳朵优化的。个性化参数被保存到非易失性存储器，例如，图3的存储器315。用户也可以在播放状态中间重启个性化。用户也可以放弃个性化并且切换至播放状态。在该情况发生时，所取得的任何测量结果将不会被保存。在播放状态下，装置根据在个性化模式期间计算出的个性化参数进行操作，以补偿用户的不完善的听力。

当处于播放状态时，用户能够控制下述参数：音量：该参数控制装置的输出音量；平衡：该参数控制左音频声道和右音频声道之间的音量平衡；低音、高音：参数“低音”和“高音”在低频和高频上提供附加的提升/削减，与高端室内音频系统类似；压缩因子：参数“压缩因子”允许用户的听力得到部分补偿而不是完全补偿，该参数帮助用户通过选择优选的补偿程度而在初始使用时段期间习惯所述装置；以及目标均衡曲线：该参数基于用户的听力数据而定义所述装置将生成的目标频率响应曲线。默认目标均衡曲线是平坦的，其表示“理想”听力情况，但是可以使用其它目标曲线来模拟某些扩音器的调音等等。

示例4

下文的示例提供了个性化算法的实施例，其测量并收集来自个体用户的听力参数。继而将这些参数用于设计与用户的两耳听力匹配的均衡器。由于很多人两耳听力不均等，因而有必要在均衡过程中将两耳区别对待；因而必须单独地从两耳收集数据。

人的听力跨越从20Hz到20000Hz的最多十个倍频程的范围。然而第一个和最后一个倍频程中的准确均衡可能非常困难，因为很多(甚至大多数)人都遭受对应频率上的严重听力损失。因而，在一些实施例中，测试局限于从大约90Hz到5600Hz的频率。就正常情况下与听力相关联的频率范围的倍频带而言，人耳在第5、第6、第7和第8倍频带中最灵敏。因而，在一些其它实施例中，测试局限于从大约710Hz到11200Hz的频率。

此外，不希望获得那些频率上的完全均衡(即，对损失的完全补偿)，因为其易于产生信号失真以及令人不悦的人为效果。出于这些原因，在一个特定示例中，将第一个和最后一个倍频程从个性化程序中排除，以使测试局限于从大约90Hz到5600Hz的频率。

根据该特定实施例，选择具有离散频率的初始的一组音调。在一个特定示例中，可以例如在近似对数标度上选择离散频率，每倍频程三个频率，总共24个频率。可以包括或不包括第一个和最后一个倍频程。替代地，频率可以是仅从第5个到第8个倍频程中选择的。在使用第一个和最后一个倍频程时，可以使用结果对听力损失进行完全或部分补偿。而且，在一个特定示例中，为每只耳朵使用处于50Hz到12KHz的范围内的24个测试音调频率。

图4A所示的个性化测试程序(通过语音指令或者文本指令)被引导；因此免除了用户对阅读并记住印刷的指令的需要。

个性化程序具有两个主要步骤：

·动态范围计算405

·听力数据计算410

在完成了步骤405和410之后，在步骤415中使用步骤405和410的结果对均衡器进行调整。在该实施例的方法中，第一步骤405是计算并调整用户的听力动态范围，该范围由两个单独的音量水平构成：

·上端水平，在该水平上用户的每只耳朵能够舒服地听到所有的(不同频率的)音调，以及

·下端水平，在该水平上用户不能听到所述音调中的任何音调。

参考图4B，根据一个实施例，如下完成第一步骤，即动态范围计算。在步骤435，选择一系列音调。在步骤440，在每只耳朵(左耳或者右耳)中重复地播放所述系列，并提示用户提供指示该用户听到该系列中的所有音调的能力的输入。针对另一只耳朵重复该操作。当该过程在445结束时，系统使用从测试程序获得的数据来在450处生成多个状态。之后，所述过程进行至在455处使用在步骤450中生成的状态来执行听力数据计算。

在图4C中提供了动态范围程序的更加详细的示例。根据该实施例，针对每只耳朵确定上端水平和下端水平。为了确定上端水平，向用户的每只耳朵播放一系列有区别的音调。该系列被顺序播放，其中，在每次播放时，所有音调都是按顺序一个接一个地播放的。例如，如果选择24个频率，那么所述程序将一个接一个地(例如，按照频率的升序)按顺序生成24个音调。提示用户提高音量、降低音量或者接受音量，以使得能够舒适地听所有的音调。这是针对每只耳朵单独完成的。

为了确定下端水平，重复相同的程序，但是这次提示用户调整音量直到什么都听不到为止。这样就结束了初始测试，根据该测试确立了每只耳朵的两个音量水平：每只耳朵的上端音量水平和每只耳朵的下端音量水平。每个音量水平适用于整个系列，即，适用于该系列中的所有频率/音调。

例如，在步骤441中，在用户对音量进行调整时在右耳中重复播放该系列音调，以使所有音调都被舒服地听到。在步骤442，一旦确定完成了音量调整，那么过程就进行至步骤443，在该步骤中，在左耳中播放该系列。再次请用户调整音量，直到能够舒适地听到该系列中的所有音调为止。当在步骤444完成调整时，过程进行至步骤446，在该步骤中，再次在右耳中播放该系列，但是这次请用户降低音量直到听不到该系列中的任何音调为止，即，直到用户听到的是寂静无声为止。在448，对左耳重复该过程。在过程完成时，通过设置音调/耳朵对并针对每一对设置上端水平、下端水平和中等水平而生成状态，下文将对此做进一步解释。

该实施例的方法中的第二步骤是听力数据计算。在动态范围计算程序结束时，所述算法配备有四个初始数据值：每只耳朵的上端水平和下端水平。在该特定示例中，所有参数以dB为单位。现在所述算法生成144个状态的一组：每只耳朵72个状态，并且对于24个音调中的每个音调存在3个状态。也就是说，对于每只耳朵和每个频率存在三个状态：

·上端水平

·下端水平

·中间水平。

中间水平被当做以dB为单位的上端水平和下端水平的中间值。然而，应当注意，可以使用其它中等水平代替中间水平。例如，可以使用乘数k或者函数f(j)确定中等水平。我们用AL_,i、AM_,i和AU_,i(其中，1≤i≤48)来表示每个耳朵/频率对的三个状态。

之后，如我么已经说过的，根据如上文所述的在初始测试中获得的四个值来设置所有的AL_,i和AU_,i，并且如果使用中间水平，则将AM_,i当做0.5(AL,i+AU,i)，如果使用具有乘数的中等水平(其中0<k<1)，则将AM_,i当做k(AL,i+AU,i)，或者如果使用具有函数而非乘数的中等水平，则将AM_,i当做某一f(j)(AL,i+AU,i)。此时(根据初始测试的结果)我们确信当每个频率以水平AU_,i发声时，用户能够听到该频率，并且当以水平AL_,i发声时，用户不能听到该频率。

根据个性化算法的该实施例，所述方法继续进行以逐渐减小每个耳朵/频率对的上端水平和下端水平之间的距离，直到该距离变得小于规定的阈值为止。在该特定示例中，将如下实现该目的。在图4D的流程图中示出了示例。在步骤460，生成随机数i，在该示例中，i处于1和48之间。在步骤462，在由i确定的耳朵/频率对上以音量水平AM_,i发出短蜂鸣声。在一些实施例中，在边缘处使蜂鸣声波形的包络平滑，以消除可能的喀喇音。指导用户如果他/她听到蜂鸣声则做出响应(例如，按下按钮)。所述算法进行等待，直到在步骤464中提供响应或者直到在步骤466已经经过了超时周期为止。在后一种情况下，所述算法假定未听到所述蜂鸣声。

现在执行状态更新。取决于结果，做出两种选择之一：如果听到了蜂鸣声，那么在步骤468中所述算法设置AU,i＝AM,i，并且之后将AM,i更新为AM,i＝0.5(AL,i+AU,i)，或者如果使用具有乘数的中等水平，则将AM,i更新为AM,i＝k(AL,i+AU,i)。如果没有听到蜂鸣声，那么在步骤469，所述算法设置AL,i＝AM,i，并且之后将AM,i更新为AM,i＝0.5(AL,i+AU,i)，或者如果使用具有乘数的中等水平，则将AM,i更新为AM,i＝k(AL,i+AU,i)。在任一种情况下，减小AL,i和AU,i之间的距离，例如，在k＝0.5的特定示例中使其减半。因此所述算法继续，每次随机地选择i并减小/减半对应的耳朵/频率对的上端水平和下端水平之间的距离。随机化用来消除耳朵的可能使结果发生偏差的“记忆”。随机化被应用于被测试的耳朵以及被测试的音调。

当在步骤470达到使A_U,i-A_L,i≤D(其中，D是预设阈值)的点时，所述算法进行至步骤472，在该步骤中，所述算法可以使用所获得的AM,i将第i个耳朵/频率对标记为已完成。替代地，根据一个实施例，在步骤470，当A_U,i-A_L,i≤D时，所述过程进行至步骤472，并进行最终计算AM,i＝0.5(AL,i+AU,i)，或者如果使用具有乘数的中等水平，则进行最终计算AM,i＝k(AL,i+AU,i)，并且将第i个耳朵/频率对标记为已完成。因而，值AM_,i在±0.5D以内接近用户的听力阈值水平。该特定示例使用D＝2dB，其使得阈值水平在±1dB以内是准确的。

在所有的耳朵/频率对都被标记为已完成之后，所述算法终止，提供了48个AM_,i值作为输出。文中将这些值称为用户的听力数据。这些值被存储在非易失性存储器中，以使它们可用于其它算法的组成部分。图5A示出了表示每只耳朵的每个测试音调的听力灵敏度的听力数据的图形表示。

若干用户可以使用同一装置(家人或朋友)，在该情况下存储若干听力数据组。此外，个体用户可以在不同时间使用不同的听筒。在该情况下，建议用户针对每个听筒对单独地执行个性化，并存储对应的听力数据(因为不同的听筒型号之间存在频率响应和/或灵敏度的差异)。

均衡器设计算法

均衡器设计算法是在后台操作的，并且用户不可对其直接访问。在下述情况下进入该算法：

·在个性化程序结束时。

·当用户改变“压缩因子”时。

·当用户改变“低音”或“高音”时。

·当用户改变目标均衡曲线时。

均衡器设计算法基于个性化数据针对每只耳朵单独地计算均衡器的系数，并且任选通过“压缩因子”、“低音”和“高音”数据对所述系数进行修改。其准确度被确定为与个性化数据的准确度一致。

均衡器设计采用48个听力数据值的组作为输入，如在个性化算法中所述并且如图5A所示的。这些值对应于用于左耳的24个值和用于右耳的24个值，因而我们可以只重点讨论一个声道。我们用A_i表示听力数据的组，并且回想起这些正是来自个性化算法的AM_,i的最终值。

在该特定实施例中，均衡器设计针对每只耳朵添加了两个附加的数据值：

-频率0上的数据点，使其等于最低测试音调的数据点的值。其将频率响应扩展至0Hz。

-在频率Fs/2上(抽样速率频率的一半)的数据点，使其等于最高测试音调的数据点的值。其将频率响应从我们的最高测量频率一直扩展至Fs/2。此时，针对每只耳朵我们具有26个测量结果，如图5B所示。

除了听力数据之外，所述算法还受若干控制的影响：

·压缩因子(任选的)

·低音

·高音

·平衡

·目标均衡曲线

这些控制的值/状态是由用户设置的并且被存储在非易失性存储器中。

常用的图形均衡器使用递归带通滤波器组，其中，每个这种滤波器被调谐至某一中心频率和某一Q因子。该类型的均衡器并非是无相位失真的；此外，难以准确地控制它们的幅度响应特性。

相反，所采取的实施方式是单个高阶有限脉冲响应(FIR)滤波器均衡器。可以使这种滤波器无相位失真(即，线性相位)，并且这种滤波器可以具有准确的幅度响应。此外，已知FIR滤波器对计算噪声具有低灵敏度，并且具有有效率的硬件架构。

均衡器设计者将基于用户的听力数据和控制的值来计算FIR系数。图6中示出了FIR滤波器的图形表示，其中，x[n]表示输入信号(要播放的音乐)，y[n]表示输出信号(发送至驱动器——扬声器或耳机的信号)。该实施例的FIR滤波器包括具有N+1个抽头(系数)b₀到b_n的N级延迟线，并且Z^-1是一个抽样时间(1/Fs)的延迟级。应当基于所需的精确度来选择FIR系数的数量。将来自所有抽头的信号相加，以生成输出信号y[n]。在下一示例中，我们使用n＝512个FIR滤波器系数以及48KHz的抽样速率。

示例5

在设计的第一步骤中，均衡器设计者将扩展的用户听力数据“箝位”至0dB值。这是通过找到扩展的用户听力数据(左耳数据点和右耳数据点，总共52个数据点)中的最小值来完成的。在找到该值之后，我们从扩展的用户听力数据的每者中减去该值。在该操作之后，用户的扩展的听力数据中的最低值将总是0dB，如可以从图5C中看出的。

在描述FIR系数的计算之前，我们必须讨论可选的控制压缩因子(CF)的作用。

识别出52个A_i中的最大的A_iMax和最小的A_iMin。52个A_i中的最大的A_iMax和最小的A_iMin之间的差(以dB计)表示频域中的均衡器的动态范围。动态范围取决于人的听力，并且对于一些听力受损的人而言其可以达到几十dB。具有大动态范围的均衡器易于产生伪影，例如哨音和类似于回声的声音，这些声音倾向于在输入音频信号经历突然的变化时出现。此外，已经遭受听力受损多年的人通常不习惯其听力突然提高，并且可能在过渡期期间对新的声音感到不适。

出于这些原因，实施方式包括可选的CF控制，其目标在于将均衡器的动态范围减小至由听力数据提供的完全动态范围的一部分。

根据一个示例，CF采取由用户控制的预设离散值，例如，从0到31的32个离散值。其功能在于根据下述公式修改听力数据中的每者：

A_icf＝A_min+(Ai–A_min)CF/32

其中，A_icf是在应用压缩因子之后的听力数据值。我们观察到了下述内容：

·如果CF＝0，那么A_icf＝A_min，这意味着均衡器是平坦的。

·如果CF＝32，那么A_icf不存在变化，这意味着全动态范围内的均衡。

·对于CF的中等值，动态范围从Amax-A_min变为(Amax-A_min)CF/32，因而其变成了初始动态范围的一部分。

我们已经发现，在自适应的早期阶段，CF≈10对于很多初始用户而言是令人感到舒服的值。再往后，当用户更加习惯于该装置时，他或她可以选择更高的CF值。接近最大值的CF值可能更加适用于只有轻度损伤的用户。图5D示出了在使用CF＝10之后用户的扩展听力数据。可以看出，图5D的曲线图与图5C的曲线图形状相同，只是在y轴上的幅度降低。

在通过压缩因子对听力数据进行校正之后，通过使用内插法在整个频率范围内计算幅度响应。该步骤使用用户的扩展听力数据(每只耳朵26个点)，并且针对每只耳朵的总共N个数据值计算附加的数据点，其中，N是FIR的系数的数量。这是必需的，因为在该示例中我们必须设计出长度512的FIR，因而要对26个点进行外插，以生成512个数据值。内插过程创建了每只耳朵512个值的数据组，其中，每个数据组对应于下述频率上的用户的听力灵敏度

F[n]＝n*Fs/512(对于n＝0,255)

注意，对于大于或等于Fs/2的频率而言，我们将数据点值设定为0(如根据奈奎斯特定律所要求的，以避免混叠)。在图5E中对此给出了例示。

下一步骤是目标均衡曲线(如果需要的话)。到目前为止，我们都在对均衡器进行设计，以生成平坦的频率响应结果。由于我们使用在前一步骤中获得的内插数据组在频域内进行操作，因而现在我们能够通过操纵特定数据点来创建任何所需的均衡曲线。例如，如果我们想要使频率Fi上的增益提高XdB，那么我们将额外的增益添加到已经处于该数据组的值：

放大响应[Fi]+＝X

下一步骤是添加低音(BA)和高音(TR)控制。现在我们可以受益于FIR方案的附加的优点，即：能够容易地将低音和高音包含到总频率响应中，而不需要附加的低音滤波器和高音滤波器。这两种控制的形状是预设的，并且可以使控制值以1dB的步长在-12dB到12dB之间变化。

要添加的最后的控制是平衡(BA)。这是简单地通过将平衡值(以dB计)的一半添加到右声道均衡器并从左声道均衡器减去该值的一半而被包括的。

在我们设计均衡器之前，我们可以可选地使目标频率响应从16000Hz下降(例如，线性地)到Fs/2(在我们的示例中为24000Hz)。这样做使FIR设计过程变得容易。这在图5F中示出。

在算法中的该点，可以以通过FIR长度(在该示例中为512)确定的频率分辨率获得每个声道的全幅度响应。为了计算所需的FIR系数b0..511，我们将使用逆快速傅里叶变换(逆FFT)。我们将使用为零的相位、在前面步骤中计算出的数据组和幅度响应(实部)来用于逆FFT的输入。我们创建对称FIR，其在因果关系实施方式中将变为线性相位。应用平缓的窗口(例如，Hann函数)，以进一步使频率响应变得平滑。在该步骤结束时，我们具有两个由512个FIR系数构成的组(每只耳朵一组)，其可以与按照图6实施的FIR滤波器一起使用。

均衡器设计算法的其余步骤不与频率响应直接相关，而是侧重音量控制的初始设置。均衡的信号的输出能量既取决于输入信号频谱又取决于均衡器的频率响应。尽管后者是已知的，但是前者难以预测并且随着音乐的变化而改变。因此，我们使用“典型”音乐频谱，其能量在低频和中频上近似相等，并且从预设频率以上以每十倍频程40dB的速度下降。输入信号频谱和均衡器响应的和(以dB计)给出了输出信号频谱，能够容易地根据该输出信号频谱计算出能量。初始音量控制然后随着所计算出的能量而负变化，由此使得所感知的信号水平大致恒定(这意味着不管是否运用均衡器，用户听到的所感知的音量水平都将是相同的)。当然，用户可以总是将音量控制人工地调整到期望水平。

注意，用户可以在运行时间改变压缩因子、低音控制和高音控制以及目标曲线选择的值。任何这样的变化都将触发如上文所述的对均衡器(例如，FIR滤波器系数)的自动重新设计，并且将其馈送至均衡器引擎。用户将能够立即注意到任何控制变化的效果。

在一个实施例中，按照每只耳朵，使用在前面的步骤中计算出的滤波器系数将均衡器引擎实施为对称FIR滤波器。

如果目标架构不支持对称FIR的有效率的实施方式，那么作为替代可以使用标准FIR滤波器实施方式(通过复制所计算出的系数)。

从上文的描述和对应的附图中可以理解，本发明的实施例通过生成针对特定用户以及该用户使用的特定音响进行个性化的均衡器而增强了对音乐的享受。本发明的实施例可以实施成硬件、软件或者硬件和软件的组合。例如，本发明的实施例可以实施成包括存储于其上的指令的非暂态计算机可读介质，所述指令在处理器上被执行时执行下述步骤：执行动态范围计算，以针对多个预定频率确定用户的动态听力范围；执行听力数据计算，以针对用户的每只耳朵单独地确定所述多个预定频率中的每者的上端水平和下端水平；使用听力数据计算的输出来调整音频播放器的均衡，以获得用户量身定制的均衡；以及在向用户播放音频文件之前将用户量身定制的均衡应用于音频信号

在一些实施例中，听力数据计算生成数量N的个性化听力数据，并且还包括将个性化的听力数据转化为均衡系数的步骤。转化个性化的听力数据的步骤可以包括将N个个性化的听力数据外插到M个外插听力数据中并将M个外插听力数据转换为M个均衡器系数的步骤，其中，M个均衡器系数可以是FIR滤波器的M个系数。转换M个外插听力数据的步骤可以是通过将逆快速傅里叶变换应用于M个外插听力数据而执行的。实施例还可以包括应用压缩因子以由此缩小量身定制的均衡的动态范围的步骤。

尽管已经在本文中例示和描述了本发明的某些特征，但对于本领域的技术人员，可以出现很多修改、替换、改变和等价方案。因此，应当理解所附权利要求旨在覆盖落在本发明的真正精神内的所有这种修改和变化。

Claims

1.一种用于调整针对用户进行个性化的音频播放器的均衡的计算机实现的方法，包括：

执行动态范围计算，以针对多个预定频率确定所述用户的动态听力范围；

执行听力数据计算，以针对所述用户的每只耳朵单独地确定所述多个预定频率中的每者的上端水平和下端水平；

使用所述听力数据计算的输出来调整音频播放器的均衡，以获得用户量身定制的均衡；以及

在向所述用户播放所述音频文件之前将所述用户量身定制的均衡应用于音频信号。

2.根据权利要求1所述的方法，还包括将压缩因子应用于所述量身定制的均衡，由此减小所述量身定制的均衡的所述动态范围。

3.根据权利要求1所述的方法，其中，执行动态范围计算包括：针对每只耳朵单独地获得指示所述用户能够听到所述多个预定频率的音量水平以及所述用户不再能够听到所述多个预定频率的音量水平的用户输入。

4.根据权利要求3所述的方法，其中，在获得所述用户的输入之前，在所述用户的耳朵中发出所述多个预定频率的声音作为一系列音调。

5.根据权利要求4所述的方法，其中，所述一系列音调排除了来自所述用户能够听到的第一个倍频程和最后一个倍频程的频率。

6.根据权利要求1所述的方法，其中，执行听力数据计算包括：针对所述多个预定频率中的每者确定初始最高水平和初始最低水平，以及使用用户的输入来使针对所述多个预定频率中的每者的每个最高水平与其对应的最低水平之间的跨距最小化。

7.根据权利要求6所述的方法，其中，当所述多个预定频率中的一个频率的最高水平与其对应的最低水平之间的最小化的跨距达到了预设阈值时，为所述多个预定频率中的所述频率指定听力阈值水平。

8.根据权利要求7所述的方法，其中，将所述听力阈值水平计算为最高水平与其对应的最低水平之间的最小化的跨距的中点。

9.根据权利要求7所述的方法，还包括将压缩因子应用于所述量身定制的均衡，其中，将所述压缩因子计算为所述最高水平中的最高的一个与所述最低水平中的最低的一个之间的跨距乘以零和一之间的乘数。

10.根据权利要求1所述的方法，其中，调整音频播放器的均衡包括使用所述听力数据计算来修改有限脉冲响应滤波器的系数。

11.根据权利要求1所述的方法，其中，将所述用户量身定制的均衡应用于音频信号包括将单独的均衡应用于左耳声道和右耳声道。

12.一种用于调整针对用户进行个性化的音频播放器的均衡的方法，包括：

生成具有不同频率的一系列多个音调；

执行下述操作至少一次：

在所述用户的一只耳朵中发出所述系列的声音，并且请求来自所述用户的指示是否听到全部所述多个音调的输入；以及

在所述用户的第二只耳朵中播放所述系列，并且请求来自所述用户的指示是否听到全部所述多个音调的输入；

此后执行下述操作：

生成多个状态的组，每个状态包括所述多个音调中的一个音调并且具有对左耳或右耳的分配、具有经分配的上端水平、具有经分配的下端水平、并且具有中等水平；

向所述用户发出所述状态中的每者的声音，并且根据所述用户输入来更新所述状态，以生成更新的状态；以及

使用所述更新的状态来调整所述均衡。

13.根据权利要求12所述的方法，其中，请求来自所述用户的指示是否听到全部所述多个音调的输入包括：在一个阶段请求所述用户对音量进行调整直到舒适地听到所述系列为止，并且在第二阶段请求所述用户对所述音量进行调整直到不能听到所述系列为止。

14.根据权利要求13所述的方法，其中，所述经分配的上端水平对应于舒适地听到所述系列时的音量，并且所述经分配的下端水平对应于不能听到所述系列的音量。

15.根据权利要求14所述的方法，其中，更新所述状态包括：针对所述状态中的每者使所述上端水平与所述下端水平之间的跨距最小化。

16.根据权利要求15所述的方法，其中，使所述跨距最小化包括减小所述跨距直到所述跨距达到预设阈值为止。

17.根据权利要求16所述的方法，还包括在跨距达到预设阈值时设置阈值水平。

18.根据权利要求12所述的方法，其中，向所述用户发出所述状态中的每者的声音并根据所述用户输入更新所述状态以生成更新的状态的步骤包括：

多次执行下述操作：

随机地选择所述状态中的一个状态：

在所述用户的耳朵之一中以处于所述经分配的上端水平和所述经分配的下端水平之间的中等水平发出对应于所述状态的音调的声音；

请求所述用户指示是否听到了所述音调，以及：

如果听到了所述音调，那么将所述上端水平设置为等于所述中等水平，由此生成经修订的上端水平，并且设置经修订的中等水平；

如果未听到所述音调，那么将所述下端水平设置为等于所述中等水平，由此生成经修订的下端水平，并且设置经修订的中等水平；

判断所述经修订的上端水平与所述经修订的下端水平之间的跨距是否达到了预设阈值，如果是，那么将所述经修订的中等水平设置为针对所选择的状态的听力数据。

19.根据权利要求18所述的方法，其中，使用所述更新的状态来调整所述均衡包括将所述听力数据应用于有限脉冲响应滤波器的系数。

20.根据权利要求19所述的方法，还包括将压缩因子应用于有限脉冲响应滤波器的所述系数，由此减小所述均衡的动态范围。

21.根据权利要求20所述的方法，其中，所述压缩因子是通过下述操作设置的：

确定全部所述状态中的具有最高水平的最高上端水平；

确定全部所述状态中的具有最低水平的最低下端水平；

将小数乘数应用于所述最高上端水平和所述最低下端水平的跨距。