CN112956210B

CN112956210B - 基于均衡滤波器的音频信号处理方法及装置

Info

Publication number: CN112956210B
Application number: CN201980071007.3A
Authority: CN
Inventors: 庞立昀; 丰斯·阿德里安森; 罗曼·施利珀; 李松
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2019-02-15
Filing date: 2019-02-15
Publication date: 2022-09-02
Anticipated expiration: 2039-02-15
Also published as: EP3847827A1; WO2020164746A1; US11405723B2; CN112956210A; US20210250686A1

Abstract

本发明涉及一种用于处理音频信号的方法，该方法包括：根据一对嘴对耳传递函数来处理所述音频信号，以获得处理后的音频信号；使用一对均衡滤波器来对所述处理后的音频信号进行滤波以获得滤波后的音频信号，其中，所述均衡滤波器的参数取决于耳机的声阻抗；以及将所述滤波后的音频信号输出到该耳机。根据此方法，抵消闭塞效应并提供自然的感知声压。

Description

基于均衡滤波器的音频信号处理方法及装置

技术领域

本发明涉及音频信号处理和再现的领域。更具体地，本发明涉及一种用于使用均衡滤波器来处理音频信号的方法，以及一种用于基于均衡滤波器来处理音频信号的装置。本发明还涉及一种计算机可读存储介质。

背景技术

耳机是戴在用户耳朵上方或周围的一对小型扬声器驱动器。耳机是电声换能器，它们可将电信号转换为对应的声音。与扬声器相比，耳机使单个用户可私下收听音频源，而扬声器向室外发出声音，使得附近的任何人都可听到。耳机也称为耳用扬声器或耳机。环耳式(“在耳朵周围”)和耳上式(“在耳朵上”)耳机在头顶上方使用束带将扬声器固定就位。称为耳塞或听筒的另一种类型由插入用户耳道的各个单元组成。在电信的背景下，头戴式耳机是耳机和麦克风的组合。耳机可直接使用电线或使用无线技术(诸如蓝牙或FM收音机)连接至信号源，诸如音频放大器、收音机、CD播放器、便携式媒体播放器、移动电话、视频游戏机或电子乐器。

由于声音封闭式耳机在嘈杂环境中具有更好的信噪比，因此优选采用声音封闭式耳机，以尽可能地减弱外部噪声并获得良好的音频再现质量。封闭式耳机，尤其是密封耳道的“耳内”(入耳式)和“外耳内”(耳塞式)耳机，可能会增加从耳道内部到外部了解到的声阻抗。对于耳道内部的低频，声阻抗增加后，声压级也会增加。对于自己产生的声音(例如，说话、摩擦和嗡嗡声)，在听或说时会感觉到声音不自然地放大且不舒服。该效应通常被描述为闭塞效应。

如图1所示，耳膜处的声压是由通过嘴104传输到耳道103的起点的喉部101所产生的声音与所传输的人体传导的声音的总和。图1示出未发生闭塞效应的开放式耳朵场景(参考场景)。Hme表示通过空气从嘴104到内耳102的传递路径，并且Hb表示通过骨头从喉部到内耳102的传递路径。

如图2示意性所示，如果用耳机封闭耳道，则通过空气(Hme)传输的声音被耳机(105)的隔离曲线衰减。穿过人体的信号路径(Hb)保持不变。用耳机密封耳道的作用是在低频下放大耳膜前方的声压。这导致闭塞效应。

在图3中，通过比较耳道内测得的两个声压级频谱来示出闭塞效应。虚线曲线示出未闭塞的开放式耳朵的声压。实线曲线示出同一人戴着环耳式(耳挂式)耳机的耳道内部的声压级。可以看出，声压级在大约60Hz至400Hz之间的频率范围内增加。

“自然度”是通过耳机进行声音再现的重要感知属性之一。自然度被定义为用户完全沉浸在原始环境中的感觉。在“仅聆听”的情况下，这是在耳道入口处的双耳录音，可以被回放(环境声音)。从用户开始讲话的那一刻起，周围声音的再现就不再那么重要了，沉浸感也得以减弱。在用户正在讲话或参加电话会议的情况下，环境声音不太重要。因此，更重要的是确保当用户戴上头戴式耳机时对自己的声音的感知与不戴头戴式耳机时的感知一样接近。然而，自然度会受到佩戴声学封闭式耳机(尤其是入耳式耳机)的影响，因为此类耳机具有很强的闭塞效应。

发明内容

本发明的主要技术领域是通过耳机的双耳音频再现。本发明的一个目的是通过利用头戴式耳机的线内麦克风捕获用户自己的声音来减少入耳式或耳塞式耳机的闭塞效应，并且本发明的实施例还可用于耳挂式或耳上头戴式耳机。头戴式耳机经过抗闭塞算法处理，从而在耳道内产生自然的声压分布。

前述和其他目的是通过独立权利要求的主题来实现。根据从属权利要求、说明书和附图，进一步的实现方式是显而易见的。

本发明的第一方面提供一种处理音频信号的方法，所述方法包括：根据一对嘴对耳传递函数来处理音频信号，以获得处理后的音频信号；使用一对均衡滤波器来对处理后的音频信号进行滤波以获得滤波后的音频信号，其中，均衡滤波器的参数取决于耳机的声阻抗；以及将滤波后的音频信号输出到耳机。

根据所述第一方面的所述音频处理方法，已经降低了用于入耳式或耳塞式耳机的闭塞效应，并且在耳道内创建了自然的声压分布。

音频信号表示声音，通常对模拟信号使用一定的电压电平，对数字信号使用一系列的二进制数。音频信号的音频频率范围约为20Hz至20,000Hz，对应于人类听力的上限和下限。音频信号可直接合成，也可起源于换能器，例如麦克风、乐器拾音器、留声机盒带或磁带头。扬声器或耳机将电音频信号转换回声音。

在实例中，音频信号可由接收器获得。例如，所述接收器可经由有线或无线通信信道从另一设备或另一系统获得音频信号。

在另一个实例中，可使用麦克风和处理器来获得音频信号。所述麦克风用于记录从声源获得的信息，并且所述处理器用于处理由麦克风记录的这些信息以获得音频信号。

在所述第一方面的一个实现方式中，所述嘴对耳传递函数描述从嘴到耳膜的传递函数。

在所述第一方面的一个实现方式中，使用头部和躯干模拟器来获得所述嘴对耳传递函数，或使用真人来获得嘴对耳传递函数。

在实例中，配备有嘴和耳模拟器的头部和躯干模拟器提供用于测量HmeTF的方法。测量从输入信号(被馈送到嘴模拟器的扬声器)到输出信号(来自耳部麦克风)的传递函数或脉冲响应。

在另一个实例中，可测量从嘴附近的麦克风或扬声器到耳部麦克风的传递函数。与提到头部和躯干模拟器的以上实例相比，使用真人的优势是可从测量消除嘴模拟器的响应，并且还非常适合模拟——因为说话的对象可带有类似地位于他们的嘴附近的麦克风作为模拟系统的一部分。

均衡是调整电子信号中频率分量之间平衡的过程。在声音记录和再现中，均衡是通常使用线性滤波器或其他类型的滤波器来更改音频系统的频率响应的过程。用于实现均衡的电路或设备称为均衡滤波器或均衡器。这些设备强化(增强)或减弱(削减)特定频带或“频率范围”的能量。

音乐制作中常见的均衡器或滤波器有参数均衡器、半参数均衡器、图形均衡器、峰值均衡器和程序均衡器或滤波器。图形均衡器或滤波器通常包括在在家用计算机上播放音乐的消费音频设备和软件中。参数均衡器或滤波器比图形均衡器需要更多的专业知识，并且它们可在所选择的频率附近提供更具体的补偿或更改。这可用来除去不想要的共振或增强某些频率。

声阻抗是声压与流量之比。在实例中，根据标准ISO-10534-2，声阻抗被定义为“复声压p(0)与复声粒子速度v(0)的法向分量在参考平面上的单个频率下的比”。参考平面是确定阻抗Z(或反射系数r或导纳G)的阻抗管的截面，并且是测试对象的表面。假设参考平面位于x＝(在我们的上下文中，这是管的末端，测试对象的开始端)。因此，p(0)描述管的末端处的复声压，而v(0)描述了管的末端处的复声速。复声压p和复声压v表示时域中这些参数的傅立叶变换。

在实例中，对于线性时不变系统，施加到系统的声压与通过垂直于该压力施加方向的压力方向的表面的所得声体积流速之间的关系由下式给出：

p(t)＝[R*Q](t)，

或等效地

Q(t)＝[G*p](t),

其中

·p是声压；

·Q是声量流速；

·*是卷积运算符；

·R是时域中的声阻抗；

·G＝R-1是时域中的声学电导(R-1是R的卷积倒数)。

表示为Z的声阻抗是拉普拉斯变换或傅立叶变换，或时域声阻抗的解析表示：

其中

·L是拉普拉斯变换运算符；

·F是傅立叶变换算符；

·下标“a”是解析表示运算符；

·Q-1是Q的卷积倒数。

在所述第一方面的一个实现方式中，基于声阻抗管来测量所述耳机的所述声阻抗。例如，所述声阻抗管可具有从20Hz到2kHz的可测量频率范围。

在所述第一方面的一个实现方式中，所述均衡滤波器的参数是均衡滤波器的增益因子，均衡滤波器的增益因子与耳机的声阻抗的倒数成正比。

在实例中，均衡滤波器的增益因子或形状(g)与的ZHP倒数成正比。

其中α是缩放因子(比例系数)，它可由用户选择，也可在不同耳机的测量过程中确定。

在所述第一方面的一个实现方式中，基于耳机的耳机类型来选择所述对均衡滤波器。

在实例中，基于耳机的声阻抗来预先设计均衡滤波器。因此，需要所用耳机的信息。可手动或自动选择耳机类型。例如，所述耳机类型可由用户基于耳机类别(例如，耳挂式耳机、耳上式耳机)或耳机型号(例如，HUAWEI Earbud)来手动选择。也可通过USB Type-C提供的信息自动选择耳机类型。针对每个耳机，根据耳机的声阻抗然后选择均衡滤波器，如上所述。对于每个类别，我们可基于平均声阻抗来设计滤波器，或针对每个类别使用代表性的均衡滤波器。

在所述第一方面的一个实现方式中，基于通用串行总线USB Type-C信息来获得耳机的耳机类型。

本发明的第二方面提供一种用于处理立体声信号的装置，其中，所述装置包括被配置为执行以下操作的处理电路：根据一对嘴对耳传递函数来处理音频信号，以获得处理后的音频信号；使用一对均衡滤波器来对处理后的音频信号进行滤波以获得滤波后的音频信号，其中，所述均衡滤波器的参数取决于耳机的声阻抗；以及将滤波后的音频信号输出到耳机。

所述处理电路可包括硬件和软件。所述硬件可包括模拟或数字电路，或包括模拟和数字电路两者。在一个实施例中，所述处理电路包括一个或多个处理器以及连接至所述一个或多个处理器的非易失性存储器。所述非易失性存储器可携载可执行程序代码，所述可执行程序代码在由一个或多个处理器执行时，使得所述装置执行本文所述的操作或方法。

在所述第二方面的一个实现方式中，所述嘴对耳传递函数描述从嘴到耳膜的传递函数。

在所述第二方面的一个实现方式中，基于声阻抗管来测量所述耳机的所述声阻抗，所述声阻抗管具有从20Hz到2kHz的可测量频率范围。

在所述第二方面的一个实现方式中，其中，所述均衡滤波器的参数是均衡滤波器的增益因子，均衡滤波器的增益因子与耳机的声阻抗的倒数成正比。

在所述第二方面的一个实现方式中，其中，基于耳机的耳机类型来选择所述一对均衡滤波器。

在所述第二方面的一个实现方式中，基于通用串行总线USB Type-C信息来获得耳机的耳机类型。

本发明中描述的滤波器可以硬件或软件或以硬件和软件的组合来实现。

本发明的第三方面涉及一种存储程序代码的计算机可读存储介质。所述程序代码包括用于执行根据第一方面所述的方法或其实现方式之一的指令。

本发明可以硬件和/或软件实现。

附图说明

为了更清楚地说明本发明的实施例的技术特征，下面简要介绍用于描述实施例的附图。以下描述中的附图仅是本发明的一些实施例，但是在不脱离权利要求所限定的本发明的范围的情况下，可对这些实施例进行修改。

图1示出关于未发生闭塞效应的开放式耳朵场景(参考场景)的实例。

图2示出发生闭塞效应的耳朵场景(参考场景)的实例。

图3示出通过比较耳道内测得的两个声压级频谱来示出闭塞效应的实例。

图4示出根据实施例的用于减小闭塞效应的方法的示意图，

图5示出嘴对耳传递函数的测量的实例。

图6示出根据实施例的通过使用声阻抗管来测量耳机的声阻抗的示意图；

图7示出开放式耳机的声阻抗和封闭式耳机的声阻抗的实例。

图8示出入耳式耳机和耳塞式耳机的声阻抗的实例；

图9示出均衡滤波器的频率曲线的实例；

图10示出根据实施例的在安静环境中配合带有头戴式耳机使用电话的方法的信号处理图；

图11示出根据实施例的高通斜坡滤波器的实例；

图12示出根据实施例的在嘈杂环境中配合带有头戴式耳机使用电话的方法的信号处理图；

图13示出根据实施例的用于处理音频信号的方法的信号处理图；

图14示出根据实施例的用于处理音频信号的装置的示意图。

在附图中，相同附图标记将用于相同或功能上等效的部件。

具体实施方式

在以下描述中，参考了附图，这些附图形成了本发明的一部分，并且在附图中以图示的方式示出可放置本发明的特定方面。应了解，本发明可被置于其他方面，并且可在不脱离本发明的范围的情况下进行结构或逻辑上的改变。因此，由于本发明的范围由所附权利要求书限定，因此以下详细描述不应被视为限制性的。

例如，应了解，与所描述的方法有关的公开内容通常也将适用于被配置为执行该方法的对应设备或系统，且反之亦然。例如，如果描述特定的方法步骤，则即使未在附图中明确描述或示出，对应设备也可包括用于执行所描述的方法步骤的单元。

此外，在以下详细描述以及权利要求中，描述了具有功能块或处理单元的实施例，该等功能块或处理单元彼此连接或交换信号。应了解，本发明还覆盖包括附加功能块或处理单元的实施例，例如前置或后置滤波和/或前置或后置放大单元，他们布置在下文描述的实施例的接收器的功能块或处理单元之间。

最后，应理解，除非另外特别指出，否则本文所述的各个示例性方面的特征可彼此组合。

声道是传递信息的途径，在这种情况下，信息是声音信息。从物理上讲，它可能是例如您讲话的电子管，或者是从麦克风到耳机的电线，或者是放大器或计算机内部电子组件之间的连接。

磁道是记录在磁带上的声道内容的物理位置。在技术允许的范围内，可有任何数量的平行磁道，但对于日常用途，存在1个、2个或4个平行磁道。两个磁道可用于一个或两个播放方向上的两个独立单声道信号，或一个方向上的立体声信号。四个磁道(例如盒式录音机)被组织为成对工作，以在每个方向上产生立体声信号。将单声道信号记录在一个磁道(与左立体声声道相同的磁道)上或同时记录在两个磁道上(取决于磁带录音机或单声道信号源如何连接至录音机)。

单声道声音信号不包含任何方向信息。在实例中，沿铁路平台可能存在若干扬声器，而在机场周围可能有数百个扬声器，但是信号保持单声道。不能仅通过将单声道信号发送到两个“立体声”声道来生成方向信息。然而，通过从一个声道向另一个声道平移，可从单声道信号中产生方向的错觉。

立体声信号可包含来自左右听觉场的同步方向信息。因此，它至少需要两个声道，一个用于左场，一个用于右场。左声道由指向左场的单声道麦克风馈入，而右声道由指向右场的第二个单声道麦克风馈入(您还将找到将两个定向单声道麦克风集成在一起的立体声麦克风)。在实例中，四声道立体声使用四个声道，环绕立体声在左右方向上至少具有除左和右之外的附加声道。公共和家庭影院立体声系统可拥有更多声道，从而将声场划分为更窄的扇区。

立体声，或更常见的是立体声，是一种声音再现的方法，它可产生多方向可听见的幻觉。通常，这是通过使用两个或多个独立的音频声道(通过两个或多个扬声器(或立体声耳机)的配置)来实现的，从而在自然听觉中产生从各个方向听到的声音的印象。

在本发明的一个实施例中，音频信号处理方法或音频信号处理装置的目的是在使用入耳式耳机时提高自然度并降低闭塞效应，并抵消闭塞效应并提供被认为是自然的声压。在实例中，用户的声音被在线麦克风捕获，并且与用于左/右耳的一对嘴对耳传递函数(HmeTF)401进行卷积402，分别形成记录或数据库(图4)。所得信号由基于所用耳机的声阻抗设计的均衡滤波器(抗闭塞滤波器)403进行滤波(k)。

头部相关传递函数(HRTF)是表征耳朵如何从空间中的某个点接收声音的响应。当声音冲击听众时，头部、耳朵、耳道的大小和形状、头的密度、鼻腔和口腔的大小和形状都会改变声音并影响其感知方式，从而提高某些频率并衰减其他频率。一般而言，HRTF在2,700Hz的频率下以+17dB的主谐振从2至5kHz提升频率。

用于两只耳朵的一对HRTF可用于合成似乎来自空间特定点的双耳声音。它是描述来自特定点的声音将如何到达耳朵(通常在耳道的外端)的传递函数。左耳和右耳的HRTF描述分别从声音源到左耳和右耳的声音传播路径对声音的滤波。HRTF也可描述为声音从自由空气方向到到达耳膜的声音的修改。

嘴对耳传递函数(HmeTF)描述从嘴到耳膜的传递函数。HmeTF可使用虚拟头(带有嘴模拟器的头部躯干)进行非单独测量，或HmeTF可通过将智能电话或麦克风靠近用户的嘴部放置并再现测量信号来单独测量。测量信号是通过放置在闭塞的耳道(120)入口附近的麦克风获取的。测量信号可以是噪声信号。图5示出单个HmeTF的测量实例。如果使用非单独HmeTF，则可对其进行一次测量并将其提供给许多用户。如果需要单独HmeTF，则它需要为每个用户测量一次。

在实例中，HmeTF测量可在从同一个头的嘴部到耳朵的真实空间环境中进行。为了进行模拟，可使用HmeTF对讲话者的声音进行实时卷积处理，从而使讲话者可在模拟空间环境中听到自己声音的声音。我们通过实例示出如何使用人类受试者(通过测量语音的传递函数)或头部和躯干模拟器进行HmeTF测量。

在实例中，使用头部和躯干模拟器(HATS)来测量HmeTF。除了在高频范围内之外，HATS的嘴部模拟器方向性与人类对话语音的平均长期方向性相似。HATS的标准嘴部麦克风位置(称为“嘴部参考点”)距离“唇中心”25mm(距脸部表面6mm)。在嘴部参考点使用麦克风。使用一些位于耳道入口附近的麦克风，而不是使用HATS的内置麦克风(声学等效于耳膜的位置)。原因之一是在真人身上使用了类似于HATS之一的麦克风设置。真人身上的麦克风设置包括可与HATS麦克风的麦克风相似或相同并且被放置在与HATS的位置相等的位置上的麦克风。另一个原因是，需要避免通过耳道共振进行测量，因为在模拟中将需要反转强共振峰，否则会引入噪声，甚至可能导致延迟。

在另一个实例中，有关HmeTF的测量是通过将扫掠正弦测试信号发送到嘴部扬声器进行的，该扬声器的声音记录在嘴部和耳部麦克风上。扫描范围为50Hz至15kHz，在15s的时段内对数频率标度上具有恒定的扫描速率。适于使来自扫描的脉冲响应解卷积的信号与三个麦克风信号一起直接发送到记录设备。这样产生从信号发生器到麦克风的脉冲响应(IR)，通过在频率域中将耳部麦克风除以嘴部麦克风，可将传递函数从嘴部麦克风传递到耳部麦克风。该过程首先是对来自嘴部麦克风脉冲响应的直接声音进行傅立叶变换，将其零填充为期望脉冲响应长度的两倍。直接声音由嘴部麦克风IR的最大绝对峰值决定，并使用介于-2到+2ms之间的数据，并应用了Tukey窗函数(50％的窗使用增加的余弦的一半周期来淡入和淡出，中心的50％的常数为1)。

在另一个实例中，傅里叶变换窗长度用于耳部麦克风脉冲响应，窗的后半部分被零填充。传递函数是通过将交叉谱(嘴部IR的共轭乘以耳部IR)除以嘴部麦克风直接声音的自动谱来获得的。在返回时域之前，将带通滤波器应用于传递函数，以使其处于100Hz至10kHz的范围内，以避免频谱极端情况下的信噪比问题(这是通过在此范围之外通过系数接近零来将频谱分量相乘来实现的)。在应用傅立叶逆变换后，脉冲响应将被截断(丢弃后半部分)。每只耳朵的所得IR乘以麦克风校准信号(声压级为94dB)的嘴对耳rms值的相应比率，以补偿记录系统声道之间增益的差异。

在另一个实例中，可使用真人并使用与HATS中使用的麦克风布置相似或相同的麦克风布置来测量HmeTF。尽管存在其他可能性，但声源可仅仅是语音。在嘴部附近的麦克风与每个耳部麦克风之间计算传递函数。此方法用于测量嘴对耳传递函数(无室内反射)，也可用于测量室内反射。使用这种技术的优点(与使用HATS相比)可包括匹配该个人的个人长期语音指向性；匹配人耳与头部有关的传递功能；而且测量系统只需要最少的设备。

在实例中，HmeTF的公式取决于其测量方式，通常它是耳朵和嘴部的复合声音信号之间的比率，HmeTF＝p_ear/p_mouth。

在另一个实例中，使用真人和智能电话来测量HmeTF。麦克风设置可能与其他实例类似，并且智能电话必须放置在靠近嘴部的位置。智能电话充当声源和参考麦克风。在智能电话麦克风(参考麦克风)与耳部麦克风之间计算传递函数。这种方法的优点是与真人的语音相比，声源的带宽增加。

均衡滤波器的参数基于耳机的声阻抗。耳机在低频下的声阻抗与感知到的闭塞效应高度相关，即，高声阻抗对应于由耳机引起的高闭塞效应。可使用定制的声阻抗管(例如，根据ISO-10534-2制造的声阻抗管)来测量耳机的声阻抗。测量管可制造为适合人耳道的几何形状，例如，管的内径应为约8mm，并且频率范围应介于至少60Hz与2kHz之间。如图6所示，测量1)带耳机的人造耳

和2)不带耳机的人造耳(|Z|_OE)的声阻抗。然后，可通过计算

与|Z|_OE之间的比率来确定耳机(Z_HP)的声阻抗：

在另一个实例中，可通过计算

与|Z|_OE之间的差来确定耳机(Z_HP)的声阻抗：

图7示出开放式耳机和封闭式耳机的声阻抗的实例。虚线示出开放式耳机的声阻抗。开放式耳机的感知闭塞效应非常低。实线示出封闭式耳机的声阻抗。在高达1.5kHz的低频范围内增加的阻抗会增强低频声级，这对应于较高的感知阻塞。

图8中的曲线110、111示出入耳式耳机110和耳塞式耳机111的声阻抗的示例性结果。耳塞式耳机111的阻抗低于入耳式耳机110的阻抗，直到大约1kHz的频率。

在实例中，均衡滤波器的增益因子或形状(g)与Z_HP的倒数成正比。

其中α是缩放因子(比例系数)，它可由用户选择，也可在不同耳机的多个测量过程中确定。图9示出均衡滤波器的示例性目标频率曲线，以减小闭塞效应并提高用户自己的声音的自然度。112示出入耳式耳机的目标响应曲线，113示出耳塞的目标响应曲线。

图13示出根据实施例的用于处理音频信号的方法的示意图。该方法包括：

S21：根据一对嘴对耳传递函数来处理音频信号。

S22：使用一对均衡滤波器来对处理后的音频信号进行滤波。

S23：将滤波后的音频信号输出到耳机。

实施例1，在安静环境中带头戴式耳机的电话(带直插式麦克风的入耳式耳机或耳塞)。

图10示出此实施例的框图。用户自己的声音(通过空气传输)是使用所用耳机的嵌入式麦克风捕获的。通过一对嘴对耳传递函数(HmeTF)对捕获的语音信号13进行滤波，该函数可在14之前被单独地或非单独地确定。然后，滤波后的语音信号通过一对抗闭塞直通均衡滤波器进一步滤波，以增强用户自己的声音的高通分量。然后，使用耳机来向用户播放滤波后的信号，并增强用户讲话时的自然感。

基于耳机的声阻抗来预先设计抗闭塞直通均衡滤波器12。因此，需要所用耳机的信息。该操作可手动或自动完成。例如，耳机可由用户基于耳机类别(例如，耳挂式耳机、耳上式耳机)或耳机型号(例如，HUAWEI Earbud)来手动选择11。USB Type-C提供的信息也可自动检测该耳机。对于每个耳机，然后基于其声阻抗选择抗闭塞直通均衡滤波器，如上所述。对于每个类别，我们可基于平均声阻抗来设计滤波器，或针对每个类别使用代表性的均衡滤波器。

滤波器的形状应与声阻抗的倒数成正比(0-ZHP dB)。对于抗闭塞直通均衡滤波器的设计，几乎每个低阶无限脉冲响应IIR滤波器或有限脉冲响应FIR滤波器都是合适的(需要低等待时间)。

图11示出一个实现方式中的高通斜坡滤波器(FIR滤波器)用于设计抗闭塞直通均衡滤波器的实例。其他滤波器也可用于，例如带有Chebyshev-II IIR滤波器的实现方式。

可分两步设计滤波器：

1.)可通过从低(60Hz)到截止频率作为起点的平均声阻抗来确定阻带衰减。然后，从低频到高频，可通过取决于频率的声阻抗的第一个零交叉来确定截止频率。

2.)通过最小化声阻抗曲线(目标)的倒数与设计的频率响应之间的误差(例如，使用机器学习)来迭代阻带衰减和截止频率。

例如，内置式耳塞的截止频率为3.5kHz，阻带衰减为16dB。例如，预先设计的滤波器可存储在云中、存储在提供给用户的在线数据库中或存储在智能电话中。

实施例2，在嘈杂环境中带头戴式耳机的电话(带直插式麦克风的入耳式耳机或耳塞)。

例如，用户正在嘈杂的空间(例如，饭店或机场中)用头戴式耳机进行电话会议。由内置麦克风捕获的用户自己的声音与环境噪声相结合，这可能会降低自然感。另外，用户不希望远程用户听到环境噪声，因为这会降低语音清晰度。

因此，在嘈杂环境的情况下，捕获到的用户语音首先会分解为直接声音和环境声音。环境声音被丢弃。提取的直接声音通过一对HmeTFs进行滤波，并进一步通过一对抗闭塞直通均衡滤波器进行滤波，以模拟直接声音部分。将测量或合成的后期混响部分添加到直接部分中，以模拟相当安静但具有本地空间信息的环境。然后，使用耳机来向用户播放信号，并增强用户讲话时的自然感。另外，可将提取的直接声音发送到远程用户以增强语音清晰度。

在一个实施例中，双耳信号是直接声音、早期反射与后期混响的总和：

Left＝d_left(t)+e_left(t)+l_left(t)

Right＝d_right(t)+e_right(t)+l_right(t)

图14示出根据实施例的用于处理音频信号的设备30的示意图。设备30包括处理器31和存储程序代码的计算机可读存储介质32。程序代码包括用于执行用于处理音频信号的方法或其实现方式之一的实施例的指令。

本发明的实施例的应用包括使用多个扬声器的任何声音再现系统或环绕声系统。特别地，本发明的实施例可应用于

-TV扬声器系统；

-汽车娱乐系统；

-电话会议系统；和/或

-家庭影院系统，

其中，需要一个或多个收听者的个人收听环境。

以上描述仅为本发明的实现方式，对本发明范围的保护并不限于此。本领域技术人员可容易地进行任何变化或替换。本申请的保护范围由所附权利要求书限定。

Claims

1.一种用于处理音频信号的方法，其特征在于，所述方法包括：

根据一对嘴对耳传递函数来处理所述音频信号，以获得处理后的音频信号；

使用一对均衡滤波器来对所述处理后的音频信号进行滤波，以获得滤波后的音频信号，其中，所述均衡滤波器的参数取决于耳机的声阻抗；以及

将所述滤波后的音频信号输出到所述耳机，

其中，所述均衡滤波器的参数是所述均衡滤波器的增益因子，其中，所述均衡滤波器的所述增益因子与所述耳机的所述声阻抗的倒数成正比。

2.根据权利要求1所述的方法，其特征在于，其中，所述嘴对耳传递函数描述从嘴到耳膜的传递函数。

3.根据权利要求1或2所述的方法，其特征在于，其中，基于声阻抗管来测量所述耳机的声阻抗，所述声阻抗管具有从20Hz到2kHz的可测量频率范围。

4.根据权利要求1或2所述的方法，其特征在于，其中，基于所述耳机的耳机类型来选择所述对均衡滤波器。

5.根据权利要求4所述的方法，其特征在于，其中，基于通用串行总线USB Type-C信息来获得所述耳机的所述耳机类型。

6.一种用于处理立体声信号的装置，其特征在于，其中，所述装置包括被配置为执行以下操作的处理电路：

根据一对嘴对耳传递函数来处理音频信号，以获得处理后的音频信号；

使用一对均衡滤波器来对所述处理后的音频信号进行滤波以获得滤波后的音频信号，其中，所述均衡滤波器的参数取决于耳机的声阻抗；以及

将所述滤波后的音频信号输出到所述耳机，

其中，所述均衡滤波器的参数是所述均衡滤波器的增益因子，所述均衡滤波器的所述增益因子与所述耳机的声阻抗的倒数成正比。

7.根据权利要求6所述的装置，其特征在于，其中，所述嘴对耳传递函数描述从嘴到耳膜的传递函数。

8.根据权利要求6或7所述的装置，其特征在于，其中，基于声阻抗管来测量所述耳机的声阻抗，所述声阻抗管具有从20Hz到2kHz的可测量频率范围。

9.根据权利要求6或7所述的装置，其特征在于，其中，基于所述耳机的耳机类型来选择所述一对均衡滤波器。

10.根据权利要求9所述的装置，其特征在于，其中，基于通用串行总线USB Type-C信息来获得所述耳机的所述耳机类型。

11.一种存储程序代码的计算机可读存储介质(32)，其特征在于，所述程序代码由计算机执行时，使得所述计算机执行权利要求1至5中任一项所述的方法。