CN109218912B

CN109218912B - 多麦克风爆破噪声控制

Info

Publication number: CN109218912B
Application number: CN201810722507.6A
Authority: CN
Inventors: 拉斯穆斯·孔斯格德·奥尔森
Original assignee: GN Audio AS
Current assignee: GN Audio AS
Priority date: 2017-06-30
Filing date: 2018-06-29
Publication date: 2021-12-07
Anticipated expiration: 2038-06-29
Also published as: CN109218912A; US10262676B2; US20190005977A1; EP3422736B1; EP3422736A1

Abstract

本申请涉及多麦克风爆破噪声控制。公开的是用于降低用户和远端装置之间的语音通信中的爆破噪声的方法和耳机。该耳机被配置为由用户佩戴。该耳机包括具有第一、第二端的麦克风吊杆；接收音频输入信号的第一、第二和第三电声输入变换器，设置在麦克风吊杆中；提供语音信号的第一波束形成器；提供爆破噪声信号的第二波束形成器，自适应地被配置为消除语音和背景噪声而不消除爆破噪声；比较器，将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中，在被配置为传输至远端装置的输出信号中，爆破噪声降低。

Description

多麦克风爆破噪声控制

技术领域

本公开涉及用于降低用户和远端装置之间的语音通信中的爆破噪声的耳机。该耳机包括用于接收音频输入信号的第一电声输入变换器、第二电声输入变换器和第三电声输入变换器。

背景技术

为了改善背景噪声的抑制，耳机经常配备有梯度麦克风和/或多个具有波束形成的麦克风，优选地，安装在靠近用户嘴巴的麦克风臂上。不幸地，这种麦克风系统对爆破噪声-以及对风噪声和处理噪声很敏感。

爆破噪声可以由例如泡沫制成的外部风罩和/或通过将麦克风移动远离嘴巴来抑制。有效风罩通常很大且笨重，并且移动麦克风降低语音-背景噪声比-尤其是在较低频率下。在电话呼叫期间，爆破噪声可以适当加压于远端参与者。

发明内容

需要改善耳机麦克风中爆破噪声抑制。

公开的是用于降低用户和远端装置之间的语音通信的爆破噪声的耳机。该耳机被配置为由用户佩戴。该耳机包括具有第一端和第二端的麦克风吊杆。当用户正在佩戴耳机时，第一端被配置为指向用户的嘴巴。该耳机包括用于接收音频输入信号的第一电声输入变换器、第二电声输入变换器和第三电声输入变换器。第一电声输入变换器、第二电声输入变换器和第三电声输入变换器被设置在麦克风吊杆中。该耳机包括被配置为提供语音信号的第一波束形成器。语音信号基于来自第一电声输入变换器的第一输入信号。第一波束形成器被配置为优化语音-背景噪声比。该耳机包括被配置为提供爆破噪声信号的第二波束形成器。爆破噪声信号基于来自第一电声输入变换器的第一输入信号、来自第二电声输入变换器的第二输入信号以及来自第三电声输入变换器的第三输入信号。第二波束形成器自适应地被配置为消除语音和背景噪声，而不消除爆破噪声。该耳机包括比较器，该比较器被配置为将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中，降低被配置为传输至远端装置的输出信号中的爆破噪声。

还公开了在耳机中降低佩戴耳机的用户和远端装置之间的语音通信中的爆破噪声的方法。该耳机包括具有第一端和第二端的麦克风吊杆，其中，当用户佩戴耳机时，第一端被配置为指向用户的嘴巴。该耳机包括用于接收音频信号的第一电声输入变换器、第二电声输入变换器和第三电声输入变换器，其中，第一电声输入变换器、第二电声输入变换器和第三电声输入变换器被设置在麦克风吊杆中。该方法包括接收第一电声输入变换器中的第一音频信号、第二电声输入变换器中的第二音频信号以及第三电声输入变换器中的第三音频信号。该方法包括在第一波束形成器中提供语音信号，该语音信号至少基于来自第一电声输入变换器的第一输入信号，其中，第一波束形成器被配置为优化语音-背景噪声比。该方法包括在第二波束形成器中提供爆破噪声信号，该爆破噪声信号基于来自第一电声输入变换器的第一输入信号、来自第二电声输入变换器的第二输入信号以及来自第三电声输入变换器的第三输入信号，其中，第二波束形成器自适应地被配置为消除语音和背景噪声而不消除爆破噪声。该方法包括在比较器中，将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以确定具有爆破噪声的时间周期和频带。该方法包括降低被配置为在所确定的具有爆破噪声的时间周期和频带中传输至远端装置的输出信号中的爆破噪声。

优点是输出信号中的爆破噪声被降低，因为这将用户的言语的更好和更舒适的传输提供给远端装置。

爆破噪声最强，因此在这种情况下最接近个人讲话(即，耳机的用户)的嘴巴。越远离用户的嘴巴爆破噪声越弱。因此，优点是在爆破噪声存在于用户言语的时间周期和频带中，可以降低这个爆破噪声。可以不同的方式执行降低爆破噪声。

因为爆破噪声最靠近用户的嘴巴，因此来自最靠近用户嘴巴的麦克风吊杆上的输入变换器(例如，前置麦克风)的输入信号，例如可以利用来自更远离用户嘴巴的麦克风吊杆上的输入变换器(例如，后置麦克风)的输入信号替换。

爆破噪声可以限定为由至少来自佩戴耳机的用户的嘴巴的气流引起的风湍流。还称为喘息噪声的爆破噪声是由来自用户的嘴巴在麦克风或输入变换器(例如，用户佩戴的耳机的麦克风)中讲话的气流引起的风湍流。提供在下文中呼吸噪声从嘴巴发出而且该噪声由为本文中描述的爆破噪声设计的方法进行处理。爆破噪声风湍流造成耳机的麦克风的麦克风隔膜的运动。爆破噪声可以由爆破音导致，该爆破音是由谈话者、歌手和其他歌唱者在麦克风中说话产生的口阻塞音，诸如，p、t和k。在使用例如通信耳机的通信中，爆破噪声会对对话的远端侧导致非常紧张的体验。

爆破噪声的模式包括人类语言、言语产生、流体力学和/或电声。爆破噪声存在可以利用的一些特性：

-爆破噪声强烈依赖从嘴巴喷出的距离。因此，进一步远离嘴巴的麦克风较少被暴露。

-爆破噪声在麦克风之间呈现极低的相关性(不连贯)。

-爆破噪声随着时间改变，并且大部分时间不存在爆破噪声。

-爆破噪声具有由低频率控制的随着时间改变的倾斜的功率频谱。

因此在这种情况下，爆破噪声最强并且因此最接近个人讲话(即，耳机的用户)的嘴巴。越远离用户的嘴巴，爆破噪声变弱。爆破噪声是低频噪声。

如所公开的耳机和方法提供爆破噪声从输出信号移去同时执行最佳的背景噪声消除并且保存完整的语音质量。

该耳机包括第一电声输入变换器、第二电声输入变换器和第三电声输入变换器，例如，三个麦克风。电声输入变换器安装在麦克风吊杆上。优选地，电声输入变换器被布置在麦克风吊杆上的端射配置中。

语音信号是由第一波束形成器提供。语音信号至少基于来自第一电声输入变换器的第一输入信号。当麦克风吊杆被布置在相对于用户嘴巴的预期位置中时，第一电声输入变换器可以是在麦克风吊杆上最靠近用户嘴巴的输入变换器。第一波束形成器被配置为优化语音-背景噪声比。语音信号还可以基于来自第二电声输入变换器的第二输入信号。当麦克风吊杆被布置在相对于用户嘴巴的预期位置中时，第一电声输入变换器和第二电声输入变换器可以是在麦克风吊杆上最靠近用户嘴巴的两个输入变换器。当麦克风吊杆被布置在相对于用户嘴巴的预期位置中时，第三电声输入变换器可以是相对于用户嘴巴的最后面或远处的输入变换器。

爆破噪声信号基于来自全部三个输入变换器的信号由第二波束形成器提供。第二波束形成器自适应地被配置为消除语音和背景噪声，而不消除爆破噪声。

比较器被配置为将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以确定具有高含量的爆破噪声的时间周期和频带，例如，时间频率小区。比较器可以是或者可以包括爆破噪声检测器或者爆破噪声传感器。

在所确定的具有爆破噪声的时间周期和频带中，在被配置为传输至远端装置的输出信号中，爆破噪声降低。

降低输出信号中的爆破噪声可以包括利用另一个信号替换爆破噪声，和/或利用另一个信号抑制爆破噪声，和/或去除爆破噪声。例如，爆破噪声可以利用来自第三电声输入变换器的第三输入信号替换，因为这个第三输入信号包括较少爆破噪声。

在具有高含量的爆破噪声的时间频率小区中，混频器可以利用来自第三电声输入变换器(例如，最后面的麦克风)的信号替换语音信号。合成信号或输出信号被提供给通信系统，使得远端装置接收具有降低爆破噪声的用户的语音。

该耳机可以包括多于三个输入变换器，诸如，包括四个、五个、六个等输入变换器。因此，第一波束形成器可以处理来自输入变换器的多于一个或两个的输入信号。

在具有很高容量的爆破噪声的时间频率小区中，混频器可以利用舒适噪声或者利用沉默替换语音信号。在具有很高容量的爆破噪声的时间频率小区中，混频器可以抑制语音信号。

如果存在两个前置输入变换器，则语音信号或原始信号通过波束形成两个前置输入变换器中的一个或两个来形成。可选地，更多输入变换器可包括在原始信号波束形成器中。这个波束形成器被配置为优化语音-背景噪声比。

可以是波束形成器或实际麦克风的爆破噪声传感器可以通过使用三个或更多个输入变换器形成。这个波束形成器自适应地被配置为消除语音和背景噪声，而不消除爆破噪声。最终，如果前置输入变换器确定具有高容量的爆破噪声的时间频率小区，则爆破噪声传感器可以与一个或多个进行比较。

在混合过程中，包含爆破噪声的语音信号或原始信号的部分可以利用来自后置输入变换器麦克风或第三电声输入变换器麦克风的输入信号、和/或在严重情况下利用舒适噪声或沉默进行替换。

该耳机包括具有第一端和第二端的麦克风吊杆。当用户佩戴耳机时，第一端被配置为指向用户的嘴巴。麦克风吊杆的第二端被配置为安装在耳机处，例如，安装在输出变换器处，安装在耳机的听筒外壳或扬声器外壳处，安装在用户的耳朵处等。

该耳机包括用于接收音频信号的第一电声输入变换器、第二电声输入变换器和第三电声输入变换器。音频信号是输入信号。因此，第一电声输入变换器被配置为接收第一输入信号。第二电声输入变换器被配置为接收第二输入信号。第三电声输入变换器被配置为接收第三输入信号。

该耳机包括被配置为提供语音信号的第一波束形成器。语音信号基于来自第一电声输入变换器的第一输入信号。来自第一电声输入变换器的第一输入信号可以提供至用于生成语音信号的处理单元。因此，处理单元可以包括第一波束形成器。第一电声输入变换器可以是梯度麦克风、噪声消除麦克风等。

第一波束形成器可以是自适应的，例如，第一波束形成器可以被配置为消除从不同音频源输入的音频。

输入信号的言语部分和噪声部分可以是相关的。输入信号中的爆破噪声部分可以是不相关的。

第一波束形成器被配置为优化语音-背景噪声比和/或抑制与语音相比的噪声。

该耳机包括比较器，该比较器被配置为将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。这些时间周期和频带可以称为时间频率小区。具有爆破噪声的时间周期和频带可以是具有高容量的爆破噪声的时间周期和频带。

可以控制、适配或配置输入变换器的方向特性，使得来自两个输入变换器(例如，两个前置麦克风)的输入信号可以基本上相似并且从而可以消除来自这些输入信号的言语和/或噪声。通过使用三个输入变换器，可以消除言语和噪声这两者。

当使用波束形成器或定向麦克风时，将存在爆破噪声。优点是通过本耳机和方法，可以检测和降低爆破噪声。

在一些实施方式中，爆破噪声是由至少来自佩戴耳机的用户的嘴巴的气流引起的风湍流。

在一些实施方式中，第一电声输入变换器和第二电声输入变换器以距第一端比第一端和第三电声输入变换器之间的距离更短的距离布置在麦克风吊杆上。因此，当用户将耳机佩戴在它的预期位置中时，第一电声输入变换器和第二电声输入变换器可以布置在被配置为布置为靠近、紧邻、邻近于用户嘴巴的麦克风吊杆的第一端。第一电声输入变换器和第二电声输入变换器可以是前置麦克风或输入变换器。第三电声输入变换器可以是后置麦克风或输入变换器。第三电声输入变换器可以布置在更远离第一端，诸如更靠近第二端的麦克风吊杆上。例如，从第一端至第一电声输入变换器和第二电声输入变换器可能存在0.5cm。例如，从第一端至第三电声输入变换器可能存在2cm。因此，第三电声输入变换器以距第一端比第一端分别和第一电声输入变换器和第二电声输入变换器之间的距离更大的距离被布置在麦克风吊杆上。

在一些实施方式中，降低输出信号中的爆破噪声包括在具有爆破噪声的时间周期和频带中利用来自第三电声输入变换器的第三输入信号替换语音信号。这可以通过在耳机中提供混频器获得，其中，该混频器被配置为执行降低、替换等。替换波束形成器可以用于执行这个替换。替换波束形成器可以是由输入变换器组成的波束形成器，其中，检测不到爆破或爆破噪声，例如，第三电声输入变换器和第四电声输入变换器，或者例如，第三输电声入变换器和第二电声输入变换器。

在一些实施方式中，降低输出信号中的爆破噪声包括在具有爆破噪声的时间周期和频带中将语音信号与包括舒适噪声的舒适信号和/或与第三输入信号混合。

在一些实施方式中，降低输出信号中的爆破噪声包括抑制(诸如，去除)具有爆破噪声的时间周期和频带中的语音信号。因此，例如，可以提供沉默代替爆破噪声。可以通过提供另一个信号代替爆破噪声来抑制爆破噪声。

在一些实施方式中，第一波束形成器适于通过使用最小方差无失真响应(MVDR)计算或广义旁瓣消除器(GSC)计算优化语音-背景噪声比。

第一波束形成器可以使用其他类似方法，例如，盲源分离等。第一波束形成器可以是自适应波束形成器。第一波束形成器可以是具有特定灵敏度的预定义的波束形成器。

广义旁瓣消除，例如，参见Ivan Tashev；声音捕获和处理：实际方法，2009年7月的Wiley的388页，指的是波束形成器具有建立为处理结构以保存感兴趣的信号的限制，该信号是耳机使用情况下的用户言语。

GSC可具有两个计算分支：

第一分支可以是拾取用户言语和环境噪声的混合的参考分支或固定波束形成器。参考分支的实例是延迟加总波束形成器，例如，求和关于用户言语、或当作参考的麦克风中的一个对准的振幅和相位信号。如以下解释的，参考分支可优选地选择和/或设计成麦克风相对于用户的嘴巴的定位尽可能不灵敏，因为参考分支的用户言语响应确定GSC的用户言语响应。由于全方位辐射麦克风对于位置以及麦克风灵敏度变化相对不灵敏、相对逼真，因此全方位辐射麦克风可能是合适的。在多麦克风耳机麦克风吊杆设计中，可位于更接近麦克风吊杆的旋转点的后置麦克风(其中，旋转点一般在用户耳朵的耳机的听筒处或在该听筒处铰接)可以是优选的，因为它对麦克风吊杆的移动较不灵敏。因此，优选地，这没有提供用户言语信号的振幅频谱的变化。

GSC计算的第二分支可以计算言语消除信号，其中，借助于分块矩阵，过滤和减去信号，以便尽可能地减少用户言语信号。

最终，噪声消除可以通过GSC通过自适应地过滤言语消除信号并且将其从参考分支中减去以便使输出功率最小化来执行。在理想情况下，言语消除信号(理想地)不包含用户言语成分，并且因此减去产生噪声消除输出不改变参考分支中存在的用户言语成分。因此，言语成分的振幅频谱可以是相同的或者在GSC参考分支和GSC波束形成器的输出处非常相似。可以说GSC波束形成器的波束在用户言语上居中。

因此，广义旁瓣消除器(GSC)系统或计算可以在该方法以及其他系统中使用，诸如，最小方差无失真响应(MVDR)计算或系统。

最小方差无失真响应(MVDR)适用于使遭受单个线性约束的过滤加总波束形成器的输出功率最小的波束形成器。该解决方案可以通过单步、闭合解决方案获得。经常，选择约束或导向矢量以致波束形成器在观察方向上维持均匀响应，即，感兴趣方向上的波束点。可以设计导向矢量以致用户语音或言语成分的振幅频谱在MVDR波束形成器的输入(即，参考)和输出处相同。

MVDR波束形成器计算用于单个频带简单地总结如下。信号模型，第i个输入，

x_i＝c_is+n_i

其中，s和n_i分别是用户言语和第i个环境噪声信号。c_i是结合麦克风振幅和相位响应、输入电子响应和声路程响应的完整的第i个复合响应。

可以书写过滤加总波束形成器，

y＝w^Hx

MVDR波束形成器使受标准化约束的输出最小，

w_MVDR＝argmin_w<|y|²>

遭受w^Ha＝q

MVDR成本函数的闭合式解决方案为，

其中，C和a分别是噪声协方差矩阵和导向矢量。

选择导向矢量a，并且q＝1，以便限制波束形成器的语音或言语响应等于“最佳的”参考麦克风。以上为了GSC波束形成器描述了为了加强麦克吊杆定位选择最有利的麦克风。

限制波束形成器的语音或言语响应等于参考(即，“最佳的”)麦克风可以通过使用相对的嘴巴对麦克风传递函数作为导向矢量实现

其中，通过从第i个麦克风至用户言语成分的参考麦克风估计复合传递函数，分数a_i可能是近似的而不接近c_i。

因此，用户言语成分在参考麦克风中和MVDR波束形成器的输出处可以是相同或相似的。证明如下：

进一步地，与GSC系统类似，当语音活动检测器(VAD)表示用户言语成分将不过多损害该估计时，可以估计和更新噪声协方差矩阵。

导向矢量、噪声协方差估计和MVDR解决方案可以合适的间隔更新，例如，每4ms、10ms或100ms，利用噪声消除益处均衡计算成本。正则项可以添加至噪声协方差估计。

在一些实施方式中，第二波束形成器通过消除在输入变换器/麦克风之间相关的输入信号的部分并且保持不相关的输入信号的部分自适应地消除语音和背景噪声，而不消除爆破噪声。爆破噪声在输入变换器之间可以是不相关的。言语和环境噪声在输入变换器之间可以是相关的。

在一些实施方式中，第一电声输入变换器和第二电声输入变换器被布置为提供第一输入信号与第二输入信号的相关性比第一输入信号和第二输入信号中的每一个与第三输入信号的相关性更相关。输入信号的言语和噪声部分在输入变换器之间可以是相关的。输入信号的爆破或爆破噪声部分在输入变换器之间可以是不相关的。第一输入信号和第二输入信号是更相关的可以意味着这些更高程度地相关。

在一些实施方式中，耳机包括第四电声输入变换器。在一些实施方式中，耳机包括麦克风吊杆上的第五输入变换器、第六输入变换器、第七输入变换器、第八输入变换器等。更多输入变换器将改善爆破噪声降低。

在一些实施方式中，由第一波束形成器提供的语音信号进一步基于来自第二电声输入变换器的第二输入信号、和/或来自第三电声输入变换器的第三输入信号和/或来自第四电声输入变换器的第四输入信号。由第二波束形成器提供的爆破噪声信号还可以基于来自第四电声输入变换器的第四输入信号。

在一些实施方式中，耳机包括用于再生音频信号的输出变换器。在一些实施方式中，输出信号传输至输出变换器，从而将降低的爆破噪声输出信号应用于耳机的用户。输出变换器可以是扬声器、接收器等。将降低爆破噪声的输出信号传输至耳机的输出变换器提供耳机的用户可以听见与输出至远端装置相同的输出信号。这被称为侧音。优点是用户可以听见传输至远端装置的相同信号，使得用户准确地放置麦克风吊杆。

侧音是在描述给予例如耳机用户的自身语音反馈的电信中使用的术语。为了实现这个效果，耳机麦克风信号被添加至扬声器信号。这帮助耳机用户控制他/她的语音的水平和特性。

在爆破噪声控制系统应用于传输音频的情况下，有用的是爆破噪声控制还应用于侧音，反映通过对话的远侧体验的爆破噪声的降低水平。另外，用户将听到他/她自己的语音爆破噪声并且调整进一步远离嘴巴的麦克风吊杆。这在传输信号中将导致更差的语音-背景噪声比，并且因此，抵消后面的想法将爆破噪声控制应用于传输信号。

因此，爆破噪声控制(例如，低延迟爆破噪声)可以应用于侧音。

侧音产生可以是低延迟，例如，小于10ms，以便自然感知。相反地，传输信号上的延迟要求不是类似精确的，例如，一般的移动对话具有250ms的端到端延迟。因此，爆破噪声控制的低延迟版本是优选的，进行用于低延迟的声音质量。

用于侧音的低延迟爆破噪声控制例如可以通过将来自传输爆破噪声控制的转换信号应用于侧音信号获得，而不补偿提前检测。该转换然后将总是稍微“滞后”。

在一些实施方式中，第一电声输入变换器、第二电声输入变换器和第三电声输入变换器以端射配置被设置在麦克风吊杆中。端射配置可包括输入变换器中的两个被布置为更接近麦克风吊杆的第一端，并且一个或多个输入变换器被布置为更远离麦克风吊杆的第一端。

在一些实施方式中，麦克风吊杆长于5cm，诸如长于6cm，诸如长于7cm，诸如长于8cm，诸如长于10cm，诸如长于12cm，诸如长于14cm。优点是麦克风吊杆长，因为第一电声输入变换器和第二电声输入变换器(例如，前置麦克风)可以接近嘴巴，并且第三电声输入变换器(例如，后置麦克风)可以更远离嘴巴，因为这实现降低爆破噪声的效果。

本发明涉及包括以上描述和下文中的耳机的不同方面，并且对应的系统部分、方法、装置、系统、网络、成套工具、用途和/或产品意味着每个产生结合第一提及方面描述的益处和优点中的一个或多个，并且各自具有对应于结合第一提及方面描述的和/或所附权利要求中公开的实施方式的一个或多个实施方式。

附图说明

参考附图，通过以下示例性实施方式的详细说明，对于本领域中的技术人员而言，以上和其他特征以及优点将变得容易地显而易见，在附图中：

图1示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机的实例。

图2示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机的实例。

图3示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声并且同时提供侧音的耳机的实例。

图4a和图4b示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机的实例。

图5示意性地示出了示出用户的言语中的爆破噪声的时间频率图的实例。

具体实施方式

在下文中参考附图描述各种实施方式。贯穿全文，相同参考标号是指相同元件。因此，不在每幅图的描述中详细描述相同元件。还应注意的是，附图仅旨在促进实施方式的描述。它们不旨在作为所要求保护的发明的彻底描述或者作为所要求保护的范围上的限制。此外，示出的实施方式不必具有示出的所有方面或优点。即使没有如此示出，或者没有如此明确地描述，结合具体实施方式描述的方面或优点也不必局限于该实施方式并且可以在任何其他实施方式中实践。

贯穿全文，相同的参考标号用于相同或对应的部件。

图1示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机2的实例。耳机2被配置为由用户佩戴。耳机2包括具有第一端和第二端的麦克风吊杆(未示出)。当用户正在佩戴耳机时，第一端被配置为指向用户的嘴巴。

耳机2包括用于接收音频输入信号的第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14。

第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14被设置在麦克风吊杆中。

耳机2包括被配置为提供语音信号(未示出)的第一波束形成器16。语音信号基于来自第一电声输入变换器10的第一输入信号20。第一波束形成器16被配置为优化语音-背景噪声比。

耳机2包括被配置为提供爆破噪声信号28的第二波束形成器26。爆破噪声信号28基于来自第一电声输入变换器10的第一输入信号20、来自第二电声输入变换器12的第二输入信号22以及来自第三电声输入变换器14的第三输入信号24。第二波束形成器26自适应地被配置为消除语音和背景噪声，而不消除爆破噪声。

耳机2包括比较器30，该比较器被配置为将爆破噪声信号28与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中，在被配置为传输至远端装置的输出信号32中，爆破噪声降低。

图2示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机2的实例。耳机2被配置为由用户佩戴。耳机2包括具有第一端和第二端的麦克风吊杆(未示出)。当用户正在佩戴耳机时，第一端被配置为指向用户的嘴巴。

耳机2包括被配置为提供语音信号18的第一波束形成器16。语音信号18基于来自第一电声输入变换器10的第一输入信号20以及来自第二电声输入变换器12的第二输入信号22。可选地，语音信号18还可以基于来自第三电声输入变换器14的第三输入信号24。第一波束形成器16被配置为优化语音-背景噪声比。

耳机2包括被配置为提供爆破噪声信号28的第二波束形成器26。爆破噪声信号28基于来自第一电声输入变换器10的第一输入信号20、来自第二电声输入变换器12的第二输入信号22、以及来自第三电声输入变换器14的第三输入信号24。第二波束形成器26自适应地被配置为消除语音和背景噪声，而不消除爆破噪声。

耳机2包括比较器30，该比较器被配置为将爆破噪声信号28与多个频带中的每一个内的语音信号18进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中，在被配置为传输至远端装置的输出信号32中，爆破噪声降低。

在所确定的具有爆破噪声的时间周期和频带中，输出信号32中的爆破噪声可以通过利用来自第三电声输入变换器14的第三输入信号24替换语音信号降低。

可替换地和/或此外，在所确定的具有爆破噪声的时间周期和频带中，可以通过利用包括舒适噪声的舒适信号36替换或者抑制语音信号降低输出信号32中的爆破噪声。

爆破噪声降低的输出信号32还可以在传输至远端装置之前传输至用于普通噪声抑制的普通噪声抑制单元38。

来自第一电声输入变换器10的第一输入信号20、来自第二电声输入变换器12的第二输入信号22、以及来自第三电声输入变换器14的第三输入信号24可以在传输至第一波束形成器和第二波束形成器之前在均衡器34中均衡。

图3示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声并且同时提供侧音的耳机2的实例。

耳机2被配置为由用户佩戴。耳机2包括具有第一端和第二端的麦克风吊杆(未示出)。当用户正在佩戴耳机时，第一端被配置为指向用户的嘴巴。

耳机2包括被配置为提供语音信号的第一波束形成器16。语音信号基于来自第一电声输入变换器10的第一输入信号20。可选地，语音信号还可以基于来自第二电声输入变换器12的第二输入信号22以及来自第三电声输入变换器14的第三输入信号24。第一波束形成器16被配置为优化语音-背景噪声比。

耳机2包括被配置为提供爆破噪声信号的第二波束形成器26。爆破噪声信号基于来自第一电声输入变换器10的第一输入信号20、来自第二电声输入变换器12的第二输入信号22、以及来自第三电声输入变换器14的第三输入信号24。第二波束形成器26自适应地被配置为消除语音和背景噪声，但不消除爆破噪声。

耳机2包括比较器30，该比较器被配置为将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中，在被配置为传输至远端装置的输出信号32中，爆破噪声降低。

耳机2包括用于再生音频信号的输出变换器40。输出信号32经由侧音单元42被传输至输出变换器40，从而将降低的爆破噪声输出信号32应用于耳机2的用户。输出变换器40可以是扬声器、接收器等。将降低爆破噪声的输出信号32传输至耳机2的输出变换器40提供耳机的用户可以听见与输出至远端装置相同的输出信号32。这被称为侧音。

输出变换器40还接收远端装置音频信号44。

图4a和图4b示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机2的实例。耳机2被配置为由用户佩戴。

图4a示出了耳机2包括具有第一端6和第二端8的麦克风吊杆4。当用户正在佩戴耳机2时，第一端6被配置为指向用户的嘴巴。

图4b示出了耳机2包括用于接收音频输入信号的第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14。

第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14被设置在麦克风吊杆4中。第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14可以被设置在端射配置中。

图5示意性地示出了利用检测到的爆破噪声图案覆盖的言语图谱的实例。言语图谱是示出了用户的言语中的爆破噪声的时间、频率图。

在y轴上示出了以Hz测量的频率作为x轴上的以秒测量的时间的函数。在图表中，用户言语中的爆破或爆破噪声由箭头表示。还表示用户的呼吸。

尽管已经示出并描述了特定的特征，但是应当理解的是，所述特征不旨在限制所要求保护的发明，并且对本领域技术人员来说显而易见的是，可以在不偏离所要求保护的发明的范围的情况下，对其做出各种改变和修改。因此，说明书和附图只作为说明性意义而非限制性意义。所要求保护的发明旨在覆盖所有替换、修改和等效物。

在以下项中阐述了示例性耳机和方法。

1.一种耳机(2)，用于降低用户和远端装置之间的语音通信中的爆破噪声，该耳机(2)被配置为由用户佩戴，耳机(2)包括：

-麦克风吊杆(4)，具有第一端(6)和第二端(8)，其中，当用户佩戴耳机(2)时，第一端(6)被配置为指向用户的嘴巴；

-第一电声输入变换器(10)、第二电声输入变换器(12)和第三电声输入变换器(14)，用于接收音频信号，其中，第一电声输入变换器(10)、第二电声输入变换器(12)和第三电声输入变换器(14)被设置在麦克风吊杆(4)中；

-第一波束形成器(16)，被配置为提供语音信号(18)，语音信号(18)基于来自第一电声输入变换器(10)的第一输入信号(20)，其中，第一波束形成器(16)被配置为优化语音-背景噪声比；

-第二波束形成器(26)，被配置为提供爆破噪声信号(28)，爆破噪声信号(28)基于来自第一电声输入变换器(10)的第一输入信号(20)、来自第二电声输入变换器(12)的第二输入信号(22)以及来自第三电声输入变换器(14)的第三输入信号(24)，其中，第二波束形成器(26)自适应地被配置为消除语音和背景噪声而不消除爆破噪声；

-比较器(30)，被配置为将爆破噪声信号(28)与多个频带中的每一个内的语音信号(18)进行重复比较以便确定具有爆破噪声的时间周期和频带；

其中，在所确定的具有爆破噪声的时间周期和频带中，被配置为传输至远端装置的输出信号(32)中的爆破噪声降低。

2.根据前述项所述的耳机，其中，爆破噪声是由至少来自佩戴耳机的用户的嘴巴的气流所引起的风湍流。

3.根据前述项中任一项所述的耳机，其中，第一电声输入变换器和第二电声输入变换器以距第一端比第一端和第三电声输入变换器之间的距离短的距离被布置在麦克风吊杆上。

4.根据前述项中任一项所述的耳机，其中，降低输出信号中的爆破噪声包括在具有爆破噪声的时间周期和频带中利用来自第三电声输入变换器的第三输入信号替换语音信号。

5.根据前述项中任一项所述的耳机，其中，降低输出信号中的爆破噪声包括在具有爆破噪声的时间周期和频带中将语音信号与包括舒适噪声的舒适信号和/或与第三输入信号混合。

6.根据前述项中任一项所述的耳机，其中，降低输出信号中的爆破噪声包括抑制，诸如去除具有爆破噪声的时间周期和频带中的语音信号。

7.根据前述项中任一项所述的耳机，其中，第一波束形成器适于通过使用最小方差无失真响应(MVDR)计算或广义旁瓣消除器(GSC)计算优化语音-背景噪声比。

8.根据前述项中任一项所述的耳机，其中，第二波束形成器通过消除输入信号的相关的部分并且保持输入信号的不相关的部分来自适应地消除语音和背景噪声而不消除爆破噪声。

9.根据前述项中任一项所述的耳机，其中，第一电声输入变换器和第二电声输入变换器被布置为提供第一输入信号与第二输入信号的相关性比第一输入信号和第二输入信号中的每一个与第三输入信号的相关性更相关。

10.根据前述项中任一项所述的耳机，其中，耳机包括第四电声输入变换器。

11.根据前述项中任一项所述的耳机，其中，由第一波束形成器提供的语音信号进一步基于来自第二电声输入变换器的第二输入信号、和/或来自第三电声输入变换器的第三输入信号和/或来自第四电声输入变换器的第四输入信号。

12.根据前述项中任一项所述的耳机，其中，耳机包括用于音频信号的再生的输出变换器；并且其中，输出信号被传输至输出变换器，从而将降低爆破噪声的输出信号应用至耳机的用户。

13.根据前述项中任一项所述的耳机，其中，第一电声输入变换器、第二电声输入变换器和第三电声输入变换器被设置在端射配置中的麦克风吊杆中。

14.根据前述项中任一项所述的耳机，其中，麦克风吊杆长于5cm，诸如长于6cm，诸如长于7cm，诸如长于8cm，诸如长于10cm，诸如长于12cm，诸如长于14cm。

15.一种在耳机中降低佩戴耳机的用户和远端装置之间的语音通信中的爆破噪声的方法，该耳机包括：-麦克风吊杆，具有第一端和第二端，其中，当用户佩戴耳机时，第一端被配置为指向用户的嘴巴；

-第一电声输入变换器、第二电声输入变换器和第三电声输入变换器，用于接收音频信号，其中，第一电声输入变换器、第二电声输入变换器和第三电声输入变换器被设置在麦克风吊杆中；

该方法包括：

-接收第一电声输入变换器中的第一音频信号、第二电声输入变换器中的第二音频信号以及第三电声输入变换器中的第三音频信号；

-在第一波束形成器中提供语音信号，语音信号至少基于来自第一电声输入变换器的第一输入信号，其中，第一波束形成器被配置为优化语音-背景噪声比；

-在第二波束形成器中提供爆破噪声信号，该爆破噪声信号基于来自第一电声输入变换器的第一输入信号、来自第二电声输入变换器的第二输入信号以及来自第三电声输入变换器的第三输入信号，其中，第二波束形成器自适应地被配置为消除语音和背景噪声而不消除爆破噪声；

-在比较器中，将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以确定具有爆破噪声的时间周期和频带；

-降低被配置为在所确定的具有爆破噪声的时间周期和频带中传输至远端装置的输出信号中的爆破噪声。

参考列表

2 耳机

4 麦克风吊杆

6 麦克风吊杆的第一端

8 麦克风吊杆的第二端

10 第一电声输入变换器

12 第二电声输入变换器

14 第三电声输入变换器

16 第一波束形成器

18 语音信号

20 第一输入信号

22 第二输入信号

24 第三输入信号

26 第二波束形成器

28 爆破噪声信号

30 比较器

32 输出信号

34 均衡器

36 舒适信号

38 噪声抑制单元

40 输出变换器

42 侧音单元

44来自远端装置的音频信号。

Claims

1.一种耳机（2），用于降低用户和远端装置之间的语音通信中的爆破噪声，所述耳机（2）被配置为由所述用户佩戴，所述耳机（2）包括：

-麦克风吊杆（4），具有第一端（6）和第二端（8），其中，当所述用户佩戴所述耳机（2）时，所述第一端（6）被配置为指向所述用户的嘴巴；

-第一电声输入变换器（10）、第二电声输入变换器（12）和第三电声输入变换器（14），用于接收音频信号，其中，所述第一电声输入变换器（10）、所述第二电声输入变换器（12）和所述第三电声输入变换器（14）被设置在所述麦克风吊杆（4）中，使得当所述用户佩戴所述耳机（2）时，所述第一电声输入变换器（10）最靠近所述用户的嘴巴并且所述第三电声输入变换器（14）更远离所述用户的嘴巴；

-第一波束形成器（16），被配置为提供语音信号（18），所述语音信号（18）至少基于来自所述第一电声输入变换器（10）的第一输入信号（20），其中，所述第一波束形成器（16）被配置为优化语音-背景噪声比；

-第二波束形成器（26），被配置为提供爆破噪声信号（28），所述爆破噪声信号（28）基于来自所述第一电声输入变换器（10）的所述第一输入信号（20）、来自所述第二电声输入变换器（12）的第二输入信号（22）以及来自所述第三电声输入变换器（14）的第三输入信号（24），其中，所述第二波束形成器（26）自适应地被配置为消除语音和背景噪声而不消除爆破噪声；

-比较器（30），被配置为将所述爆破噪声信号（28）与多个频带中的每一个频带内的所述语音信号（18）进行重复比较以便确定具有爆破噪声的时间周期和频带；

其中，通过在所确定的具有爆破噪声的时间周期和频带中用来自所述第三电声输入变换器（14）的所述第三输入信号（24）替换所述语音信号，或者，通过在所确定的具有爆破噪声的时间周期和频带中，将所述语音信号（18）与包括舒适噪声的舒适信号（36）和/或与所述第三输入信号（24）混合，在所确定的具有爆破噪声的时间周期和频带中降低被配置为传输至所述远端装置的输出信号（32）中的所述爆破噪声。

2.根据权利要求1所述的耳机（2），其中，所述爆破噪声是由至少来自佩戴所述耳机的所述用户的嘴巴的气流所引起的风湍流。

3.根据权利要求1或2所述的耳机（2），其中，所述第一电声输入变换器（10）和所述第二电声输入变换器（12）以距所述第一端（6）比所述第一端（6）和所述第三电声输入变换器（14）之间的距离短的距离被布置在所述麦克风吊杆上。

4.根据权利要求1或2所述的耳机（2），其中，降低所述输出信号（32）中的所述爆破噪声包括抑制，具有爆破噪声的时间周期和频带中的所述语音信号（18）。

5.根据权利要求4所述的耳机（2），其中，所述抑制指去除。

6.根据权利要求1或2所述的耳机（2），其中，所述第一波束形成器（16）适于通过使用最小方差无失真响应（MVDR）计算或广义旁瓣消除器（GSC）计算优化所述语音-背景噪声比。

7.根据权利要求1或2所述的耳机（2），其中，所述第二波束形成器（26）通过消除输入信号的相关的部分并且保持所述输入信号的不相关的部分来自适应地消除语音和背景噪声而不消除爆破噪声。

8.根据权利要求1或2所述的耳机，其中，所述第一电声输入变换器（10）和所述第二电声输入变换器（12）被布置为提供所述第一输入信号（20）与所述第二输入信号（22）的相关性比所述第一输入信号（20）和所述第二输入信号（22）中的每一个与所述第三输入信号（24）的相关性更相关。

9.根据权利要求1或2所述的耳机（2），其中，所述耳机（2）包括第四电声输入变换器。

10.根据权利要求1或2所述的耳机（2），其中，由所述第一波束形成器（16）提供的所述语音信号（18）进一步基于来自所述第二电声输入变换器（12）的所述第二输入信号（22）、和/或来自所述第三电声输入变换器（14）的所述第三输入信号（24）。

11.根据权利要求9所述的耳机（2），其中，由所述第一波束形成器（16）提供的所述语音信号（18）进一步基于来自所述第二电声输入变换器（12）的所述第二输入信号（22）、和/或来自所述第三电声输入变换器（14）的所述第三输入信号（24）和/或来自所述第四电声输入变换器的第四输入信号。

12.根据权利要求1或2所述的耳机（2），其中，所述耳机（2）包括用于音频信号的再生的输出变换器（40）；并且其中，所述输出信号（32）被传输至所述输出变换器（40），从而将降低爆破噪声的输出信号施加至所述耳机（2）的所述用户。

13.根据权利要求1或2所述的耳机（2），其中，所述第一电声输入变换器（10）、所述第二电声输入变换器（12）和所述第三电声输入变换器（14）被设置以端射配置的所述麦克风吊杆（4）中。

14.根据权利要求1或2所述的耳机（2），其中，所述麦克风吊杆（4）长于5 cm。

15.根据权利要求14所述的耳机（2），其中，所述麦克风吊杆（4）长于6 cm。

16.根据权利要求15所述的耳机（2），其中，所述麦克风吊杆（4）长于7 cm。

17.根据权利要求16所述的耳机（2），其中，所述麦克风吊杆（4）长于8 cm。

18.根据权利要求17所述的耳机（2），其中，所述麦克风吊杆（4）长于10 cm。

19.根据权利要求18所述的耳机（2），其中，所述麦克风吊杆（4）长于12 cm。

20.根据权利要求19所述的耳机（2），其中，所述麦克风吊杆（4）长于14 cm。

21.一种在耳机（2）中降低佩戴所述耳机（2）的用户和远端装置之间的语音通信中的爆破噪声的方法，所述耳机（2）包括：-麦克风吊杆（4），具有第一端（6）和第二端（8），其中，当所述用户佩戴所述耳机（2）时，所述第一端（6）被配置为指向所述用户的嘴巴；

所述方法包括：

-接收所述第一电声输入变换器（10）中的第一输入信号（20）、所述第二电声输入变换器中（12）的第二输入信号（22）以及所述第三电声输入变换器中（14）的第三输入信号（24）；

-在第一波束形成器（16）中提供语音信号（18），所述语音信号（18）至少基于来自所述第一电声输入变换器（10）的所述第一输入信号（20），其中，所述第一波束形成器（16）被配置为优化语音-背景噪声比；

-在第二波束形成器（26）中提供爆破噪声信号（28），所述爆破噪声信号（28）基于来自所述第一电声输入变换器（10）的所述第一输入信号（20）、来自所述第二电声输入变换器（12）的所述第二输入信号（22）以及来自所述第三电声输入变换器（14）的所述第三输入信号（24），其中，所述第二波束形成器（26）自适应地被配置为消除语音和背景噪声而不消除爆破噪声；

-在比较器（30）中，将所述爆破噪声信号（28）与多个频带中的每一个频带内的所述语音信号（18）进行重复比较以确定具有爆破噪声的时间周期和频带；

-通过在所确定的具有爆破噪声的时间周期和频带中用来自所述第三电声输入变换器（14）的所述第三输入信号（24）替换所述语音信号，或者，通过在所确定的具有爆破噪声的时间周期和频带中，将所述语音信号（18）与包括舒适噪声的舒适信号（36）和/或与所述第三输入信号（24）混合，降低被配置为在所确定的具有爆破噪声的时间周期和频带中传输至所述远端装置的输出信号中的所述爆破噪声。