CN109218912B - 多麦克风爆破噪声控制 - Google Patents

多麦克风爆破噪声控制 Download PDF

Info

Publication number
CN109218912B
CN109218912B CN201810722507.6A CN201810722507A CN109218912B CN 109218912 B CN109218912 B CN 109218912B CN 201810722507 A CN201810722507 A CN 201810722507A CN 109218912 B CN109218912 B CN 109218912B
Authority
CN
China
Prior art keywords
electro
signal
headset
acoustic input
input transducer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810722507.6A
Other languages
English (en)
Other versions
CN109218912A (zh
Inventor
拉斯穆斯·孔斯格德·奥尔森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GN Audio AS
Original Assignee
GN Audio AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GN Audio AS filed Critical GN Audio AS
Publication of CN109218912A publication Critical patent/CN109218912A/zh
Application granted granted Critical
Publication of CN109218912B publication Critical patent/CN109218912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6058Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • H04R1/04Structural association of microphone with electric circuitry therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor
    • H04R1/083Special constructions of mouthpieces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6008Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/105Earpiece supports, e.g. ear hooks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/10Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
    • H04R2201/107Monophonic and stereophonic headphones with microphone for two-way hands free communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/405Non-uniform arrays of transducers or a plurality of uniform arrays with different transducer spacing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/01Noise reduction using microphones having different directional characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/07Mechanical or electrical reduction of wind noise generated by wind passing a microphone

Abstract

本申请涉及多麦克风爆破噪声控制。公开的是用于降低用户和远端装置之间的语音通信中的爆破噪声的方法和耳机。该耳机被配置为由用户佩戴。该耳机包括具有第一、第二端的麦克风吊杆;接收音频输入信号的第一、第二和第三电声输入变换器,设置在麦克风吊杆中;提供语音信号的第一波束形成器;提供爆破噪声信号的第二波束形成器,自适应地被配置为消除语音和背景噪声而不消除爆破噪声;比较器,将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中,在被配置为传输至远端装置的输出信号中,爆破噪声降低。

Description

多麦克风爆破噪声控制
技术领域
本公开涉及用于降低用户和远端装置之间的语音通信中的爆破噪声的耳机。该耳机包括用于接收音频输入信号的第一电声输入变换器、第二电声输入变换器和第三电声输入变换器。
背景技术
为了改善背景噪声的抑制,耳机经常配备有梯度麦克风和/或多个具有波束形成的麦克风,优选地,安装在靠近用户嘴巴的麦克风臂上。不幸地,这种麦克风系统对爆破噪声-以及对风噪声和处理噪声很敏感。
爆破噪声可以由例如泡沫制成的外部风罩和/或通过将麦克风移动远离嘴巴来抑制。有效风罩通常很大且笨重,并且移动麦克风降低语音-背景噪声比-尤其是在较低频率下。在电话呼叫期间,爆破噪声可以适当加压于远端参与者。
发明内容
需要改善耳机麦克风中爆破噪声抑制。
公开的是用于降低用户和远端装置之间的语音通信的爆破噪声的耳机。该耳机被配置为由用户佩戴。该耳机包括具有第一端和第二端的麦克风吊杆。当用户正在佩戴耳机时,第一端被配置为指向用户的嘴巴。该耳机包括用于接收音频输入信号的第一电声输入变换器、第二电声输入变换器和第三电声输入变换器。第一电声输入变换器、第二电声输入变换器和第三电声输入变换器被设置在麦克风吊杆中。该耳机包括被配置为提供语音信号的第一波束形成器。语音信号基于来自第一电声输入变换器的第一输入信号。第一波束形成器被配置为优化语音-背景噪声比。该耳机包括被配置为提供爆破噪声信号的第二波束形成器。爆破噪声信号基于来自第一电声输入变换器的第一输入信号、来自第二电声输入变换器的第二输入信号以及来自第三电声输入变换器的第三输入信号。第二波束形成器自适应地被配置为消除语音和背景噪声,而不消除爆破噪声。该耳机包括比较器,该比较器被配置为将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中,降低被配置为传输至远端装置的输出信号中的爆破噪声。
还公开了在耳机中降低佩戴耳机的用户和远端装置之间的语音通信中的爆破噪声的方法。该耳机包括具有第一端和第二端的麦克风吊杆,其中,当用户佩戴耳机时,第一端被配置为指向用户的嘴巴。该耳机包括用于接收音频信号的第一电声输入变换器、第二电声输入变换器和第三电声输入变换器,其中,第一电声输入变换器、第二电声输入变换器和第三电声输入变换器被设置在麦克风吊杆中。该方法包括接收第一电声输入变换器中的第一音频信号、第二电声输入变换器中的第二音频信号以及第三电声输入变换器中的第三音频信号。该方法包括在第一波束形成器中提供语音信号,该语音信号至少基于来自第一电声输入变换器的第一输入信号,其中,第一波束形成器被配置为优化语音-背景噪声比。该方法包括在第二波束形成器中提供爆破噪声信号,该爆破噪声信号基于来自第一电声输入变换器的第一输入信号、来自第二电声输入变换器的第二输入信号以及来自第三电声输入变换器的第三输入信号,其中,第二波束形成器自适应地被配置为消除语音和背景噪声而不消除爆破噪声。该方法包括在比较器中,将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以确定具有爆破噪声的时间周期和频带。该方法包括降低被配置为在所确定的具有爆破噪声的时间周期和频带中传输至远端装置的输出信号中的爆破噪声。
优点是输出信号中的爆破噪声被降低,因为这将用户的言语的更好和更舒适的传输提供给远端装置。
爆破噪声最强,因此在这种情况下最接近个人讲话(即,耳机的用户)的嘴巴。越远离用户的嘴巴爆破噪声越弱。因此,优点是在爆破噪声存在于用户言语的时间周期和频带中,可以降低这个爆破噪声。可以不同的方式执行降低爆破噪声。
因为爆破噪声最靠近用户的嘴巴,因此来自最靠近用户嘴巴的麦克风吊杆上的输入变换器(例如,前置麦克风)的输入信号,例如可以利用来自更远离用户嘴巴的麦克风吊杆上的输入变换器(例如,后置麦克风)的输入信号替换。
爆破噪声可以限定为由至少来自佩戴耳机的用户的嘴巴的气流引起的风湍流。还称为喘息噪声的爆破噪声是由来自用户的嘴巴在麦克风或输入变换器(例如,用户佩戴的耳机的麦克风)中讲话的气流引起的风湍流。提供在下文中呼吸噪声从嘴巴发出而且该噪声由为本文中描述的爆破噪声设计的方法进行处理。爆破噪声风湍流造成耳机的麦克风的麦克风隔膜的运动。爆破噪声可以由爆破音导致,该爆破音是由谈话者、歌手和其他歌唱者在麦克风中说话产生的口阻塞音,诸如,p、t和k。在使用例如通信耳机的通信中,爆破噪声会对对话的远端侧导致非常紧张的体验。
爆破噪声的模式包括人类语言、言语产生、流体力学和/或电声。爆破噪声存在可以利用的一些特性:
-爆破噪声强烈依赖从嘴巴喷出的距离。因此,进一步远离嘴巴的麦克风较少被暴露。
-爆破噪声在麦克风之间呈现极低的相关性(不连贯)。
-爆破噪声随着时间改变,并且大部分时间不存在爆破噪声。
-爆破噪声具有由低频率控制的随着时间改变的倾斜的功率频谱。
因此在这种情况下,爆破噪声最强并且因此最接近个人讲话(即,耳机的用户)的嘴巴。越远离用户的嘴巴,爆破噪声变弱。爆破噪声是低频噪声。
如所公开的耳机和方法提供爆破噪声从输出信号移去同时执行最佳的背景噪声消除并且保存完整的语音质量。
该耳机包括第一电声输入变换器、第二电声输入变换器和第三电声输入变换器,例如,三个麦克风。电声输入变换器安装在麦克风吊杆上。优选地,电声输入变换器被布置在麦克风吊杆上的端射配置中。
语音信号是由第一波束形成器提供。语音信号至少基于来自第一电声输入变换器的第一输入信号。当麦克风吊杆被布置在相对于用户嘴巴的预期位置中时,第一电声输入变换器可以是在麦克风吊杆上最靠近用户嘴巴的输入变换器。第一波束形成器被配置为优化语音-背景噪声比。语音信号还可以基于来自第二电声输入变换器的第二输入信号。当麦克风吊杆被布置在相对于用户嘴巴的预期位置中时,第一电声输入变换器和第二电声输入变换器可以是在麦克风吊杆上最靠近用户嘴巴的两个输入变换器。当麦克风吊杆被布置在相对于用户嘴巴的预期位置中时,第三电声输入变换器可以是相对于用户嘴巴的最后面或远处的输入变换器。
爆破噪声信号基于来自全部三个输入变换器的信号由第二波束形成器提供。第二波束形成器自适应地被配置为消除语音和背景噪声,而不消除爆破噪声。
比较器被配置为将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以确定具有高含量的爆破噪声的时间周期和频带,例如,时间频率小区。比较器可以是或者可以包括爆破噪声检测器或者爆破噪声传感器。
在所确定的具有爆破噪声的时间周期和频带中,在被配置为传输至远端装置的输出信号中,爆破噪声降低。
降低输出信号中的爆破噪声可以包括利用另一个信号替换爆破噪声,和/或利用另一个信号抑制爆破噪声,和/或去除爆破噪声。例如,爆破噪声可以利用来自第三电声输入变换器的第三输入信号替换,因为这个第三输入信号包括较少爆破噪声。
在具有高含量的爆破噪声的时间频率小区中,混频器可以利用来自第三电声输入变换器(例如,最后面的麦克风)的信号替换语音信号。合成信号或输出信号被提供给通信系统,使得远端装置接收具有降低爆破噪声的用户的语音。
该耳机可以包括多于三个输入变换器,诸如,包括四个、五个、六个等输入变换器。因此,第一波束形成器可以处理来自输入变换器的多于一个或两个的输入信号。
在具有很高容量的爆破噪声的时间频率小区中,混频器可以利用舒适噪声或者利用沉默替换语音信号。在具有很高容量的爆破噪声的时间频率小区中,混频器可以抑制语音信号。
如果存在两个前置输入变换器,则语音信号或原始信号通过波束形成两个前置输入变换器中的一个或两个来形成。可选地,更多输入变换器可包括在原始信号波束形成器中。这个波束形成器被配置为优化语音-背景噪声比。
可以是波束形成器或实际麦克风的爆破噪声传感器可以通过使用三个或更多个输入变换器形成。这个波束形成器自适应地被配置为消除语音和背景噪声,而不消除爆破噪声。最终,如果前置输入变换器确定具有高容量的爆破噪声的时间频率小区,则爆破噪声传感器可以与一个或多个进行比较。
在混合过程中,包含爆破噪声的语音信号或原始信号的部分可以利用来自后置输入变换器麦克风或第三电声输入变换器麦克风的输入信号、和/或在严重情况下利用舒适噪声或沉默进行替换。
该耳机包括具有第一端和第二端的麦克风吊杆。当用户佩戴耳机时,第一端被配置为指向用户的嘴巴。麦克风吊杆的第二端被配置为安装在耳机处,例如,安装在输出变换器处,安装在耳机的听筒外壳或扬声器外壳处,安装在用户的耳朵处等。
该耳机包括用于接收音频信号的第一电声输入变换器、第二电声输入变换器和第三电声输入变换器。音频信号是输入信号。因此,第一电声输入变换器被配置为接收第一输入信号。第二电声输入变换器被配置为接收第二输入信号。第三电声输入变换器被配置为接收第三输入信号。
该耳机包括被配置为提供语音信号的第一波束形成器。语音信号基于来自第一电声输入变换器的第一输入信号。来自第一电声输入变换器的第一输入信号可以提供至用于生成语音信号的处理单元。因此,处理单元可以包括第一波束形成器。第一电声输入变换器可以是梯度麦克风、噪声消除麦克风等。
第一波束形成器可以是自适应的,例如,第一波束形成器可以被配置为消除从不同音频源输入的音频。
输入信号的言语部分和噪声部分可以是相关的。输入信号中的爆破噪声部分可以是不相关的。
第一波束形成器被配置为优化语音-背景噪声比和/或抑制与语音相比的噪声。
该耳机包括比较器,该比较器被配置为将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。这些时间周期和频带可以称为时间频率小区。具有爆破噪声的时间周期和频带可以是具有高容量的爆破噪声的时间周期和频带。
可以控制、适配或配置输入变换器的方向特性,使得来自两个输入变换器(例如,两个前置麦克风)的输入信号可以基本上相似并且从而可以消除来自这些输入信号的言语和/或噪声。通过使用三个输入变换器,可以消除言语和噪声这两者。
当使用波束形成器或定向麦克风时,将存在爆破噪声。优点是通过本耳机和方法,可以检测和降低爆破噪声。
在一些实施方式中,爆破噪声是由至少来自佩戴耳机的用户的嘴巴的气流引起的风湍流。
在一些实施方式中,第一电声输入变换器和第二电声输入变换器以距第一端比第一端和第三电声输入变换器之间的距离更短的距离布置在麦克风吊杆上。因此,当用户将耳机佩戴在它的预期位置中时,第一电声输入变换器和第二电声输入变换器可以布置在被配置为布置为靠近、紧邻、邻近于用户嘴巴的麦克风吊杆的第一端。第一电声输入变换器和第二电声输入变换器可以是前置麦克风或输入变换器。第三电声输入变换器可以是后置麦克风或输入变换器。第三电声输入变换器可以布置在更远离第一端,诸如更靠近第二端的麦克风吊杆上。例如,从第一端至第一电声输入变换器和第二电声输入变换器可能存在0.5cm。例如,从第一端至第三电声输入变换器可能存在2cm。因此,第三电声输入变换器以距第一端比第一端分别和第一电声输入变换器和第二电声输入变换器之间的距离更大的距离被布置在麦克风吊杆上。
在一些实施方式中,降低输出信号中的爆破噪声包括在具有爆破噪声的时间周期和频带中利用来自第三电声输入变换器的第三输入信号替换语音信号。这可以通过在耳机中提供混频器获得,其中,该混频器被配置为执行降低、替换等。替换波束形成器可以用于执行这个替换。替换波束形成器可以是由输入变换器组成的波束形成器,其中,检测不到爆破或爆破噪声,例如,第三电声输入变换器和第四电声输入变换器,或者例如,第三输电声入变换器和第二电声输入变换器。
在一些实施方式中,降低输出信号中的爆破噪声包括在具有爆破噪声的时间周期和频带中将语音信号与包括舒适噪声的舒适信号和/或与第三输入信号混合。
在一些实施方式中,降低输出信号中的爆破噪声包括抑制(诸如,去除)具有爆破噪声的时间周期和频带中的语音信号。因此,例如,可以提供沉默代替爆破噪声。可以通过提供另一个信号代替爆破噪声来抑制爆破噪声。
在一些实施方式中,第一波束形成器适于通过使用最小方差无失真响应(MVDR)计算或广义旁瓣消除器(GSC)计算优化语音-背景噪声比。
第一波束形成器可以使用其他类似方法,例如,盲源分离等。第一波束形成器可以是自适应波束形成器。第一波束形成器可以是具有特定灵敏度的预定义的波束形成器。
广义旁瓣消除,例如,参见Ivan Tashev;声音捕获和处理:实际方法,2009年7月的Wiley的388页,指的是波束形成器具有建立为处理结构以保存感兴趣的信号的限制,该信号是耳机使用情况下的用户言语。
GSC可具有两个计算分支:
第一分支可以是拾取用户言语和环境噪声的混合的参考分支或固定波束形成器。参考分支的实例是延迟加总波束形成器,例如,求和关于用户言语、或当作参考的麦克风中的一个对准的振幅和相位信号。如以下解释的,参考分支可优选地选择和/或设计成麦克风相对于用户的嘴巴的定位尽可能不灵敏,因为参考分支的用户言语响应确定GSC的用户言语响应。由于全方位辐射麦克风对于位置以及麦克风灵敏度变化相对不灵敏、相对逼真,因此全方位辐射麦克风可能是合适的。在多麦克风耳机麦克风吊杆设计中,可位于更接近麦克风吊杆的旋转点的后置麦克风(其中,旋转点一般在用户耳朵的耳机的听筒处或在该听筒处铰接)可以是优选的,因为它对麦克风吊杆的移动较不灵敏。因此,优选地,这没有提供用户言语信号的振幅频谱的变化。
GSC计算的第二分支可以计算言语消除信号,其中,借助于分块矩阵,过滤和减去信号,以便尽可能地减少用户言语信号。
最终,噪声消除可以通过GSC通过自适应地过滤言语消除信号并且将其从参考分支中减去以便使输出功率最小化来执行。在理想情况下,言语消除信号(理想地)不包含用户言语成分,并且因此减去产生噪声消除输出不改变参考分支中存在的用户言语成分。因此,言语成分的振幅频谱可以是相同的或者在GSC参考分支和GSC波束形成器的输出处非常相似。可以说GSC波束形成器的波束在用户言语上居中。
因此,广义旁瓣消除器(GSC)系统或计算可以在该方法以及其他系统中使用,诸如,最小方差无失真响应(MVDR)计算或系统。
最小方差无失真响应(MVDR)适用于使遭受单个线性约束的过滤加总波束形成器的输出功率最小的波束形成器。该解决方案可以通过单步、闭合解决方案获得。经常,选择约束或导向矢量以致波束形成器在观察方向上维持均匀响应,即,感兴趣方向上的波束点。可以设计导向矢量以致用户语音或言语成分的振幅频谱在MVDR波束形成器的输入(即,参考)和输出处相同。
MVDR波束形成器计算用于单个频带简单地总结如下。信号模型,第i个输入,
xi=cis+ni
其中,s和ni分别是用户言语和第i个环境噪声信号。ci是结合麦克风振幅和相位响应、输入电子响应和声路程响应的完整的第i个复合响应。
可以书写过滤加总波束形成器,
y=wHx
MVDR波束形成器使受标准化约束的输出最小,
wMVDR=argminw<|y|2>
遭受wHa=q
MVDR成本函数的闭合式解决方案为,
Figure GDA0003229206190000111
其中,C和a分别是噪声协方差矩阵和导向矢量。
选择导向矢量a,并且q=1,以便限制波束形成器的语音或言语响应等于“最佳的”参考麦克风。以上为了GSC波束形成器描述了为了加强麦克吊杆定位选择最有利的麦克风。
限制波束形成器的语音或言语响应等于参考(即,“最佳的”)麦克风可以通过使用相对的嘴巴对麦克风传递函数作为导向矢量实现
Figure GDA0003229206190000112
其中,通过从第i个麦克风至用户言语成分的参考麦克风估计复合传递函数,分数ai可能是近似的而不接近ci
因此,用户言语成分在参考麦克风中和MVDR波束形成器的输出处可以是相同或相似的。证明如下:
Figure GDA0003229206190000121
进一步地,与GSC系统类似,当语音活动检测器(VAD)表示用户言语成分将不过多损害该估计时,可以估计和更新噪声协方差矩阵。
导向矢量、噪声协方差估计和MVDR解决方案可以合适的间隔更新,例如,每4ms、10ms或100ms,利用噪声消除益处均衡计算成本。正则项可以添加至噪声协方差估计。
在一些实施方式中,第二波束形成器通过消除在输入变换器/麦克风之间相关的输入信号的部分并且保持不相关的输入信号的部分自适应地消除语音和背景噪声,而不消除爆破噪声。爆破噪声在输入变换器之间可以是不相关的。言语和环境噪声在输入变换器之间可以是相关的。
在一些实施方式中,第一电声输入变换器和第二电声输入变换器被布置为提供第一输入信号与第二输入信号的相关性比第一输入信号和第二输入信号中的每一个与第三输入信号的相关性更相关。输入信号的言语和噪声部分在输入变换器之间可以是相关的。输入信号的爆破或爆破噪声部分在输入变换器之间可以是不相关的。第一输入信号和第二输入信号是更相关的可以意味着这些更高程度地相关。
在一些实施方式中,耳机包括第四电声输入变换器。在一些实施方式中,耳机包括麦克风吊杆上的第五输入变换器、第六输入变换器、第七输入变换器、第八输入变换器等。更多输入变换器将改善爆破噪声降低。
在一些实施方式中,由第一波束形成器提供的语音信号进一步基于来自第二电声输入变换器的第二输入信号、和/或来自第三电声输入变换器的第三输入信号和/或来自第四电声输入变换器的第四输入信号。由第二波束形成器提供的爆破噪声信号还可以基于来自第四电声输入变换器的第四输入信号。
在一些实施方式中,耳机包括用于再生音频信号的输出变换器。在一些实施方式中,输出信号传输至输出变换器,从而将降低的爆破噪声输出信号应用于耳机的用户。输出变换器可以是扬声器、接收器等。将降低爆破噪声的输出信号传输至耳机的输出变换器提供耳机的用户可以听见与输出至远端装置相同的输出信号。这被称为侧音。优点是用户可以听见传输至远端装置的相同信号,使得用户准确地放置麦克风吊杆。
侧音是在描述给予例如耳机用户的自身语音反馈的电信中使用的术语。为了实现这个效果,耳机麦克风信号被添加至扬声器信号。这帮助耳机用户控制他/她的语音的水平和特性。
在爆破噪声控制系统应用于传输音频的情况下,有用的是爆破噪声控制还应用于侧音,反映通过对话的远侧体验的爆破噪声的降低水平。另外,用户将听到他/她自己的语音爆破噪声并且调整进一步远离嘴巴的麦克风吊杆。这在传输信号中将导致更差的语音-背景噪声比,并且因此,抵消后面的想法将爆破噪声控制应用于传输信号。
因此,爆破噪声控制(例如,低延迟爆破噪声)可以应用于侧音。
侧音产生可以是低延迟,例如,小于10ms,以便自然感知。相反地,传输信号上的延迟要求不是类似精确的,例如,一般的移动对话具有250ms的端到端延迟。因此,爆破噪声控制的低延迟版本是优选的,进行用于低延迟的声音质量。
用于侧音的低延迟爆破噪声控制例如可以通过将来自传输爆破噪声控制的转换信号应用于侧音信号获得,而不补偿提前检测。该转换然后将总是稍微“滞后”。
在一些实施方式中,第一电声输入变换器、第二电声输入变换器和第三电声输入变换器以端射配置被设置在麦克风吊杆中。端射配置可包括输入变换器中的两个被布置为更接近麦克风吊杆的第一端,并且一个或多个输入变换器被布置为更远离麦克风吊杆的第一端。
在一些实施方式中,麦克风吊杆长于5cm,诸如长于6cm,诸如长于7cm,诸如长于8cm,诸如长于10cm,诸如长于12cm,诸如长于14cm。优点是麦克风吊杆长,因为第一电声输入变换器和第二电声输入变换器(例如,前置麦克风)可以接近嘴巴,并且第三电声输入变换器(例如,后置麦克风)可以更远离嘴巴,因为这实现降低爆破噪声的效果。
本发明涉及包括以上描述和下文中的耳机的不同方面,并且对应的系统部分、方法、装置、系统、网络、成套工具、用途和/或产品意味着每个产生结合第一提及方面描述的益处和优点中的一个或多个,并且各自具有对应于结合第一提及方面描述的和/或所附权利要求中公开的实施方式的一个或多个实施方式。
附图说明
参考附图,通过以下示例性实施方式的详细说明,对于本领域中的技术人员而言,以上和其他特征以及优点将变得容易地显而易见,在附图中:
图1示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机的实例。
图2示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机的实例。
图3示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声并且同时提供侧音的耳机的实例。
图4a和图4b示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机的实例。
图5示意性地示出了示出用户的言语中的爆破噪声的时间频率图的实例。
具体实施方式
在下文中参考附图描述各种实施方式。贯穿全文,相同参考标号是指相同元件。因此,不在每幅图的描述中详细描述相同元件。还应注意的是,附图仅旨在促进实施方式的描述。它们不旨在作为所要求保护的发明的彻底描述或者作为所要求保护的范围上的限制。此外,示出的实施方式不必具有示出的所有方面或优点。即使没有如此示出,或者没有如此明确地描述,结合具体实施方式描述的方面或优点也不必局限于该实施方式并且可以在任何其他实施方式中实践。
贯穿全文,相同的参考标号用于相同或对应的部件。
图1示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机2的实例。耳机2被配置为由用户佩戴。耳机2包括具有第一端和第二端的麦克风吊杆(未示出)。当用户正在佩戴耳机时,第一端被配置为指向用户的嘴巴。
耳机2包括用于接收音频输入信号的第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14。
第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14被设置在麦克风吊杆中。
耳机2包括被配置为提供语音信号(未示出)的第一波束形成器16。语音信号基于来自第一电声输入变换器10的第一输入信号20。第一波束形成器16被配置为优化语音-背景噪声比。
耳机2包括被配置为提供爆破噪声信号28的第二波束形成器26。爆破噪声信号28基于来自第一电声输入变换器10的第一输入信号20、来自第二电声输入变换器12的第二输入信号22以及来自第三电声输入变换器14的第三输入信号24。第二波束形成器26自适应地被配置为消除语音和背景噪声,而不消除爆破噪声。
耳机2包括比较器30,该比较器被配置为将爆破噪声信号28与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中,在被配置为传输至远端装置的输出信号32中,爆破噪声降低。
图2示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机2的实例。耳机2被配置为由用户佩戴。耳机2包括具有第一端和第二端的麦克风吊杆(未示出)。当用户正在佩戴耳机时,第一端被配置为指向用户的嘴巴。
耳机2包括用于接收音频输入信号的第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14。
第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14被设置在麦克风吊杆中。
耳机2包括被配置为提供语音信号18的第一波束形成器16。语音信号18基于来自第一电声输入变换器10的第一输入信号20以及来自第二电声输入变换器12的第二输入信号22。可选地,语音信号18还可以基于来自第三电声输入变换器14的第三输入信号24。第一波束形成器16被配置为优化语音-背景噪声比。
耳机2包括被配置为提供爆破噪声信号28的第二波束形成器26。爆破噪声信号28基于来自第一电声输入变换器10的第一输入信号20、来自第二电声输入变换器12的第二输入信号22、以及来自第三电声输入变换器14的第三输入信号24。第二波束形成器26自适应地被配置为消除语音和背景噪声,而不消除爆破噪声。
耳机2包括比较器30,该比较器被配置为将爆破噪声信号28与多个频带中的每一个内的语音信号18进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中,在被配置为传输至远端装置的输出信号32中,爆破噪声降低。
在所确定的具有爆破噪声的时间周期和频带中,输出信号32中的爆破噪声可以通过利用来自第三电声输入变换器14的第三输入信号24替换语音信号降低。
可替换地和/或此外,在所确定的具有爆破噪声的时间周期和频带中,可以通过利用包括舒适噪声的舒适信号36替换或者抑制语音信号降低输出信号32中的爆破噪声。
爆破噪声降低的输出信号32还可以在传输至远端装置之前传输至用于普通噪声抑制的普通噪声抑制单元38。
来自第一电声输入变换器10的第一输入信号20、来自第二电声输入变换器12的第二输入信号22、以及来自第三电声输入变换器14的第三输入信号24可以在传输至第一波束形成器和第二波束形成器之前在均衡器34中均衡。
图3示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声并且同时提供侧音的耳机2的实例。
耳机2被配置为由用户佩戴。耳机2包括具有第一端和第二端的麦克风吊杆(未示出)。当用户正在佩戴耳机时,第一端被配置为指向用户的嘴巴。
耳机2包括用于接收音频输入信号的第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14。
第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14被设置在麦克风吊杆中。
耳机2包括被配置为提供语音信号的第一波束形成器16。语音信号基于来自第一电声输入变换器10的第一输入信号20。可选地,语音信号还可以基于来自第二电声输入变换器12的第二输入信号22以及来自第三电声输入变换器14的第三输入信号24。第一波束形成器16被配置为优化语音-背景噪声比。
耳机2包括被配置为提供爆破噪声信号的第二波束形成器26。爆破噪声信号基于来自第一电声输入变换器10的第一输入信号20、来自第二电声输入变换器12的第二输入信号22、以及来自第三电声输入变换器14的第三输入信号24。第二波束形成器26自适应地被配置为消除语音和背景噪声,但不消除爆破噪声。
耳机2包括比较器30,该比较器被配置为将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以便确定具有爆破噪声的时间周期和频带。在所确定的具有爆破噪声的时间周期和频带中,在被配置为传输至远端装置的输出信号32中,爆破噪声降低。
耳机2包括用于再生音频信号的输出变换器40。输出信号32经由侧音单元42被传输至输出变换器40,从而将降低的爆破噪声输出信号32应用于耳机2的用户。输出变换器40可以是扬声器、接收器等。将降低爆破噪声的输出信号32传输至耳机2的输出变换器40提供耳机的用户可以听见与输出至远端装置相同的输出信号32。这被称为侧音。
输出变换器40还接收远端装置音频信号44。
图4a和图4b示意性地示出了用于降低用户和远端装置之间的语音通信的爆破噪声的耳机2的实例。耳机2被配置为由用户佩戴。
图4a示出了耳机2包括具有第一端6和第二端8的麦克风吊杆4。当用户正在佩戴耳机2时,第一端6被配置为指向用户的嘴巴。
图4b示出了耳机2包括用于接收音频输入信号的第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14。
第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14被设置在麦克风吊杆4中。第一电声输入变换器10、第二电声输入变换器12和第三电声输入变换器14可以被设置在端射配置中。
图5示意性地示出了利用检测到的爆破噪声图案覆盖的言语图谱的实例。言语图谱是示出了用户的言语中的爆破噪声的时间、频率图。
在y轴上示出了以Hz测量的频率作为x轴上的以秒测量的时间的函数。在图表中,用户言语中的爆破或爆破噪声由箭头表示。还表示用户的呼吸。
尽管已经示出并描述了特定的特征,但是应当理解的是,所述特征不旨在限制所要求保护的发明,并且对本领域技术人员来说显而易见的是,可以在不偏离所要求保护的发明的范围的情况下,对其做出各种改变和修改。因此,说明书和附图只作为说明性意义而非限制性意义。所要求保护的发明旨在覆盖所有替换、修改和等效物。
在以下项中阐述了示例性耳机和方法。
1.一种耳机(2),用于降低用户和远端装置之间的语音通信中的爆破噪声,该耳机(2)被配置为由用户佩戴,耳机(2)包括:
-麦克风吊杆(4),具有第一端(6)和第二端(8),其中,当用户佩戴耳机(2)时,第一端(6)被配置为指向用户的嘴巴;
-第一电声输入变换器(10)、第二电声输入变换器(12)和第三电声输入变换器(14),用于接收音频信号,其中,第一电声输入变换器(10)、第二电声输入变换器(12)和第三电声输入变换器(14)被设置在麦克风吊杆(4)中;
-第一波束形成器(16),被配置为提供语音信号(18),语音信号(18)基于来自第一电声输入变换器(10)的第一输入信号(20),其中,第一波束形成器(16)被配置为优化语音-背景噪声比;
-第二波束形成器(26),被配置为提供爆破噪声信号(28),爆破噪声信号(28)基于来自第一电声输入变换器(10)的第一输入信号(20)、来自第二电声输入变换器(12)的第二输入信号(22)以及来自第三电声输入变换器(14)的第三输入信号(24),其中,第二波束形成器(26)自适应地被配置为消除语音和背景噪声而不消除爆破噪声;
-比较器(30),被配置为将爆破噪声信号(28)与多个频带中的每一个内的语音信号(18)进行重复比较以便确定具有爆破噪声的时间周期和频带;
其中,在所确定的具有爆破噪声的时间周期和频带中,被配置为传输至远端装置的输出信号(32)中的爆破噪声降低。
2.根据前述项所述的耳机,其中,爆破噪声是由至少来自佩戴耳机的用户的嘴巴的气流所引起的风湍流。
3.根据前述项中任一项所述的耳机,其中,第一电声输入变换器和第二电声输入变换器以距第一端比第一端和第三电声输入变换器之间的距离短的距离被布置在麦克风吊杆上。
4.根据前述项中任一项所述的耳机,其中,降低输出信号中的爆破噪声包括在具有爆破噪声的时间周期和频带中利用来自第三电声输入变换器的第三输入信号替换语音信号。
5.根据前述项中任一项所述的耳机,其中,降低输出信号中的爆破噪声包括在具有爆破噪声的时间周期和频带中将语音信号与包括舒适噪声的舒适信号和/或与第三输入信号混合。
6.根据前述项中任一项所述的耳机,其中,降低输出信号中的爆破噪声包括抑制,诸如去除具有爆破噪声的时间周期和频带中的语音信号。
7.根据前述项中任一项所述的耳机,其中,第一波束形成器适于通过使用最小方差无失真响应(MVDR)计算或广义旁瓣消除器(GSC)计算优化语音-背景噪声比。
8.根据前述项中任一项所述的耳机,其中,第二波束形成器通过消除输入信号的相关的部分并且保持输入信号的不相关的部分来自适应地消除语音和背景噪声而不消除爆破噪声。
9.根据前述项中任一项所述的耳机,其中,第一电声输入变换器和第二电声输入变换器被布置为提供第一输入信号与第二输入信号的相关性比第一输入信号和第二输入信号中的每一个与第三输入信号的相关性更相关。
10.根据前述项中任一项所述的耳机,其中,耳机包括第四电声输入变换器。
11.根据前述项中任一项所述的耳机,其中,由第一波束形成器提供的语音信号进一步基于来自第二电声输入变换器的第二输入信号、和/或来自第三电声输入变换器的第三输入信号和/或来自第四电声输入变换器的第四输入信号。
12.根据前述项中任一项所述的耳机,其中,耳机包括用于音频信号的再生的输出变换器;并且其中,输出信号被传输至输出变换器,从而将降低爆破噪声的输出信号应用至耳机的用户。
13.根据前述项中任一项所述的耳机,其中,第一电声输入变换器、第二电声输入变换器和第三电声输入变换器被设置在端射配置中的麦克风吊杆中。
14.根据前述项中任一项所述的耳机,其中,麦克风吊杆长于5cm,诸如长于6cm,诸如长于7cm,诸如长于8cm,诸如长于10cm,诸如长于12cm,诸如长于14cm。
15.一种在耳机中降低佩戴耳机的用户和远端装置之间的语音通信中的爆破噪声的方法,该耳机包括:-麦克风吊杆,具有第一端和第二端,其中,当用户佩戴耳机时,第一端被配置为指向用户的嘴巴;
-第一电声输入变换器、第二电声输入变换器和第三电声输入变换器,用于接收音频信号,其中,第一电声输入变换器、第二电声输入变换器和第三电声输入变换器被设置在麦克风吊杆中;
该方法包括:
-接收第一电声输入变换器中的第一音频信号、第二电声输入变换器中的第二音频信号以及第三电声输入变换器中的第三音频信号;
-在第一波束形成器中提供语音信号,语音信号至少基于来自第一电声输入变换器的第一输入信号,其中,第一波束形成器被配置为优化语音-背景噪声比;
-在第二波束形成器中提供爆破噪声信号,该爆破噪声信号基于来自第一电声输入变换器的第一输入信号、来自第二电声输入变换器的第二输入信号以及来自第三电声输入变换器的第三输入信号,其中,第二波束形成器自适应地被配置为消除语音和背景噪声而不消除爆破噪声;
-在比较器中,将爆破噪声信号与多个频带中的每一个内的语音信号进行重复比较以确定具有爆破噪声的时间周期和频带;
-降低被配置为在所确定的具有爆破噪声的时间周期和频带中传输至远端装置的输出信号中的爆破噪声。
参考列表
2 耳机
4 麦克风吊杆
6 麦克风吊杆的第一端
8 麦克风吊杆的第二端
10 第一电声输入变换器
12 第二电声输入变换器
14 第三电声输入变换器
16 第一波束形成器
18 语音信号
20 第一输入信号
22 第二输入信号
24 第三输入信号
26 第二波束形成器
28 爆破噪声信号
30 比较器
32 输出信号
34 均衡器
36 舒适信号
38 噪声抑制单元
40 输出变换器
42 侧音单元
44来自远端装置的音频信号。

Claims (21)

1.一种耳机(2),用于降低用户和远端装置之间的语音通信中的爆破噪声,所述耳机(2)被配置为由所述用户佩戴,所述耳机(2)包括:
-麦克风吊杆(4),具有第一端(6)和第二端(8),其中,当所述用户佩戴所述耳机(2)时,所述第一端(6)被配置为指向所述用户的嘴巴;
-第一电声输入变换器(10)、第二电声输入变换器(12)和第三电声输入变换器(14),用于接收音频信号,其中,所述第一电声输入变换器(10)、所述第二电声输入变换器(12)和所述第三电声输入变换器(14)被设置在所述麦克风吊杆(4)中,使得当所述用户佩戴所述耳机(2)时,所述第一电声输入变换器(10)最靠近所述用户的嘴巴并且所述第三电声输入变换器(14)更远离所述用户的嘴巴;
-第一波束形成器(16),被配置为提供语音信号(18),所述语音信号(18)至少基于来自所述第一电声输入变换器(10)的第一输入信号(20),其中,所述第一波束形成器(16)被配置为优化语音-背景噪声比;
-第二波束形成器(26),被配置为提供爆破噪声信号(28),所述爆破噪声信号(28)基于来自所述第一电声输入变换器(10)的所述第一输入信号(20)、来自所述第二电声输入变换器(12)的第二输入信号(22)以及来自所述第三电声输入变换器(14)的第三输入信号(24),其中,所述第二波束形成器(26)自适应地被配置为消除语音和背景噪声而不消除爆破噪声;
-比较器(30),被配置为将所述爆破噪声信号(28)与多个频带中的每一个频带内的所述语音信号(18)进行重复比较以便确定具有爆破噪声的时间周期和频带;
其中,通过在所确定的具有爆破噪声的时间周期和频带中用来自所述第三电声输入变换器(14)的所述第三输入信号(24)替换所述语音信号,或者,通过在所确定的具有爆破噪声的时间周期和频带中,将所述语音信号(18)与包括舒适噪声的舒适信号(36)和/或与所述第三输入信号(24)混合,在所确定的具有爆破噪声的时间周期和频带中降低被配置为传输至所述远端装置的输出信号(32)中的所述爆破噪声。
2.根据权利要求1所述的耳机(2),其中,所述爆破噪声是由至少来自佩戴所述耳机的所述用户的嘴巴的气流所引起的风湍流。
3.根据权利要求1或2所述的耳机(2),其中,所述第一电声输入变换器(10)和所述第二电声输入变换器(12)以距所述第一端(6)比所述第一端(6)和所述第三电声输入变换器(14)之间的距离短的距离被布置在所述麦克风吊杆上。
4.根据权利要求1或2所述的耳机(2),其中,降低所述输出信号(32)中的所述爆破噪声包括抑制,具有爆破噪声的时间周期和频带中的所述语音信号(18)。
5.根据权利要求4所述的耳机(2),其中,所述抑制指去除。
6.根据权利要求1或2所述的耳机(2),其中,所述第一波束形成器(16)适于通过使用最小方差无失真响应(MVDR)计算或广义旁瓣消除器(GSC)计算优化所述语音-背景噪声比。
7.根据权利要求1或2所述的耳机(2),其中,所述第二波束形成器(26)通过消除输入信号的相关的部分并且保持所述输入信号的不相关的部分来自适应地消除语音和背景噪声而不消除爆破噪声。
8.根据权利要求1或2所述的耳机,其中,所述第一电声输入变换器(10)和所述第二电声输入变换器(12)被布置为提供所述第一输入信号(20)与所述第二输入信号(22)的相关性比所述第一输入信号(20)和所述第二输入信号(22)中的每一个与所述第三输入信号(24)的相关性更相关。
9.根据权利要求1或2所述的耳机(2),其中,所述耳机(2)包括第四电声输入变换器。
10.根据权利要求1或2所述的耳机(2),其中,由所述第一波束形成器(16)提供的所述语音信号(18)进一步基于来自所述第二电声输入变换器(12)的所述第二输入信号(22)、和/或来自所述第三电声输入变换器(14)的所述第三输入信号(24)。
11.根据权利要求9所述的耳机(2),其中,由所述第一波束形成器(16)提供的所述语音信号(18)进一步基于来自所述第二电声输入变换器(12)的所述第二输入信号(22)、和/或来自所述第三电声输入变换器(14)的所述第三输入信号(24)和/或来自所述第四电声输入变换器的第四输入信号。
12.根据权利要求1或2所述的耳机(2),其中,所述耳机(2)包括用于音频信号的再生的输出变换器(40);并且其中,所述输出信号(32)被传输至所述输出变换器(40),从而将降低爆破噪声的输出信号施加至所述耳机(2)的所述用户。
13.根据权利要求1或2所述的耳机(2),其中,所述第一电声输入变换器(10)、所述第二电声输入变换器(12)和所述第三电声输入变换器(14)被设置以端射配置的所述麦克风吊杆(4)中。
14.根据权利要求1或2所述的耳机(2),其中,所述麦克风吊杆(4)长于5 cm。
15.根据权利要求14所述的耳机(2),其中,所述麦克风吊杆(4)长于6 cm。
16.根据权利要求15所述的耳机(2),其中,所述麦克风吊杆(4)长于7 cm。
17.根据权利要求16所述的耳机(2),其中,所述麦克风吊杆(4)长于8 cm。
18.根据权利要求17所述的耳机(2),其中,所述麦克风吊杆(4)长于10 cm。
19.根据权利要求18所述的耳机(2),其中,所述麦克风吊杆(4)长于12 cm。
20.根据权利要求19所述的耳机(2),其中,所述麦克风吊杆(4)长于14 cm。
21.一种在耳机(2)中降低佩戴所述耳机(2)的用户和远端装置之间的语音通信中的爆破噪声的方法,所述耳机(2)包括:-麦克风吊杆(4),具有第一端(6)和第二端(8),其中,当所述用户佩戴所述耳机(2)时,所述第一端(6)被配置为指向所述用户的嘴巴;
-第一电声输入变换器(10)、第二电声输入变换器(12)和第三电声输入变换器(14),用于接收音频信号,其中,所述第一电声输入变换器(10)、所述第二电声输入变换器(12)和所述第三电声输入变换器(14)被设置在所述麦克风吊杆(4)中,使得当所述用户佩戴所述耳机(2)时,所述第一电声输入变换器(10)最靠近所述用户的嘴巴并且所述第三电声输入变换器(14)更远离所述用户的嘴巴;
所述方法包括:
-接收所述第一电声输入变换器(10)中的第一输入信号(20)、所述第二电声输入变换器中(12)的第二输入信号(22)以及所述第三电声输入变换器中(14)的第三输入信号(24);
-在第一波束形成器(16)中提供语音信号(18),所述语音信号(18)至少基于来自所述第一电声输入变换器(10)的所述第一输入信号(20),其中,所述第一波束形成器(16)被配置为优化语音-背景噪声比;
-在第二波束形成器(26)中提供爆破噪声信号(28),所述爆破噪声信号(28)基于来自所述第一电声输入变换器(10)的所述第一输入信号(20)、来自所述第二电声输入变换器(12)的所述第二输入信号(22)以及来自所述第三电声输入变换器(14)的所述第三输入信号(24),其中,所述第二波束形成器(26)自适应地被配置为消除语音和背景噪声而不消除爆破噪声;
-在比较器(30)中,将所述爆破噪声信号(28)与多个频带中的每一个频带内的所述语音信号(18)进行重复比较以确定具有爆破噪声的时间周期和频带;
-通过在所确定的具有爆破噪声的时间周期和频带中用来自所述第三电声输入变换器(14)的所述第三输入信号(24)替换所述语音信号,或者,通过在所确定的具有爆破噪声的时间周期和频带中,将所述语音信号(18)与包括舒适噪声的舒适信号(36)和/或与所述第三输入信号(24)混合,降低被配置为在所确定的具有爆破噪声的时间周期和频带中传输至所述远端装置的输出信号中的所述爆破噪声。
CN201810722507.6A 2017-06-30 2018-06-29 多麦克风爆破噪声控制 Active CN109218912B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17179056.1 2017-06-30
EP17179056.1A EP3422736B1 (en) 2017-06-30 2017-06-30 Pop noise reduction in headsets having multiple microphones

Publications (2)

Publication Number Publication Date
CN109218912A CN109218912A (zh) 2019-01-15
CN109218912B true CN109218912B (zh) 2021-12-07

Family

ID=59269906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810722507.6A Active CN109218912B (zh) 2017-06-30 2018-06-29 多麦克风爆破噪声控制

Country Status (3)

Country Link
US (1) US10262676B2 (zh)
EP (1) EP3422736B1 (zh)
CN (1) CN109218912B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3629602A1 (en) * 2018-09-27 2020-04-01 Oticon A/s A hearing device and a hearing system comprising a multitude of adaptive two channel beamformers
CN110428806B (zh) * 2019-06-03 2023-02-24 交互未来(北京)科技有限公司 基于麦克风信号的语音交互唤醒电子设备、方法和介质
US11145319B2 (en) * 2020-01-31 2021-10-12 Bose Corporation Personal audio device
US11521633B2 (en) * 2021-03-24 2022-12-06 Bose Corporation Audio processing for wind noise reduction on wearable devices
US20220392479A1 (en) * 2021-06-04 2022-12-08 Samsung Electronics Co., Ltd. Sound signal processing apparatus and method of processing sound signal
CN114023307B (zh) * 2022-01-05 2022-06-14 阿里巴巴达摩院(杭州)科技有限公司 声音信号处理方法、语音识别方法、电子设备和存储介质
US11705101B1 (en) * 2022-03-28 2023-07-18 International Business Machines Corporation Irrelevant voice cancellation
US20240071404A1 (en) * 2022-08-30 2024-02-29 Bose Corporation Input selection for wind noise reduction on wearable devices

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1581026B1 (en) * 2004-03-17 2015-11-11 Nuance Communications, Inc. Method for detecting and reducing noise from a microphone array
US8340309B2 (en) * 2004-08-06 2012-12-25 Aliphcom, Inc. Noise suppressing multi-microphone headset
EP1732352B1 (en) * 2005-04-29 2015-10-21 Nuance Communications, Inc. Detection and suppression of wind noise in microphone signals
DK1949755T3 (da) * 2005-10-11 2010-08-23 Widex As Høreapparat og fremgangsmåde til behandling af indgangssignaler i et høreapparat
US20080043995A1 (en) * 2006-08-01 2008-02-21 Acoustic Technologies, Inc. Histogram for controlling a telephone
US8175291B2 (en) 2007-12-19 2012-05-08 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement
US8812309B2 (en) 2008-03-18 2014-08-19 Qualcomm Incorporated Methods and apparatus for suppressing ambient noise using multiple audio signals
DK2629551T3 (en) * 2009-12-29 2015-03-02 Gn Resound As Binaural hearing aid system
US9467775B2 (en) * 2011-09-02 2016-10-11 Gn Netcom A/S Method and a system for noise suppressing an audio signal
JP6069830B2 (ja) * 2011-12-08 2017-02-01 ソニー株式会社 耳孔装着型収音装置、信号処理装置、収音方法
JP6069829B2 (ja) * 2011-12-08 2017-02-01 ソニー株式会社 耳孔装着型収音装置、信号処理装置、収音方法
US20130163781A1 (en) 2011-12-22 2013-06-27 Broadcom Corporation Breathing noise suppression for audio signals
US9438985B2 (en) 2012-09-28 2016-09-06 Apple Inc. System and method of detecting a user's voice activity using an accelerometer
US20140126743A1 (en) * 2012-11-05 2014-05-08 Aliphcom, Inc. Acoustic voice activity detection (avad) for electronic systems
US20140270316A1 (en) * 2013-03-13 2014-09-18 Kopin Corporation Sound Induction Ear Speaker for Eye Glasses
EP2819429B1 (en) * 2013-06-28 2016-06-22 GN Netcom A/S A headset having a microphone
US9167333B2 (en) * 2013-10-18 2015-10-20 Plantronics, Inc. Headset dictation mode
GB2519379B (en) 2013-10-21 2020-08-26 Nokia Technologies Oy Noise reduction in multi-microphone systems
US20150172807A1 (en) * 2013-12-13 2015-06-18 Gn Netcom A/S Apparatus And A Method For Audio Signal Processing
TWI543635B (zh) * 2013-12-18 2016-07-21 jing-feng Liu Speech Acquisition Method of Hearing Aid System and Hearing Aid System
DK2916321T3 (en) * 2014-03-07 2018-01-15 Oticon As Processing a noisy audio signal to estimate target and noise spectral variations
WO2015135201A1 (zh) * 2014-03-14 2015-09-17 华为终端有限公司 双传声器耳机及通话中音频信号的降噪处理方法
US9905216B2 (en) * 2015-03-13 2018-02-27 Bose Corporation Voice sensing using multiple microphones
WO2016147020A1 (en) 2015-03-19 2016-09-22 Intel Corporation Microphone array speech enhancement

Also Published As

Publication number Publication date
CN109218912A (zh) 2019-01-15
US10262676B2 (en) 2019-04-16
US20190005977A1 (en) 2019-01-03
EP3422736B1 (en) 2020-07-29
EP3422736A1 (en) 2019-01-02

Similar Documents

Publication Publication Date Title
US11657793B2 (en) Voice sensing using multiple microphones
CN109218912B (zh) 多麦克风爆破噪声控制
US10748549B2 (en) Audio signal processing for noise reduction
US10438605B1 (en) Echo control in binaural adaptive noise cancellation systems in headsets
US9749731B2 (en) Sidetone generation using multiple microphones
EP3057337B1 (en) A hearing system comprising a separate microphone unit for picking up a users own voice
EP2819429B1 (en) A headset having a microphone
KR101463324B1 (ko) 오디오 등화를 위한 시스템들, 방법들, 디바이스들, 장치, 및 컴퓨터 프로그램 제품들
JP6069829B2 (ja) 耳孔装着型収音装置、信号処理装置、収音方法
CN111131947A (zh) 耳机信号处理方法、系统和耳机
EP3155826B1 (en) Self-voice feedback in communications headsets
CN113498005A (zh) 适于提供用户自我话音的估计量的听力装置
JP6197930B2 (ja) 耳孔装着型収音装置、信号処理装置、収音方法
CN115398934A (zh) 再现音频信号时主动抑制闭塞效应的方法、装置、耳机及计算机程序
EP4329335A1 (en) A method of reducing wind noise in a hearing device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant