JP2018513625A - サブバンド信号の適応混合 - Google Patents

サブバンド信号の適応混合 Download PDF

Info

Publication number
JP2018513625A
JP2018513625A JP2017551244A JP2017551244A JP2018513625A JP 2018513625 A JP2018513625 A JP 2018513625A JP 2017551244 A JP2017551244 A JP 2017551244A JP 2017551244 A JP2017551244 A JP 2017551244A JP 2018513625 A JP2018513625 A JP 2018513625A
Authority
JP
Japan
Prior art keywords
output
subband
microphone array
array processing
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017551244A
Other languages
English (en)
Other versions
JP6547003B2 (ja
Inventor
マルコ・オレスカニン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bose Corp
Original Assignee
Bose Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bose Corp filed Critical Bose Corp
Publication of JP2018513625A publication Critical patent/JP2018513625A/ja
Application granted granted Critical
Publication of JP6547003B2 publication Critical patent/JP6547003B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/01Noise reduction using microphones having different directional characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

方法は、(複数のサブバンドを含む周波数帯域に関連付けられている)第1のマイクロホンアレイ処理信号を受信するステップと、この周波数帯域に関連付けられている第2のマイクロホンアレイ処理信号を受信するステップとを含む。この方法は、第1のマイクロホンアレイ処理信号に基づいて、第1のサブバンドに対応する第1の出力を生成するステップと、第2のマイクロホンアレイ処理信号に基づいて、第1のサブバンドに対応する第2の出力を生成するステップとを含む。方法は、第1のマイクロホンアレイ処理信号に基づいて、第2のサブバンドに対応する第3の出力を生成するステップと、第2のマイクロホンアレイ処理信号に基づいて、第2のサブバンドに対応する第4の出力を生成するステップとを含む。方法は、マイクロホン混合演算の第1のセットを実行して、第1のサブバンドについての適応混合器出力を生成するステップと、マイクロホン混合演算の異なるセットを実行して、第2のサブバンドについての別の適応混合器出力を生成するステップとを含む。

Description

本開示は、概して、サブバンド信号の適応混合に関する。
電気通信システムを介して通信するためのヘッドセットは、装着者の音声(たとえば、音声信号を伝送し、かつ/または記憶するための電子デバイスに提供されることになる)を検出するための1つまたは複数のマイクロホンを含むことができる。そのようなマイクロホンは、他のタイプの雑音の中でも特に、周囲雑音および/または風雑音を含む様々なタイプの雑音に曝される可能性がある。いくつかの場合においては、特定の雑音軽減方策(noise mitigation strategy)が、あるタイプの雑音(たとえば、他人が近くで会話していること、交通、機械などの周囲雑音)に、より良く適している場合がある。他の場合においては、別の雑音軽減方策が、別のタイプの雑音(たとえば、ヘッドセットを通過する空気によって生じる雑音を含む風雑音)に、より良く適している場合がある。例示するように、「指向性(directional)」雑音軽減方策は、周囲雑音軽減に、より良く適している場合があり、一方、「全指向性(omnidirectional)」雑音軽減方策は、風雑音軽減に、より良く適している場合がある。
1つの実装形態においては、方法は、複数のサブバンドを含む周波数帯域に関連付けられている第1のマイクロホンアレイ処理信号を受信するステップを含む。この方法は、複数のサブバンドを含む周波数帯域に関連付けられている第2のマイクロホンアレイ処理信号を受信するステップを含む。方法は、第1のマイクロホンアレイ処理信号に基づいて、第1の出力を生成するステップを含む。第1の出力は、複数のサブバンドのうちの第1のサブバンドに対応する。方法は、第2のマイクロホンアレイ処理信号に基づいて、第2の出力を生成するステップを含む。第2の出力は、第1のサブバンドに対応する。方法は、第1のマイクロホンアレイ処理信号に基づいて、第3の出力を生成するステップを含む。第3の出力は、第2のサブバンドに対応する。方法は、第2のマイクロホンアレイ処理信号に基づいて、第4の出力を生成するステップを含む。第4の出力は、第2のサブバンドに対応する。方法は、マイクロホン混合演算の第1のセットを実行して、第1のサブバンドに関連付けられている第1の適応混合器出力を生成するステップと、マイクロホン混合演算の第2のセットを実行して、第2のサブバンドに関連付けられている第2の適応混合器出力を生成するステップとをさらに含む。マイクロホン混合演算の第2のセットは、マイクロホン混合演算の第1のセットとは異なっている。
別の実装形態においては、装置は、第1のマイクロホンアレイ処理構成要素と、第2のマイクロホンアレイ処理構成要素と、第1の帯域分析フィルタ構成要素と、第2の帯域分析フィルタ構成要素と、第1のサブバンドに関連付けられている第1の適応混合構成要素とを含む。第1のマイクロホンアレイ処理構成要素は、複数のマイクロホンから複数のマイクロホン信号を受信し、第1のマイクロホンアレイ処理信号を生成するように構成されている。第1のマイクロホンアレイ処理信号は、複数のサブバンドを含む周波数帯域に関連付けられている。第2のマイクロホンアレイ処理構成要素は、複数のマイクロホンから複数のマイクロホン信号を受信し、第2のマイクロホンアレイ処理信号を生成するように構成されている。第2のマイクロホンアレイ処理信号は、複数のサブバンドを含む周波数帯域に関連付けられている。第1の帯域分析フィルタ構成要素は、第1のマイクロホンアレイ処理信号に基づいて、第1の出力を生成するように構成されている。第1の出力は、複数のサブバンドのうちの第1のサブバンドに対応する。第2の帯域分析フィルタ構成要素は、第2のマイクロホンアレイ処理信号に基づいて、第2の出力を生成するように構成されている。第2の出力は、第1のサブバンドに対応する。第1の適応混合構成要素は、第1の出力の第2の出力に対する比較に基づいて、第1のサブバンドに関連付けられている第1の適応混合器出力を生成するように構成されている。
さらなる別の実装形態においては、システムは、複数のマイクロホンと、第1のマイクロホンアレイ処理構成要素と、第2のマイクロホンアレイ処理構成要素と、第1の帯域分析フィルタ構成要素と、第2の帯域分析フィルタ構成要素と、第1の適応混合構成要素と、第1の合成構成要素とを含む。第1のマイクロホンアレイ処理構成要素は、複数のマイクロホンから受信した複数のマイクロホン信号に基づいて、第1のマイクロホンアレイ処理信号を生成するように構成されている。第1のマイクロホンアレイ処理信号は、複数のサブバンドを含む周波数帯域に関連付けられている。第2のマイクロホンアレイ処理構成要素は、複数のマイクロホンから受信した複数のマイクロホン信号に基づいて、第2のマイクロホンアレイ処理信号を生成するように構成されている。第2のマイクロホンアレイ処理信号は、複数のサブバンドを含む周波数帯域に関連付けられている。第1の帯域分析フィルタ構成要素は、第1のマイクロホンアレイ処理信号に基づいて、第1の出力を生成するように構成されている。第1の出力は、複数のサブバンドのうちの第1のサブバンドに対応する。第2の帯域分析フィルタ構成要素は、第2のマイクロホンアレイ処理信号に基づいて、第2の出力を生成するように構成されている。第2の出力は、第1のサブバンドに対応する。第1の適応混合構成要素は、第1のサブバンドに関連付けられ、第1の適応混合構成要素は、第1の出力の第2の出力に対する比較に基づいて、第1のサブバンドに関連付けられている第1の適応混合器出力を生成するように構成されている。第1の合成構成要素は、第1の適応混合構成要素に関連付けられ、第1の合成構成要素は、第1の適応混合器出力に基づいて、第1の合成されたサブバンド出力信号を生成するように構成されている。
サブバンド信号を適応的に混合するためのシステムの例示的な実装形態の略図である。 サブバンド信号のサブセットを適応的に混合するためのシステムの例示的な実装形態の略図である。 サブバンド信号を適応的に混合するための方法の例示的な実装形態のフローチャートである。
いくつかの場合においては、音声通信に使用されるヘッドセット(たとえば、有線または無線のヘッドセット)は、様々な雑音軽減方策を用いて、ヘッドセットのマイクロホンによって捕捉される雑音量を抑える。たとえば、雑音には、周囲雑音および/または風雑音が含まれる場合がある。雑音の軽減により、遠端の通信相手に聞こえる雑音量を抑えることができる。別の例として、雑音の軽減により、遠隔発話認識エンジン(remote speech recognition engine)の発話認識が改善し得る。いくつかの事例においては、ある雑音軽減方策(たとえば、第1の「ビームフォーミング(beamforming)」方策)は、周囲雑音軽減においてはより効果的であるが、風雑音軽減においてはそれほど効果的ではない「指向性がより高い(more directional)」方策を表す。別の雑音軽減方策(たとえば、第2の「ビームフォーミング」方策)は、風雑音軽減においてはより効果的であるが、周囲雑音軽減においてはそれほど効果的ではない「指向性がより低い(less directional)」方策を表す。
本開示は、帯域の複数の分析セクション(たとえば、周波数帯域など、周波数領域信号表現の複数のサブバンド)を適応的に混合するシステムおよび方法について説明する。本開示においては、個々のサブバンドにおける周辺の雑音に対する発話の信号対雑音比(SNR:signal-to-noise ratio)を改善するために、複数マイクロホン混合アルゴリズムが、個々のサブバンド信号におけるエネルギーに基づいて、多数の相異なるサブバンドのサブバンド信号を変形するのに使用される。一例として、風雑音は、帯域制限されている(たとえば、周波数領域において約1KHz未満である)。風雑音の場合においては、(風雑音に関連付けられていない帯域の部分を含む)帯域全体にわたって「広帯域利得(wide band gain)」を適用する代わりに、いくつかの事例においては、風雑音に関連付けられているサブバンドに、「指向性がより低い」雑音軽減方策が用いられる。風雑音に関連付けられていないサブバンド(たとえば、約1KHzを上回るサブバンド)においては、いくつかの事例においては、(周囲雑音軽減においてより効果的であり得る)「指向性がより高い」雑音軽減方策が用いられる。
いくつかの場合においては、本開示のサブバンド適応混合方法は、(たとえば、遠端のパーティに送信される信号の中の雑音量を抑えるために電気通信に使用される雑音打消しヘッドセットのための)帯域全体にわたって広帯域利得を適用する能動的な風雑音軽減解に比較して、改善された性能を提供する。たとえば、いくつかの場合においては、本開示のサブバンド適応混合方法は、帯域全体にわたって働く混合方法に比べて、帯域のより大きい部分におけるより高いSNR(たとえば、8KHz帯域に対応する狭帯域信号、または16KHz帯域に対応する広帯域信号)、ならびに残響の低減を結果的にもたらす。
風雑音軽減の説明のための例として、超指向性マイクロホンアレイ(たとえば、速度マイクロホン)、および全指向性マイクロホン(たとえば、圧力マイクロホン)が、ヘッドセットに関連付けられ得る。概して、超指向性マイクロホンアレイは、全指向性マイクロホンよりも、周囲雑音に対する感度が低く、超指向性マイクロホンアレイは、全指向性マイクロホンよりも、風雑音に対する感度が高い。1つの帯域を複数のサブバンド(たとえば、8つのサブバンド)に分けることによって、「指向性がより低い」解は、サブバンドの第1のセット(たとえば、第1の3つのサブバンド)に適用され、一方、「指向性がより高い」解は、サブバンドの第2のセット(たとえば、次の5つのサブバンド)に適用される。次いで、相異なる混合演算の出力が、出力信号を生成するために組み合わせられる。風雑音の存在下においては、相異なるサブバンドに相異なる混合解を選択的に適用することにより、出力信号におけるより高い指向性に起因して、結果的に残響の低減がもたらされる可能性がある。さらなる便益には、サブバンド混合により結合する部分的な近接効果に起因する、(遠端のパーティに送信されることになる)出力信号のSNRおよび音声の深さの増大が含まれ得る。
実際には、風雑音の存在下においては、本開示の適応サブバンド混合アルゴリズムは、(たとえば、第1の3つのサブバンドに適用される)「指向性がより低い」解の出力の方を好む場合がある。いくつかの場合においては、このことは、結果的に、ほぼ「バイナリ(binary)」ディシジョン、および「指向性がより高い」解の出力との10%未満の混合だけによる、「指向性がより低い」出力信号の出力(たとえば、次の5つのサブバンドに適用される)の構文解析をもたらす。この結果は、チューニングおよび受動的な風雑音保護に起因して、相異なるヘッドセットによって異なる可能性がある。「指向性がより低い」解を風雑音に関連付けられている選択されたサブバンドに適用することにより、出力信号における風雑音の量を低減することができる一方、「指向性がより高い」解を帯域の残りに適用して、周囲雑音軽減を改善することが可能になる。
図1を参照すると、サブバンド信号を適応的に混合するためのシステムの一例が示され、全体的に100と示されている。図1は、複数のマイクロホンアレイ処理ブロック(たとえば、ビームフォーマ)からの出力が、複数のサブバンド(または「分析セクション」)に分割され得ることを示している。相異なるサブバンドに関連付けられている信号は、相異なる混合構成要素に送信されて、処理され得る。マイクロホン混合演算の第1のセットは、第1のサブバンドについて実行されて、第1のサブバンドの信号対雑音比を改善することができ、マイクロホン混合演算の第2のセットは、第2のサブバンドについて実行されて、第2のサブバンドの信号対雑音比を改善することができる。いくつかの場合においては、「指向性がより低い」解は、(たとえば、風雑音の約1KHz未満など、帯域制限された周波数範囲における)サブバンド信号の第1のセットのSNRを改善することができる。他の場合においては、「指向性がより高い」解は、(たとえば、風雑音に関連付けられている帯域制限された周波数範囲外の)サブバンド信号の第2のセットの信号対雑音比を改善するのに使用され得る。
図1の例においては、システム100は、2つ以上のマイクロホンを含むマイクロホンアレイ102の複数のマイクロホンを含む。たとえば、図1に示されている特定の実装形態においては、マイクロホンアレイ102は、第1のマイクロホン104、第2のマイクロホン106、および第Nのマイクロホン108を含む。代替の実装形態においては、マイクロホンアレイ102は、2つのマイクロホン(たとえば、第1のマイクロホン104および第2のマイクロホン106)を含むことができる。勾配マイクロホンは、無線ヘッドセットにおいて優れた音声応答を提供する際、有用である場合がある両指向性マイクロホンパターンを有することができ、ここでは、マイクロホンは、ユーザの口の全体的な方向を指すことができる。そのようなマイクロホンは、周囲雑音において優れた応答を行うことができるが、風雑音の影響を受けやすい。圧力マイクロホンは、全指向性マイクロホンパターンを有する傾向がある。
システム100は、2つ以上のマイクロホンアレイ処理構成要素(たとえば、「ビームフォーマ」)をさらに含む。図1に示されている特定の実装形態においては、システム100は、第1のマイクロホンアレイ処理構成要素110(たとえば、拡散雑音環境における使用に向けて設計されている「指向性が高い」ビームフォーマまたはVMICなど、図1の中の「B1」と識別される第1のビームフォーマ)を含む。システム100はまた、第2のマイクロホンアレイ処理構成要素112(たとえば、風雑音環境における使用に向けて設計されている「指向性がより低い」ビームフォーマまたはPMICなど、図1の中の「B2」と識別される第2のビームフォーマ)も含む。代替の実装形態においては、3つ以上のマイクロホンアレイ処理構成要素(たとえば、3つ以上のビームフォーマ)が使用されてもよい。さらには、いくつかの場合においては、他の帯域制限されたセンサが、改善した雑音軽減に向けて追加の帯域制限された信号を供給するための第3のビームフォーマ(たとえば、図1には示されていない「B3」)に通信可能なように連結され得る。帯域制限されたセンサの他の例には、他の選択肢の中でも特に、骨伝導マイクロホン、ANRにおけるフィードバックマイクロホン、圧電素子、皮膚の振動を遠隔に監視する光学ドップラー速度計、または皮膚の接触振動を介して、直接、監視する圧力素子を含めることができる。骨および皮膚伝導による音声は、低周波数に対して帯域制限される。
図1は、第1のマイクロホン104が、第1のマイクロホンアレイ処理構成要素110および第2のマイクロホンアレイ処理構成要素112に通信可能なように連結されていることを示している。第1のマイクロホンアレイ処理構成要素110および第2のマイクロホンアレイ処理構成要素112は、第1のマイクロホン104から第1のマイクロホン信号を受信するように構成されている。図1は、第2のマイクロホン106が、第1のマイクロホンアレイ処理構成要素110および第2のマイクロホンアレイ処理構成要素112に通信可能なように連結されていることをさらに示している。第1のマイクロホンアレイ処理構成要素110および第2のマイクロホンアレイ処理構成要素112は、第2のマイクロホン106から第2のマイクロホン信号を受信するように構成されている。図1に示されている特定の実装形態においては、マイクロホンアレイ102は、3つ以上のマイクロホンを含む。この例においては、第Nのマイクロホン108は、第1のマイクロホンアレイ処理構成要素110および第2のマイクロホンアレイ処理構成要素112に通信可能なように連結される。第1のマイクロホンアレイ処理構成要素110および第2のマイクロホンアレイ処理構成要素112は、第Nのマイクロホン108から第Nのマイクロホン信号を受信するように構成されている。代替の実装形態においては、システム100は、マイクロホンアレイ102の複数のマイクロホンからマイクロホン信号を受信する3つ以上のマイクロホンアレイ処理構成要素(たとえば、「ビームフォーマ」)を含む。
第1のマイクロホンアレイ処理構成要素110は、複数のサブバンドを含む周波数帯域に関連付けられている第1のマイクロホンアレイ処理信号を生成するように構成されている。一例として、周波数帯域は、他の選択肢の中でも特に、8KHz帯域など、狭帯域に対応することができる。別の例として、周波数帯域は、他の選択肢の中でも特に、16KHz帯域など、広帯域に対応することができる。特定の実装形態においては、第1のマイクロホンアレイ処理構成要素110は、マイクロホンアレイ102のマイクロホンから受信した複数のマイクロホン信号に基づいて、ビームフォーミング演算の第1のセットを実行するように構成されている第1のビームフォーミング構成要素を含む。特定の事例においては、ビームフォーミング演算の第1のセットは、1つまたは複数の指向性マイクロホンビームフォーミング演算を含む。
第2のマイクロホンアレイ処理構成要素112は、周波数帯域に関連付けられている第2のマイクロホンアレイ処理信号を生成するように構成されている。特定の実装形態においては、第2のマイクロホンアレイ処理構成要素112は、マイクロホンアレイ102のマイクロホンから受信したマイクロホン信号に基づいて、ビームフォーミング演算の第2のセットを実行するように構成されている第2のビームフォーミング構成要素を含む。特定の事例においては、ビームフォーミング演算の第2のセットは、1つまたは複数の全指向性マイクロホンビームフォーミング演算を含む。
システム100は、複数の帯域分析フィルタをさらに含む。図1の例においては、帯域分析フィルタは、第1のマイクロホンアレイ処理構成要素110に関連付けられている帯域分析フィルタの第1のセット114、および第2のマイクロホンアレイ処理構成要素112に関連付けられている帯域分析フィルタの第2のセット116を含む。帯域分析フィルタは、特定の帯域の複数の分析セクションを決定するように構成されている。いくつかの場合においては、分析セクションは、特定の周波数帯域(たとえば、8KHz帯域などの「狭」周波数帯域、または16KHz帯域などの「広」周波数帯域)の相異なる周波数サブバンドに対応することができる。帯域分析フィルタが、フィルタバンクとして働くとき、分析セクションの他の例は、特定のタイプのフィルタバンクに応じて使用され得る。たとえば、周波数領域の「VFE」フィルタバンクと呼ばれるコサイン変調フィルタバンクは、複素数にされ得る。いくつかの場合においては、分析セクションは、時間領域サンプルに対応することができる。他の場合においては、分析セクションは、周波数領域サンプルに対応することができる。さらには、図1は、フィルタバンクの1つの例を示しているが、他の実装形態が企図される。例示するように、フィルタバンクは、均一なフィルタバンクとして実装されても、または不均一なフィルタバンクとして実装されてもよい。サブバンドフィルタはまた、他の選択肢の中でも特に、コサイン変調フィルタバンク(CMFB:cosine modulated filter bank)、ウェーブレットフィルタバンク、DFTフィルタバンク、BARKスケールに基づいたフィルタバンク、またはオクターブフィルタバンクとして実装されてもよい。
例示するように、コサイン変調フィルタバンク(CMFB)は、オーディオ符号化のためのMPEG規格において使用され得る。この場合においては、フィルタバンクの分析部分の後、信号は、「実数(real)」成分しか含まない。このタイプのフィルタバンクは、離散コサイン変換(たとえば、DCTおよびMDCT)を用いて、効率的に実装され得る。フィルタバンクの他の例には、DFT変調フィルタバンク、一般化DFTフィルタバンク、または複素指数変調フィルタを含める。この場合においては、フィルタバンクの分析部分の後、信号は、周波数ビンに対応する複素値成分を含む。DFTフィルタバンクは、重み付け重複加算(WOLA:weighted overlap add)DFTフィルタバンクを介して効率的に実装され得、ここでは、高速フーリエ変換(FFT:fast Fourier transform)が、DFT変換を効率的に計算するのに使用され得る。WOLAのDFTフィルタバンクは、埋め込み式ハードウェアにおける実装に数値的に効率的であり得る。
図1に示されている特定の実装形態においては、第1のマイクロホンアレイ処理構成要素110に関連付けられている帯域分析フィルタの第1のセット114は、第1の帯域分析フィルタ118(図1の中の「H1」と識別される)と、第2の帯域分析フィルタ120(図1の中の「H2」と識別される)と、第Nの帯域分析フィルタ122(図1の中の「HN」と識別される)とを含む。第2のマイクロホンアレイ処理構成要素112に関連付けられている帯域分析フィルタの第2のセット116は、第1の帯域分析フィルタ124(図1の中の「H1」と識別される)と、第2の帯域分析フィルタ126(図1の中の「H2」と識別される)と、第Nの帯域分析フィルタ128(図1の中の「HN」と識別される)とを含む。一例として、第1の帯域分析フィルタ118(H1)は、(偶数積層されたフィルタバンクの場合においては)低域通過フィルタ、または(奇数積層されたフィルタバンクの場合においては)帯域通過フィルタとすることができる。別の例として、第Nの帯域分析フィルタ(HN)は、(偶数積層の場合においては)高域通過フィルタ、または(奇数積層の場合においては)帯域分析フィルタとすることができる。他のフィルタ(たとえば、H2)は、帯域通過フィルタとすることができる。加えて、フィルタバンクは、デシメーション(N=M)されても、またはオーバーサンプル(M<N)されてもよい。いくつかのフィルタバンクは、サブバンド処理における信号変形に対して、よりロバストとすることができ、いくつかのオーディオおよび発話適用例において利用され得る。
帯域分析フィルタの第1のセット114の第1の帯域分析フィルタ118は、第1のマイクロホンアレイ処理構成要素110から受信したマイクロホンアレイ処理信号に基づいて、第1の出力130を生成するように構成されている。第1の出力130は、複数のサブバンドのうちの第1のサブバンド(図1の中の「サブバンド(1)信号」と識別される)に対応する。帯域分析フィルタの第1のセット114の第2の帯域分析フィルタ120は、第1のマイクロホンアレイ処理構成要素110から受信したマイクロホンアレイ処理信号に基づいて、第2の出力132を生成するように構成されている。第2の出力132は、複数のサブバンドのうちの第2のサブバンド(図1の中の「サブバンド(2)信号」と識別される)に対応する。帯域分析フィルタの第1のセット114の第Nの帯域分析フィルタ122は、第1のマイクロホンアレイ処理構成要素110から受信したマイクロホンアレイ処理信号に基づいて、第Nの出力134を生成するように構成されている。第Nの出力134は、複数のサブバンドのうちの第Nのサブバンド(図1の中の「サブバンド(N)信号」と識別される)に対応する。
帯域分析フィルタの第2のセット116の第1の帯域分析フィルタ124は、第2のマイクロホンアレイ処理構成要素112から受信したマイクロホンアレイ処理信号に基づいて、第1の出力136を生成するように構成されている。第1の出力136は、第1のサブバンド(図1の中の「サブバンド(1)信号」と識別される)に対応する。帯域分析フィルタの第2のセット116の第2の帯域分析フィルタ126は、第2のマイクロホンアレイ処理構成要素112から受信したマイクロホンアレイ処理信号に基づいて、第2の出力138を生成するように構成されている。第2の出力138は、第2のサブバンド(図1の中の「サブバンド(2)信号」と識別される)に対応する。帯域分析フィルタの第2のセット116の第Nの帯域分析フィルタ128は、第2のマイクロホンアレイ処理構成要素112から受信したマイクロホンアレイ処理信号に基づいて、第Nの出力140を生成するように構成されている。第Nの出力140は、第Nのサブバンド(図1の中の「サブバンド(N)信号」と識別される)に対応する。図1に示されている特定の実装形態においては、システム100は、帯域分析フィルタの1つまたは複数の出力に対して1つまたは複数のデシメーション演算を実行するように構成された複数のデシメーション構成要素(図1の中の下向きの矢印とともに文字「M」によって識別される)をさらに含む。いくつかの場合においては、値Mは、1とすることができる(デシメーションなし)一方、他の場合においては、値Mは、1未満とすることができる。
システム100は、複数の(適応)混合構成要素をさらに含む。図1に示されている特定の実装形態においては、混合構成要素は、第1の混合構成要素150(図1の中の「α1」と識別される)と、第2の混合構成要素152(図1の中の「α2」と識別される)と、第Nの混合構成要素154(図1の中の「αN」と識別される)とを含む。第1の混合構成要素150は、帯域分析フィルタの第1のセット114の第1の帯域分析フィルタ118から、第1のサブバンドに対応する第1の出力130を受信するように構成されている。第1の混合構成要素150は、帯域分析フィルタの第2のセット116の第1の帯域分析フィルタ124から、第1のサブバンドに対応する第1の出力136を受信するようにさらに構成されている。第1の混合構成要素150は、出力130および136に基づいて、第1のサブバンドに関連付けられている第1の適応混合器出力を生成するように構成されている。
本明細書においてさらに説明するように、第1の混合構成要素150は、第1のスケーリングファクタ(「第1の混合係数」またはα1とも呼ばれる)を用いて、第1のサブバンドに関連付けられている第1の適応混合器出力を生成する。いくつかの事例においては、第1の混合係数(α1)は、第1の出力130および136のうちの、より雑音が少ない方が、第1のサブバンドに関連付けられている第1の適応混合器出力に対して、より大きい寄与をもたらすように選択され、またはコンピュータ計算される。いくつかの場合においては、第1の混合係数(α1)は、0から1の間で変化させてもよい。他の値がまた、他の選択肢の中でも特に、(たとえば、出力130、136のそれぞれの少なくとも一部分を使用するための)より狭い範囲、または(たとえば、出力130、136のうちの一方が、第1の適応混合器出力をオーバードライブすることを可能にするための)より広い範囲を含んで使用されてもよい。
いくつかの実装形態においては、正規化された最小二乗平均(NLMS:normalized least-mean-square)アルゴリズムが、マイクロホン混合演算に利用され得る。NLMSアルゴリズムは、分析後の実数値出力を含むフィルタバンク(たとえば、CMFBフィルタバンク、またはウェーブレットフィルタバンク)において使用するために、または分析後の複素値出力を含むフィルタバンクにおいて使用するために一般化され得る。NLMSアルゴリズムは、正規化LMSタイプ方式(normalized-LMS type system)に依存して、複数の信号におけるパワーを検出し、それに応じて、信号における重み付けを減らす。重み付け出力は、下記の数式(1)に従って、決定され得る。
y(n)=α(n)W(n)+(1-α(n)D(n)) (1)
上記の数式(1)においては、α(n)は、推定すべき重み付けを識別する方式であり、W(n)およびD(n)は、ビームフォーミングされた、または単一の素子出力である。たとえば、図1を参照すると、W(n)およびD(n)は、第1のビームフォーマ(B1)110、および第2のビームフォーマ(B2)112の出力にそれぞれ対応することができる。説明のための例として、出力は、様々な雑音環境において互いに対して帯域にわたって異なる性能を含む音声信号を受信し得る速度および圧力マイクロホン信号、MVDR出力、遅延和ビームフォーマ出力、または他のセンサ組合せに対応することができる。たとえば、信号は、他の選択肢の中でも特に、骨伝導マイクロホン、ANRにおけるフィードバックマイクロホン、圧電素子、顔の振動を監視する光学ドップラー速度計から受信可能である。
上記の数式(1)においては、指数nは、1からLまでのサンプル指数である。フレーム処理スキームの場合においては、Lは、フレームサイズを表す。サンプル処理スキームの場合においては、Lは、サンプルにおけるパワー正規化のためのフレームサイズを表す。サンプルのすべてが、フィルタバンク(たとえば、図1の帯域分析フィルタ)ごとの出力であり、実数または複素数の両方であってよい(たとえば、y(n)が、複素数である場合、W(n)およびD(n)もまた同様である)という一般化された仮定がなされてよい。低減(たとえば、最小化)すべきコスト関数は、下記の数式(2)に従って、決定され得る。
J(n)=E{|y(n)|2}=E{y(n)yH(n)} (2)
上記の数式(2)においては、Hは、ベクトルの場合におけるエルミート演算子である。単一の値の場合においては、Hは、*共役である。コスト関数を低減させるための重み付けα(n)を見つけるために、α(n)に対するJ(n)の偏導関数が、下記の数式(3)に従って、使用され得る。
αJ(n)=∇αE{y(n)yH(n)}=2E{∇α(y(n))yH(n)} (3)
上記の数式(3)においては、∇α(y(n))=∇α(α(n)W(n)+(1-α(n)D(n)))=W(n)-D(n)である。したがって、∇αJ(n)=2E{(W(n)-D(n))yH(n)}である。
平均二乗誤差更新数式、または確率勾配再帰が、形式
Figure 2018513625
を有するとき、次が計算され得る。
α(n+1)=α(n)-μ∇αJ(n)
=α(n)-μE{(W(n)-D(n))yH(n)}
不偏誤差推定量が、下記に示されている予想関数の近似に使用され得る。
Figure 2018513625
L=1という単純な場合においては、これは、
Figure 2018513625
に縮小する。
重み付け数式は、次のように定義され得る。
α(n+1)=α(n)-μ(W(n)-D(n))yH(n)
この場合においては、μは、ステップサイズ、または学習率である。実際の実装形態は、正則化されたニュートンの再帰形式を含むことができ、ここでは、学習率は、下記に示されている信号パワーおよび正則化定数により入力信号を正規化またはスケーリングすることによって調整される。
Figure 2018513625
この場合においては、ε(i)は、数値的安定を確保する(ゼロによって除算されないように保護する)ために加えられる小さい正の定数、ε(i)>0であり、Lは、0よりも大きい。図1に関しては、最後の結果は、下記の数式(4)に示されるフィルタバンク分解関数と表すことができる。
Figure 2018513625
上記の数式(4)においては、指数kが、導入され、ここでは、k=1:Nであり、Nは、フィルタバンクまたはマイクロホン混合帯域の数である。帯域ごとに、マイクロホン混合手順を用いて、信号をブレンドすることができる。
複素数値サンプルを含むフィルタバンク(たとえば、WOLAのDFTフィルタバンク)の場合においては、数式(4)が、利用され得る。実数値サンプルを含むフィルタバンク(たとえば、CMFB)の場合においては、数式(4)は、下記の数式(5)に示す、より単純な形式に縮小することができる。
Figure 2018513625
概して、同じデータのブロックスキームの場合、実数値データ手法が、複素数値手法よりも数値的に効率的である。
第2の混合構成要素152は、帯域分析フィルタの第1のセット114のうちの第2の帯域分析フィルタ120から、第2のサブバンドに対応する第2の出力132を受信するように構成されている。第2の混合構成要素152は、帯域分析フィルタの第2のセット116のうちの第2の帯域分析フィルタ126から、第2のサブバンドに対応する第2の出力138を受信するようにさらに構成されている。第2の混合構成要素152は、出力132および138に基づいて、第2のサブバンドに関連付けられている第2の適応混合器出力を生成するように構成されている。
本明細書にさらに説明するように、第2の混合構成要素152は、第2のスケーリングファクタ(「第2の混合係数」またはα2とも呼ばれる)を用いて、第2のサブバンドに関連付けられている第2の適応混合器出力を生成する。第2の混合係数(α2)は、第2の出力132および138のうちの、より雑音が少ない方が、第2のサブバンドに関連付けられている第2の適応混合器出力に対して、より大きい寄与をもたらすように選択され、またはコンピュータ計算され得る。いくつかの場合においては、第2の混合係数(α2)は、0から1の間で変化させてもよい。他の値がまた、(たとえば、出力132、138のそれぞれの少なくとも一部分を使用するための)より狭い範囲、(たとえば、出力132、138のうちの一方が、第2の適応混合器出力をオーバードライブすることを可能にするための)より広い範囲を含んで使用されてもよい。いくつかの場合においては、第2の混合係数(α2)は、動的な値とすることができる。他の場合においては、第2の混合係数(α2)は、一定値とすることができる。
第Nの混合構成要素154は、帯域分析フィルタの第1のセット114のうちの第Nの帯域分析フィルタ122から、第Nのサブバンドに対応する第Nの出力134を受信するように構成されている。第Nの混合構成要素154は、帯域分析フィルタの第2のセット116のうちの第Nの帯域分析フィルタ128から、第Nのサブバンドに対応する第Nの出力140を受信するようにさらに構成されている。第Nの混合構成要素154は、出力134および140に基づいて、第Nのサブバンドに関連付けられている第Nの適応混合器出力を生成するように構成されている。
本明細書にさらに説明するように、第Nの混合構成要素154は、第Nのスケーリングファクタ(「第Nの混合係数」またはαNとも呼ばれる)を用いて、第Nのサブバンドに関連付けられている第Nの適応混合器出力を生成することができる。第Nの混合係数(αN)は、第Nの出力134および140のうちの、より雑音が少ない方が、第Nのサブバンドに関連付けられている第Nの適応混合器出力に対して、より大きい寄与をもたらすように選択され、またはコンピュータ計算され得る。いくつかの場合においては、第Nの混合係数(αN)は、0から1の間で変化させてもよい。他の値がまた、(たとえば、出力134、140のそれぞれの少なくとも一部分を使用するための)より狭い範囲、(たとえば、出力134、140のうちの一方が、第Nの適応混合器出力をオーバードライブすることを可能にするための)より広い範囲を含んで使用されてもよい。いくつかの場合においては、第Nの混合係数(αN)は、動的な値とすることができる。他の場合においては、第Nの混合係数(αN)は、一定値とすることができる。
図1に示されている特定の実装形態においては、システム100は、適応混合器出力のうちの1つまたは複数の出力に対して1つまたは複数の補間演算を実行するように構成された複数の補間構成要素(図1の中の上向きの矢印とともに文字「M」によって識別される)をさらに含む。図1は、システム100が、複数の合成構成要素(または合成「フィルタ」)を含み得ることをさらに示している。たとえば、図1に示されている特定の実装形態においては、複数の合成構成要素は、第1の合成構成要素160(図1の中の「F1」と識別される)と、第2の合成構成要素162(図1の中の「F2」と識別される)と、第Nの合成構成要素164(図1の中の「FN」と識別される)とを含む。
第1の合成構成要素160は、第1の混合構成要素150に関連付けられ、第1の混合構成要素150から受信した第1の適応混合器出力に基づいて、第1の合成されたサブバンド出力信号を生成するように構成されている。第2の合成構成要素162は、第2の適応混合構成要素152に関連付けられ、第2の混合構成要素152から受信した第2の適応混合器出力に基づいて、第2の合成されたサブバンド出力信号を生成するように構成されている。第Nの合成構成要素164は、第Nの適応混合構成要素154に関連付けられ、第Nの混合構成要素154から受信した第Nの適応混合器出力に基づいて、第Nの合成されたサブバンド出力信号を生成するように構成されている。
合成構成要素160〜164は、合成されたサブバンド出力信号をコンバイナ170に供給するように構成されている。コンバイナ170は、合成構成要素160〜164から受信した、合成されたサブバンド出力信号の組合せに基づいて、オーディオ出力信号172を生成するように構成されている。図1に示されている特定の実装形態においては、コンバイナ170は、第1の合成構成要素160から受信した第1の合成されたサブバンド出力信号と、第2の合成構成要素162から受信した第2の合成されたサブバンド出力信号と、第Nの合成構成要素164から受信した第Nの合成されたサブバンド出力信号との組合せに基づいて、オーディオ出力信号172を生成するように構成されている。
動作にあたっては、第1のマイクロホンアレイ処理構成要素110(たとえば、第1のビームフォーマ)は、マイクロホンアレイ102のマイクロホンから(たとえば、第1のマイクロホン104から、第2のマイクロホン106から、および第Nのマイクロホン108から)、複数のマイクロホン信号を受信する。いくつかの事例においては、マイクロホンアレイ102の個々のマイクロホンは、ヘッドセットに関連付けられ、個々のマイクロホンは、ヘッドセット上の様々な場所に位置決めされる(またはそうでなければ、ブームマイクロホンなど、ヘッドセットに接続される)。例示するように、マイクロホンアレイ102の1つまたは複数のマイクロホンは、ヘッドセットの一方の側に(たとえば、耳腔に面して、耳腔内に、またはそれらの組合せで)位置決めされ得、一方、マイクロホンアレイ102の1つまたは複数のマイクロホンは、ヘッドセットの別の側に(たとえば、音声入力を捕捉するための1つまたは複数の方向に)位置決めされ得る。
第1のマイクロホンアレイ処理構成要素110は、マイクロホンアレイ102からの複数のマイクロホン信号を処理するとき、第1のビームフォーミング方策を採用する。第2のマイクロホンアレイ処理構成要素112は、マイクロホンアレイ102からの複数のマイクロホン信号を処理するとき、第2のビームフォーミング方策を採用する。いくつかの場合においては、第1のビームフォーミング方策は、第2のビームフォーミング方策よりも、「指向性がより高い」ビームフォーミング方策に対応する。たとえば、いくつかの場合においては、第1のビームフォーミング方策は、ある適用例(たとえば、周囲雑音打消し)により良く適しており、一方、第2のビームフォーミング方策は、別の適用例(たとえば、風雑音打消し)により良く適している。相異なるビームフォーミング方策が採用されると、相異なるビームフォーマ出力が、相異なるマイクロホンアレイ処理構成要素110、112によって生成される。
相異なるマイクロホンアレイ処理構成要素110、112の出力は、帯域分析フィルタに供給される。たとえば、第1のマイクロホンアレイ処理構成要素110の出力は、帯域分析フィルタの第1のセット114に供給され、第2のマイクロホンアレイ処理構成要素112の出力は、帯域分析フィルタの第2のセット116に供給される。帯域分析フィルタの第1のセット114は、(第1のビームフォーミング演算から生じる)第1のマイクロホンアレイ処理構成要素110の出力の相異なるセクションを分析するためのN個の帯域分析フィルタ118〜122を含む。帯域分析フィルタの第2のセット116は、(第2のビームフォーミング演算から生じる)第2のマイクロホンアレイ処理構成要素112の出力の相異なるセクションを分析するためのN個の帯域分析フィルタ124〜128を含む。例示するように、第1のビームフォーミング演算の結果に基づいて、第1の帯域分析フィルタ118は、第1のサブバンド信号130を生成し、第2の帯域分析フィルタ120は、第2のサブバンド信号132を生成し、第Nの帯域分析フィルタ122は、第Nのサブバンド信号134を生成する。第2のビームフォーミング演算の結果に基づいて、第1の帯域分析フィルタ124は、第1のサブバンド信号136を生成し、第2の帯域分析フィルタ126は、第2のサブバンド信号138を生成し、第Nの帯域分析フィルタ128は、第Nのサブバンド信号140を生成する。
図1は、(第1のサブバンドに関連付けられている)第1の出力130、136が、第1の適応混合構成要素150に伝達されることを示している。(第2のサブバンドに関連付けられている)第2の出力132、138は、第2の適応混合構成要素152に伝達される。(第Nのサブバンドに関連付けられている)出力134、140は、第Nの適応混合構成要素154に伝達される。図1の例においては、デシメーション演算は、サブバンド信号が適応混合構成要素150〜154によって処理されるのに先立って、サブバンド信号に対して実行される。第1の適応混合構成要素150は、出力130および136に基づいて、第1のサブバンドに関連付けられている第1の適応混合器出力を生成する。第2の適応混合構成要素152は、出力132および138に基づいて、第2のサブバンドに関連付けられている第2の適応混合器出力を生成する。第Nの適応混合構成要素154は、出力134および140に基づいて、第Nのサブバンドに関連付けられている第Nの適応混合器出力を生成する。
上記にさらに説明したように、特定のサブバンドの出力信号を「ブレンドする」のに使用される特定の混合係数は、より高いSNRを含む出力が、特定の適応混合器出力のより大きい部分(またはすべて)を表すように、選択される、またはコンピュータ計算される。いくつかの事例においては、第1のサブバンドは、風雑音(たとえば、約1KHz未満)に対応する。いくつかの場合においては、第1のマイクロホンアレイ処理構成要素110は、指向性雑音軽減方策を採用し、第2のマイクロホンアレイ処理構成要素112は、全指向性雑音軽減方策を採用する。風雑音の存在下では、第1の帯域分析フィルタ118によって生成される第1のサブバンド信号130は、第1の帯域分析フィルタ124によって生成される第1のサブバンド信号136よりも、風雑音の影響を受ける。この場合においては、第1の適応混合構成要素150は、第1のサブバンドに、より高いSNRを提供するために、第1のサブバンド信号136(「指向性がより低い」出力)を選択する。別の例として、第2のサブバンドは、風雑音に関連付けられている帯域外である(たとえば、約1KHzよりも高い)。風雑音の存在下では、第2のサブバンド信号132、138は、第1のサブバンド信号130、136ほどは、風雑音の影響を受けない可能性がある。この場合においては、第2の適応混合構成要素152は、第2のサブバンドに、より高いSNRを提供するために、第2の帯域分析フィルタ120によって生成される第2のサブバンド信号138(「指向性がより高い」出力)を選択する。
図1は、第1の適応混合構成要素150が、(補間を介して)第1の合成フィルタ160に、第1のサブバンドに関連付けられている第1の適応混合器出力を送信することをさらに示している。第2の適応混合構成要素152は、(補間を介して)第2の合成フィルタ162に、第2のサブバンドに関連付けられている第2の適応混合器出力を送信する。第Nの適応混合構成要素154は、(補間を介して)第Nの合成フィルタ164に、第Nのサブバンドに関連付けられている第Nの適応混合器出力を送信する。コンバイナ170は、合成構成要素160〜164からの適応混合出力信号を組み合わせて、(遠端のパーティに、または発話認識エンジンに伝達されることになる)出力信号172を生成する。
したがって、図1は、サブバンド信号を適応的に混合するシステムの一例を示している。図1は、いくつかの場合においては、「指向性がより低い」解が、(たとえば、風雑音の約1KHz未満など、帯域制限された周波数範囲における)サブバンド信号の第1のセットについての信号対雑音比を改善することができることを示している。他の場合においては、「指向性がより高い」解が、(たとえば、風雑音に関連付けられている帯域制限された周波数範囲外の)サブバンド信号の第2のセットについての信号対雑音比を改善するのに使用され得る。
図2を参照すると、サブバンド信号を適応的に混合するシステムの一例が示され、全体的に200と示されている。図2の例においては、抜粋した構成要素(たとえば、マイクロホンアレイ、補間構成要素など)は、例示目的としてのみ省略されている。図2は、例示的な実装形態を示しており、ここでは、複数の帯域分析フィルタが、複数のサブバンド信号(たとえば、8つのサブバンド信号など、N個のサブバンド信号)を生成することができる。サブバンド信号の第1のサブセット(たとえば、8つのサブバンド信号のうちの3つ)が、適応混合構成要素(たとえば、適応α値を含む混合構成要素)のあるセットに供給され得る。サブバンド信号の第2のサブセット(たとえば、8つのサブバンド信号うちの5つ)が、混合構成要素(たとえば、静的α値を含む混合構成要素)の別のセットに供給され得る。例示するように、サブバンド信号の第1のサブセットは、帯域制限された周波数範囲(たとえば、周囲雑音が、風雑音と重畳し得る約1KHz未満)にあってよく、サブバンド信号の第2のサブセットは、帯域制限された周波数範囲外にあってよい。
図2に示されている例においては、システム200は、第1のマイクロホンアレイ処理構成要素202(たとえば、図2の中の「B1」と識別される第1のビームフォーマ)と、第2のマイクロホンアレイ処理構成要素204(たとえば、図2の中の「B2」と識別される第2のビームフォーマ)とを含む。いくつかの場合においては、図2の第1のマイクロホンアレイ処理構成要素202は、図1の第1のマイクロホンアレイ処理構成要素110に対応してもよい。第2のマイクロホンアレイ処理構成要素204は、図1の第2のマイクロホンアレイ処理構成要素112に対応してもよい。図2には示されていないが、第1のマイクロホンアレイ処理構成要素202および第2のマイクロホンアレイ処理構成要素204は、マイクロホンアレイの複数のマイクロホン(たとえば、図1のマイクロホンアレイ102のマイクロホン104〜108)から、マイクロホン信号を受信するように構成され得る。
図2の例においては、複数の帯域分析フィルタは、第1のマイクロホンアレイ処理構成要素202に関連付けられ、複数の帯域分析フィルタは、第2のマイクロホンアレイ処理構成要素204に関連付けられている。第1のマイクロホンアレイ処理構成要素202に関連付けられている帯域分析フィルタは、帯域分析フィルタの第1のサブセット206、および帯域分析フィルタの第2のサブセット208を含む。第2のマイクロホンアレイ処理構成要素204に関連付けられている帯域分析フィルタは、帯域分析フィルタの第1のサブセット210、および帯域分析フィルタの第2のサブセット212を含む。
図2は、第1のマイクロホンアレイ処理構成要素202に関連付けられている帯域分析フィルタの第1のサブセット206が、(適応)混合構成要素の第1のセット214に通信可能なように連結されていることを示している。第1のマイクロホンアレイ処理構成要素202に関連付けられている帯域分析フィルタの第2のサブセット208は、混合構成要素の第2のセット216に通信可能なように連結されている。図2は、第2のマイクロホンアレイ処理構成要素204に関連付けられている帯域分析フィルタの第1のサブセット210が、(適応)混合構成要素の第1のセット214に通信可能なように連結されていることをさらに示している。第2のマイクロホンアレイ処理構成要素204に関連付けられている帯域分析フィルタの第2のサブセット212は、混合構成要素の第2のセット216に通信可能なように連結されている。
図2においては、N個の帯域分析フィルタは、第1のマイクロホンアレイ処理構成要素202に関連付けられ、N個の帯域分析フィルタは、第2のマイクロホンアレイ処理構成要素204に関連付けられている。図2の例示的な非限定的な例においては、Nは、4よりも大きい(たとえば、8つのサブバンド)。例示するように、第1のマイクロホンアレイ処理構成要素202に関連付けられている帯域分析フィルタの第1のサブセット206は、3つの帯域分析フィルタを含み、第2のマイクロホンアレイ処理構成要素204に関連付けられている帯域分析フィルタの第1のサブセット210は、3つの帯域分析フィルタを含んでいる。第1のマイクロホンアレイ処理構成要素202に関連付けられている帯域分析フィルタの第2のサブセット208は、少なくとも2つの帯域分析フィルタを含み、第2のマイクロホンアレイ処理構成要素204に関連付けられている帯域分析フィルタの第2のサブセット212は、少なくとも2つの帯域分析フィルタを含んでいる。特定のサブセットの中の帯域分析フィルタの数は、変化させてもよいことが認識されよう。たとえば、第1のサブセット206、210は、2つ以下の帯域分析フィルタ、または4つ以上の帯域分析フィルタを含んでよく、第2のサブセット208、212は、単一の帯域分析フィルタ、または3つ以上の帯域分析フィルタを含んでもよい。
図2に示されている例においては、第1のマイクロホンアレイ処理構成要素202に関連付けられている帯域分析フィルタの第1のサブセット206は、第1の帯域分析フィルタ218(図2の中の「H1」と識別される)と、第2の帯域分析フィルタ220(図2の中の「H2」と識別される)と、第3の帯域分析フィルタ222(図2の中の「H3」と識別される)とを含む。第1のマイクロホンアレイ処理構成要素202に関連付けられている帯域分析フィルタの第2のサブセット208は、第4の帯域分析フィルタ224(図2の中の「H4」と識別される)と、第Nの帯域分析フィルタ226(図2の中の「HN」と識別される)とを含む。
第2のマイクロホンアレイ処理構成要素204に関連付けられている帯域分析フィルタの第1のサブセット210は、第1の帯域分析フィルタ228(図2の中の「H1」と識別される)と、第2の帯域分析フィルタ230(図2の中の「H2」と識別される)と、第3の帯域分析フィルタ232(図2の中の「H3」と識別される)とを含む。第2のマイクロホンアレイ処理構成要素204に関連付けられている帯域分析フィルタの第2のサブセット212は、第4の帯域分析フィルタ234(図2の中の「H4」と識別される)と、第Nの帯域分析フィルタ236(図2の中の「HN」と識別される)とを含む。
帯域分析フィルタの第1のサブセット206を参照すると、第1の帯域分析フィルタ218は、第1のサブバンドに対応する第1の出力240(図2の中の「サブバンド(1)信号」と識別される)を生成するように構成されている。第2の帯域分析フィルタ220は、第2のサブバンドに対応する第2の出力242(図2の中の「サブバンド(2)信号」と識別される)を生成するように構成されている。第3の帯域分析フィルタ222は、第3のサブバンドに対応する第3の出力244(図2の中の「サブバンド(3)信号」と識別される)を生成するように構成されている。帯域分析フィルタの第2のサブセット208を参照すると、第4の帯域分析フィルタ224は、第4のサブバンドに対応する第4の出力246(図2の中の「サブバンド(4)信号」と識別される)を生成するように構成されている。第Nの帯域分析フィルタ226は、第Nのサブバンドに対応する第Nの出力248(図2の中の「サブバンド(N)信号」と識別される)を生成するように構成されている。
帯域分析フィルタの第1のサブセット210を参照すると、第1の帯域分析フィルタ228は、第1のサブバンドに対応する第1の出力250(図2の中の「サブバンド(1)信号」と識別される)を生成するように構成されている。第2の帯域分析フィルタ230は、第2のサブバンドに対応する第2の出力252(図2の中の「サブバンド(2)信号」と識別される)を生成するように構成されている。第3の帯域分析フィルタ232は、第3のサブバンドに対応する第3の出力254(図2の中の「サブバンド(3)信号」と識別される)を生成するように構成されている。帯域分析フィルタの第2のサブセット212を参照すると、第4の帯域分析フィルタ234は、第4のサブバンドに対応する第4の出力256(図2の中の「サブバンド(4)信号」と識別される)を生成するように構成されている。第Nの帯域分析フィルタ236は、第Nのサブバンドに対応する第Nの出力258(図2の中の「サブバンド(N)信号」と識別される)を生成するように構成されている。
(第1のサブセット206および210が、3つのサブバンド信号を生成するために3つの帯域分析フィルタを含んでいる)図2の例においては、(適応)混合構成要素の第1のセット214は、第1の混合構成要素260(図2の中の「α1」と識別される)と、第2の混合構成要素262(図2の中の「α2」と識別される)と、第3の混合構成要素264(図2の中の「α3」と識別される)とを含む。混合構成要素の第2のセット216は、第4の混合構成要素266(図2の中の「α4」と識別される)と、第Nの混合構成要素268(図2の中の「αN」と識別される)とを含む。
第1の混合構成要素260は、(第1のマイクロホンアレイ処理構成要素202に関連付けられている)第1の帯域分析フィルタ218から、第1のサブバンドに対応する第1の出力240を受信するように構成されている。第1の混合構成要素260は、(第2のマイクロホンアレイ処理構成要素204に関連付けられている)第1の帯域分析フィルタ228から、第1のサブバンドに対応する第1の出力250を受信するようにさらに構成されている。第1の混合構成要素260は、出力240および250に基づいて、第1のサブバンドに関連付けられている第1の適応混合器出力を生成するように構成されている。
第1の混合構成要素260は、第1のスケーリングファクタ(「第1の混合係数」またはα1とも呼ばれる)を用いて、第1のサブバンドに関連付けられている第1の適応混合器出力を生成することができる。第1の混合係数(α1)は、第1の出力240および250のうちの、より雑音が少ない方が、第1のサブバンドに関連付けられている第1の適応混合器出力に対して、より大きい寄与をもたらすように選択され、またはコンピュータ計算され得る。いくつかの場合においては、第1の混合係数(α1)は、0から1の間で変化させてもよい。他の値がまた、他の選択肢の中でも特に、(たとえば、出力240、250のそれぞれの少なくとも一部分を使用するための)より狭い範囲、または(たとえば、出力240、250のうちの一方が、第1の適応混合器出力をオーバードライブすることを可能にするための)より広い範囲を含んで使用されてもよい。
第2の混合構成要素262は、(第1のマイクロホンアレイ処理構成要素202に関連付けられている)第2の帯域分析フィルタ220から、第2のサブバンドに対応する第2の出力242を受信するように構成されている。第2の混合構成要素262は、(第2のマイクロホンアレイ処理構成要素204に関連付けられている)第2の帯域分析フィルタ230から、第2のサブバンドに対応する第2の出力252を受信するようにさらに構成されている。第2の混合構成要素262は、出力242および252に基づいて、第2のサブバンドに関連付けられている第2の適応混合器出力を生成するように構成されている。
第2の混合構成要素262は、第2のスケーリングファクタ(「第2の混合係数」またはα2とも呼ばれる)を用いて、第2のサブバンドに関連付けられている第2の適応混合器出力を生成することができる。第2の混合係数(α2)は、第1の出力242および252のうちの、より雑音が少ない方が、第2のサブバンドに関連付けられている第2の適応混合器出力に対して、より大きい寄与をもたらすように選択され、またはコンピュータ計算され得る。いくつかの場合においては、第2の混合係数(α2)は、0から1の間で変化させてもよい。他の値がまた、他の選択肢の中でも特に、(たとえば、出力242、252のそれぞれの少なくとも一部分を使用するための)より狭い範囲、または(たとえば、出力242、252のうちの一方が、第2の適応混合器出力をオーバードライブすることを可能にするための)より広い範囲を含んで使用されてもよい。
第3の混合構成要素264は、(第1のマイクロホンアレイ処理構成要素202に関連付けられている)第3の帯域分析フィルタ222から、第3のサブバンドに対応する第3の出力244を受信するように構成されている。第3の混合構成要素264は、(第2のマイクロホンアレイ処理構成要素204に関連付けられている)第3の帯域分析フィルタ232から、第3のサブバンドに対応する第3の出力254を受信するようにさらに構成されている。第3の混合構成要素264は、出力244および254に基づいて、第3のサブバンドに関連付けられている第3の適応混合器出力を生成するように構成されている。
第3の混合構成要素264は、第3のスケーリングファクタ(「第3の混合係数」またはα3とも呼ばれる)を用いて、第3のサブバンドに関連付けられている第3の適応混合器出力を生成することができる。第3の混合係数(α3)は、第3の出力244および254のうちの、より雑音が少ない方が、第3のサブバンドに関連付けられている第3の適応混合器出力に対して、より大きい寄与をもたらすように選択され、またはコンピュータ計算され得る。いくつかの場合においては、第3の混合係数(α3)は、0から1の間で変化させてもよい。他の値がまた、他の選択肢の中でも特に、(たとえば、出力244、254のそれぞれの少なくとも一部分を使用するための)より狭い範囲、または(たとえば、出力244、254のうちの一方が、第3の適応混合器出力をオーバードライブすることを可能にするための)より広い範囲を含んで使用されてもよい。
第4の混合構成要素266は、(第1のマイクロホンアレイ処理構成要素202に関連付けられている)第4の帯域分析フィルタ224から、第4のサブバンドに対応する第4の出力246を受信するように構成されている。第4の混合構成要素266は、(第2のマイクロホンアレイ処理構成要素204に関連付けられている)第4の帯域分析フィルタ234から、第4のサブバンドに対応する第4の出力256を受信するようにさらに構成されている。第4の混合構成要素266は、出力246および256に基づいて、第4のサブバンドに関連付けられている第4の混合器出力を生成するように構成されている。いくつかの場合においては、第4の混合構成要素266は、第4のスケーリングファクタ(α4)を用いて、第4のサブバンドに関連付けられている第4の混合器出力を生成することができる。たとえば、第4のスケーリングファクタ(α4)は、第1のマイクロホンアレイ処理構成要素202に関連付けられている第4の出力246、または第2のマイクロホンアレイ処理構成要素204に関連付けられている第4の出力256のいずれかを選択するために、「非適応」静的スケーリングファクタを表すことができる。一例として、第4の出力246が、第4の出力256よりも雑音が少ないとき、第4の混合構成要素266は、第4の出力246に1というスケーリングファクタ(および第4の出力256に0というスケーリングファクタ)を適用することによって、第4の出力246を「選択する」ことができる。別の例として、第4の出力246が、第4の出力256よりも雑音が多いとき、第4の混合構成要素266は、第4の出力246に0というスケーリングファクタ(および第4の出力256に1というスケーリングファクタ)を適用することによって、第4の出力256を「選択する」ことができる。
第Nの混合構成要素268は、(第1のマイクロホンアレイ処理構成要素202に関連付けられている)第Nの帯域分析フィルタ226から、第Nのサブバンドに対応する第Nの出力248を受信するように構成されている。第Nの混合構成要素268は、(第2のマイクロホンアレイ処理構成要素204に関連付けられている)第Nの帯域分析フィルタ236から、第Nのサブバンドに対応する第Nの出力258を受信するようにさらに構成されている。第Nの混合構成要素268は、出力248および258に基づいて、第Nのサブバンドに関連付けられている第Nの混合器出力を生成するように構成されている。いくつかの場合においては、第Nの混合構成要素268は、第1のマイクロホンアレイ処理構成要素202に関連付けられている第Nの出力248、または第2のマイクロホンアレイ処理構成要素204に関連付けられている第Nの出力258のいずれかを選択するために、「非適応」スケーリングファクタ(αN)を使用することができる。一例として、第Nの出力248が、第Nの出力258よりも雑音が少ないとき、第Nの混合構成要素268は、第Nの出力248に1というスケーリングファクタ(および第Nの出力258に0というスケーリングファクタ)を適用することによって、第Nの出力248を「選択する」ことができる。別の例として、第Nの出力248が、第Nの出力258よりも雑音が多いとき、第Nの混合構成要素268は、第Nの出力248に0というスケーリングファクタ(および第Nの出力258に1というスケーリングファクタ)を適用することによって、第Nの出力258を「選択する」ことができる。
いくつかの場合においては、複数の補間構成要素が(図2には、示されていない)、適応混合器出力のうちの1つまたは複数の出力に対して、1つまたは複数の補間演算を実行するように構成され得る。図2は、システム200が、複数の合成構成要素(または合成「フィルタ」)を含むことができることをさらに示している。たとえば、図2に示されている例においては、複数の合成構成要素は、第1の合成構成要素270(図2の中の「F1」と識別される)と、第2の合成構成要素272(図2の中の「F2」と識別される)と、第3の合成構成要素274(図2の中の「F3」と識別される)とを含む。第1の合成構成要素270、第2の合成構成要素272、および第3の合成構成要素274は、(適応)混合構成要素の第1のセット214に関連付けられている。図2は、第4の合成構成要素276(図2の中の「F4」と識別される)と、第Nの合成構成要素278(図2の中の「FN」と識別される)とをさらに示している。第4の合成構成要素276、および第Nの合成構成要素278は、混合構成要素の第2のセット216に関連付けられている。
第1の合成構成要素270は、第1の混合構成要素260に関連付けられ、第1の混合構成要素260から受信した第1の適応混合器出力に基づいて、第1の合成されたサブバンド出力信号を生成するように構成されている。第2の合成構成要素272は、第2の適応混合構成要素262に関連付けられ、第2の混合構成要素262から受信した第2の適応混合器出力に基づいて、第2の合成されたサブバンド出力信号を生成するように構成されている。第3の合成構成要素274は、第3の適応混合構成要素264に関連付けられ、第3の混合構成要素264から受信した第3の適応混合器出力に基づいて、第3の合成されたサブバンド出力信号を生成するように構成されている。(適応)混合構成要素の第1のセット214に関連付けられている合成構成要素270〜274は、合成されたサブバンド出力信号をコンバイナ280に供給するように構成されている。コンバイナ280は、合成構成要素270〜274から受信した、(第2のコンバイナ284に供給されることになる)合成されたサブバンド出力信号を組み合わせるように構成されている。
第4の合成構成要素276は、第4の混合構成要素266に関連付けられ、第4の混合構成要素266から受信した第4の混合器出力に基づいて、第4の合成されたサブバンド出力信号を生成するように構成されている。第Nの合成構成要素278は、第Nの適応混合構成要素268に関連付けられ、第Nの混合構成要素268から受信した第Nの混合器出力に基づいて、第Nの合成されたサブバンド出力信号を生成するように構成されている。混合構成要素の第2のセット216に関連付けられている合成構成要素276、278は、合成されたサブバンド出力信号をコンバイナ282に供給するように構成されている。コンバイナ282は、合成構成要素276、278から受信した、(第2のコンバイナ284に供給されることになる)合成されたサブバンド出力信号を組み合わせるように構成されている。図2の例においては、第2のコンバイナ284は、合成構成要素270〜278から受信した合成されたサブバンド出力信号の組合せに基づいて、オーディオ出力信号286を生成するように構成されている。
動作にあたっては、第1のマイクロホンアレイ処理構成要素202(たとえば、第1のビームフォーマ)は、(図2には示されていない、マイクロホンアレイのマイクロホンから)複数のマイクロホン信号を受信することができる。第1のマイクロホンアレイ処理構成要素202は、複数のマイクロホン信号を処理するとき、第1のビームフォーミング方策を採用する。第2のマイクロホンアレイ処理構成要素204は、複数のマイクロホン信号を処理するとき、第2のビームフォーミング方策を採用する。いくつかの場合においては、第1のビームフォーミング方策は、第2のビームフォーミング方策よりも、「指向性がより高い」ビームフォーミング方策に対応する。たとえば、いくつかの場合においては、第1のビームフォーミング方策は、ある適用例(たとえば、周囲雑音打消し)により良く適しており、一方、第2のビームフォーミング方策は、別の適用例(たとえば、風雑音打消し)により良く適している。相異なるビームフォーミング方策が採用されると、相異なるビームフォーマ出力が、相異なるマイクロホンアレイ処理構成要素202、204によって生成される。
相異なるマイクロホンアレイ処理構成要素202、204の出力は、帯域分析フィルタに供給される。たとえば、第1のマイクロホンアレイ処理構成要素202の出力は、帯域分析フィルタの第1のセット206に、および帯域分析フィルタの第2のセット208に供給される。帯域分析フィルタの第1のセット206は、(第1のビームフォーミング演算から生じる)第1のマイクロホンアレイ処理構成要素202の出力の相異なるセクションを分析するための3つの帯域分析フィルタ218〜222を含む。帯域分析フィルタの第2のセット208は、(第1のビームフォーミング演算から生じる)第1のマイクロホンアレイ処理構成要素202の出力の相異なるセクションを分析するための少なくとも2つの帯域分析フィルタ224、226を含む。例示するように、第1のビームフォーミング演算の結果に基づいて、第1の帯域分析フィルタ218は、第1のサブバンド信号240を生成し、第2の帯域分析フィルタ220は、第2のサブバンド信号242を生成し、第3の帯域分析フィルタ222は、第3のサブバンド信号244を生成する。第1のビームフォーミング演算の結果に基づいて、第4の帯域分析フィルタ224は、第4のサブバンド信号246を生成し、第Nの帯域分析フィルタ226は、第Nのサブバンド信号248を生成する。
第2のマイクロホンアレイ処理構成要素204の出力は、帯域分析フィルタの第1のセット210に、および帯域分析フィルタの第2のセット212に供給される。帯域分析フィルタの第1のセット210は、(第2のビームフォーミング演算から生じる)第2のマイクロホンアレイ処理構成要素204の出力の相異なるセクションを分析するための3つの帯域分析フィルタ228〜232を含む。帯域分析フィルタの第2のセット212は、(第2のビームフォーミング演算から生じる)第2のマイクロホンアレイ処理構成要素204の出力の相異なるセクションを分析するための少なくとも2つの帯域分析フィルタ234、236を含む。例示するように、第2のビームフォーミング演算の結果に基づいて、第1の帯域分析フィルタ228は、第1のサブバンド信号250を生成し、第2の帯域分析フィルタ230は、第2のサブバンド信号252を生成し、第3の帯域分析フィルタ232は、第3のサブバンド信号254を生成する。第2のビームフォーミング演算の結果に基づいて、第4の帯域分析フィルタ234は、第4のサブバンド信号256を生成し、第Nの帯域分析フィルタ236は、第Nのサブバンド信号258を生成する。
図2は、第1のサブバンド信号240、250が、第1の(適応)混合構成要素260に伝達されることを示している。第2のサブバンド信号242、252は、第2の(適応)混合構成要素262に伝達される。第3のサブバンド信号244、254は、第3の(適応)混合構成要素264に伝達される。図2の例においては、デシメーション演算は、サブバンド信号が適応混合構成要素260〜264によって処理されるのに先立って、サブバンド信号に対して実行される。第1の適応混合構成要素260は、出力240および250に基づいて、第1のサブバンドに関連付けられている第1の適応混合器出力を生成する。第2の適応混合構成要素262は、出力242および252に基づいて、第2のサブバンドに関連付けられている第2の適応混合器出力を生成する。第3の適応混合構成要素264は、出力244および254に基づいて、第3のサブバンドに関連付けられている第3の適応混合器出力を生成する。
上記にさらに説明したように、特定のサブバンドの出力信号を「ブレンドする」のに使用される特定の混合係数は、より高いSNRを含む出力が、特定の適応混合器出力のより大きい部分(またはすべて)を表すように、選択される、またはコンピュータ計算される。いくつかの事例においては、第1の3つのサブバンドは、周囲雑音と風雑音とが重畳するサブバンドに対応することができる。いくつかの場合においては、第1のマイクロホンアレイ処理構成要素202は、指向性雑音軽減方策を採用し、第2のマイクロホンアレイ処理構成要素204は、全指向性雑音軽減方策を採用する。
第4のサブバンド信号246、256は、第4の混合構成要素266に伝達される。第Nのサブバンド信号248、258は、第Nの混合構成要素268に伝達される。図2の例においては、デシメーション演算は、サブバンド信号が混合構成要素266、268によって処理されるのに先立って、サブバンド信号に対して実行される。第4の混合構成要素266は、出力246および256に基づいて、第4のサブバンドに関連付けられている第4の混合器出力を生成する。第Nの混合構成要素268は、出力248および258に基づいて、第Nのサブバンドに関連付けられている第Nの混合器出力を生成する。
図2は、第1の適応混合構成要素260が、(図2においては省略されている補間を介して)第1の合成フィルタ270に、第1のサブバンドに関連付けられている第1の適応混合器出力を送信することをさらに示している。第2の適応混合構成要素262は、(図2においては省略されている補間を介して)第2の合成フィルタ272に、第2のサブバンドに関連付けられている第2の適応混合器出力を送信する。第3の適応混合構成要素264は、(図2においては省略されている補間を介して)第3の合成フィルタ274に、第3のサブバンドに関連付けられている第3の適応混合器出力を送信する。コンバイナ280は、適応混合構成要素260〜264からの適応混合出力信号を組み合わせる。第4の混合構成要素266は、(図2においては省略されている補間を介して)第4の合成フィルタ276に、第4のサブバンドに関連付けられている第4の混合器出力を送信する。第Nの混合構成要素268は、(図2においては省略されている補間を介して)第Nの合成フィルタ278に、第Nのサブバンドに関連付けられている第Nの混合器出力を送信する。コンバイナ282は、混合構成要素266、268からの混合出力信号を組み合わせる。第2のコンバイナ284は、コンバイナ280、282の出力に基づいて、(遠端のパーティに、または発話認識エンジンに伝達されることになる)出力信号286を生成する。
したがって、図2は、例示的な実装形態を示しており、ここでは、複数の帯域分析フィルタが、複数のサブバンド信号(たとえば、8つのサブバンド信号など、N個のサブバンド信号)を生成する。サブバンド信号の第1のサブセット(たとえば、8つのサブバンド信号のうちの3つ)が、適応混合構成要素(たとえば、適応α値を含む混合構成要素)のあるセットに供給され得る。サブバンド信号の第2のサブセット(たとえば、8つのサブバンド信号うちの5つ)が、混合構成要素(たとえば、「非適応」静的α値を含む混合構成要素)の別のセットに供給され得る。例示するように、サブバンド信号の第1のサブセットは、帯域制限された周波数範囲(たとえば、周囲雑音が、風雑音と重畳し得る約1KHz未満)にあってよく、サブバンド信号の第2のサブセットは、帯域制限された周波数範囲外にあってよい。
図3は、サブバンド信号を適応的に混合する方法300の例示的な実装形態のフローチャートである。図3は、相異なるマイクロホンアレイ処理構成要素(たとえば、相異なるビームフォーミング方策を採用する相異なるビームフォーマ)からのマイクロホンアレイ処理信号が、複数の分析セクション(たとえば、サブバンド)に分割され得ることを示している。特定のサブバンドのための相異なるマイクロホンアレイ処理信号は、特定のサブバンドに関連付けられている適応混合構成要素に伝達される出力を生成するのに使用される。帯域全体にわたって「広帯域利得」を適用する代わりに、1つの帯域を複数の分析セクションに分けて処理すると、相異なる分析セクションにおける適応混合が可能になり得る。相異なる分析セクションにおける適応混合により、風雑音(たとえば、約1KHz未満)に関連付けられているサブバンドにおける風雑音の軽減、および残りのサブバンドにおける周囲雑音の軽減が可能になる。
方法300は、302において、複数のマイクロホンに関連付けられている第1のマイクロホンアレイ処理構成要素から、第1のマイクロホンアレイ処理信号を受信するステップを含む。第1のマイクロホンアレイ処理信号は、複数のサブバンドを含む周波数帯域に関連付けられている。一例として、図1を参照すると、帯域分析フィルタの第1のセット114の第1の帯域分析フィルタ118は、第1のマイクロホンアレイ処理構成要素110(たとえば、第1のビームフォーマ)から、マイクロホンアレイ処理信号を受信する。第1のマイクロホンアレイ処理構成要素110は、マイクロホンアレイ102のマイクロホン104〜108に関連付けられている。
方法300は、304において、複数のマイクロホンに関連付けられている第2のマイクロホンアレイ処理構成要素から、第2のマイクロホンアレイ処理信号を受信するステップを含む。第2のマイクロホンアレイ処理信号は、複数のサブバンドを含む周波数帯域に関連付けられている。一例として、図1を参照すると、帯域分析フィルタの第2のセット116の第1の帯域分析フィルタ124は、第2のマイクロホンアレイ処理構成要素112(たとえば、第2のビームフォーマ)から、マイクロホンアレイ処理信号を受信する。第2のマイクロホンアレイ処理構成要素112は、マイクロホンアレイ102のマイクロホン104〜108に関連付けられている。
方法300は、306において、第1のマイクロホンアレイ処理信号に基づいて、複数のサブバンドのうちの第1のサブバンドに対応する第1の出力を生成するステップを含む。一例として、図1を参照すると、帯域分析フィルタの第1のセット114の第1の帯域分析フィルタ118は、第1の帯域分析フィルタ118から受信したマイクロホンアレイ処理信号に基づいて、第1のサブバンドに関連付けられている第1の出力130を生成する。
方法300は、308において、第2のマイクロホンアレイ処理信号に基づいて、第1のサブバンドに対応する第2の出力を生成するステップを含む。一例として、図1を参照すると、帯域分析フィルタの第2のセット116の第1の帯域分析フィルタ124は、第1の帯域分析フィルタ124から受信したマイクロホンアレイ処理信号に基づいて、第1のサブバンドに関連付けられている第1の出力136を生成する。
方法300は、310において、複数の適応混合構成要素のうちの第1の適応混合構成要素に、第1の出力および第2の出力を伝達するステップをさらに含む。各適応混合構成要素は、複数のサブバンドのうちの特定のサブバンドに関連付けられ、第1の適応混合構成要素は、第1のサブバンドに関連付けられている。一例として、図1を参照すると、第1のサブバンドに関連付けられている第1の出力130は、第1の帯域分析フィルタ118から(任意選択的なデシメーションを介して)、(第1のサブバンドに関連付けられている)第1の適応混合構成要素150に伝達される。さらには、第1のサブバンドに関連付けられている第1の出力136は、第1の帯域分析フィルタ124から(任意選択的なデシメーションを介して)、(第1のサブバンドに関連付けられている)第1の適応混合構成要素150に伝達される。
いくつかの例においては、上述の装置および技法の実装形態は、当業者にとっては明らかになるであろうコンピュータ構成要素、コンピュータ実装ステップを含む。コンピュータ実装ステップが、たとえば、フロッピディスク、ハードディスク、光ディスク、フラッシュメモリ、不揮発性メモリ、およびRAMなどのコンピュータ可読媒体においてコンピュータ実行可能命令として記憶され得ることは、当業者には理解されるべきである。いくつかの例においては、コンピュータ可読媒体は、信号ではないコンピュータメモリデバイスである。さらには、コンピュータ実行可能命令が、たとえば、マイクロプロセッサ、デジタル信号プロセッサ、ゲートアレイなどの多様なプロセッサにおいて実行可能であることは、当業者には理解されるべきである。説明を簡単にするために、上述のシステムおよび方法のステップまたは素子がすべて、コンピュータシステムの一部として本明細書に説明されているわけではなく、当業者は、各ステップまたは素子が、対応するコンピュータシステムまたはソフトウェアコンポーネントを有し得ることを認識するであろう。そのため、そのようなコンピュータシステムおよび/またはソフトウェアコンポーネントは、それらの対応するステップまたは素子(つまり、それらの機能)を説明することによって可能になり、本開示の範囲内にある。
当業者は、本発明の概念から逸脱することなく、本明細書に開示される装置および技法を多数使用する、修正する、逸脱することができる。たとえば、本開示に示され、または説明されている構成要素もしくは特徴は、示され、または説明されている場所に限定されない。別の例として、本開示による装置の例は、前述の図のうちの1つまたは複数を参照して説明されるもののすべて、それより少ない、またはそれとは異なる構成要素を含むことができる。開示された諸例は、本明細書に開示される装置および技法の中に存在する、またはそれらによって所有されるそれぞれの、ならびにあらゆる新規特徴、および特徴の新規組合せを包含している、かつ添付の特許請求の範囲、およびそれの均等物によってのみ限定されるものと解釈すべきである。
100 システム
102 マイクロホンアレイ
104、106、108 マイクロホン
110、112 マイクロホンアレイ処理構成要素
114、116 帯域分析フィルタのセット
118、120、122、124、126、128 帯域分析フィルタ
130、132、134、136、138、140 出力
150、152、154 混合構成要素
160、162、164 合成構成要素
170 コンバイナ
172 オーディオ出力信号
200 システム
202、204 マイクロホンアレイ処理構成要素
206、208、210、212 帯域分析フィルタのサブセット
214、216 混合構成要素のセット
218、220、222、224、226、228、230、232、234、236 帯域分析フィルタ
240、242、244、246、248、250、252、254、256、258 出力
260、262、264、266、268 混合構成要素
270、272、274、276、278 合成構成要素、合成フィルタ
280、282、284 コンバイナ
286 オーディオ出力信号

Claims (20)

  1. 複数のサブバンドを含む周波数帯域に関連付けられている第1のマイクロホンアレイ処理信号を受信するステップと、
    前記複数のサブバンドを含む前記周波数帯域に関連付けられている第2のマイクロホンアレイ処理信号を受信するステップと、
    前記第1のマイクロホンアレイ処理信号に基づいて、第1の出力を生成するステップであって、前記第1の出力が、前記複数のサブバンドのうちの第1のサブバンドに対応する、ステップと、
    前記第2のマイクロホンアレイ処理信号に基づいて、第2の出力を生成するステップであって、前記第2の出力が、前記複数のサブバンドのうちの前記第1のサブバンドに対応する、ステップと、
    前記第1のマイクロホンアレイ処理信号に基づいて、第3の出力を生成するステップであって、前記第3の出力が、前記複数のサブバンドのうちの第2のサブバンドに対応する、ステップと、
    前記第2のマイクロホンアレイ処理信号に基づいて、第4の出力を生成するステップであって、前記第4の出力が、前記第2のサブバンドに対応する、ステップと、
    マイクロホン混合演算の第1のセットを実行して、前記第1のサブバンドに関連付けられている第1の適応混合器出力を生成するステップと、
    マイクロホン混合演算の第2のセットを実行して、前記第2のサブバンドに関連付けられている第2の適応混合器出力を生成するステップであって、マイクロホン混合演算の前記第2のセットが、マイクロホン混合演算の前記第1のセットとは異なっている、ステップと
    を含む方法。
  2. 複数の適応混合構成要素のうちの第1の適応混合構成要素に、前記第1の出力および前記第2の出力を伝達するステップであって、各適応混合構成要素が、前記複数のサブバンドのうちの特定のサブバンドに関連付けられ、前記第1の適応混合構成要素が、前記第1のサブバンドに関連付けられている、ステップと、
    前記複数の適応混合構成要素のうちの第2の適応混合構成要素に、前記第3の出力および前記第4の出力を伝達するステップであって、前記第2の適応混合構成要素が、前記第2のサブバンドに関連付けられている、ステップと
    をさらに含む、請求項1に記載の方法。
  3. 前記第1の適応混合構成要素が、マイクロホン混合演算の前記第1のセットを実行して、前記第1のサブバンドに関連付けられている前記第1の適応混合器出力を生成し、
    前記第2の適応混合構成要素が、マイクロホン混合演算の前記第2のセットを実行して、前記第2のサブバンドに関連付けられている前記第2の適応混合器出力を生成する、
    請求項2に記載の方法。
  4. マイクロホン混合演算の前記第1のセットは、前記第1の出力が、前記第2の出力の第2の信号対雑音比よりも高い第1の信号対雑音比を有することに応答して、前記第1のサブバンドに関連付けられている前記第1の適応混合器出力を生成するように選択され、
    マイクロホン混合演算の前記第2のセットは、前記第3の出力が、前記第4の出力に関連付けられている第4の信号対雑音比よりも低い第3の信号対雑音比を有することに応答して、前記第2のサブバンドに関連付けられている前記第2の適応混合器出力を生成するように選択される、
    請求項3に記載の方法。
  5. 前記第1のサブバンドが、風雑音に関連付けられている周波数値の第1の範囲に対応する、請求項2に記載の方法。
  6. 前記第2のサブバンドが、風雑音に関連付けられている周波数値の第2の範囲に対応する、請求項5に記載の方法。
  7. 前記第1のマイクロホンアレイ処理信号が、複数のマイクロホンから受信した複数のマイクロホン信号に対して実行されるビームフォーミング演算の第1のセットの結果である、請求項1に記載の方法。
  8. 前記第2のマイクロホンアレイ処理信号が、前記複数のマイクロホンから受信した前記複数のマイクロホン信号に対して実行されるビームフォーミング演算の第2のセットの第2の結果である、請求項7に記載の方法。
  9. ビームフォーミング演算の前記第1のセットが、1つまたは複数の全指向性マイクロホンビームフォーミング演算を含み、ビームフォーミング演算の前記第2のセットが、1つまたは複数の指向性マイクロホンビームフォーミング演算を含む、請求項8に記載の方法。
  10. 前記第1の出力に対して1つまたは複数のデシメーション演算を実行するステップと、
    前記第2の出力に対して1つまたは複数のデシメーション演算を実行するステップと
    をさらに含む、請求項1に記載の方法。
  11. 前記第1の出力を前記第2の出力と比較するステップと、
    前記第1の出力が、前記第2の出力よりも高い信号対雑音比を有することに応答して、マイクロホン混合演算の前記第1のセットを実行して、前記第1のサブバンドに関連付けられている前記第1の適応混合器出力を生成するステップと、
    前記第1の出力が、前記第2の出力よりも低い信号対雑音比を有することに応答して、マイクロホン混合演算の前記第2のセットを実行するステップと
    をさらに含む、請求項1に記載の方法。
  12. 複数のマイクロホンから複数のマイクロホン信号を受信し、
    複数のサブバンドを含む周波数帯域に関連付けられている第1のマイクロホンアレイ処理信号を生成する
    ように構成された第1のマイクロホンアレイ処理構成要素と、
    前記複数のマイクロホンから前記複数のマイクロホン信号を受信し、
    前記複数のサブバンドを含む前記周波数帯域に関連付けられている第2のマイクロホンアレイ処理信号を生成する
    ように構成された第2のマイクロホンアレイ処理構成要素と、
    前記第1のマイクロホンアレイ処理信号に基づいて、第1の出力を生成するように構成された第1の帯域分析フィルタ構成要素であって、前記第1の出力が、前記複数のサブバンドのうちの第1のサブバンドに対応する、第1の帯域分析フィルタ構成要素と、
    前記第2のマイクロホンアレイ処理信号に基づいて、第2の出力を生成するように構成された第2の帯域分析フィルタ構成要素であって、前記第2の出力が、前記第1のサブバンドに対応する、第2の帯域分析フィルタ構成要素と、
    前記第1のサブバンドに関連付けられている第1の適応混合構成要素であって、前記第1の出力の前記第2の出力に対する比較に基づいて、前記第1のサブバンドに関連付けられている第1の適応混合器出力を生成するように構成されている、第1の適応混合構成要素と
    を備える装置。
  13. 前記第1の適応混合構成要素は、
    前記第1の出力が、前記第2の出力よりも高い信号対雑音比を有するとき、マイクロホン混合演算の第1のセットを実行して、前記第1の適応混合器出力を生成するように構成され、マイクロホン混合演算の前記第1のセットが、風雑音軽減に関連付けられ、
    前記第1の適応混合構成要素は、
    前記第1の出力が、前記第2の出力よりも低い信号対雑音比を有するとき、マイクロホン混合演算の第2のセットを実行して、前記第1の適応混合器出力を生成するように構成され、マイクロホン混合演算の前記第2のセットが、周囲雑音軽減に関連付けられている、請求項12に記載の装置。
  14. 前記第1のマイクロホンアレイ処理構成要素が、前記複数のマイクロホン信号に対してビームフォーミング演算の第1のセットを実行するように構成され、前記第2のマイクロホンアレイ処理構成要素が、前記複数のマイクロホン信号に対してビームフォーミング演算の第2のセットを実行するように構成されている、請求項12に記載の装置。
  15. 前記第1のマイクロホンアレイ処理信号に基づいて、第3の出力を生成するように構成された第3の帯域分析フィルタ構成要素であって、前記第3の出力が、前記複数のサブバンドのうちの第2のサブバンドに対応する、第3の帯域分析フィルタ構成要素と、
    前記第2のマイクロホンアレイ処理信号に基づいて、第4の出力を生成するように構成された第4の帯域分析フィルタ構成要素であって、前記第4の出力が、前記第2のサブバンドに対応する、第4の帯域分析フィルタ構成要素と、
    前記第2のサブバンドに関連付けられている第2の適応混合構成要素であって、前記第3の出力の前記第4の出力に対する比較に基づいて、前記第2のサブバンドに関連付けられている第2の混合器出力を生成するように構成されている、第2の適応混合構成要素と
    をさらに備える、請求項12に記載の装置。
  16. 前記第1のマイクロホンアレイ処理信号に基づいて、第3の出力を生成するように構成された第3の帯域分析フィルタ構成要素であって、前記第3の出力が、前記複数のサブバンドのうちの第2のサブバンドに対応する、第3の帯域分析フィルタ構成要素と、
    前記第2のマイクロホンアレイ処理信号に基づいて、第4の出力を生成するように構成された第4の帯域分析フィルタ構成要素であって、前記第4の出力が、前記第2のサブバンドに対応する、第4の帯域分析フィルタ構成要素と、
    前記第2のサブバンドに関連付けられている混合構成要素であって、前記第3の出力および前記第4の出力に基づいて、周囲雑音軽減に関連付けられているマイクロホン混合演算のセットを実行するように構成されている、混合構成要素と
    をさらに備える、請求項12に記載の装置。
  17. 前記第1のサブバンドが、周波数値の第1の範囲に対応し、周波数値の前記第1の範囲における各周波数値が、約1KHz以下であり、
    前記第2のサブバンドが、周波数値の第2の範囲に対応し、周波数値の前記第2の範囲における各周波数値が、約1KHz以上である、
    請求項14に記載の装置。
  18. 複数のマイクロホンと、
    前記複数のマイクロホンから受信した複数のマイクロホン信号に基づいて、第1のマイクロホンアレイ処理信号を生成するように構成された第1のマイクロホンアレイ処理構成要素であって、前記第1のマイクロホンアレイ処理信号が、複数のサブバンドを含む周波数帯域に関連付けられている、第1のマイクロホンアレイ処理構成要素と、
    前記複数のマイクロホンから受信した前記複数のマイクロホン信号に基づいて、第2のマイクロホンアレイ処理信号を生成するように構成された第2のマイクロホンアレイ処理構成要素であって、前記第2のマイクロホンアレイ処理信号が、前記複数のサブバンドを含む前記周波数帯域に関連付けられている、第2のマイクロホンアレイ処理構成要素と、
    前記第1のマイクロホンアレイ処理信号に基づいて、第1の出力を生成するように構成された第1の帯域分析フィルタ構成要素であって、前記第1の出力が、前記複数のサブバンドのうちの第1のサブバンドに対応する、第1の帯域分析フィルタ構成要素と、
    前記第2のマイクロホンアレイ処理信号に基づいて、第2の出力を生成するように構成された第2の帯域分析フィルタ構成要素であって、前記第2の出力が、前記第1のサブバンドに対応する、第2の帯域分析フィルタ構成要素と、
    前記第1のサブバンドに関連付けられている第1の適応混合構成要素であって、前記第1の出力の前記第2の出力に対する比較に基づいて、前記第1のサブバンドに関連付けられている第1の適応混合器出力を生成するように構成されている、第1の適応混合構成要素と、
    前記第1の適応混合構成要素に関連付けられている第1の合成構成要素であって、前記第1の適応混合器出力に基づいて、第1の合成されたサブバンド出力信号を生成するように構成されている、第1の合成構成要素と
    を備える、システム。
  19. 前記第1のマイクロホンアレイ処理信号に基づいて、第3の出力を生成するように構成された第3の帯域分析フィルタ構成要素であって、前記第3の出力が、前記複数のサブバンドのうちの第2のサブバンドに対応する、第3の帯域分析フィルタ構成要素と、
    前記第2のマイクロホンアレイ処理信号に基づいて、第4の出力を生成するように構成された第4の帯域分析フィルタ構成要素であって、前記第4の出力が、前記第2のサブバンドに対応する、第4の帯域分析フィルタ構成要素と、
    前記第2のサブバンドに関連付けられている第2の適応混合構成要素であって、前記第3の出力の前記第4の出力に対する比較に基づいて、前記第2のサブバンドに関連付けられている第2の適応混合器出力を生成するように構成されている、第2の適応混合構成要素と、
    第2の適応混合構成要素に関連付けられている第2の合成構成要素であって、前記第2の適応混合器出力に基づいて、第2の合成されたサブバンド出力信号を生成するように構成されている、第2の合成構成要素と、
    複数の合成されたサブバンド出力信号に基づいて、オーディオ出力信号を生成するコンバイナであって、前記複数の合成されたサブバンド出力信号が、少なくとも前記第1の合成されたサブバンド出力信号と前記第2の合成されたサブバンド出力信号とを含む、コンバイナと
    をさらに備える、請求項18に記載のシステム。
  20. 前記複数のマイクロホンが、少なくとも1つの全指向性マイクロホンと、少なくとも1つの指向性マイクロホンとを含み、前記複数のマイクロホンが、ヘッドセット内に配設される、請求項18に記載のシステム。
JP2017551244A 2015-03-30 2016-03-29 サブバンド信号の適応混合 Expired - Fee Related JP6547003B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/672,683 2015-03-30
US14/672,683 US9838782B2 (en) 2015-03-30 2015-03-30 Adaptive mixing of sub-band signals
PCT/US2016/024736 WO2016160821A1 (en) 2015-03-30 2016-03-29 Adaptive mixing of sub-band signals

Publications (2)

Publication Number Publication Date
JP2018513625A true JP2018513625A (ja) 2018-05-24
JP6547003B2 JP6547003B2 (ja) 2019-07-17

Family

ID=55745834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017551244A Expired - Fee Related JP6547003B2 (ja) 2015-03-30 2016-03-29 サブバンド信号の適応混合

Country Status (5)

Country Link
US (1) US9838782B2 (ja)
EP (1) EP3278572B1 (ja)
JP (1) JP6547003B2 (ja)
CN (1) CN107409255B (ja)
WO (1) WO2016160821A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10609475B2 (en) 2014-12-05 2020-03-31 Stages Llc Active noise control and customized audio system
US10945080B2 (en) 2016-11-18 2021-03-09 Stages Llc Audio analysis and processing system
US9980075B1 (en) 2016-11-18 2018-05-22 Stages Llc Audio source spatialization relative to orientation sensor and output
US10117021B1 (en) * 2017-03-31 2018-10-30 Polycom, Inc. Audio feedback reduction utilizing adaptive filters and nonlinear processing
IT201700040732A1 (it) * 2017-04-12 2018-10-12 Inst Rundfunktechnik Gmbh Verfahren und vorrichtung zum mischen von n informationssignalen
US10229698B1 (en) * 2017-06-21 2019-03-12 Amazon Technologies, Inc. Playback reference signal-assisted multi-microphone interference canceler
US10522167B1 (en) * 2018-02-13 2019-12-31 Amazon Techonlogies, Inc. Multichannel noise cancellation using deep neural network masking
US10581481B1 (en) * 2018-09-18 2020-03-03 Battelle Energy Alliance, Llc Communication device, spread-spectrum receiver, and related method using normalized matched filter for improving signal-to-noise ratio in harsh environments
US10938992B1 (en) 2019-05-06 2021-03-02 Polycom, Inc. Advanced audio feedback reduction utilizing adaptive filters and nonlinear processing
CN110121129B (zh) * 2019-06-20 2021-04-20 歌尔股份有限公司 耳机的麦克风阵列降噪方法、装置、耳机及tws耳机
US11062723B2 (en) * 2019-09-17 2021-07-13 Bose Corporation Enhancement of audio from remote audio sources
CN110767247B (zh) * 2019-10-29 2021-02-19 支付宝(杭州)信息技术有限公司 语音信号处理方法、声音采集装置和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002525982A (ja) * 1998-09-18 2002-08-13 アンドレア エレクトロニクス コーポレイション 混信消去方法及び装置
JP2004537944A (ja) * 2001-08-08 2004-12-16 ディエスピーファクトリー リミテッド オーバーサンプルされたフィルタバンクを用いる指向性オーディオ信号処理
JP2007336232A (ja) * 2006-06-15 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> 特定方向収音装置、特定方向収音プログラム、記録媒体
JP2008538882A (ja) * 2005-04-29 2008-11-06 ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー マイク信号の中の風ノイズの検出および抑制
EP2765787A1 (en) * 2013-02-07 2014-08-13 Sennheiser Communications A/S A method of reducing un-correlated noise in an audio processing device

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7206421B1 (en) * 2000-07-14 2007-04-17 Gn Resound North America Corporation Hearing system beamformer
US6748086B1 (en) * 2000-10-19 2004-06-08 Lear Corporation Cabin communication system without acoustic echo cancellation
US20060013412A1 (en) * 2004-07-16 2006-01-19 Alexander Goldin Method and system for reduction of noise in microphone signals
US20060227976A1 (en) * 2005-04-07 2006-10-12 Gennum Corporation Binaural hearing instrument systems and methods
US8068627B2 (en) * 2006-03-14 2011-11-29 Starkey Laboratories, Inc. System for automatic reception enhancement of hearing assistance devices
US7783478B2 (en) * 2007-01-03 2010-08-24 Alexander Goldin Two stage frequency subband decomposition
US8912522B2 (en) 2009-08-26 2014-12-16 University Of Maryland Nanodevice arrays for electrical energy storage, capture and management and method for their formation
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
US8798278B2 (en) 2010-09-28 2014-08-05 Bose Corporation Dynamic gain adjustment based on signal to ambient noise level
US8620650B2 (en) 2011-04-01 2013-12-31 Bose Corporation Rejecting noise with paired microphones
US8488829B2 (en) 2011-04-01 2013-07-16 Bose Corporartion Paired gradient and pressure microphones for rejecting wind and ambient noise
US9620146B2 (en) * 2012-05-16 2017-04-11 Nuance Communications, Inc. Speech communication system for combined voice recognition, hands-free telephony and in-car communication
JP6371516B2 (ja) * 2013-11-15 2018-08-08 キヤノン株式会社 音響信号処理装置および方法
US9886966B2 (en) * 2014-11-07 2018-02-06 Apple Inc. System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002525982A (ja) * 1998-09-18 2002-08-13 アンドレア エレクトロニクス コーポレイション 混信消去方法及び装置
JP2004537944A (ja) * 2001-08-08 2004-12-16 ディエスピーファクトリー リミテッド オーバーサンプルされたフィルタバンクを用いる指向性オーディオ信号処理
JP2008538882A (ja) * 2005-04-29 2008-11-06 ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー マイク信号の中の風ノイズの検出および抑制
JP2007336232A (ja) * 2006-06-15 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> 特定方向収音装置、特定方向収音プログラム、記録媒体
EP2765787A1 (en) * 2013-02-07 2014-08-13 Sennheiser Communications A/S A method of reducing un-correlated noise in an audio processing device

Also Published As

Publication number Publication date
US9838782B2 (en) 2017-12-05
WO2016160821A1 (en) 2016-10-06
JP6547003B2 (ja) 2019-07-17
US20160295322A1 (en) 2016-10-06
CN107409255B (zh) 2020-01-21
CN107409255A (zh) 2017-11-28
EP3278572A1 (en) 2018-02-07
EP3278572B1 (en) 2020-11-18

Similar Documents

Publication Publication Date Title
JP6547003B2 (ja) サブバンド信号の適応混合
JP5007442B2 (ja) 発話改善のためにマイク間レベル差を用いるシステム及び方法
CN106251877B (zh) 语音声源方向估计方法及装置
US8861745B2 (en) Wind noise mitigation
CN110085248B (zh) 个人通信中降噪和回波消除时的噪声估计
US8565459B2 (en) Signal processing using spatial filter
US7386135B2 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
CN110770827B (zh) 基于相关性的近场检测器
US9521486B1 (en) Frequency based beamforming
US10623854B2 (en) Sub-band mixing of multiple microphones
JP2017503388A5 (ja)
AU2011334840A1 (en) Apparatus and method for spatially selective sound acquisition by acoustic triangulation
Thiergart et al. An informed LCMV filter based on multiple instantaneous direction-of-arrival estimates
Reddy et al. Unambiguous speech DOA estimation under spatial aliasing conditions
Priyanka A review on adaptive beamforming techniques for speech enhancement
Spriet et al. Stochastic gradient-based implementation of spatially preprocessed speech distortion weighted multichannel Wiener filtering for noise reduction in hearing aids
Neo et al. Polynomial matrix eigenvalue decomposition of spherical harmonics for speech enhancement
Madhu et al. Localisation-based, situation-adaptive mask generation for source separation
Tanaka et al. Acoustic beamforming with maximum SNR criterion and efficient generalized eigenvector tracking
Ahmed et al. Comparison of LMS and NLMS algorithm with the using of 4 Linear Microphone Array for Speech Enhancement.
Stolbov et al. Dual-microphone speech enhancement system attenuating both coherent and diffuse background noise
Gong et al. Noise power spectral density matrix estimation based on modified IMCRA
US10204638B2 (en) Integrated sensor-array processor
Firoozabadi et al. Localization of multiple simultaneous speakers by combining the information from different subbands
Agrawal et al. Dual microphone beamforming algorithm for acoustic signals

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180914

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190527

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190624

R150 Certificate of patent or registration of utility model

Ref document number: 6547003

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees