JP2007523514A - 適応ビームフォーマ、サイドローブキャンセラー、方法、装置、及びコンピュータープログラム - Google Patents
適応ビームフォーマ、サイドローブキャンセラー、方法、装置、及びコンピュータープログラム Download PDFInfo
- Publication number
- JP2007523514A JP2007523514A JP2006540739A JP2006540739A JP2007523514A JP 2007523514 A JP2007523514 A JP 2007523514A JP 2006540739 A JP2006540739 A JP 2006540739A JP 2006540739 A JP2006540739 A JP 2006540739A JP 2007523514 A JP2007523514 A JP 2007523514A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- adaptive
- signal
- beamformer
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 13
- 238000004590 computer program Methods 0.000 title claims description 5
- 230000005236 sound signal Effects 0.000 claims abstract description 52
- 238000005259 measurement Methods 0.000 claims abstract description 35
- 230000008569 process Effects 0.000 claims abstract description 3
- 239000013256 coordination polymer Substances 0.000 claims description 10
- 230000006978 adaptation Effects 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 12
- 230000000903 blocking effect Effects 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000012886 linear function Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/18—Methods or devices for transmitting, conducting or directing sound
- G10K11/26—Sound-focusing or directing, e.g. scanning
- G10K11/34—Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
- G10K11/341—Circuits therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
比較的に強靱な適応ビームフォーマであって:複数のマイクロホン(101、103、105)のそれぞれからの入力音声信号(u1、u2、u3)を処理し、及び目標信号源(160)からの音に主に相当する第1の音声信号(z)を出力するよう構成されたフィルター加算ビームフォーマ(107);及び例えばサイドローブキャンセラー構成に組み込まれた場合の雑音測定であり、第1の音声信号(z)から雑音信号(y)を減算し、雑音除去された第2の音声信号(r)を得るよう構成される適応雑音推定部(150)を有し:及びサイドローブキャンセリングの比(Q)に応じて倍率(S)を提供するよう構成され、及び倍率(S)を用い適応ステップサイズを決定するよう構成される倍率決定部(170)を更に有する。サイドローブキャンセラーは、目標信号源に比較的適切に追従しているが雑音源からの干渉に比較的影響を受けない場合に、迅速に適応する。
Description
本発明は、適応ビームフォーマ及び前記適応ビームフォーマを有するサイドローブキャンセラーに関する。
本発明はまた、前記適応ビームフォーマ又はサイドローブキャンセラーを有する、ハンズフリー音声通信装置、音声制御装置及び音声を生成する対象を追尾する追尾装置に関する。
本発明はまた、前記音声制御装置を有する民生用装置に関する。
本発明はまた、適応ビームフォーミング方法又はサイドローブキャンセリング方法に関する。
サイドローブキャンセラー及び上述のように構成要素であるビームフォーマの実施例は(注意:ビームフォーマ及びサイドローブキャンセラーには関連する装置として名付けられる。これは、サイドローブキャンセラー内のビームフォーマは、独立型のビームフォーマと同様に利用され、従って両者とも本発明の特定の技術的特長が解決する同じ問題を有しているためである)、非特許文献1から既知である。サイドローブキャンセラーは、目標信号源に追従するよう設計される。つまり、目標信号源からの音に主に対応する出力信号を生成する。同時に、雑音と称される他の音源からの音を可能な限り除去する。これを実現するため、サイドローブキャンセラーは、複数のマイクロホンからの信号を処理する適応ビームフォーマを有し、適応ビームフォーマのビームフォーマフィルターは、目標信号源から各マイクロホンへの目標音声の逆経路を示すよう最適化できる(つまり、目標音声は、例えば種々の面で反射することにより変更され、最終的に異なる方向から特定のマイクロホンへ入力される)。フィルターされた信号を加算することにより、ビームフォーマは、目標音声の方角に高い感度を有する部分の方向感受性パターンを効率的に実現する。例えば、純粋な遅延を有するフィルターの場合、ビームフォーマは、メインローブ及びサイドローブを有するsin(x)/xのパターンを実現する。しかし、このような感受性パターンに関する問題は、他の音源からの音が拾われることも含む。例えば、雑音源は、あるサイドローブの方向に存在するかも知れない。この問題を解決するため、サイドローブキャンセラーはまた、適応雑音除去段階を有する。マイクロホンの測定から、目標音声成分をブロックすることにより、雑音基準信号が計算される。つまり、例えば、サイドローブ内の雑音が決定される。適応フィルターを用い、これら雑音測定結果から、目標音声に向かうローブパターンに漏れている雑音量を推定する。最後に、この雑音はメインローブに拾われたものから差し引かれ、大部分が目標音声である最終的な音声信号を抽出する。指向性パターンは、この最適化されたサイドローブキャンセラーに基づき計算される場合、目標信号源に向かうメインローブを有し、雑音源の方向ではゼロになる。
従来のサイドローブキャンセラー及びビームフォーマには多くの問題があり、実際には理想的に動作しない。第一に、目標信号源、例えばスピーカーと雑音源からの音、例えばモーター音との間に必ずしも物理的な違いが存在しない。そのため話者を追従する代わりに、システムは雑音源に向かって逸れてしまい、目標信号源と雑音源の間の方向に向かうメインローブを捉える場合がある。従って、サイドローブキャンセラーでは、雑音基準は音声又は一般に目標音を有するので、メインローブにより拾われた音から雑音のみを除去する代わりに、目標音の一部も除去されてしまう。音声の場合、これは特に望ましくない。マイクロホンアレイを有するサイドローブキャンセラーは、サイドローブキャンセラーを有さない単一のマイクロホンよりも好ましくない動作をする場合さえある。各マイクロホンは、関連する音、例えば遅延音を拾うので、特定方向(例えば、第2の話者)から到来する雑音は、相関雑音と称される。第二に、所謂、無相関音源の問題がある。この場合、マイクロホン信号は直交する。無相関雑音は、例えば拡散音場(例えば反響音、又は車の風騒音から等の多くの独立音源)、又は単にマイクロホンの電気的雑音から生成され得る。この雑音はまた、サイドローブキャンセラーの機能と接続される。従来のサイドローブキャンセラーは、これらの問題を解決するため音声検出器を有する。目標信号源は話者であり、雑音源は存在しないと仮定する。ビームフォーマは、音声を受信した場合のみ、一般に最大出力により、適応される。雑音除去フィルターは、正しく適応されなかった場合、目標音声の最終出力に、最小化されるべき残留雑音を残す。従って、雑音のみが検出された場合、最終出力は、最適雑音除去フィルターを得るために最大化されるよりむしろ最小化される。このような音声検出器は、2つの問題を有する。第一に、サイドローブキャンセラーは、カメラを例えば音声通信音を生成する装置に向けるために必要な非音声信号に追従できない。第二に、更に重要なことに、このような音声検出器は、あまり強靱ではなく、サイドローブキャンセラーの性能の悪さの原因となっている。良いビームフォーマ/サイドローブキャンセラーは、特に目標信号源及び/又は雑音源の方向が変化する環境に用いる場合、設計が困難である。従って、フィルターは、比較的短い間隔の間、再利用される。しかしながら、この状況は、例えば部屋の中を移動する話者を追跡しようとするテレビ会議システム、又は携帯電話に組み込まれるサイドローブキャンセラーに向かって人が話すシステム、及び例えばハンズフリー自動車電話装置のように、種々の環境を携帯電話と共に移動する環境において全く共通である。サイドローブキャンセラーに関する以上の説明はまた、他の雑音除去方法に関連する適応ビームフォーマの問題でもある。
シー・ファンコート、エル・パラ(C.Fancourt, L.Parra)、ザ・ジェネラライズド・サイドローブ・デコレレータ(The generalized sidelobe decorrelator)、アイイーイーイー・ワークショップ・オン・ザ・アプリケーション・オブ・シグナル・プロセッシング・トゥー・オーディオ・アンド・アコースティックス 2001の議事(Proceedings of the IEEE Workshop on applications of signal processing to audio and acoustics 2001)、(米国)、アイイーイーイー(IEEE)、2001年
シー・ファンコート、エル・パラ(C.Fancourt, L.Parra)、ザ・ジェネラライズド・サイドローブ・デコレレータ(The generalized sidelobe decorrelator)、アイイーイーイー・ワークショップ・オン・ザ・アプリケーション・オブ・シグナル・プロセッシング・トゥー・オーディオ・アンド・アコースティックス 2001の議事(Proceedings of the IEEE Workshop on applications of signal processing to audio and acoustics 2001)、(米国)、アイイーイーイー(IEEE)、2001年
本発明の第1の目的は、雑音の影響に対し比較的強靱な適応ビームフォーマを提供することである。この第1の目的は、適応ビームフォーマにより実現される。適応ビームフォーマは、第1の適応フィルターのセットの係数が、適応ステップサイズに応じて得られた少なくとも1つの係数に異なる値を加算することにより変化される点で適応型であり、複数のマイクロホンのそれぞれからの入力音声信号を処理するよう構成され、及び前記第1の適応フィルターのセットのそれぞれで前記入力音声信号をフィルターすることにより、目標信号源からの音に主に相当する第1の音声信号を出力するよう構成されたフィルター加算ビームフォーマ;及び第1の関数として求められる倍率を提供するよう構成される、前記目標信号源から生成され前記第1の音声信号に存在する無雑音音声信号の推定である第1の変数、及び前記第1の音声信号に存在する雑音の推定である第2の変数の比の、倍率決定部を有し、前記倍率を用い前記適応ステップサイズの倍率を決定するよう構成される。
強靱な適応ビームフォーマには、単に音声/非音声の2進指標ではなく、適応ビームフォーマが目標音を追従しているか否かの(上記の音声検出器より)より連続的な評価が必要とされる。これは、このような連続的な機能により、適応ビームフォーマは、評価誤りを許容できるからである。2進指標により雑音が誤って音声として認識された場合、ビームフォーマは、完全に雑音に適応し始め、そして最適でなくなる。入力雑音に応じてビームフォーマが誤って適応した場合に、ビームフォーマがパラメータ空間で少し適応する仕組みが必要である。これは、ビームフォーマがどれだけ最適化されているか及び雑音がどれだけ入力されているかを示す、ビームフォーマを非最適化できる関数の出力に依存する適応ステップを作ることにより実現できる。これら2つの要素は共に、倍率を特定する式に纏められる。この倍率は、以下の比の関数F1である。
(1)目標信号(例えば、音声)の可変指標(例えば、第1の音声信号自体は、完全に近いが、それを更に処理したものが望ましく、ビームフォーマにより除去できない雑音が別の方法、例えばサイドローブキャンセリングにより大部分除去される)。理論上は、これは、目標信号源から実際に発生する音声であり、及び例えば部屋内の伝搬、マイクロホンの転送機能など(しかし電子回路雑音、他の相関及び無相関雑音、不要雑音源等の影響を受けない)により変更(フィルター)されると理解できる。及び
(2)目標音声/信号に近くなるよう処理された(出力)音声信号に含まれる雑音の可変指標。
(1)目標信号(例えば、音声)の可変指標(例えば、第1の音声信号自体は、完全に近いが、それを更に処理したものが望ましく、ビームフォーマにより除去できない雑音が別の方法、例えばサイドローブキャンセリングにより大部分除去される)。理論上は、これは、目標信号源から実際に発生する音声であり、及び例えば部屋内の伝搬、マイクロホンの転送機能など(しかし電子回路雑音、他の相関及び無相関雑音、不要雑音源等の影響を受けない)により変更(フィルター)されると理解できる。及び
(2)目標音声/信号に近くなるよう処理された(出力)音声信号に含まれる雑音の可変指標。
この関数が大きい場合、ビームフォーマはその機能を適切に果たし、及び正しく適応していることを示す。従って、大きい適応ステップが用いられ、移動する目標信号源を追跡できる。逆に、この関数が、ビームフォーマが適切に動作しない又はできないと示す場合(例えば、強力な干渉雑音源の存在により比が小さくなる場合)、適応ステップサイズは小さくなる。これは、フィルター加算ビームフォーマのフィルター係数は、正しい値に適応せず、更に悪化し得るためである。また、ビームフォーマフィルターの動作は、雑音により多かれ少なかれ影響される。適応ステップは、従って、倍率に比例して決定される。
適応ビームフォーマ、又はその実施例は、サイドローブキャンセラーを構成する。サイドローブキャンセラーは、第2の適応フィルターのセットを用い入力音声信号から得た対応する雑音測定結果をフィルターすることにより推定雑音信号を得るよう構成される適応雑音推定部;及び第1の音声信号から前記推定雑音信号を差し引くよう接続され、雑音除去された第2の音声信号を得る減算部を更に有する。
第2の適応フィルター(g1、g2)のセットは、フィルター加算ビームフォーマのフィルターに関連付けられ、ビームフォーマから出力される目標信号における雑音の割合を推定する。この推定された雑音信号は、一般に、例えば全てのフィルターが適切に調整されている場合に与えられる、単なる単一の雑音測定結果x1に比べより信頼性のある雑音推定である。ビームフォーマの場合、第1の音声信号(z)は、雑音に直交していない。これは、例えば、相関雑音が両方に存在するためである。サイドローブキャンセラーを用い、これは解決される。つまり、より良好な雑音推定(y)及びより良好な(不要要素が除去されている)目標音声(r)がほぼ直交する。
サイドローブキャンセラーが除去するよう最適化された種類の雑音(つまり、方向感受性パターンがゼロである方向の相関雑音源)と目標音声が共に入力された場合に、サイドローブキャンセリングは適切に機能する。これと対照的に、フィルターが最適化されていない(つまり、例えばメインローブが目標信号源の方向と雑音源の方向の間に向けられている)及び/又は無相関雑音がある場合、サイドローブキャンセラーは不適切に動作する。サイドローブキャンセラーは、主に目標音を拾う場合、大きい適応ステップサイズを用い、移動する目標信号源の迅速な追跡を可能にするよう適応する。しかしながら、サイドローブキャンセラーは、(例えば雑音源による干渉のため)目標信号源にフォーカスし続けることに問題がある場合、大きい適応ステップサイズで正しく動作しない(特に僅かに適応が不十分な場合)。従って適応ステップサイズは小さくするべきである。同様の論理は、逆に主に雑音に適応し、目標信号、例えば音声に適応しないよう設計され、雑音推定/除去にも適用される。このような連続的な評価を用い、フィルター加算ビームフォーマ及びノイズキャンセラーの雑音推定器は、必要ならば同時に適応できる。又は従来技術の音声検出器と同様に、それぞれ補完的な時間間隔で適応できる。
注意すべきことは、減算器142により第1の音声信号(z)から除去するための雑音推定(y)は、ステップサイズを決定するための雑音推定と同一である必要はない点である。これは、雑音推定部310により推定された、1次雑音推定x1、x2、x3の関数A(xi)であることが望ましい。第1の音声信号に含まれるこの推定雑音は、勿論、y自体であると見なされて良い(この場合、雑音推定部310は、物理的に1つの要素として適応雑音推定部150に統合される)。しかしながら、ある状況では、他の推定の方が良い結果をもたらす場合もある(例えば、第1の音声信号z及びブロッキング行列からの基準信号の間の相関が少ないため、適応雑音推定部150が、大きな又は信頼できる信号yを生成しない場合)。非線形関数は、次に例えば雑音基準信号の出力の合計のように利用されて良い(パーティーでの多くの背景話者による所謂「バブル雑音」のような、多くの散乱性雑音に有用)。
適応ビームフォーマ又は適応ビームフォーマを有するサイドローブキャンセラーの第1の実施例は、周波数領域で特定された第1のフィルター(f1(−t)、f2(−t)、f3(−t))のセットの係数を有し、及び比(Q)により所定の周波数帯毎に適応ステップサイズが決定されるよう構成され、前記比(Q)は、(PZZ[f,t]−CPA(xi)A(xi)[f,t])/PZZ[f,t]であり、PZZ[f,t]は時刻tにおける周波数f近傍の前記所定の周波数帯の第1の音声信号(z)の出力の測定結果、PA(xi)A(xi)[f,t]は関数Aによる少なくとも1つの雑音測定結果(x1)から雑音推定部(310)により得られた雑音信号出力の測定結果、そしてCは定数である。
出力の代わりに、振幅又は分数式で用いられる信号振幅の他の関数が用いられても良い。
サイドローブキャンセラーの適切且つ望ましい関数Aは、雑音推定フィルターを雑音推定x1、x2、x3に適用することにより得られる関数であり、及び推定雑音信号yを生成する。この例では、PA(xi)A(xi)[f,t]は、Pyy[f,t]を表す。
この場合、分母は、音声/目標信号と雑音の測定値であり、分子は目標信号の測定値である(存在する推定雑音を除去後、つまり減算後の項)である。この関数は、有用な正規化特性を有する。
ファイルターは、大部分の周波数に予め適応させても良いが、特定周波数帯の雑音が現れるか、又はサイドローブキャンセラーに関連して移動するかも知れない。この場合、特定周波数帯の係数だけを適応させれば良い。従って、本発明の適応ビームフォーマ/サイドローブキャンセラーの好適な実施例は、周波数領域を特定したフィルターと共に動作する。また、時間領域フィルター、又は他の表現が用いられても良い。この第1の実施例では、推定目標音として用いられる分数式内の信号は、ビームフォーマにより出力される第1の音声信号出力である。ビームフォーマの出力を厳密に取得する代わりに、第1の音声信号が倍率決定部に取得される前に、多くの基本的な信号整形操作が実行されて良い。例えば、雑音推定は、一般に追加遅延を生じるので、遅延成分は、一般にビームフォーマの後段に導入される。従って、遅延後の第1の音声信号は雑音信号と同期しているので、この信号を取得することが望ましい。サイドローブキャンセラーが正しく適応し雑音が殆ど存在しない場合、分子が分母とほぼ等しくなり、上述の式の雑音出力は、目標信号の出力と比較して無視できる。逆の場合、多くの雑音が存在し、分子は分母と比べ小さくなり、比が小さくなる。上述の式は、0と1の間の値を有し、上述の式を用いた単なる乗算により、提案されるステップサイズが提案値と0の間で変化可能であることを示す。ビームフォーマフィルターは、一般にそれらの適応ステップサイズを変化させることにより、上述の式から得る評価結果を用いて調整されるが、雑音推定/除去フィルターは、一般に1から前記評価結果を差し引いた値を用い変化させる。
サイドローブキャンセラーの第2の実施例は、周波数領域で特定される第1のフィルターのセットの係数を有し、及び比(Q)により所定の周波数帯毎に適応ステップサイズが決定されるよう構成され、前記比(Q)は、(PZZ[f,t]−CPA(xi)A(xi)[f,t])/Prr[f,t]であり、PZZ[f,t]は時刻tにおける周波数f近傍の前記所定の周波数帯の第1の音声信号(z)の出力の測定結果、PA(xi)A(xi)[f,t]は関数Aに従う少なくとも1つの雑音測定結果(x1)から雑音推定部により得られた雑音信号出力の測定結果、Prr[f,t]は第2の音声信号(r)の出力の測定結果、そしてCは定数である。
目標信号の推定値として第1の音声信号を利用する代わりに、第2の音声信号rを基準信号として用いても良い。第2の音声信号は、存在する雑音を第1の音声信号から差し引いて得られるので、目標音声信号のより正確な推定が期待される。目標信号を得るためのアルゴリズムの処理信号線を流れる信号は、例えばシステムがほぼ最適である場合にビームフォーマを利用すべきか否かのような決定するためのより正確な基準を形成する。しかし、サイドローブキャンセラーが最適化されていない場合、結果として得られる信号は、単純なアルゴリズムにより得る推定より遙かに悪い。従って、このようなサイドローブキャンセラーの接続形態を用いフィルターを更新する場合、従来の音声検出器は、全く受け入れ難い結果になり、ステップサイズを変化する連続的な基準のみが、実行可能な選択肢である。同様の式、及び等価なサイドローブキャンセラー更新接続構成を導出し、更なる処理、例えば一般に内在する雑音量を更に削減する処理、又は目標信号又は音声から不要成分を更に除去する処理の後に得られる信号を、基準信号として用いても良い。
ビームフォーマ/サイドローブキャンセラーは、第1の音声信号に基づきブール型指標である音声/雑音を提供する音声検出部を有し、及びサイドローブキャンセラーでは、前記指標が雑音の場合、第2のフィルターのセットのみを適応するよう構成されるので、有利である。ビームフォーマは、目標信号が音声である場合、調整された適応ステップサイズを用い、自身のフィルターを単に適応するよう構成されて良い。
ビームフォーマ/サイドローブキャンセラーは、2進判定関数を前記比に適用するよう構成され、及び判定が1の場合のみ第1のフィルターのセットを利用するよう構成され、及び判定が0の場合、第2のフィルターのセットのみを適応するよう構成されるので、有利である。例えば、上記の2つの式の何れかの値が0.5より大きい場合、ビームフォーマフィルターのみが更新される。つまり判定は1に等しく、この例では四捨五入し最も近い整数にすることにより得られる。音声検出器は、音声と非音声である雑音の間で離散的、又は不定であるが、検出器における比の利用は、サイドローブキャンセラーを鳥の鳴き声のような動物の声、又は装置により生成される音のような、あらゆる非音声の目標信号に追従するために利用できるので、有利である。
適応ビームフォーマ及びサイドローブキャンセラーは、一般にあらゆる種類の(例えば一般にハンズフリーの)音声通信機器、例えば卓上に置かれる電話会議装置、又は自動車用機器、又は通常の携帯電話、パーソナルデジタルアシスタント、口述録音装置又は同様の通信機能を備える他の装置において利用されて良い。適応ビームフォーマ及びサイドローブキャンセラーはまた、例えばテレビジョンの遠隔制御、PCの音声テキスト変換システムのような音声制御装置において、雑音が重要な問題になる装置の音声認識性能の向上に有利である。他の装置は、あらゆる種類の民生用機器、エレベーター又は高機能家屋の部品、セキュリティシステム、例えば音声認識を用いるシステム、民生用対話端末等であって良い。
本システムはまた、一般にセキュリティ用途又は特定の理由でユーザーの挙動を監視する用途に利用される、追尾装置において利用されて良い。例として、侵入者に特有の雑音に基づき、侵入者を拡大撮影するカメラであって良い。
本発明の第2の目的は、以上に説明したサイドローブキャンセラーの機能に相当するサイドローブキャンセリング方法を提供することである。
第2の目的は、適応ビームフォーミング方法により実現される。適応ビームフォーミング方法は、ビームフォーマフィルター段階は、第1の適応フィルター(f1(−t)、f2(−t)、f3(−t))のセットの係数は、少なくとも1つの係数を追加することにより、適応ステップサイズに応じて得られる異なる値に変化できるという点で適応型であり、前記第1の適応ビームフォーマフィルター(f1(−t)、f2(−t)、f3(−t))のセットのそれぞれを用い、複数のマイクロホン(101、103、105)のそれぞれからの入力音声信号(u1、u2、u3)をフィルターし、目標信号源(160)からの音に主に対応する第1の音声信号(z)を生成する、ビームフォーミング段階;前記目標信号源(160)から生成され前記第1の音声信号(z)に存在する無雑音音声信号の推定である第1の変数(F2)及び前記第1の音声信号(z)に存在する雑音の推定である第2の変数(F3)の比(Q)の倍率(S)である第1の関数(F1)を決定する段階;及び前記倍率(S)を用い適応ステップサイズの倍率を決定する段階を有する。
本方法は、一般に、例えばダウンロードサーバーに格納され又は民生用機器へ送信されるソフトウェア、として実現されて良い。
本発明のサイドローブキャンセラーのこれら及び他の特長は、以下に説明する実施例、及び添付の図面を参照することにより、明らかであろう。添付の図面は、全体の概念を例示するものであり、本発明の範囲を限定するものではない。
図1では、目標信号源160からの音は、場合によっては1つ以上の不要雑音源161も、少なくとも2つのマイクロホン101、103、105の配列に伝達する。これらマイクロホンにより出力される信号u1、u2、u3は、ビームフォーマ107の対応するフィルターf1(−t)、f2(−t)、f3(−t)の第1のセットによりフィルターされる。前記フィルターの係数、一般に周波数帯毎の係数は、例えば目標信号源160の、部屋内の状況の変化に適応できる。各フィルターから出力され得られた信号は、加算器110により加算され、第1の音声信号zを生成する。理想的には、フィルターは、特定のマイクロホンへ向かう目標音声の逆経路を示し、従って第1のマイクロホンの信号u1を第1のフィルターf1(−t)によりフィルターすることにより、理想的且つ厳密に目標音声が得られる。従って、フィルターが正しく適応していれば、第1の音声信号zは、目標音声に非常に近くなる。しかしながら、マイクロホンは雑音も拾うので、必然的に第1の音声信号zも雑音を含む。マイクロホン信号u1、u2、u3は、雑音測定結果x1、x2、x3を生成するためにも利用される。雑音のみを表す信号、数学的表現では目標音声信号と直交する信号を得るため、目標信号は、マイクロホン信号u1、u2、u3から、対応する減算器115、121、127により差し引かれる。所謂ブロッキング行列111は、従って、伝達経路フィルターf1、f2、f3を第1の音声信号zに適用し、マイクロホンにより拾われた目標音声の推定信号を得る。従って、ビームフォーマ107のフィルターとブロッキング行列のフィルターは、時間反転以外は同様である。適応雑音推定部150は、各マイクロホンから得られた雑音測定結果x1、x2、x3に基づき、どれだけの雑音が、目標信号源に向けられたビームフォーマのメインローブ、又は目標信号に向けられたローブパターンの他の部分、例えばそのパターンのサイドローブに拾われるか、従って第1の音声信号zに含まれる雑音の割合を推定する。雑音推定部150は、従って、ビームフォーマフィルターf1(−t)、f2(−t)、f3(−t)に関連する適応フィルターg1、g2の第2のセットを利用する。雑音測定結果x1、x2、x3の1つは、第2のフィルターg1、g2を適用する前に、数学的に依存しているため(3つのマイクロホン測定結果のみが存在し、第1の音声信号zである1つの目標音声信号と3つの雑音測定結果x1、x2、x3を得る)、次元縮小が行われて良い。例えば、第3の雑音信号は除去され、又はx11はx1−(x1+x2+x3)/3と定義されて良く、及びx12はx2−(x1+x2+x3)/3と定義されて良い等である。
代案として、3つの第2のフィルターが適応され、依存度に注意して自動的に収束する。最終的に減算器142は、推定雑音信号yを第1の音声信号zから差し引くよう構成される。減算器142及び雑音推定部150は共に、ノイズキャンセラーを構成し、比較的雑音を含まない、第2の音声信号rを出力する。
以上に説明したシステムは、従来既知のサイドローブキャンセラーである。図1は、ビームフォーマ107のフィルターとブロッキング行列111のフィルターを更新するビームフォーマ更新部117、123、129のそれぞれを、ブロッキング行列の一部として示すが、これらは必ずしも示された構成でなくても良い。
従来のビームフォーマの一般的な更新規則は、第1の音声信号z及び対応する雑音測定結果を入力として用い、新しいフィルター係数を特定の周波数範囲又は周波数f近傍の周波数帯に対し、以下の式で計算する。
従来技術のノイズキャンセラー更新部159において第2のフィルターg1、g2のセットを更新する一般的な更新規則は、次の通りである。
本発明のサイドローブキャンセラー100の場合、これらの更新ステップ(記号+の後の部分)は、サイドローブキャンセラーがどれだけ正しく動作するかを決定する比に基づき決定される。
従って、倍率決定部170は、入力として、望ましくは遅延部141により遅延された後の第1の音声信号z、及び雑音信号yを有するよう構成される。倍率決定部170は、比Q及び比の関数として倍率Sを計算する。倍率Sは、サイドローブキャンセラー更新接続構成では、例えば以下のように計算される。
この関数の下限は0とする。つまりこの関数は負にならない。注意すべき点は、時刻は(当業者に既知の)異なる方法で選択されて良いことであり、及び処理はブロック単位に行われることが望ましい。数式3は、次式に近似できる。
当業者は、他の雑音推定も利用されて良く、従ってサイドローブキャンセラーの雑音推定部は不要となることを理解するだろう。適応フィルター加算ビームフォーマ(この概念も遅延加算ビームフォーマ及び同様の構成を有する)及び例えばマイクロホンの何れかにより拾われた信号である雑音基準の組み合わせを用い、本発明の核の適応ビームフォーマを構成しても良い。
倍率Sは、ビームフォーマ更新部117、123、129へ送信される。ビームフォーマ更新部は、本発明によると、適応ステップサイズを倍率Sで乗算することにより、ビームフォーマフィルターの更新ステップを調整するよう構成される。本発明によると、ビームフォーマ更新部は、以下の更新規則に従う。
CPyyを用いる代わりに、別の雑音推定部310(図2にのみ示されるが、勿論、あらゆる実施例と組み合わせて良い)を用い、目標音声(例えば、z)の推定信号に依然として含まれる雑音の別の値を求めても良い。これは、例えば雑音測定結果x1、x2、x3の線形又は非線形関数であって良い。
例えば、ビームフォーマフィルターの更新(数式6)のように、多くの(相関又は無相関)雑音が存在する場合、CPyy[f,t]は比較的大きく、PZZ[f,t]−CPyy[f,t]はPZZ[f,t]より小さくなり、その結果、小さいステップサイズを得る。全く雑音がない場合、倍率は1に等しい。
従来既知の音声検出器165は、第1の音声信号zが音声として認識された場合、信号Sufiをビームフォーマ更新部117、123、129へ出力できるよう変更される。またビームフォーマ更新部117、123、129は、信号Sufiが特定値、例えば1である場合に、フィルター(f1(−t)、f2(−t)、f3(−t))のみを更新するよう構成される。同様に、信号SUWは、音声検出器165が第1の音声信号zを雑音として認識した場合にのみ、雑音推定部150のフィルターg1、g2を適応させる。音声検出は、第2の音声信号rを入力としても良い。注意すべき点は、図1では明確化のため、信号Sufi及びSUWの更新部への接続は、図示されない。しかし、これらは、例えば配線、保存、ソフトウェアの場合のメモリーからのフェッチ等のように既知のものであると理解される。
更に別の実施例では、倍率決定部170は、音声種別特徴付け部166を有して良い。音声検出器165と同様に、音声種別特徴付け部166は、サイドローブキャンセラーが主に目標信号源に追従しているか否か、又は多くの雑音を受信しているか否かを識別する。音声種別特徴付け部166は、例えば、2進決定機能(例えば、四捨五入し最も近い整数0又は1にする)を比Qに適用するよう構成され、及び上述のように信号Sufiを出力し、決定が1の場合のみ、第1のフィルター(f1(−t)、f2(−t)、f3(−t)及びf1、f2、f3も)のセットを適応し、決定が0の場合のみ、第2のフィルター(g1、g2)のセットを適応するよう構成される。これによりサイドローブキャンセラー100の強靱性が更に増大する。
図2は、第2の音声信号rに応じて、ビームフォーマ/ブロッキングフィルター(f1(−t)、f2(−t)、f3(−t)、f1、f2、f3)の更新を実行する構成を示す。第2のビームフォーマ更新部219、215、211は、以上に説明した既知のサイドキャンセラー部分の上側に図示される。第2のビームフォーマ更新部219、215、211は、第2の入力として、同様に生成された第2の雑音測定結果v1、v2、v3を有し、対応する減算器を備えるよう構成される。例えば、減算器227は、ブロッキングフィルターf1でフィルターされた第2の音声信号rを、第1のマイクロホン信号u1から差し引く。他も同様である。
数式1と同様に、基本的な更新式が以下のように選択されてよいことは、数学的に示される。
このサイドローブキャンセラーの構成200の倍率の可能な式は、第2の倍率決定部250により以下のように求められる。
実質的に相関雑音のみが存在し、ほぼ完全に除去される場合、減算器142における減算は、スカラー方程式と見なされ、定義Prr[f]≒Pzz[f]−CPyy[f]により、r=z−yなので、Sをほぼ1に等しくする。例えば雑音源の移動により、ノイズキャンセラーが不適切に適応された場合、雑音の位相は不明なので、減算器142は雑音除去を実行できない。例えば、雑音の振幅は正しく推定できるが、180度の位相差がある場合、推定された雑音信号rは、第1の音声信号から減算される代わりに加算され、単に雑音を増加させるだろう。また雑音測定結果v1、v2、v3において、目標音声でさえ多くのエネルギーが漏洩するため、雑音出力Pyy[f,t]は比較的大きくなるだろう。纏めると、この結果、Prr[f,t]>Pzz[f,t]−CPyy[f,t]となり、1より小さい倍率を得る。また、無相関雑音の場合、雑音は第1の音声信号zから適切に差し引くことができず、その結果、同様に、Prr[f,t]>Pzz[f,t]−CPyy[f,t]となる。
定数Cは、種々の方法で決定されて良い。例えばCは以下のように決定されて良い。
開示されたアルゴリズムに関する要素は、実際には、(全体的に又は部分的に)ハードウェア(例えば、特定用途向けICの部分)又は特定のデジタル信号プロセッサー、汎用プロセッサー等で動作するソフトウェアとして実施されても良い。
コンピュータープログラムは、汎用又は特定用途のプロセッサーに、プロセッサー内部にコマンドを取得するステップを読み込ませた後、発明の特徴的機能を実行させるコマンドの集合の如何なる物理的形態であって良いと見なされる。特にコンピュータープログラムは、例えばディスク又はテープのような記録担体内のデータ、メモリー内のデータ、有線又は無線のネットワーク接続を伝達するデータ、又は紙面上のプログラムコードとして実現されて良い。プログラムコードとは別に、プログラムに必要とされる特徴的なデータもコンピュータープログラムとして実現されて良い。
以上に説明された実施例は、本発明を限定するものではない。請求の範囲に記述されるような本発明の要素の組み合わせと別に、要素の他の組み合わせが可能である。要素の如何なる組み合わせも、単一の専用の要素で実現できる。
請求の範囲に記述された括弧内の如何なる参照符号も、請求の範囲を制限しない。「有する」の語は、請求の範囲に列挙されていない要素又は特長を除外するものではない。単数表記の要素は同要素の複数の存在を除外するものではない。
Claims (13)
- 適応ビームフォーマであって:
第1の適応フィルターのセットの係数が、適応ステップサイズに応じて得られた少なくとも1つの係数に異なる値を加算することにより変化される点で適応型であり、複数のマイクロホンのそれぞれからの入力音声信号を処理するよう構成され、及び前記第1の適応フィルターのセットのそれぞれで前記入力音声信号をフィルターすることにより、目標信号源からの音に主に相当する第1の音声信号を出力するよう構成されたフィルター加算ビームフォーマ;及び
第1の関数として求められる倍率を提供するよう構成される、前記目標信号源から生成され前記第1の音声信号に存在する無雑音音声信号の推定である第1の変数、及び前記第1の音声信号に存在する雑音の推定である第2の変数の比の、倍率決定部
を有し、
前記倍率を用い前記適応ステップサイズの倍率を決定するよう構成される、適応ビームフォーマ。 - サイドローブキャンセラーであって、請求項1記載の適応ビームフォーマを有し、
第2の適応フィルターのセットを用い入力音声信号から得た対応する雑音測定結果をフィルターすることにより推定雑音信号を得るよう構成される適応雑音推定部;及び
前記第1の音声信号から前記推定雑音信号を差し引くよう接続され、雑音除去された第2の音声信号を得る減算部
を更に有するサイドローブキャンセラー。 - 周波数領域で特定された前記第1のフィルターのセットの係数を有し、及び前記比により所定の周波数帯毎に前記適応ステップサイズが決定されるよう構成され、前記比は、
(PZZ[f,t]−CPA(xi)A(xi)[f,t])/PZZ[f,t]であり、
PZZ[f,t]は時刻tにおける周波数f近傍の前記所定の周波数帯の前記第1の音声信号出力の測定結果、PA(xi)A(xi)[f,t]は関数Aによる少なくとも1つの雑音測定結果から雑音推定部により得られた雑音信号出力の測定結果、そしてCは定数である、
請求項1記載の適応ビームフォーマ又は請求項2記載のサイドローブキャンセラー。 - 前記周波数領域で特定される第1のフィルターのセットの係数を有し、及び前記比により所定の周波数帯毎に前記適応ステップサイズが決定されるよう構成され、前記比は、
(PZZ[f,t]−CPA(xi)A(xi)[f,t])/Prr[f,t]であり、
PZZ[f,t]は時刻tにおける周波数f近傍の前記所定の周波数帯の前記第1の音声信号の出力の測定結果、PA(xi)A(xi)[f,t]は関数Aに従う少なくとも1つの雑音測定結果から雑音推定部により得られた雑音信号出力の測定結果、Prr[f,t]は前記第2の音声信号の出力の測定結果、そしてCは定数である、
請求項2記載のサイドローブキャンセラー。 - 前記第1の音声信号に基づきブール型指標である音声/雑音を提供する音声検出部を有し、及び前記指標が音声の場合のみ前記第1のフィルターのセットを適応するよう構成される、
請求項1記載の適応ビームフォーマ。 - 前記第1の音声信号又は前記第2の音声信号に基づきブール型指標である音声/雑音を提供する音声検出部を有し、及び前記指示が音声の場合のみ前記第1のフィルターのセットを適応するよう構成される、
請求項2記載のサイドローブキャンセラー。 - 2進判定関数を前記比に適用するよう構成され、及び前記判定が1の場合のみ前記第1のフィルターのセットを利用するよう構成される、
請求項1記載の適応ビームフォーマ又は請求項2記載のサイドローブキャンセラー。 - ハンズフリー音声通信装置であって、請求項1記載の適応ビームフォーマ又は請求項2記載のサイドローブキャンセラーを有する、ハンズフリー音声通信装置。
- 音声制御装置であって、請求項1記載の適応ビームフォーマ又は請求項2記載のサイドローブキャンセラーを有する、音声制御装置。
- 民生用装置であって、請求項9記載の音声制御装置を有する、民生用装置。
- 追尾装置であって、音声を生成する対象を追尾するよう構成され、請求項1記載の適応ビームフォーマ又は請求項2記載のサイドローブキャンセラーを有する、追尾装置。
- 適応ビームフォーミング方法であって:
ビームフォーマフィルター段階は、第1の適応フィルターのセットの係数は、少なくとも1つの係数を追加することにより、適応ステップサイズに応じて得られる異なる値に変化できるという点で適応型であり、前記第1の適応ビームフォーマフィルターのセットのそれぞれを用い、複数のマイクロホンのそれぞれからの入力音声信号をフィルターし、目標信号源からの音に主に対応する第1の音声信号を生成する、ビームフォーミング段階;
前記目標信号源から生成され前記第1の音声信号に存在する無雑音音声信号の推定である第1の変数及び前記第1の音声信号に存在する雑音の推定である第2の変数の比の倍率である第1の関数を決定する段階;及び
前記倍率を用い前記適応ステップサイズの倍率を決定する段階
を有する、適応ビームフォーミング方法。 - コンピュータープログラムであって、プロセッサーに請求項12記載の各段階を実行させる対応するコードを有する、コンピュータープログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03104334 | 2003-11-24 | ||
PCT/IB2004/052474 WO2005050618A2 (en) | 2003-11-24 | 2004-11-18 | Adaptive beamformer with robustness against uncorrelated noise |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007523514A true JP2007523514A (ja) | 2007-08-16 |
Family
ID=34610126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006540739A Pending JP2007523514A (ja) | 2003-11-24 | 2004-11-18 | 適応ビームフォーマ、サイドローブキャンセラー、方法、装置、及びコンピュータープログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US20070076898A1 (ja) |
EP (1) | EP1692685A2 (ja) |
JP (1) | JP2007523514A (ja) |
KR (1) | KR20060113714A (ja) |
CN (1) | CN101189656A (ja) |
WO (1) | WO2005050618A2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831898A (zh) * | 2012-08-31 | 2012-12-19 | 厦门大学 | 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法 |
JP2014180008A (ja) * | 2008-12-23 | 2014-09-25 | Koninklijke Philips Nv | スピーチ取り込み及びスピーチレンダリング |
JP2017531971A (ja) * | 2014-08-22 | 2017-10-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ビームフォーミングフィルタのためのfirフィルタ係数の算出 |
JP2018142813A (ja) * | 2017-02-27 | 2018-09-13 | パナソニックIpマネジメント株式会社 | 会話支援システム |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101149571B1 (ko) | 2004-04-28 | 2012-05-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 적응성 빔 형성기, 사이드로브 소거기, 핸즈프리 음성 통신 디바이스 |
JP4407538B2 (ja) * | 2005-03-03 | 2010-02-03 | ヤマハ株式会社 | マイクロフォンアレー用信号処理装置およびマイクロフォンアレーシステム |
DE602006019872D1 (ja) * | 2005-07-06 | 2011-03-10 | Koninkl Philips Electronics Nv | |
US8005238B2 (en) * | 2007-03-22 | 2011-08-23 | Microsoft Corporation | Robust adaptive beamforming with enhanced noise suppression |
US8611560B2 (en) | 2007-04-13 | 2013-12-17 | Navisense | Method and device for voice operated control |
US8625819B2 (en) | 2007-04-13 | 2014-01-07 | Personics Holdings, Inc | Method and device for voice operated control |
US11317202B2 (en) | 2007-04-13 | 2022-04-26 | Staton Techiya, Llc | Method and device for voice operated control |
US11217237B2 (en) | 2008-04-14 | 2022-01-04 | Staton Techiya, Llc | Method and device for voice operated control |
EP1986464A1 (en) * | 2007-04-27 | 2008-10-29 | Technische Universiteit Delft | Highly directive endfire loudspeaker array |
US8005237B2 (en) * | 2007-05-17 | 2011-08-23 | Microsoft Corp. | Sensor array beamformer post-processor |
KR101456866B1 (ko) * | 2007-10-12 | 2014-11-03 | 삼성전자주식회사 | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 |
CN101414839A (zh) * | 2007-10-19 | 2009-04-22 | 深圳富泰宏精密工业有限公司 | 便携式电子装置及其使用的噪音消除方法 |
US8812309B2 (en) * | 2008-03-18 | 2014-08-19 | Qualcomm Incorporated | Methods and apparatus for suppressing ambient noise using multiple audio signals |
KR20100003530A (ko) * | 2008-07-01 | 2010-01-11 | 삼성전자주식회사 | 전자기기에서 음성 신호의 잡음 제거 장치 및 방법 |
US9129291B2 (en) | 2008-09-22 | 2015-09-08 | Personics Holdings, Llc | Personalized sound management and method |
KR101547344B1 (ko) | 2008-10-31 | 2015-08-27 | 삼성전자 주식회사 | 음성복원장치 및 그 방법 |
EP2197219B1 (en) | 2008-12-12 | 2012-10-24 | Nuance Communications, Inc. | Method for determining a time delay for time delay compensation |
US8401206B2 (en) * | 2009-01-15 | 2013-03-19 | Microsoft Corporation | Adaptive beamformer using a log domain optimization criterion |
US8249862B1 (en) * | 2009-04-15 | 2012-08-21 | Mediatek Inc. | Audio processing apparatuses |
KR101581885B1 (ko) * | 2009-08-26 | 2016-01-04 | 삼성전자주식회사 | 복소 스펙트럼 잡음 제거 장치 및 방법 |
FR2950461B1 (fr) * | 2009-09-22 | 2011-10-21 | Parrot | Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile |
US8861756B2 (en) | 2010-09-24 | 2014-10-14 | LI Creative Technologies, Inc. | Microphone array system |
US20120082322A1 (en) * | 2010-09-30 | 2012-04-05 | Nxp B.V. | Sound scene manipulation |
FR2976710B1 (fr) * | 2011-06-20 | 2013-07-05 | Parrot | Procede de debruitage pour equipement audio multi-microphones, notamment pour un systeme de telephonie "mains libres" |
US9031259B2 (en) * | 2011-09-15 | 2015-05-12 | JVC Kenwood Corporation | Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US8935164B2 (en) | 2012-05-02 | 2015-01-13 | Gentex Corporation | Non-spatial speech detection system and method of using same |
US9503809B2 (en) * | 2012-08-06 | 2016-11-22 | Mitsubishi Electric Corporation | Beam-forming device |
US9270244B2 (en) | 2013-03-13 | 2016-02-23 | Personics Holdings, Llc | System and method to detect close voice sources and automatically enhance situation awareness |
US9271077B2 (en) | 2013-12-17 | 2016-02-23 | Personics Holdings, Llc | Method and system for directional enhancement of sound using small microphone arrays |
DK2916321T3 (en) * | 2014-03-07 | 2018-01-15 | Oticon As | Processing a noisy audio signal to estimate target and noise spectral variations |
WO2016093855A1 (en) * | 2014-12-12 | 2016-06-16 | Nuance Communications, Inc. | System and method for generating a self-steering beamformer |
WO2016093854A1 (en) | 2014-12-12 | 2016-06-16 | Nuance Communications, Inc. | System and method for speech enhancement using a coherent to diffuse sound ratio |
US10405082B2 (en) | 2017-10-23 | 2019-09-03 | Staton Techiya, Llc | Automatic keyword pass-through system |
US10418048B1 (en) * | 2018-04-30 | 2019-09-17 | Cirrus Logic, Inc. | Noise reference estimation for noise reduction |
CN112513976A (zh) * | 2018-05-16 | 2021-03-16 | 多特瑞尔技术有限公司 | 用于音频捕获的系统和方法 |
CN109557187A (zh) * | 2018-11-07 | 2019-04-02 | 中国船舶工业系统工程研究院 | 一种测量声学系数的方法 |
US11195540B2 (en) * | 2019-01-28 | 2021-12-07 | Cirrus Logic, Inc. | Methods and apparatus for an adaptive blocking matrix |
US11546691B2 (en) * | 2020-06-04 | 2023-01-03 | Northwestern Polytechnical University | Binaural beamforming microphone array |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5353376A (en) * | 1992-03-20 | 1994-10-04 | Texas Instruments Incorporated | System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment |
US5737431A (en) * | 1995-03-07 | 1998-04-07 | Brown University Research Foundation | Methods and apparatus for source location estimation from microphone-array time-delay estimates |
JP3216704B2 (ja) * | 1997-08-01 | 2001-10-09 | 日本電気株式会社 | 適応アレイ装置 |
US6363345B1 (en) * | 1999-02-18 | 2002-03-26 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
US6449593B1 (en) * | 2000-01-13 | 2002-09-10 | Nokia Mobile Phones Ltd. | Method and system for tracking human speakers |
EP1290912B1 (en) * | 2000-05-26 | 2005-02-02 | Koninklijke Philips Electronics N.V. | Method for noise suppression in an adaptive beamformer |
US20030027600A1 (en) * | 2001-05-09 | 2003-02-06 | Leonid Krasny | Microphone antenna array using voice activity detection |
US6937980B2 (en) * | 2001-10-02 | 2005-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech recognition using microphone antenna array |
US7099822B2 (en) * | 2002-12-10 | 2006-08-29 | Liberato Technologies, Inc. | System and method for noise reduction having first and second adaptive filters responsive to a stored vector |
-
2004
- 2004-11-18 EP EP04799186A patent/EP1692685A2/en not_active Withdrawn
- 2004-11-18 KR KR1020067010036A patent/KR20060113714A/ko not_active Application Discontinuation
- 2004-11-18 US US10/579,928 patent/US20070076898A1/en not_active Abandoned
- 2004-11-18 JP JP2006540739A patent/JP2007523514A/ja active Pending
- 2004-11-18 WO PCT/IB2004/052474 patent/WO2005050618A2/en not_active Application Discontinuation
- 2004-11-18 CN CNA2004800345675A patent/CN101189656A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014180008A (ja) * | 2008-12-23 | 2014-09-25 | Koninklijke Philips Nv | スピーチ取り込み及びスピーチレンダリング |
CN102831898A (zh) * | 2012-08-31 | 2012-12-19 | 厦门大学 | 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法 |
CN102831898B (zh) * | 2012-08-31 | 2013-11-13 | 厦门大学 | 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法 |
JP2017531971A (ja) * | 2014-08-22 | 2017-10-26 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ビームフォーミングフィルタのためのfirフィルタ係数の算出 |
US10419849B2 (en) | 2014-08-22 | 2019-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | FIR filter coefficient calculation for beam-forming filters |
JP2018142813A (ja) * | 2017-02-27 | 2018-09-13 | パナソニックIpマネジメント株式会社 | 会話支援システム |
Also Published As
Publication number | Publication date |
---|---|
KR20060113714A (ko) | 2006-11-02 |
CN101189656A (zh) | 2008-05-28 |
WO2005050618A2 (en) | 2005-06-02 |
EP1692685A2 (en) | 2006-08-23 |
US20070076898A1 (en) | 2007-04-05 |
WO2005050618A3 (en) | 2008-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007523514A (ja) | 適応ビームフォーマ、サイドローブキャンセラー、方法、装置、及びコンピュータープログラム | |
JP5762956B2 (ja) | ヌル処理雑音除去を利用した雑音抑制を提供するシステム及び方法 | |
US20200374628A1 (en) | Robust Estimation of Sound Source Localization | |
US8958572B1 (en) | Adaptive noise cancellation for multi-microphone systems | |
KR101149571B1 (ko) | 적응성 빔 형성기, 사이드로브 소거기, 핸즈프리 음성 통신 디바이스 | |
US10827263B2 (en) | Adaptive beamforming | |
JP6703525B2 (ja) | 音源を強調するための方法及び機器 | |
KR101449433B1 (ko) | 마이크로폰을 통해 입력된 사운드 신호로부터 잡음을제거하는 방법 및 장치 | |
US9558755B1 (en) | Noise suppression assisted automatic speech recognition | |
US9438992B2 (en) | Multi-microphone robust noise suppression | |
US8180067B2 (en) | System for selectively extracting components of an audio input signal | |
US8682006B1 (en) | Noise suppression based on null coherence | |
US20070038442A1 (en) | Separation of target acoustic signals in a multi-transducer arrangement | |
US8761410B1 (en) | Systems and methods for multi-channel dereverberation | |
JP2004187283A (ja) | マイクロホン装置および再生装置 | |
US9378754B1 (en) | Adaptive spatial classifier for multi-microphone systems | |
BR112015014380B1 (pt) | Filtro e método para filtragem espacial informada utilizando múltiplas estimativas da direção de chegada instantânea | |
CN111078185A (zh) | 录制声音的方法及设备 | |
US9330677B2 (en) | Method and apparatus for generating a noise reduced audio signal using a microphone array | |
Thiergart et al. | An informed MMSE filter based on multiple instantaneous direction-of-arrival estimates | |
WO2022256577A1 (en) | A method of speech enhancement and a mobile computing device implementing the method | |
US20190035382A1 (en) | Adaptive post filtering | |
US10366701B1 (en) | Adaptive multi-microphone beamforming | |
Garre et al. | An Acoustic Echo Cancellation System based on Adaptive Algorithm | |
CN110858485A (zh) | 语音增强方法、装置、设备及存储介质 |