JP2006319925A - 適応フィルタ - Google Patents

適応フィルタ Download PDF

Info

Publication number
JP2006319925A
JP2006319925A JP2005143289A JP2005143289A JP2006319925A JP 2006319925 A JP2006319925 A JP 2006319925A JP 2005143289 A JP2005143289 A JP 2005143289A JP 2005143289 A JP2005143289 A JP 2005143289A JP 2006319925 A JP2006319925 A JP 2006319925A
Authority
JP
Japan
Prior art keywords
adaptive
signal
filter
adaptive filter
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005143289A
Other languages
English (en)
Other versions
JP2006319925A5 (ja
JP4581114B2 (ja
Inventor
Herbordt Wolfgang
ウォルフガング・ヘルボート
Satoru Nakamura
哲 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2005143289A priority Critical patent/JP4581114B2/ja
Publication of JP2006319925A publication Critical patent/JP2006319925A/ja
Publication of JP2006319925A5 publication Critical patent/JP2006319925A5/ja
Application granted granted Critical
Publication of JP4581114B2 publication Critical patent/JP4581114B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

【課題】高速な収束、簡略な計算、高いトラッキング能力、十分に低い遅延を周波数領域ごとのステップサイズ制御と共に実現できる適応フィルタを提供する。
【解決手段】適応フィルタ80は、入力信号x(k)を受けるための適応係数行列W(k)を持つFIRフィルタ90と、参照信号yref(k)とFIRフィルタ90の出力y(k)とに基づいて誤差信号e(k)を計算する減算器98と、各々DFT領域区分に変換された信号x(k)及びe(k)に応答して、かつ誤差信号e(k)の確率密度分布に基づいて、行列W(k)を更新する係数更新モジュール94と、各DFT領域区分について、入力信号x(k)に干渉とノイズがあるときのみ行列W(k)を更新し、入力信号x(k)中に所望の信号があるときには更新を凍結するようにモジュール94を適応的に制御するダブルトーク検出器96とを含む。
【選択図】 図3

Description

この発明は、一般に、適応的ビーム形成によりノイズを削減する技術に関し、特に、適応的フィルタリングを異常値に対し頑健となるように改良する方法に関する。
自然で快適なマン/マシンインタラクションに対する要求が高まりつつある。そのために、マルチメディアまたは遠距離通信サービスのためのどのような端末においても、その音響に関するインターフェースは、シームレスで両手が自由に使えるような音による通信を可能にするものであることが求められている。しかも、それは乗用車の車中、会社、家庭または公共の場所のようなさまざまな音響環境で求められている。典型的な応用としては、オーディオ/ビデオ会議、対話システム、コンピュータゲーム、管制制御インターフェース、ディクテーションシステム、及び高品質の音声記録等がある。
所望の音源の近傍に置いたマイクロフォンを用いた音声及び音響採取に比べて、シームレスな音響インターフェースでは、所望の音源信号が残響によって損なわれる。これは反射のある音響環境、局部的干渉及びノイズと、ラウドスピーカからの音響エコーとによるものである。これらの干渉は聴く人にとって不快なばかりでなく、より重要なことだが、例えば音声認識にかかわる場合に有害である。基準となるラウドスピーカ信号が利用可能である場合は、常にアコースティックエコーキャンセレーションが望ましい。というのも、アコースティックエコーキャンセレーションはこのような干渉を最大限に抑制するからである。
局部的干渉及びノイズを抑制するためには、ビーム形成マイクロフォンアレイが非常に効果的である。なぜなら、これらは空間−時間フィルタリングによって干渉及びノイズを抑制する一方で、時間フィルタリングに基づく単一チャネル音声高品質化とは対照的に、所望の信号の歪を生じさせないからである。この場合、適応的な、データ依存のビーム形成器が最適の選択であると思われる。なぜなら、これらは所望の信号と干渉との特性を考慮して、干渉とノイズの抑制を最大とするからである。
適応的ビーム形成では、干渉とノイズの抑制は通常、マイクロフォンチャネルの各々に適応フィルタを置き、適応フィルタの出力信号の和をとることで行なわれる。ここで、適応フィルタは、干渉とノイズとの抑制を最大としながら所望の信号の歪が最小となるように最適化される。所望の信号の歪は通常、線形制約(「線形制約された最小分散」(lineraly−constrained minimum variance:LCMV)ビーム形成または「線形制約された最小二乗誤差」(linearly−constrained least−square error)ビーム形成)によって、または基準となる所望の信号(「最小平均二乗誤差」(Minimum mean−square error:MMSE)ビーム形成または「最小二乗誤差」(Least square error:LSE)ビーム形成)を用いることによって制御される。
干渉とノイズの抑制を最大としながら所望の信号の歪が最小となるようにするためには、しばしば、「所望信号のみ」、「干渉及びノイズのみ」、並びに「ダブルトーク」(所望信号と、干渉及びノイズ等の外乱との両者を含む)といった分類器が必要とされる。適応フィルタは、適応ビーム形成器による所望信号のキャンセレーションを防ぐために、干渉及びノイズのみが存在する場合に干渉とノイズとの抑制を最大にするよう適応化されなければならない。
適応ビームフィルタの中には、所望の信号が存在するときのみ、適応フィルタによって所望の信号の予め定められた二次統計を黙示的に推定することによって、所望の信号の歪を最小化するものがある(非特許文献1)。このような分類器では通常、誤った分類の発生が避けられないので、適応フィルタの適応処理がダブルトークの間に起こってしまい、このため適応ビーム形成器の性能が落ちる。この問題の解決策の一つは、適応アルゴリズムのステップサイズを小さく選択することである。しかしながら、適応ステップサイズを小さくすると、収束速さが遅くなり、これは時間による変動の大きい音響環境では特に不利である。このため、一方で十分に速い適応を、他方で誤った分類器によって引起される摂動に対抗する能力を、同時に達成することはしばしば困難である。この、摂動に対抗する能力を、ここでは「頑健性」と呼ぶ。
アコースティックエコーキャンセレーションに関して、非特許文献2では、局部的な話者の存在によるダブルトークバーストに対する頑健性の必要が指摘され、適応のために誤差信号の非線形関数を用いることでこれに対処している。非特許文献3では、残存するエコー信号に対する汚染されたガウスモデルを用いて、サブバンド適応フィルタリングに頑健な統計(非特許文献16)を導入することにより、サブバンドエコーキャンセラのためのダブルトークバーストに対する頑健性が得られる。非特許文献4では、頑健な統計の概念を用いて、正規化された最小平均二乗(normalized least−mean−squares:NLMS)アルゴリズム、比例NLMS(Proportional NLMS:PNLMS)アルゴリズム、及びアフィン投影アルゴリズム(affine projection algorithm:APA)の、ダブルトークに対し頑健なものを導出している。非特許文献5では頑健な再帰的最小二乗(recursive least−square:RLS)アルゴリズムが導出され、特許文献1ではこれが特許されている。
J.ベネツィ及びT.F.ゲンズラー、「音響及びネットワークキャンセレーションでの使用のための頑健な適応フィルタ」、欧州特許、EP1170864A1,2002年1月(J. Benesty and T.F. Gaensler. A robust adaptive filter for use in acoustic and network cancellation. European Patent, EP1170864A1, January 2002.) O.ホシュヤマ、A.スギヤマ、及びA.ヒラノ、「制約適応フィルタを用いたブロッキング行列を備えたマイクロフォンアレイのための頑健な適応ビーム形成器」、IEEE信号処理トランザクション、47(10):2677−2684、1999年10月(O. Hoshuyama, A. Sugiyama, and A. Hirano. A robust adaptive beamformer for microphone arrays with a blocking matrix using constrained adaptive filters. IEEE Trans. on Signal Processing, 47(10):2677-2684, October 1999.) M.M.ソンディ、「適応エコーキャンセラ」、ベルシステム技術ジャーナル、XLVI(3):497−510、1967年3月(M.M. Sondhi. An adaptive echo canceller. The Bell System Technical Journal, XLVI(3):497-510, March 1967) T.ゲンズラー、「ダブルトークに耐性のあるサブバンドエコーキャンセラ」、信号処理、65(1):89−101、1998年2月(T. Gaensler. A double-talk resistant subband echo canceller. Signal Processing, 65(1):89-101, February 1998) T.ゲンズラー、S.L.ゲイ、M.M.ソンディ及びJ.ベネツィ、「ネットワークエコーキャンセレーションのためのダブルトークに頑健な高速収束アルゴリズム」、IEEE音声及び音響処理トランザクション、8(6):656−663、2000年11月(T. Gaensler, S.L. Gay, M.M. Sondhi, and J. Benesty. Double-talk robust fast converging algorithms for network echo cancellation. IEEE Trans. on Speech and Audio Processing, 8(6):656-663, November 2000.) J.ベネツィ及びT.ゲンズラー、「頑健で高速収束する最小二乗適応アルゴリズム」、IEEE音響、音声及び信号処理国際会議予稿集、6:3785−3788、2001年5月(J. Benesty and T. Gaensler. A robust fast converging least-squares adaptive algorithm. Proceedings of. IEEE International. Conference on Acoustics, Speech, and Signal Processing, 6:3785-3788, May 2001) J.J.シンク、「周波数ドメイン及びマルチレート適応フィルタリング」、IEEE信号処理マガジン、14−37ページ、1992年1月(J.J. Shynk. Frequency-domain and multirate adaptive filtering. IEEE Signal Processing Magazine, pages 14-37, January 1992.) J.−S.スー及びK.K.パン、「マルチディレイブロック周波数ドメイン適応フィルタ」、IEEE音響、音声、及び信号処理トランザクション、38(2):373−376、1990年2月(J.-S. Soo and K.K. Pang. Multidelay block frequency domain adaptive filter. IEEE Trans. on Acoustics, Speech, and Signal Processing, 38(2):373-376, February 1990.) J.ベネツィ及びD.R.モルガン、「マルチチャネル周波数ドメイン適応フィルタリング」、S.L.ゲイ及びJ.ベネツィ編、遠距離通信のための音響信号処理、第7章、121−133ページ、クルワー学術出版、ボストン、MA、2000年(J. Benesty and D.R. Morgan. Multi-channel frequency-domain adaptive filtering. In S.L. Gay and J. Benesty, editors, Acoustic Signal Processing for Telecommunication, chapter 7, pages 121-133. Kluwer Academic Publishers, Boston, MA, 2000.) H.ブフナー、J.ベネツィ及びW.ケラーマン、「マルチチャネル周波数ドメイン適応フィルタリングとマルチチャネルアコースティックエコーキャンセレーションへの応用」、J.ベネツィ及びY.ファン編、適応信号処理:実世界の問題への応用、スプリンガー、ベルリン、2003年(H. Buchner, J. Benesty, and W. Kellermann. Multichannel frequency-domain adaptive filtering with application to multichannel acoustic echo cancellation. In J. Benesty and Y. Huang, editors, Adaptive Signal Processing: Applications to Real-World Problems. Springer, Berlin, 2003.) B.H.ニッチ、「周波数ドメインで動作する適応フィルタアルゴリズムのための周波数選択的なステップの大きさ制御」、信号処理、80(9):1733−1745、2000年9月(B. H. Nitsch. A frequency-selective stepfactor control for an adaptive filter algorithm working in the frequency domain. Signal Processing, 80(9):1733-1745, September 2000) W.ハーボート、「マン/マシンインターフェースのための音声キャプチャ」、マイクロフォンアレイ信号処理の実際的局面、スプリンガー、ハイデルベルク、ドイツ、2005年(W. Herbordt. Sound capture for human/machine interfaces: Practical aspects of microphone array signal processing. Springer, Heidelberg, Germany, 2005.) H.ブフナー、J.ベネツィ、T.ゲンズラー及びW.ケラーマン、「アコースティックエコーキャンセレーションへの応用を伴う異常値に頑健な拡大マルチディレイフィルタ」、音響エコー及びノイズ制御に関する国際ワークショップ、2003年9月(H. Buchner, J. Benesty, T. Gaensler, and W. Kellermann. An outlier robust extended multidelay filter with application to acoustic echo cancellation. Int. Workshop on Acoustic Echo and Noise Control, September 2003.) R.マーチン、「マルチチャネルエコー補償と雑音低減を伴う自由音声メカニズム」、博士論文、アーヘン情報処理データ通信研究所、1995年(R. Martin. Freisprecheinrichtungen mit mehrkanaliger Echokompensation und Stoergeraeuschreduktion. PhD thesis, Aachener Institut fuer Nachrichtengeraete und Datenkommunikation, 1995.) W.ケラーマン、「ビーム形成マイクロフォンアレイのためのアコースティックエコーキャンセレーション」、M.S.ブランドシュタイン及びD.B.ワード編、マイクロフォンアレイ:信号処理技術と応用、第13章、281−306ページ、スプリンガー、ベルリン、2001年(W. Kellermann. Acoustic echo cancellation for beamforming microphone arrays. In M.S. Brandstein and D.B. Ward, editors, Microphone Arrays: Signal Processing Techniques and Applications, chapter 13, pages 281-306. Springer, Berlin, 2001) W.ハーボート、W.ケラーマン及びS.ナカムラ、「LCMVビーム形成とアコースティックエコーキャンセレーションの組合せ最適化」、EURASIPヨーロッパ信号処理会議、予稿集、2004年(W. Herbordt, W. Kellermann, and S. Nakamura. Combined optimization of LCMV beamforming and acoustic echo cancellation. Proc. EURASIP European Signal Processing Conference, 2004.) P.J.ヒューバー、「頑健な統計」、ワイリー、ニューヨーク、1981年(P.J. Huber. Robust Statistics. Wiley, New York, 1981) W.ハーボート、「アコースティックマン/マシンフロントエンドのための頑健な適応ビーム形成とアコースティックエコーキャンセレーションとの組合せ」、博士論文、エルランゲンーニュルンベルク大学、ドイツ、2004年(W. Herbordt. Combination of robust adaptive beamforming with acoustic echo cancellation for acoustic human/machine front-ends. PhD thesis, University Erlangen-Nuremberg, Germany, 2004) L.J.グリフィス及びC.W.ジム、「線形制約された適応ビーム形成への代替的アプローチ」、IEEEアンテナ及び伝播トランザクション、30(1):27−34、1982年1月(L.J. Griffiths and C.W. Jim. An alternative approach to linearly constrained adaptive beamforming. IEEE Trans. on Antennas and Propagation, 30(1): 27-34, January 1982.) S.M.ケイ、「統計的信号処理の基礎:推定理論」、プレンティスホール、アッパーサドルリバー、NJ、1993年(S.M. Kay. Fundamentals of Statistical Signal Processing: Estimation Theory. Prentice Hall, Upper Saddle River, NJ, 1993.)
近年、DFTドメイン適応アルゴリズム(「周波数ドメイン適応フィルタ」(frequency domain adaptive filters:FDAF))(非特許文献6)がアコースティックエコーキャンセレーション及び適応ビーム形成に関し非常に関心を集めている。なぜなら、これらは(a)高速な収束と計算の簡略さとを組合せ、かつ(b)多くの応用において、十分に速いトラッキング能力と十分に低い遅延とが得られるように(非特許文献7)実現できるからである。
FDAFはマルチチャネル(MC)の場合に良好に一般化できる(MC−FDAF)(非特許文献8,9)。RLSアルゴリズムでは、収束速さは入力信号の相互相関行列の条件数から独立である。これは、高速の収束を確実にするためには、高度に自己相関のある及び相互相関のある入力信号(例えば、音声又は音楽)の場合に特に重要である。加えて、アコースティックエコーキャンセレーション又は適応ビーム形成器をDFTドメインで実現することは、DFTの領域区分ごとの適応化を可能にする。これは、時間−周波数ドメインでスパースな信号について特に有利である。なぜなら、適応アルゴリズムのステップサイズを各DFT領域区分ごとに個々に調節できるからである。これは、適応フィルタのより頻繁な適応とより速い収束とにつながり、特に色付の、時間によって変化するスペクトルを伴う信号で大いに干渉を抑制することになる(非特許文献10,11)。
このクラスのアルゴリズムの頑健性を改善するために、非特許文献12において、頑健な統計と非線形最小二乗誤差(LSE)基準とに基づいて、頑健なDFTドメインの適応フィルタが導出され、アコースティックエコーキャンセレーションに適用されている。各サブバンドに非線形コスト関数が適用され(「狭帯域分解」)各サブバンドの誤差信号が個々に最小化されるサブバンド頑健適応フィルタ(非特許文献3)とは対照的に、非特許文献12では離散的な時間ドメインで全帯域の誤差信号を最小化する。しかしながら、時間ドメインの最適化基準のため、非特許文献12をDFTの領域区分ごとのステップサイズ制御と組合わせて用いることはできない。
従って、この発明の目的の一つは、高速な収束と計算の簡略さ、さらに高いトラッキング能力と十分に低い遅延とを、周波数領域区分ごとのステップサイズ制御と組合わせて提供することのできる、適応フィルタを提供することである。
異常値に対し頑健な多入力多出力(multiple−input multiple−output:MIMO)周波数ドメイン適応アルゴリズムのコスト関数は、適応処理の基礎となる誤差信号の予め定められた非ガウス確率密度関数と最大尤度推定原理とを用いて導出できることがわかっている。これらのコスト関数を定式化することで、適応ビーム形成器又はアコースティックエコーキャンセレーションと組合せた適応ビーム形成器の、周波数領域区分ごとの適応が可能となる。予め定められた確率密度関数は、通常はガウス分布よりも分布の裾部分が厚くなる(または尖度が大きい)スーパーガウスである。
具体的には、この発明は、適応ビーム形成及び結合適応ビーム形成並びにアコースティックエコーキャンセレーションに適用される、MIMO適応フィルタと適応フィルタリングアルゴリズムとを提供する。MIMO適応フィルタは、適応フィルタ係数の行列と係数行列を適応的に更新するためのモジュールとからなり、誤差信号の統計を活用することにより、予め定められた最適化基準を用いて誤差信号を最小化する。誤差信号は、有利には非ガウス確率密度分布を有し、異常値に対し適応アルゴリズムの頑健性を提供する。適応フィルタの適応処理は、より頻繁な係数の更新のため、入力信号のスパースネスを活用できる変換ドメインで行なわれる。
特に、確率密度分布は以下で与えられ、
Figure 2006319925
ここでε∈[0,1]は非特許文献16で与えられる異常値確率であり、定数k0はεに依存し、
Figure 2006319925
となるように選ばれる。
従って、この発明によれば、適応フィルタは、適応係数のベクトルを有し、複数の入力信号を受けるように接続された有限インパルス応答フィルタと、参照信号とFIRフィルタの出力とに基づいて、誤差信号を計算するための手段と、各々が複数のDFT領域区分に変換された入力信号及び誤差信号に応答して、かつ誤差信号の予め定められた確率密度分布に基づいて、適応係数からなる適応係数ベクトルを更新するための手段と、各々がDFT領域区分に変換された入力信号及び参照信号に基づいて、各DFT区分領域について、外乱が存在しないときに係数ベクトルを更新するように、更新するための手段を適応的に制御するための手段とを含む。
予め定められた確率密度分布は非ガウス確率密度分布であってもよい。
好ましくは、非ガウス確率密度分布は以下の式で与えられ
Figure 2006319925
ここでε∈[0,1]は入力信号の異常値であり、定数k0はεに依存し、
Figure 2006319925
であるように選ばれる。
さらに好ましくは、FIRフィルタは複数の出力経路を有し、さらに入力信号と出力経路との組合せの各々について係数ベクトルを含む係数行列を有し、誤差信号を計算するための手段は、参照信号とFIRフィルタの出力とに基づいて、入力信号と出力信号との組合せの各々について誤差信号を計算するための手段を含み、更新するための手段は、各々がDFT領域区分に変換された入力信号及び誤差信号に応答して、かつ誤差信号の各々の予め定められた確率密度分布に基づいて、適応係数の適応係数行列を更新するための手段を含む。
最も好ましくは、更新するための手段は、マルチチャネルの、領域区分ごとの頑健なMC−BRFDAFアルゴリズムを用いて係数ベクトルを更新するための手段を含む。
1.始めに
以下の説明では、DFTの領域区分ごとのステップサイズ制御をダブルトークに頑健なアルゴリズムで用いることができるように、DFTドメインでLSEコスト関数を用いる、ダブルトークに対し柔軟性のあるDFTドメイン適応フィルタを導出する。この技術をMIMOシステムに適用するため、マルチチャネルの場合のこのアルゴリズムを定式化し、これを、マルチチャネル領域区分ごとの頑健FDAF(MC−BRFDAF)と呼ぶ(セクション2)。簡潔のため、制約のない場合のみを考察する。導出法は非特許文献8,9,12と同様である。
その後、MC−BRFDAFを、マイクロフォンアレイを用いたマルチチャネル音声高品質化のための適応ビーム形成に適用する(セクション3)。非特許文献17では、適応ブロッキング行列(非特許文献1)を用いた「一般化サイドローブキャンセラ」(generalized sidelobe canceller:GSC)(非特許文献18)の例をあげて、DFTドメイン適応フィルタリングが適応ビーム形成に効果的に適用できること、及び特に所望の音声信号のスパースネスが、ブロッキング行列の適応的実現を用いたGSCのトラッキング問題を解決する助けとなることを示す。これらのDFTドメインのGSCは、残響に対する頑健性とセンサの物理的許容度、又は所望の信号又は干渉の時間変化といった、ビーム形成マイクロフォンアレイが直面する課題に特に効率的に対処する。この出願では、MC−BRFDAFを用いたGSCの実験で、スケールの小さいマイクロフォンアレイであっても、MC−FDAFを用いたGSCに対しダブルトークに対する頑健性が大いに改善され、このため、適応のためにより大きなステップサイズを選ぶことができるとわかった。これはより高速な収束とより高いノイズ削減につながり、一方で、ビーム形成器の出力信号の良好な品質が保たれた。
2.ダブルトークに柔軟性のある周波数ドメイン適応フィルタ
このセクションでは、線形多入力単一出力(Multiple−input single−output:MISO)フィルタのために、MC−BRFDAFを定式化した。MIMOの場合への一般化はこのセクションの最後にまとめる。導出法は非特許文献8,9,12と同様である。
数式においては、小文字と大文字の太字はそれぞれ、ベクトルと行列の数量を表す。(・)*、(・)T、及び(・)Hはそれぞれ、複素共役、行列又はベクトル転置、及び共役転置を表す。下線を引いた数量はDFTドメインの変数を示す。kはディスクリートな時間指標である。なお、下線は明細書中では変数前のアンダースコアで示し、ベクトル行列等は名前で区別する。
2.1 重複回避を用いた出力信号の計算
Q個の入力チャネルを備えた適応MIMOシステムの出力信号ベクトルe(k)は以下で与えられる。
Figure 2006319925
ここで、yref(k)は参照信号である。MISOフィルタはQN×1ベクトルw(k)で記載され、これは長さNのQ個の列ベクトルwq(k)をフィルタ係数wn,q(k),n=0,1,…,N−1で表わす。
Figure 2006319925
適応フィルタの入力信号は、QN×1ベクトルx(k)で表わされる。
Figure 2006319925
MISOシステムの出力信号をDFTドメインで高速畳込みを用いて計算し、かつ重複を回避するために、誤差信号ベクトルe(k)のN個のサンプルのブロックを以下のように形成する。
Figure 2006319925
ブロック重複ファクタとしてα=N/Rを定義する。ここで、Rはブロックごとのサンプルの「新しい」数であり、式(6)において、ディスクリートな時間kをブロック時間rと置換える。rはrR=kによってkと関連付けられる。こうして、データ行列X(rR)を、サイズ2N×2NのDFT行列F2N×2Nを用いて、DFTドメインにおいてサイズ2NQ×2Nのブロック対角行列X(r)に変換する。
Figure 2006319925
ここでw(rR)はDFTドメインで以下のように書くことができる。
Figure 2006319925
ここで、窓行列
Figure 2006319925
は、循環畳込みを回避するために、係数ベクトルwq(rR)にN個のゼロを付加する。IN×NはサイズN×Nの恒等行列であり、0N×NはサイズN×Nのゼロの行列である。式(6)から以下を得る。
Figure 2006319925
ここで、窓行列
Figure 2006319925
は、
Figure 2006319925
からN個のサンプルを抽出する。適応フィルタの出力信号のR個のサンプルのブロックは、ベクトルe(rR)の最後のR個のサンプルから与えられる。
2.2 最適化基準
最適化基準を定式化するために、式(14)に左から
Figure 2006319925
を乗算することによって、ブロック誤差ベクトルe(rR)をDFTドメインに変換する。ここで
Figure 2006319925
である(非特許文献8)。よって以下が得られる。
Figure 2006319925
ベクトル_e(r)の要素を_en(r),n=0,1,…,2N−1で示す。
非特許文献3,4,12にならって、参照信号に対しパーセバルの理論を適用し、DFTドメインのコスト関数ξ(r)を以下のように定義した。
Figure 2006319925
パラメータk0は定数である。|_en(r)|のスケールは一般に未知であるので、ρ(・)をスケール不変とするために、式(20)に変数s(r)を導入した(非特許文献16)。これはシステム出力での残存ノイズレベルを反映するものでなければならない(非特許文献3,4)。式(20)は、|en(r)|/sn(r)≦k0に対して、各DFTドメイン内の二次誤差面のあるLSE基準(非特許文献8)と対応し、一方、|en(r)|/sn(r)>k0に対しては、二次基準が1−ノルム基準に置換わることが理解されるであろう。ρ(・)をこのように選択することにより、推定器を異常値に対し柔軟にすることができる。というのも、二次コスト関数に対し、|en(r)|/sn(r)≦k0については勾配
Figure 2006319925
が減じられるからである。k0の選択は、収束速さと頑健性とのトレードオフになる。なぜなら、アルゴリズムの頑健性は収束速さが遅くなることを代償に、k0とともに増加するからである。MC−FDAF(非特許文献8)は、
Figure 2006319925
で、またはこれと等価に、
Figure 2006319925
で得られる。
2.3 適応アルゴリズム
コスト関数(20)は、以下の形の反復ニュートンアルゴリズム(非特許文献19)を用いて、ベクトル_w(r)に対して最小化される。
Figure 2006319925
ベクトルμ(r)はステップサイズがベクトルμn(r),n=0,1,…,2N−1でサイズが2N×2Nの、主たる対角上の対角行列であって、周波数領域区分での適応を個別に制御するためのものである。DFTドメインのニュートンステップ(22)は、非特許文献5におけるディスクリートな時間ドメインのニュートンステップと類似しており、非特許文献12におけるDFTドメインのニュートンステップの、領域区分ごとの動作への拡張である。
1)コスト関数の勾配
非特許文献12に従って、
Figure 2006319925
連鎖法則を用いて、勾配∇ξ(r)は以下のように求められる。
Figure 2006319925
式(24)は長さ2Nの列ベクトル
Figure 2006319925
を用いて、次のように書くことができる。
Figure 2006319925
2)コスト関数のヘシアン
サイズ2N×2Nのヘシアン行列∇2ξ(r)は、式(29)から、以下を用いて計算することができる。
Figure 2006319925
式(28)において、ベクトル_Ψ(r)のn番目の要素をΨn(r)と示すことにより、連鎖法則を適用することによって、以下のように、式(30)中のn番目の要素
Figure 2006319925
を計算することができる。
Figure 2006319925
ここで、
Figure 2006319925
式(31)に、式(25)、(26)、(32)及び(33)を代入することにより、以下が得られる。
Figure 2006319925
主たる対角線上に、γn(r),n=0,1,…,2N−1を並べて2N×2Nの対角行列_Γ(r)を形成することにより、
Figure 2006319925
となり、式(27)と(34)とを式(30)に代入することにより、
Figure 2006319925
となる。
期待値行列_Λ(r)=Ε{∇2ξ(r)}の推定は、忘却係数0<λ<1で∇2ξ(r)の再帰的平均を取ることで、以下のように求められる(非特許文献5,12)。
Figure 2006319925
このように行列_Λ(r)を再帰的に推定することで、
Figure 2006319925
に関し、RLSのような特性を備えたMC−FDAFが得られる。(式(42)を参照)。
3)近似
ニュートン型の適応ステップ(22)は2NQ×2NQの行列∇2ξ(r)の逆行列を必要とするので、実際的なシステムには、計算の複雑さを減じるために式(36)の近似が必要であろう。非特許文献8及び非特許文献9に従って、十分に大きいNについて
Figure 2006319925
と近似することができ、これによって、次の式が得られる。
Figure 2006319925
式(37)を用いて
Figure 2006319925
を計算するために、∇2ξ(r)のブロック対角行列構造を用いて、2NQ×2NQの行列∇2ξ(r)を、サイズQ×Qの2N個の行列に変換することができる。これにより、2NQ×2NQの逆行列の複雑さをサイズQ×Qの2N行列に減じることができる(非特許文献9)。
MISOシステムの適応アルゴリズムは、最終的に式(17)、(22)、(29)、(37)及び(38)で与えられる。適応アルゴリズムの、Q個の入力チャネルとP個の出力チャネルとを備えたMIMOシステムへの一般化
Figure 2006319925
は、このアルゴリズムをP個の出力チャネルの全てについて繰返すという、直截的なものである。要約すれば、適応アルゴリズムの一回の反復は、MIMOの場合について以下のように表せる。
Figure 2006319925
MC−FDAFとは対照的に、行列_Γp(r)への依存性のために、P個の出力チャネルの全てについて重み付クロスパワースペクトル密度行列
Figure 2006319925
の逆行列を計算しなければならない。MC−FDAFは、
Figure 2006319925
と、
Figure 2006319925
とについて得られる。非特許文献10、式(29)に加えて、更新の式(42)により、領域区分に依存したステップサイズベクトルμn(r)と領域区分に依存したスケールパラメータsn(r)とで、領域区分ごとの動作が可能となることが注目される。さらに、DFTドメイン(20)でのコスト関数に基づく導出は、アルゴリズムの効率的な実現を得るために、行列_Γ(r)と等価である重み付行列の近似(非特許文献10、式(31))を必要としない。
3 MIMO適応フィルタの実施例
3.1 MIMO適応フィルタの概観
図1はM個の入力チャネル22とP個の出力チャネル24とを備えた線形有限インパルス応答(FIR)MIMOフィルタ20の構造を示し、ここで各入出力間のFIRフィルタ30はベクトルwm,p(k)で表わされる。各入力チャネルと各出力チャネル間のFIRフィルタ30はベクトルW(k)で表わされる。システムW(k)はM個の入力信号xm(k)で駆動され、これらは行列X(k)で表わされて加算器32、34、…36によって加算される。MIMOシステムの出力信号はy(k)24で表される。
適応MIMOフィルタリングでは、システムW(k)は図2に示される構造を用いて最適化される。図2を参照して、適応線形MIMOフィルタ50は、入力信号x(k)52を受け信号y(k)を出力するFIRフィルタ60と、外乱と組合わされた参照信号yref(k)から信号y(k)を減算して誤差信号e(k)54を出すための減算器66と、入力信号x(k)52と誤差信号e(k)54とを用いて、ある所与の最適化基準に従ってW(k)を決定するためにコスト関数を定式化するための係数更新モジュール62と、入力信号x(k)52及び参照信号yref(k)を用いてダブルトークを検出し、係数更新モジュール62の更新を制御するダブルトーク検出器64とを含む。
MIMOフィルタ60の出力信号y(k)は減算器66で参照信号yref(k)から減算され、この結果誤差信号e(k)54が得られる。誤差信号e(k)54は、係数更新モジュール62で所与の最適化基準に従ってW(k)を決定するためにコスト関数を定式化するのに用いられる。特に、最適化は、LCMV又はLCLSEビーム形成等でのような制約に従って行なわれ得る。誤差信号e(k)54は通常、コスト関数に従って最小化される。適応フィルタリングでは、この最小化問題は、入力信号x(k)52と誤差信号e(k)54とを用いてW(k)の係数更新を行なう何らかの適応アルゴリズムにより、反復して解決される。もし参照信号yref(k)が何らかの外乱信号とのダブルトークを含んでいれば、誤差信号e(k)54全体を最小化するのは望ましくない。なぜなら、信号はその場合、外乱と参照信号とのダブルトークも含んでいるからである。従って、外乱の存在を認識し、係数更新モジュール62によるW(k)の適応を遅くするか又は停止するダブルトーク検出器が必要とされる。
音声及びオーディオ信号処理等の多くの応用では、ある予め定められた変換ドメインにおいて、信号x(k)52及びyref(k)はスパースである。図3はこのような応用の処理に適した適応線形MIMOフィルタ80の構造を示す。
図3を参照して、適応線形MIMOフィルタ80は、入力信号x(k)82を受け、信号y(k)を出力するFIRフィルタ90と、外乱と組合わされた参照信号yref(k)から信号y(k)を減算する減算器98と、入力信号x(k)82、参照信号yref(k)、及び誤差信号e(k)84をそれぞれ変換(DFT)ドメインに変換するための変換器92、100及び102と、いずれも変換ドメインに変換された入力信号x(k)82と誤差信号e(k)84とを用いて、ある所与の最適化基準に従ってW(k)を決定するためにコスト関数を定式化するための係数更新モジュール94と、各DFT領域区分について、係数更新モジュール94が、入力信号に干渉やノイズがあるときのみ係数行列を更新し、入力信号に所望の信号があるときには更新を凍結するように各DFT領域区分に別個に作用する、ダブルトークを検出するためのダブルトーク検出器96とを含む。
図3によれば、信号x(k)82、yref(k)及びe(k)84はこうして、変換Tによりこのドメインに有利に変換でき、適応フィルタW(k)90の係数更新のためにスパースネスを活用することができる。この文脈で、スパースネスとは、変換ドメインにおいて、参照信号と外乱とが重複していない場合がしばしばであることを意味する。この場合、離散的な時間ドメインではダブルトークの間であっても、変換ドメインでは、係数更新モジュール94によって、重複のないデータセグメントで係数の更新を行なうことができる。特に、変換のためのDFTの選択には多くの有利な特徴がある。DFTドメインでは、係数Tの更新は、DFT領域区分のうち参照信号のみが検出されたものの中で行なうことができる。これには、DFT領域区分の各々で別個に動作するダブルトーク検出器96が必要である。
しかしながら、図3に示すダブルトーク検出器96は正確にダブルトークを検出することができないので、ダブルトークの間に適応が起こる危険性は常に存在する。適応フィルタをすばやく適応させるために、一般に高速で収束する適応アルゴリズムを使用することが望ましいが、ダブルトークが検出されないと高速収束適応アルゴリズムの発散につながり、従って適応フィルタの性能を減じる恐れがある。
従って、先行技術の適応アルゴリズムは多くの状況で満足のいく性能を発揮するものの、高速で収束する適応アルゴリズムを使用しながら、一方では検出されないダブルトークによって引起される摂動に対抗することが望ましい。
3.2 適応フィルタの異常値に対し頑健なコスト関数
適応的ビーム形成または適応的ビーム形成と組合されたアコースティックエコーキャンセレーションのためのMIMOフィルタの高速収束を確実にしつつ発散を避けるために、異常値に対し頑健な周知の最大尤度推定に基づく適応アルゴリズムを用いることを提案する。RLSアルゴリズム又はMC−FDAF等の典型的な非頑健高速収束適応アルゴリズムを、誤差信号e(k)がガウス分布する最大尤度推定器と解釈することができる。この仮定は非常に有益ではあるが、このような適応アルゴリズムは仮定からのわずかな偏差にもきわめて感受性が高く、従って異常値に対して影響を受けやすいことが知られている。
さらに、統計学の文献から、ガウス分布よりも分布の裾部分が厚くなる単一分布を用いることによって、異常値に対し頑健な最大尤度推定器が導出され得ることがよく知られている。このような頑健な最大尤度推定を用いて、頑健な適応アルゴリズム(特に、変換ドメインでのスパースネスを活用した適応アルゴリズム)を導出することができ、これは、適応ビーム形成又は適応ビーム形成とアコースティックエコーキャンセレーションとの結合に有利に利用することができる。
このような確率密度関数の一つは以下で与えられる。
Figure 2006319925
これは、統計学では最小インフォマティブ分布として知られている。ε∈[0,1]は非特許文献16で導入された異常値の確率であり、定数k0はεに依存し、
Figure 2006319925
となるように選ばれる。最小インフォマティブ分布は中心部がガウス分布であり、裾部分ではラプラシアン分布(ガウス分布より尖度が大きい)であることが分かる。
例として、DFT領域区分ごとのダブルトーク検出器のためのDFTドメイン適応フィルタを導出する基本的ステップを示す。この場合、zはDFTドメインにおける最適線形フィルタ_W(r)のp番目の誤差信号_ep,n(r)であると解釈され、_wp(r)のM−推定器(又は最大尤度型推定器)は、_wp(r)に関して以下に示すコスト関数を最小化することによって得られる。
Figure 2006319925
これは、等価的には以下のようにも表せる。
Figure 2006319925
スケールファクタsp,n(r)は引数r(・)の分散を正規化する。|ep,n(r)|/sp,n(r)≦k0の場合、式(46)は二次コスト関数のLSE基準に対応し、一方式(46)は|ep,n(r)|/sp,n(r)>k0.For|ep,n(r)|/sp,n(r)>k0に対する1−ノルムの基準であり、異常値に対応する可能性が高い。ξp(r)の勾配は異常値に対する頑健性が増加するように制限されている。
式(46)は以下の形の反復ニュートンアルゴリズムによって解くことができる。
Figure 2006319925
ここで、
Figure 2006319925
は_w(r)に対するコスト関数ξ(r)の勾配である。
Figure 2006319925
は_w(r)に対するヘシアンξ(r)の期待値である。_μ(r)は周波数領域区分において別個の適応を制御するための、主対角上の、ステップサイズμn(r),n=0,1,…,2N−1でサイズが2N×2Nである対角行列である。DFTドメインのニュートンステップ(47)は、非特許文献5における離散的な時間ドメインのニュートンステップと類似し、非特許文献12におけるDFTドメインのニュートンステップの領域区分ごとの動作への拡張である。
3.3 直接的ビーム形成器の実現例
図4に適応ビーム形成器120を示す。図4を参照して、適応ビーム形成器120は、M個の入力チャネルとP=1個の出力チャネルを備えた(「MISO」システム)図2に従った適応線形MIMOフィルタ50と見ることができる。M個の入力チャネルはM個のマイクロフォン信号122に対応し、これは所望の信号、干渉及びノイズの混合物を含む。適応フィルタ130は干渉とノイズとを最大に抑制しつつ、所望の信号の歪を最小にするよう適応化される。
図4を参照して、適応ビーム形成器120は、入力チャネルの各々に対し、適応フィルタ150、152、…、154を含む適応フィルタ130と、適応フィルタ150、152、…、154の出力を加算して、信号y(k)を得るための加算器138と、参照信号yref(k)から信号y(k)を減算し、誤差信号e(k)124を出力するための減算器140と、入力信号x(k)122、参照信号yref(k)、及び誤差信号e(k)124をそれぞれDFTドメインに変換するための変換器132、142及び144と、いずれも変換器132及び144によって変換ドメインに変換された入力信号x(k)122及び誤差信号e(k)124を用いて、ある所与の最適化基準に従ってW(k)(w0(k),w1(k),…,wM-1(k))を決定するためにコスト関数を定式化する係数更新モジュール134と、変換器132及び142によっていずれもDFTドメインに変換された入力信号x(k)122及び参照信号yref(k)を用いてDFT領域区分の各々においてダブルトークを検出するためのダブルトーク検出器136とを含む。
適応LCLSE又はLCMVビーム形成において、参照信号yref(k)はゼロに等しく、従って、適応フィルタ130の出力信号y(k)は誤差信号e(k)124に等しい。従って、誤差信号を最小化することは、干渉及びノイズのみならず、所望の信号をも抑制することになる。所望の信号の抑制を防ぐために、最適化基準(式(46)等)に対し時間−空間的制約を導入して、ビーム形成器出力y(k)において所望の信号を保存する。
しかしながら、制約のための設計で仮定された時間−空間特性と、所望の信号の実際の時間−空間特性との間に(例えば、音響環境での残響、マイクロフォンの不一致、または所望の音源の位置の不一致等の)不一致があると、所望の信号は常に、誤って干渉であるとされ、適応フィルタによってキャンセルされてしまう。文献では、この効果は信号漏洩及び所望信号のキャンセレーション/歪として知られている。また、所望の信号のキャンセレーションは、干渉やノイズがあるときのみ適応フィルタを適応化し、所望の信号が存在するときは常に適応を凍結することによって、回避できることがよく知られている。これは、ダブルトーク検出器136が所望信号と干渉又はノイズとのダブルトークを検出し、適応ビーム形成器の適応を不能化するか又は遅くすることを要件とする。変換ドメインにおいてセンサ信号のスパースネスを活用することによって、適応フィルタの収束を向上させることができる。
要約すれば、ダブルトークに対する頑健性と適応フィルタの高速な収束が望まれる変換ドメインにおいて、頑健なMIMO適応フィルタの応用が存在する。調査によれば、特に、センサ信号のスパースネスを活用する頑健なDFTドメインの適応フィルタリング(MC−BRFDAF)が有利な性能を発揮することが示されている。
3.4 適応ブロッキング行列を伴う一般化サイドローブキャンセラの実現例
図4の直接的な実現例を用いる代わりに、適応ビーム形成器はまた、GSCとして実現することもできる。
図5に適応ブロッキング行列を用いたGSCを示す。図5を参照して、GSC170は、入力信号x(k)172を受け、信号y(k)を出力するための固定ビーム形成器180と、入力信号x(k)172と固定ビーム形成器180からの信号y(k)とを受け、B(k)の出力が干渉の参照基準となるように、所望の信号を抑制するとともに干渉を通過させる適応ブロッキング行列B(k)182と、適応ブロッキング行列B(k)182の出力を受け、適応フィルタリングを用いて参照経路からの残存する干渉を適応的に減算するための干渉キャンセラa(k)186と、信号y(k)から干渉キャンセラ186の出力を減算してビーム形成器出力信号z(k)174を得るための減算器184とを含む。適応ブロッキング行列B(k)182と干渉キャンセラa(k)186とは変換ドメインで頑健な適応MIMOフィルタリングを系統的に適用することによって実現される。
3.4.1 固定ビーム形成器180
固定ビーム形成器180はセンサアレイを操作して所望の音源位置に向け、干渉に対して、所望の信号の性能を高める。固定ビーム形成器180はGSC170の参照経路を形成する。しばしば、固定ビーム形成器180は、所望の信号が減衰しないように、所与の区域内で所望の音源が移動することを許容するように設計される。又は、適応ビーム形成器又は適応ビーム配向ユニットを用いて、固定ビーム形成器を所望の音源位置に向けるようにしてもよい。特に小規模のマイクロフォンアレイでは、固定ビーム形成器による干渉抑制は多くの応用では不十分なため、適応ブロッキング行列及び干渉キャンセラからなる適応サイドローブキャンセリング経路が必要とされる。
3.4.2 適応ブロッキング行列182
ブロッキング行列B(k)182は、B(k)の出力が干渉の参照基準となるように、所望の信号を抑制するとともに干渉を通過させる空間フィルタである。適応ブロッキング行列B(k)182は、適応フィルタ190、192、…、194と減算器200、202、…、204とのM個の組を含み、固定ビーム形成器180の出力y(k)を用いて、入力信号x(k)172の各チャネルを適応的にフィルタリングする。
行列Bによる空間フィルタリングと所望信号の実際の波領域との間に不一致があると常に所望の信号を完全に抑制することのできない固定ブロッキング行列Bと異なり、適応ブロッキング行列は所望信号の波領域の変化をトラッキングすることができる。これは、固定ブロッキング行列が連続して所望信号成分を通過させる、時間的に変化する残響のある環境では特に重要である。マルチチャネル適応フィルタリングを用いて、固定ビーム形成器180の出力信号y(k)を参照し、この参照信号を適応フィルタ190、192、…、194を用いたサイドローブキャンセリング経路の各チャネルから減算することによって、適応ブロッキング行列182を実現することができる。
3.4.3 干渉キャンセラ186
ブロッキング行列182の出力信号を干渉の参照信号として用いて、干渉キャンセラa(k)186は適応フィルタリングにより、参照経路から残存する干渉を適応的に減算する。
3.4.4 適応制御(ダブルトーク検出)
固定ビーム形成器180は、干渉のない所望信号の推定を生成することができない。従って、ブロッキング行列182は、ブロッキング行列182による干渉の抑制を防ぐために、信号対干渉比(signal−to−interference ratio:SIR)が高いときのみに適応化されるべきである。ブロッキング行列182で抑制された干渉成分を干渉キャンセラ186でキャンセルすることはできないので、これはGSC170の出力に漏洩する。一般に、ブロッキング行列182は、所望信号を全く含まない干渉の推定を生成することはない。従って、干渉キャンセラ186は、所望の信号のキャンセレーションと歪とを防ぐために、SIRが低いときのみに適応化されるべきである。
「B(k)の適応」又は「a(k)の適応」が全帯域信号ではなく、別個の周波数領域区分で行なわれると、明らかにより高いトラッキング性能が得られる。なぜなら、時間−周波数ドメインでの所望の信号と干渉とのスパースネスを活用できるからである。従って、適応ブロッキング行列182と干渉キャンセラ186との両者に、ダブルトーク検出器が必要とされる。
3.4.5 頑健な変換ドメイン適応フィルタを使用する動機づけ
先に述べたように、適応制御(又はダブルトーク検出器)は所望の信号と干渉との活動を常に正確に検出することはできない。従って、ブロッキング行列182と干渉キャンセラ186とは、ダブルトークの間に適応化されてしまうかもしれず、これは適応フィルタの異常値につながる。変換ドメインで頑健なMIMO適応フィルタリングを用いることで、センサ信号のスパースネスを活用した、高速に収束する適応アルゴリズムを用いながら適応フィルタの発散を防ぐことができる。
図8に、男性の所望の音声と、背景にラウドスピーカからオーケストラの音楽が流れている場合の適応制御の典型的挙動の例を示す。この実験的な設定は、セクション4のものに対応する。図8(A)及び図8(B)はM/2番目のマイクロフォンで記録された所望の信号と干渉信号とを示す。図8(C)では、所望の信号と干渉とのPSDの反復平均推定値の比SIR(r,n)が、周波数n(kHz)とブロック時間rとの関数として示される。図8(D)では、SIR(r,n)に基づく判断が示される。ブロッキング行列(BM)と干渉キャンセラ(IC)とが、10log10SIR(r,n)≧15dBと10log10SIR(r,n)≦15dBとについてそれぞれ適応される。図8(E)はΥ(r,n)を用いた適応制御の判断を例示する。
図8(E)の適応制御は常に所望の信号と干渉とのアクティビティを正確に検出するわけではないことが分かるであろう。ブロッキング行列182と干渉キャンセラ186とは従って、ダブルトークの間に適応化されるかもしれず、これは適応フィルタの異常値につながる。これらの異常値と、起こりうる適応フィルタの発散とは、(a)適応フィルタのステップサイズを減じること、又は(b)適応フィルタがダブルトークの間に適応されにくくなるように、適応しきい値を減じること、によって防止できるであろう。
しかしながら、どちらの選択肢もトラッキング能力を低下させ、このためGSC170の干渉抑制を低下させてしまう。このトレードオフを避けるために、MC−BRFDAFをブロッキング行列182と干渉キャンセラ182とに適用する。
図5から、ブロッキング行列182が1個の入力チャネルとM個の出力チャネルとを備えた単一入力多出力のシステムに対応し、干渉キャンセラ186がM個の入力チャネルとP=1の出力チャネルを備えたMISOシステムに対応することが理解されるであろう。ブロッキング行列の適応フィルタbm(k)をm=0かつp=0,1,…,M−1であるwm,p(k)で特定し、適応フィルタa(k)をm=0,1,…,M−1かつp=0であるwm,p(k)で特定することにより、頑健なMIMO適応フィルタを変換ドメイン中で系統的に使用して、適応ブロッキング行列182を備えたGSC170を実現することができる。
特に、MC−BRFDAFアルゴリズムはこのGSCの適応にとって有用である。ステップサイズベクトル_μ(r)は適応制御によって決定され、0と周波数に依存しない一定値のベクトルμcとの間で切換えられ、適応を不能化及び可能化する。
3.5 固定ブロッキング行列を備えた一般化サイドローブキャンセラの実現例
適応ブロッキング行列182を備えたGSCの代替物として、固定(時間不変の)ブロッキング行列Bを備えてGSCを実現することもできる。ここで、頑健なMIMO適応フィルタは干渉キャンセラ186にのみ適用される。
3.6 アコースティックエコーキャンセレーションと適応ビーム形成との結合
実際的なマルチメディア端末では、アコースティックエコー、干渉及びノイズを最適に抑制するために、ビーム形成マイクロフォンアレイとアコースティックエコーキャンセレーションとを組合わせることが望ましい(非特許文献13,14)。ここでは一般に、アコースティックエコーキャンセレーションとビーム形成との肯定的な相乗作用を最大に活用しながら、組合せシステムの計算の複雑さを最小にする、という課題に取り組まなければならない。
図6はアコースティックエコーキャンセレーションと適応ビーム形成との結合システム220の構造を示す。調査によれば、図6によるアコースティックエコーキャンセレーションと適応ビーム形成との組合せは、時間によって強度に変化するエコー経路があり、アコースティックエコーe(k)、所望信号d(k)及び干渉またはノイズn(k)のダブルトークがしばしば起こる状況で、有利な特性を有することが示されている(非特許文献15)。
3.6.1 直接的実現例
図6で、線226上のQ個のラウドスピーカ信号v(k)は適応フィルタ240に対する追加の入力チャネルと解することができる。従って、アコースティックエコーキャンセレーションと適応ビーム形成との結合システム220は、M+Q個の入力チャネル222及び228を備えたMISOシステムに対応し、ここでアコースティックエコーは干渉とみなされる。従って、アコースティックエコー、干渉及びノイズはLCLSE又はLCMV最適化基準を用いて適応MIMOシステムを最適化することによって抑制できる。従って、結合システムを適応するために、従来のLCLSE/LCMVビーム形成で生じるのと同様のダブルトークの問題が生じるため、頑健なMIMO適応フィルタを用い、変換ドメインでのスパースネスを活用することが望ましい。
適応フィルタ240は、入力信号x(k)222を受けるための適応フィルタw(k)250と、線228上でラウドスピーカ信号v(k)を受けるためのアコースティックエコーキャンセラa(k)252とを含む。
適応ビーム形成器220はさらに、適応フィルタ250の出力とアコースティックエコーキャンセラa(k)252の出力とを加算して、線224上に出力信号y(k)を生成する加算器242を含む。
特に、MC−BRFDAFが図6の結合システムの適応に有用である。
3.6.2 GSCとしての実現
アコースティックエコーキャンセレーションと適応ビーム形成との結合システム220は図7に示すGSC270として実現することができる。
図7を参照して、GSC270は入力信号x(k)272を受け、信号ywc(k)を出力するための適応フィルタ290と、入力信号x(k)272を受け、信号yB(k)を出力するためのブロッキング行列B(k)292と、信号yB(k)と線278上のラウドスピーカ信号v(k)とを受けるための干渉キャンセラ298とを含む。
干渉キャンセラ298は信号yB(k)を受けるための適応フィルタwa(k)310と、ラウドスピーカ信号v(k)を受けるためのアコースティックエコーキャンセラa(k)312とを含む。
GSC270はさらに、適応フィルタwa(k)310の出力とアコースティックエコーキャンセラa(k)312の出力とを加算するための加算器296と、加算器296の出力を信号ywc(k)から減算して、GSC270の出力y(k)を生成するための減算器294とを含む。
アコースティックエコーキャンセラa(k)312は、干渉キャンセラの付加的なチャネルである。従って、結合システムを適応化するためには、従来のGSCと同様のダブルトークの問題が生じるため、頑健なMIMO適応フィルタを用い、変換ドメインでのスパースネスを活用することが望ましい。特に、MC−BRFDAFが図7の結合システムの適応に有用である。
4.実験結果
MC−BRFDAFとMC−FDAFとによって実現されたGSCを、12cmアパチャでM=4個の均等に間隔をあけたセンサを備えた、残響時間T60=250msの室内のマイクロフォンアレイに適用した。図9(A)の所望信号が側面方向60cmの距離から到達した。図9(B)の干渉が後方距離120cmで認められた。センサでの平均SIRは3dBであった。パラメータは最大収束速さと収束後の最大ノイズ抑制を得るために最適化された。パラメータを以下の表1に示す。
Figure 2006319925
パラメータは、一定のステップサイズパラメータμcを除き、どちらのGSC実現例についても同じである。図9(A)から図9(C)はブロッキング行列による所望信号の抑制TRBM(k)、GSCの干渉抑制IR(k)、及びシステムの初期化後の時間の関数としてのGSCによる所望の信号の歪SSNR(k)をそれぞれ示す。SSNR(k)は、所望信号のみについて、固定ビーム形成器の出力とGSCの出力との間のセグメント化されたSNRである。干渉キャンセラは所望の信号に歪を生じさせてはならないので、理想的にはSSNR(k)=∞となる。ブロッキング行列(図9(A))と干渉キャンセラ(図9(B))とは、MC−FDAFに対するよりもMC−BRFDAFに対してのほうが、より早く収束することが分かる。これは、ダブルトークへの頑健性が改善されるため、MC−BRFDAFについてはより大きなステップサイズを選択できることによる。TRBM(k)はどちらのGSCに対してもほぼ同じ値まで収束するが、収束後のIR(k)は、MC−BRFDAFに対するものがMC−FDAFに対するものより約4dB大きい。この結果は、さまざまに混合した音声信号にこのアルゴリズムを適用することによって確認された。歪SSNR(k)(図9(C))は、MC−BRFDAFに対するもののほうが、MC−FDAFよりわずかに高かった。
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味および範囲内でのすべての変更を含む。
M個の入力チャネルとP個の出力チャネルとを備えた線形有限インパルス応答(FIR)MIMOフィルタの構造を示す図である。 システムW(k)を最適化するための構造を示す図である。 係数更新モジュールと変換ドメインでのダブルトーク検出器とを備えた適応線形MIMOフィルタを示す図である。 参照信号yref(k)を参照する適応ビーム形成器を示す図である。 適応ブロッキング行列を備えたGSCを示す図である。 適応ビーム形成とアコースティックエコーキャンセレーションとの結合最適化のための構造を示す図である。 一般化されたエコー及び干渉キャンセラを示す図である。 所望の男性の音声とラウドスピーカからの背景で流れるオーケストラの音楽とに対する、GSCの適応制御の典型的挙動を示す図である。 「連続した」ダブルトークに対し、MC−FDAFを用いた場合とMC−BRFDAFを用いた場合のGSCの比較を示す図である。
符号の説明
20 FIR MIMOフィルタ
30、60、90 FIRフィルタ
32、34、36 加算器
50、80 適応線形MIMOフィルタ
62、94 係数更新モジュール
64、96 ダブルトーク検出器
66、98 減算器
92、100、102 変換器

Claims (5)

  1. 適応係数のベクトルを有し、複数の入力信号を受けるように接続された有限インパルス応答(Finite impulse response:FIR)フィルタと、
    参照信号と前記FIRフィルタの出力とに基づいて、誤差信号を計算するための手段と、
    各々が複数の離散フーリエ変換(Discrete Fourier Transform:DFT)領域区分に変換された入力信号及び誤差信号に応答して、かつ前記誤差信号の予め定められた確率密度分布に基づいて、適応係数からなる適応係数ベクトルを更新するための手段と、
    各々がDFT領域区分に変換された前記入力信号及び前記参照信号に基づいて、各DFT領域区分について外乱が存在しないときに係数ベクトルを更新するように、前記更新するための手段を適応的に制御するための手段とを含む、適応フィルタ。
  2. 前記予め定められた確率密度分布は非ガウス確率密度分布である、請求項1に記載の適応フィルタ。
  3. 前記非ガウス確率密度分布は以下の式で与えられ
    Figure 2006319925
    ここでε∈[0,1]は入力信号の異常値であり、定数k0はεに依存し、
    Figure 2006319925
    であるように選ばれる、請求項2に記載の適応フィルタ。
  4. 前記FIRフィルタは複数の出力経路を有し、さらに入力信号と出力経路との組合せの各々について係数ベクトルを含む係数行列を有し、
    前記誤差信号を計算するための前記手段は、前記参照信号と前記FIRフィルタの出力とに基づいて、前記入力信号と出力信号との組合せの各々について前記誤差信号を計算するための手段を含み、
    前記更新するための手段は、前記各々がDFT領域区分に変換された入力信号及び前記誤差信号に応答して、かつ前記誤差信号の各々の予め定められた確率密度分布に基づいて、前記適応係数の適応係数行列を更新するための手段を含む、請求項1〜請求項3のいずれかに記載の適応フィルタ。
  5. 前記更新するための手段が、マルチチャネルの、領域区分ごとの頑健な周波数ドメイン適応フィルタ(multichannel bin−wise robust frequency−domain adaptive filter:MC−BRFDAF)アルゴリズムを用いて係数ベクトルを更新するための手段を含む、請求項1〜請求項3のいずれかに記載の適応フィルタ。
JP2005143289A 2005-05-16 2005-05-16 適応型ビーム形成器 Expired - Fee Related JP4581114B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005143289A JP4581114B2 (ja) 2005-05-16 2005-05-16 適応型ビーム形成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005143289A JP4581114B2 (ja) 2005-05-16 2005-05-16 適応型ビーム形成器

Publications (3)

Publication Number Publication Date
JP2006319925A true JP2006319925A (ja) 2006-11-24
JP2006319925A5 JP2006319925A5 (ja) 2007-05-17
JP4581114B2 JP4581114B2 (ja) 2010-11-17

Family

ID=37540125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005143289A Expired - Fee Related JP4581114B2 (ja) 2005-05-16 2005-05-16 適応型ビーム形成器

Country Status (1)

Country Link
JP (1) JP4581114B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209445A (ja) * 2007-02-23 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> 残響除去装置、残響除去方法、残響除去プログラム、記録媒体
JP2010245697A (ja) * 2009-04-02 2010-10-28 Nippon Telegr & Teleph Corp <Ntt> 適応マイクロホンアレイ残響抑圧装置、適応マイクロホンアレイ残響抑圧方法及びプログラム
JP2011253536A (ja) * 2010-06-02 2011-12-15 Honeywell Internatl Inc 多変数制御装置
JP2012044609A (ja) * 2010-08-23 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム
WO2022120085A1 (en) * 2020-12-03 2022-06-09 Dolby Laboratories Licensing Corporation Subband domain acoustic echo canceller based acoustic state estimator

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108390663B (zh) 2018-03-09 2021-07-02 电信科学技术研究院有限公司 一种有限冲激响应滤波器系数矢量的更新方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1093680A (ja) * 1996-09-13 1998-04-10 Nippon Telegr & Teleph Corp <Ntt> サブバンド多チャネル音声通信会議用反響消去方法
JP2000252884A (ja) * 1999-02-26 2000-09-14 Toshiba Corp 適応フィルタ学習方式
JP2002503910A (ja) * 1998-02-13 2002-02-05 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 雑音環境におけるフィルタ適応化の制御方法および装置
JP2002057606A (ja) * 2000-06-26 2002-02-22 Lucent Technol Inc 音響およびネットワークエコーキャンセレーションにおいて用いるための耐誤差性の適応フィルタ
JP2003250193A (ja) * 2002-02-25 2003-09-05 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP2003284183A (ja) * 2002-03-20 2003-10-03 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧装置、反響抑圧方法及びプログラム
WO2004017303A1 (en) * 2002-08-16 2004-02-26 Dspfactory Ltd. Method and system for processing subband signals using adaptive filters
JP2004537233A (ja) * 2001-07-20 2004-12-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ エコー抑圧回路及びラウドスピーカ・ビームフォーマを有する音響補強システム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1093680A (ja) * 1996-09-13 1998-04-10 Nippon Telegr & Teleph Corp <Ntt> サブバンド多チャネル音声通信会議用反響消去方法
JP2002503910A (ja) * 1998-02-13 2002-02-05 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 雑音環境におけるフィルタ適応化の制御方法および装置
JP2000252884A (ja) * 1999-02-26 2000-09-14 Toshiba Corp 適応フィルタ学習方式
JP2002057606A (ja) * 2000-06-26 2002-02-22 Lucent Technol Inc 音響およびネットワークエコーキャンセレーションにおいて用いるための耐誤差性の適応フィルタ
JP2004537233A (ja) * 2001-07-20 2004-12-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ エコー抑圧回路及びラウドスピーカ・ビームフォーマを有する音響補強システム
JP2003250193A (ja) * 2002-02-25 2003-09-05 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP2003284183A (ja) * 2002-03-20 2003-10-03 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧装置、反響抑圧方法及びプログラム
WO2004017303A1 (en) * 2002-08-16 2004-02-26 Dspfactory Ltd. Method and system for processing subband signals using adaptive filters

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209445A (ja) * 2007-02-23 2008-09-11 Nippon Telegr & Teleph Corp <Ntt> 残響除去装置、残響除去方法、残響除去プログラム、記録媒体
JP2010245697A (ja) * 2009-04-02 2010-10-28 Nippon Telegr & Teleph Corp <Ntt> 適応マイクロホンアレイ残響抑圧装置、適応マイクロホンアレイ残響抑圧方法及びプログラム
JP2011253536A (ja) * 2010-06-02 2011-12-15 Honeywell Internatl Inc 多変数制御装置
JP2012044609A (ja) * 2010-08-23 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム
WO2022120085A1 (en) * 2020-12-03 2022-06-09 Dolby Laboratories Licensing Corporation Subband domain acoustic echo canceller based acoustic state estimator

Also Published As

Publication number Publication date
JP4581114B2 (ja) 2010-11-17

Similar Documents

Publication Publication Date Title
US9280965B2 (en) Method for determining a noise reference signal for noise compensation and/or noise reduction
KR101331388B1 (ko) 음향 에코를 제거하기 위한 컴퓨터 구현 프로세스 및 시스템
US7693291B2 (en) Multi-channel frequency-domain adaptive filter method and apparatus
US10117021B1 (en) Audio feedback reduction utilizing adaptive filters and nonlinear processing
EP3613220B1 (en) Apparatus and method for multichannel interference cancellation
Kellermann Acoustic echo cancellation for beamforming microphone arrays
JP4581114B2 (ja) 適応型ビーム形成器
Reuven et al. Dual-source transfer-function generalized sidelobe canceller
Reuven et al. Joint noise reduction and acoustic echo cancellation using the transfer-function generalized sidelobe canceller
US6694020B1 (en) Frequency domain stereophonic acoustic echo canceller utilizing non-linear transformations
Cho et al. Stereo acoustic echo cancellation based on maximum likelihood estimation with inter-channel-correlated echo compensation
Mahbub et al. A single-channel acoustic echo cancellation scheme using gradient-based adaptive filtering
Yan et al. Optimum step-size control for a variable step-size stereo acoustic echo canceller in the frequency domain
Djendi et al. A new adaptive solution based on joint acoustic noise and echo cancellation for hands-free systems
Hamidia et al. Double-talk detection using the singular value decomposition for acoustic echo cancellation
Henni et al. A new joint noise reduction and echo suppression system based on FBSS and automatic voice activity detector
Herbordt et al. Application of a double-talk resilient DFT-domain adaptive filter for bin-wise stepsize controls to adaptive beamforming
Kaur et al. Performance and convergence analysis of LMS algorithm
Sondhi Adaptive echo cancelation for voice signals
Hamidia et al. A new structure for acoustic echo cancellation in double-talk scenario using auxiliary filter
Benesty et al. Adaptive algorithms for MIMO acoustic echo cancellation
Kotte Performance Analysis of Adaptive Algorithms based on different parameters Implemented for Acoustic Echo Cancellation in Speech Signals
US11315543B2 (en) Pole-zero blocking matrix for low-delay far-field beamforming
Hamidia et al. Effect of a signal decorrelation on adaptive filtering algorithms for acoustic echo cancellation
Shrawankar et al. Acoustic echo cancellation postfilter design issues for speech recognition system

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070328

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100427

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100720

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100810

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130910

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees