JP4955228B2 - ラウンドロビン正則化を用いたマルチチャネルエコーキャンセレーション - Google Patents

ラウンドロビン正則化を用いたマルチチャネルエコーキャンセレーション Download PDF

Info

Publication number
JP4955228B2
JP4955228B2 JP2005169880A JP2005169880A JP4955228B2 JP 4955228 B2 JP4955228 B2 JP 4955228B2 JP 2005169880 A JP2005169880 A JP 2005169880A JP 2005169880 A JP2005169880 A JP 2005169880A JP 4955228 B2 JP4955228 B2 JP 4955228B2
Authority
JP
Japan
Prior art keywords
correlation matrix
adaptive filter
regularized
echo cancellation
subband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005169880A
Other languages
English (en)
Other versions
JP2006018254A5 (ja
JP2006018254A (ja
Inventor
ダブリュ.ストークス ジャック
シー.プラット ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006018254A publication Critical patent/JP2006018254A/ja
Publication of JP2006018254A5 publication Critical patent/JP2006018254A5/ja
Application granted granted Critical
Publication of JP4955228B2 publication Critical patent/JP4955228B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

本発明は、一般には信号処理に関し、より詳細にはラウンドロビン正則化を用いて捕捉チャネルにおける複数の再生チャネルのエコーをキャンセルする方法およびシステムに関する。
エコーキャンセレーションは、さまざまなアプリケーションにおいて重要な要素である。一般に、エコーキャンセレーションとは、エコーが減衰されるか、または除去されるように、電気エコーおよび音響エコーをディジタル的にキャンセルすることである。エコーキャンセレーションは、通信システム等のアプリケーションにおいて必須であり、音質を改善するために用いられる。エコーキャンセレーションは、導線(電話線を含む)のインピーダンス不整合によって生じるハイブリッドエコーや、ラウドスピーカからマイクロフォンへの音の音響結合によって生じる音響エコーを含むいくつかの異なるタイプのエコーを克服するために用いられる。これらのタイプのエコーは、ワイヤレス電話、ハンズフリー電話、電話会議システム、インターネット電話および音声認識システムのようないくつかの異なる技術で見られる。エコーキャンセレーションを用いることにより、これらおよび多くの他の技術の音質および有用性が改善される。
1つのタイプのエコーキャンセレーションは、音響エコーキャンセレーションであり、音波のエコーをキャンセルするために用いられる。通常、このようなエコーは、1つまたは複数のラウドスピーカから出た音が1つまたは複数のマイクロフォンによってピックアップされるときに形成される。音響エコーはかなり顕著になることがあり、ユーザにとって耳障りなことさえある。
一般に、音響エコーキャンセレーションは、1つまたは複数の再生信号を取得し、各再生信号が対応するスピーカに向かい、その再生信号によって生じた1つまたは複数のマイクロフォン信号からのそれぞれのエコーの推定を減算することによって機能する。より具体的には、このエコーループを通る再生信号が変換および遅延され、背景雑音およびおそらくは近端音声がマイクロフォンで加算され、エコーキャンセレーションのための減算プロセスが使用される。減算後に得られる信号は誤差信号と呼ばれ、その目標は、近端音声がマイクロフォン信号に存在しないときに誤差信号を最小化することである。
音響エコーキャンセレーションシステムの核心は適応フィルタリングである。一般に、適応フィルタは、スピーカおよびマイクロフォンを収容する室内の伝達関数を識別または「学習」するために用いられる。この伝達関数は、室内環境の物理的特性に大きく依存する。適応フィルタは、スピーカに送られた再生信号を得て、室内のインパルス応答を表すいくつかの係数を再帰的に調整することによって機能する。実際のエコーから減算された推定エコーである誤差信号を用いて、この誤差が最小になるようにフィルタ係数を変化させる。
従来、再生信号はそれぞれ、単一の遅延線および単一のフィルタを用いて、時間サンプルの単一のストリームとして処理されている。これに改善を施すために、再生信号をサブバンドに分割し、サブバンドごとに1つの適応フィルタとして、複数の適応フィルタを並列に動作させることができる。計算上の複雑さを低減するために、異なるサブバンドにおける適応フィルタの長さを、そのサブバンドにおけるエコー長に応じて変化させることが、非特許文献1の論文によって検討されている。その論文から低音のほうがより長く反響する傾向にあるので、CPUの計算サイクルを節約するために、下位のサブバンド(lower subband)の適応フィルタを長くすることができる。上位のサブバンド(upper subband)では、フィルタを短くすることができる。このように、非特許文献1の論文は、下位のサブバンドではより長い適応フィルタを用い、上位のサブバンドではより短い適応フィルタを用いることができることを示唆している。
捕捉信号中のエコーをキャンセルするために、再生信号の各サブバンドをディジタル遅延線に格納し、遅延されたサブバンド信号を複数のタップに分ける。各タップで、再生信号をサンプリングする。フィルタのタップ数は、ディジタル遅延線の長さを表す。例えば、4タップは再生信号を現フレーム、現フレーム−1、現フレーム−2、および現フレーム−3でサンプリングすることを意味する。遅延のそれぞれは、フレーム長に等しい(これは、例として、約16ミリ秒または20ミリ秒とすることができる)。このように、フレーム長が16msであり、4タップ(すなわち長さ4の適応フィルタ)である場合であって、適応フィルタが周波数領域で適応サブバンドフィルタリングを用いて実施される場合、再生信号は、現フレーム、現フレームよりも16ms前のフレーム、32ms前のフレーム、および48ms前のフレームで検査される。
各サンプルをタップ重みWと呼ばれる重みの複素共役(complex conjugate)で乗算し、乗算した重みを和算し、その後マイクロフォン信号から減算する。各タップ重みを調整して、出力パワーを最小化する。出力パワーを最小化することで、スピーカ信号をできるだけ抑え、これによってエコーを低減する。
音響エコーキャンセレーションは、最初に、モノラル(モノ)システムで使われた。図1は、モノ再生信号を処理するために用いられるシングルチャネル音響エコーキャンセレーション(AEC)システム100を示している。モノ再生信号x105を、同等のマルチチャネル信号にコピーし、右スピーカ110および左スピーカ120を通して再生する。スピーカ110、120のそれぞれからのエコー130、140が部屋の壁150から反射され、マイクロフォン160によって捕捉される。マイクロフォンは、(電話会議参加者からなどの)所望の音声165と背景雑音170も捕捉する。
エコー130、140、所望音声165および背景雑音170は合成されてマイクロフォン信号yを構成する。マイクロフォン信号yは第1の分析フィルタバンク175によって処理され、再生信号xは第2の分析フィルタバンク180によって処理され、信号xおよびyが時間領域から周波数領域信号XおよびYにそれぞれ変換される。AECのエコーはかなり長く、適応フィルタは時間領域でよりも周波数領域での方が、多くの場合、速く収束するので、周波数領域でAECを実行することが重要である。なお、分析フィルタバンク175、180は、(箱形ウィンドウを含む)ウィンドウ付きFFT(windowed fast Fourier transofrm)や、例示的な一実施形態におけるMCLT(modulated complex lapped transform)など、任意の複素周波数領域変換として実施することができることに留意されたい。
変換されたX信号およびY信号は、適応フィルタを用いて、誤差信号を最小化するために室内の伝達関数を学習するAECモノプロセッサ185に入力される。処理された信号は、近端音声を含む、エコーが低減された周波数領域信号を時間領域に変換して戻す合成フィルタバンク190に送られる。なお、図1のモノAECプロセッサは、サブバンドごとに単一の適応フィルタのみを用いていることに留意されたい。
図2は、単一のサブバンドmおよびフレームnについて、図1に示したモノAECプロセッサ185の詳細なブロック図である。モノAECプロセッサ185は、サブバンドごとに単一の適応フィルタ200を含む。適応フィルタ係数更新部210を用いて、サブバンド適応フィルタ200の処理された係数を更新する。図1に示したように、モノ再生信号xがスピーカ110、120に再生されるとき単一の適応フィルタ200が実施される。典型的な実施形態では、適応フィルタは、正則化(regularization)を有する正規化された最小平均二乗(NLMS:normalized least mean square)アルゴリズムを使用する。正則化付きのNLMSアルゴリズムについて、以下に詳細を示す。
正則化とは、ある数を別の数で除算するときに、分母がゼロになって分数が無限大にならないようにするために、分母に小さい値を加算または減算するプロセスである。分数を正則化するための別の方法は、分母が正である閾値よりも小さい場合に、分母をその閾値に等しく設定することである。同様に、分母が負である場合、分母がある負の閾値よりも小さければ、分母をその負の閾値に設定する。
図1に示したシングルチャネルAECシステム100は、モノ再生信号からエコーを除去するためだけのものである。AECをステレオに拡張することを論じた最初の論文の1つは非特許文献2の論文である。しかし、NLMSアルゴリズムはモノAECの問題に対してはうまく機能するが、ステレオ(または他のマルチチャネル)AECの問題ではNLMSは有効でない。その理由は、NLMSがマルチチャネル再生信号のチャネル間の相関を考慮しておらず、これによって適応フィルタの収束が大幅に遅くなるからである。
非特許文献2のSondhiとMorganは、ステレオAEC問題を解決するためにNLMSの代わりに再帰的最小二乗法(RLS:recursive least squares)を用いることを提案した。RLSアルゴリズムは、適応フィルタのパラメータ(または重み)を調整するための代替アルゴリズムである。RLSがNLMSよりもうまく機能する理由は、RLSが再生チャネルを無相関化(decorrelate)する傾向があるためである。RLSは、入力スピーカデータの相関行列(correlation matrix)の逆行列(inverse)の推定を再帰的に計算するので、スピーカチャネル間の相関を学習し、正しい解に素早く収束することができる。しかし、SondhiとMorganは、可能性としてNLMSの代わりにRLSアルゴリズムを用いることを提案しているだけで詳細を示していない。
図3は、ステレオ再生信号を処理するために用いられるステレオAECシステム300を示している。図3に示すステレオAECシステム300は、サブバンドベースのシステムであり、これはスピーカ信号を複数のサブバンドに分割し、サブバンドごとに適応フィルタを設けることを意味する。適応フィルタは並列に動作する。なお、図3はステレオ再生信号を有するAECシステム300を示しているが、マルチチャネル再生信号に対しても機能するAECシステムを設計できることに留意されたい。また、図3には単一のマイクロフォンを示しているが、AECシステム300は複数のマイクロフォンにも容易に拡張可能である。
図3を参照すると、ステレオ再生の場合、ステレオ再生信号xは、右ステレオチャネルx(0)302および左ステレオチャネルx(1)305の2つのチャネルから構成される。マルチチャネルAECの場合について、Nチャネル再生の場合、信号はチャネルx(0)〜x(N−1)から構成されることになる。再生信号302および305は、ディジタル−アナログ変換器(D/A)(図示せず)によってアナログ信号に変換される。
マルチチャネル再生信号(ステレオ信号を含む)は、いくつかの異なる方法で作成することができる。図4は、Microsoft(登録商標)Windows(登録商標) Messengerや、インターネットゲーム用の音声チャットなど、音声通信システムとともに使用される図3のAECシステム300を示している。図4において、ディジタルの遠端モノ音声信号400がソースから到着する。音声信号400は、音楽410および音楽420のようないくつかのステレオオーディオサウンド、コンピュータゲームサウンド、またはコンピュータのシステムサウンドとローカルにミキシングされる。
別法として、図5は、マルチチャネル再生信号がステレオ音楽を含む場合を示している。この場合、音楽410があるマルチチャネル再生チャネルに割り当てられ、音楽420が別のマルチチャネル再生チャネルに割り当てられる。マルチチャネルサウンドとミキシングされる遠端音声はない。
さらに別の場合として、図6は、マルチチャネル信号がモノ音声を含む場合を示している。図6に示すこの状況は、Microsoft(登録商標)Windows(登録商標) Messengerシステムに用いることができる。モノ音声600は再生チャネルのそれぞれにコピーされるが、マルチチャネル再生信号はモノラルである。
図3に戻って、再生信号302、305は次に、右スピーカ310および左スピーカ320を通じてそれぞれ再生される。第1のエコー330および第2のエコー340が部屋(図示せず)の壁350から反射され、マイクロフォン355でエコーを生成する。複数のマイクロフォンがある場合、ステレオAECシステム300の別個のものでそれぞれのマイクロフォンから捕捉された信号を独立に処理することもできるし、1つのAECアルゴリズムがマイクロフォンアレイアルゴリズムのモノ出力を処理することもできよう。スピーカからのエコーに加えて、マイクロフォン355によって捕捉されるオーディオ信号は、所望音声360および背景雑音365からも構成される。マイクロフォン355によって捕捉されるアナログオーディオ信号は、アナログ−ディジタル変換器(A/D)(図示せず)によってディジタルマイクロフォン信号yに変換される。
音響エコーキャンセレーションは、高速ウィンドウ付き変換(FFT)やMCLTのような周波数領域変換に基づく適応サブバンドフィルタリングを用いて実行されることが多い。第1のフィルタバンク370および第2のフィルタバンク375は、ステレオ再生信号x(0)およびx(1)のそれぞれを時間領域から周波数領域信号X(0)およびX(1)にそれぞれ変換する。同様に、第3の分析フィルタバンク380は、モノマイクロフォン信号yを時間領域から周波数領域信号Yに変換する。これらの信号はステレオAECプロセッサ385によって処理され、出力Zは合成フィルタバンク390を通る。そして、エコーが低減された時間領域信号zが出力される。
図7は、図3に示した単一のサブバンドに対するステレオAECプロセッサ385の詳細なブロック図である。ステレオAECプロセッサは、第1のマルチチャネル再生信号X(0)に対する第1の適応フィルタ700と、第2のマルチチャネル再生信号X(1)に対する第2の適応フィルタ710を含む。なお、別個のシングルチャネルフィルタが各サブバンドに関して他のサブバンドとは独立に並列に動作することに留意されたい。図3に関して上述したように、再生信号X(0)、X(1)を処理し、適応フィルタ係数更新部720を用いて、シングルチャネルフィルタ700、710の処理後の係数を更新する。そして、エコーが低減された周波数領域信号Zが出力される。
しかし、適応フィルタ重みを計算するためのRLSアルゴリズムでの1つの問題点は、計算の複雑さが高いことである。この複雑さは、最小平均二乗法(LMS)の場合のO(2N)に比べて、O(2N+6N)のオーダーである。ここで、N=C×Lであり、Cは再生チャネルの数、Lはサブバンドの適応フィルタ長である。以前、このRLSの計算の複雑さにより、実用システムのAECでは使用できなかった。非特許文献3の論文は、モノAECに高速RLS(FRLS)を用いることを論じた最初の論文の1つである。FRLSは、相関行列(または任意の他の種類の行列)の使用を避けることによって、速度を高め、RLSの複雑さを低減する。しかし、FRLSでの1つの問題点は、それがかなり不安定であることである。この不安定性の結果、FRLSアルゴリズムは直ぐに発散することがある。FRLSの安定性を改善するためにいくつかの試みがなされている。しかし、現在までのところ、マルチチャネルAEC問題に対する満足な解決法は見出されていない。非特許文献3のHattyは、FRLSの安定性を改善しようとして、バンドごとに定期的にFRLSアルゴリズム全体をリセットすることによってラウンドロビン方式を用いることを提案した。Hattyが行ったことは、アルゴリズムの状態全体を放棄し、ゼロから再開することによって、バンドを完全に再初期化することであった。
しかし、このリセット技法での問題は、このリセットによって、FRLSアルゴリズムが各リセット後に室内の伝達関数を再収束し、再学習しなければならないために、リセット中のバンドについてエコー漏れを生じることである。さらに、Hattyの技法は、任意の与えられた時刻にアルゴリズムの少なくとも一部がリセット中であるということのために、再生信号に歪みを引き起こした。
1995年に、J.Benestyらは非特許文献4において、高速RLS(FRLS)を用いてステレオAEC問題を解決しようと試みた。しかし、Benestyの論文は、適応サブバンドフィルタリングを用いる代わりに時間領域でFRLSを用いることを提案している。
また、非特許文献5の論文では、更新が提案されている。非特許文献5の論文において、Benestyは、左チャネルと右チャネルと(これらは非常に類似している)を無相関化するために、両方のチャネルに非線形性を付加している。一実施態様において、ベネスティは、非線形性の正の部分を一方のチャネルに付加し、非線形性の逆(負)の部分を他方のチャネルに付加している。この導入された非線形性によって、チャネルを適応フィルタが個別のパスを学習できる程度に異なるように強制する。このようにして、チャネルを無相関化し、近端スピーカから近端マイクロフォンへの近端伝達関数だけでなく遠端の人から遠端のステレオマイクロフォンへの遠端伝達関数に追従しなければならないことに関連する非一意性(non−uniqueness)の問題を避けることができる程度に異ならせる。
(非特許文献5の論文で行われているように)非線形性を信号に付加することに伴う問題点は、どのようなタイプの非線形性を付加しても信号が歪む傾向にあることである。基本的に、非線形性を付加することは、信号に歪みを付加することである。しかし、歪みを付加することは、AECシステムが音楽再生を伴うシステムでうまく機能するためのものである場合、望ましくない。理想的には、音楽再生の場合、信号は歪みがなく音楽が忠実に再生されるべきである。
非特許文献6の論文において、ステレオのAEC問題に対する解決法として、サブバンドでFRLSを用い、再生チャネルに非線形性を付加することが提案されている。この論文は、FRLSアルゴリズムの並列構成を動作させることによって、構成の1つが「暴発」すると、すなわち不安定になると、最適には及ばない別の構成にフォールバックできるようにすることで、安定性を増大しようとしている。この実装はアルゴリズムの再初期化に役立つ。
1990年に、非特許文献3の論文が適応サブバンドAEC処理にFRLSを用いることを提案したとき、マイクロプロセッサは今日のマイクロプロセッサよりもはるかに遅かった。結果として、RLSはマルチチャネルAEC問題に対する実際的な解決法ではなかった。しかし、最近のマイクロプロセッサの速度の大幅な向上により、今ではRLSを用いることができる。しかし、マルチチャネル再生信号の相関行列が特異(singular)になる場合、RLSアルゴリズムは不安定になり発散することになる。
A. Gilloire, "Experiments with Sub−band Acoustic Echo Cancellers for Teleconferencing," 1987 International Conference on Acoustics, Speech, and Signal Processing, 1987, pp.2141−2144 M. Sondhi and D. Morgan, "Acoustic echo cancellation for stereophonic teleconferencing," Proc. IEEE Workshop Appls. Signal Processing Audio Acoustics, 1991 B. Hatty, "Recursive Least Squares Algorithms using Multirate Systems for Cancellation of Acoustical Echoes," 1990 International Conference on Acoustics, Speech, and Signal Processing, 3−6 April, 1990, vol.2, pp.1145−1148 J. Benesty, J., et. al., "Adaptive Filtering Algorithms for Stereophonic Acoustic Echo Cancellation," Proc. ICASSP’95, pp.3099−3102 J. Benesty, D. Morgan, and M. Sondhi, "A Better Understanding and an Improved Solution to the Problems of Stereophonic Acoustic Echo Cancellation," Proc. ICASSP’97, pp.303−306 P. Eneroth, S. Gay, T. Gansler, and J. Benesty, "A Real−Time Implementation of a Stereophonic Acoustic Echo Canceller," IEEE Trans. On Speech and Audio Processing, Vol9. no.5, July 2001, pp.513−523
したがって、マルチチャネル再生信号に使用することができるエコーキャンセレーションのシステムおよび方法が必要とされている。また、システムが不安定にならないようにするためにFRLSの使用を回避するマルチチャネルエコーキャンセレーションのシステムおよび方法が必要とされている。また、再生信号への歪みの付加することを回避するマルチチャネルエコーキャンセレーションのシステムおよび方法が必要とされている。また、原信号の忠実な再現を維持しながら効果的にエコーを除去するために、上記のRLSアルゴリズムの問題を回避し、克服するマルチチャネルエコーキャンセレーションのシステムおよび方法が必要とされている。
本明細書に開示する発明は、ラウンドロビン正則化を有するマルチチャネルエコーキャンセレーションのシステムおよび方法を含む。本発明は、モノ信号およびマルチチャネル信号の両方に関して使用することができ、現在の適応フィルタアルゴリズム(RLSなど)の上記の欠点を克服する。特に、ラウンドロビン正則化は、適応フィルタアルゴリズムの相関行列を正則化することによって、適応フィルタアルゴリズムが特異になり、暴発することがないようにする。この正則化は、ラウンドロビン方式で行われる。換言すれば、各適応フィルタに関連するサブバンド再生データの逆相関行列を、ラウンドロビン順に正則化して、逆相関行列が発散しないようにする。別の一実施形態では、各逆相関行列が発散について検査される。逆相関行列が発散し始めた場合、行列が正則化される。
マルチチャネルラウンドロビン正則化エコーキャンセレーション方法は、複数の再生信号のエコーを含む捕捉信号を取得することを含む。複数の再生信号を複数のサブバンドに分解し、複数の適応フィルタをサブバンドに適用する。各適応フィルタは逆相関行列を有する。次に、複数の適応フィルタの各1つをラウンドロビン順に選択して、ラウンドごとにフィルタのそれぞれが選択されるようにする。そして、各選択された適応フィルタに関連する逆相関行列を正則化する。そして、正則化された適応フィルタを用いて、捕捉信号からエコーを除去する。
逆相関行列の正則化は、相関行列を正則化することによって達成することができる。このように、逆相関行列の逆行列をとり、次にこの相関行列を正則化し、正則化した相関行列の逆行列をとって、正則化された逆相関行列を得る。
相関行列は、少なくとも2つの方法で正則化することができる。1つの方法は、相関行列を正則化するたびに相関行列の対角要素に小さい値を加えることである。これにより、逆相関行列が発散しないようにする。もう1つの方法は、ある閾値を決め、相関行列の各対角要素を検査する。ゼロによる除算の危険があるときはいつでも相関行列の対角要素をその閾値に等しく設定する。相関行列の対角要素が閾値よりも大きい場合、相関行列のその要素には何もしない。
正則化は、ラウンドロビン方式で実施される。システムにおける各サブバンドを順に選択して、そのサブバンドの適応フィルタを検査できるようにする。この検査には、その時点で正則化が必要であるかどうかを判定することを含んでもよい。ラウンドロビン方式を用いて、各サブバンドが定期的に検査されるようにする。ラウンドロビン方式は、単一のサブバンドが各フレームについて検査されるように実施してもよい。あるいは、ラウンドロビン方式は、フレームごとにいくつかの、またはすべてのサブバンドが検査されるように実施してもよい。また、ラウンドロビン方式は、数フレームごとに1つのサブバンドが検査されるように実施してもよい。
本明細書に開示するマルチチャネルエコーキャンセレーションのシステムおよび方法の別の特徴は、モノラルおよびマルチチャネルのエコーキャンセレーションの間の動的な切替である。特に、この特徴は、モノAECアルゴリズム(正規化された最小平均二乗法(NLMS)など)と、本発明のエコーキャンセレーションアルゴリズムの効率的な再初期化を用いた複数のチャネルに対する本発明のAECアルゴリズムとの間での動的な切替を提供する。切替は動的であって、RLSアルゴリズムの効率的な再初期化のために、エコー漏れはほとんどまたは全くない。これは、状態変数を共有し、新規な推定技法を使用して、ラウンドロビン正則化を用いたRLSアルゴリズムの逆相関行列を推定することによって達成される。これにより、本発明は、何らエコー漏れなくNLMS(モノ)からRLS(マルチチャネル)に切り替えられるようにする。
本明細書に開示するマルチチャネルエコーキャンセレーションのシステムおよび方法のさらに別の特徴は、下位および上位のサブバンドに対する混合処理(mixed processing)である。特に、CPUリソースの要件を低くするために、NLMS処理を上位サブバンドで使用する一方で、ラウンドロビン正則化RLSを下位サブバンドで使用する。複数の再生信号および捕捉信号の両方をまず(低い方の周波数の信号を含む)下位サブバンドおよび(高い方の周波数の信号を含む)上位サブバンドに分割する。下位サブバンドに関し、本明細書に開示するRLSラウンドロビン正則化エコーキャンセレーションを用いる。上位サブバンドに関し、NLMS処理を用いる。NLMSの方が使用するCPUリソースが少なく、ステレオ効果は上位サブバンドの周波数で減衰するので、NLMSを上位サブバンドで使用する。下位周波数では、ステレオ効果が最も顕著なので、本発明のより優れたRLSラウンドロビン正則化を使用する。
本発明は、本発明の諸態様を例示する以下の説明および添付の図面を参照することによってさらに良く理解することができる。他の特徴および利点は、添付の図面とともに以下の本発明の詳細な説明から明らかとなるであろう。添付の図面は、本発明の原理を例として示している。
以下、図面を通じて、同様の参照番号は対応する部分を表している。
以下の本発明の説明では添付図面を参照する。添付図面は、その説明の一部をなし、本発明を実施することができる具体例を例示として示している。なお、他の実施形態を利用することもでき、本発明の範囲から逸脱することなく構成上の変更をなすことができることを理解されたい。
(I.はじめに
信号のエコーキャンセレーションのための現在の技法はさまざまな欠点を有する。例えば、正規化された最小平均二乗法(NLMS)は、信号がモノラル信号である場合には有用であるが、相関のあるマルチチャネル再生信号に関してはうまく働かない。非線形性を用いてマルチチャネル再生信号を処理することにより、個々のチャネルが無相関化されるが、再生信号に望ましくない歪みが付加される。これは、ユーザがもとの歪みのないバージョンを聞きたいと思う音楽を再生信号が含む場合には受け入れられない。再帰最小二乗法(RLS)および高速再帰最小二乗法(FRLS)もまた、マルチチャネル再生信号を無相関化する助けになる。しかし、FRLSは極めて不安定になることがある。RLSは計算量が大きく、高い相関のある再生信号に対しては不安定になることがある。
本明細書に開示するマルチチャネルラウンドロビン正則化エコーキャンセレーションの方法およびシステムは、現在の方法のこうした問題点を克服する。マルチチャネルラウンドロビン正則化エコーキャンセレーション方法は、複数の再帰最小二乗(RLS)適応フィルタを使用し、ラウンドロビン正則化方式を用いることによってマルチチャネル再生信号(音響信号など)を処理して、RLSアルゴリズムが安定にとどまるようにする。安定性は、RLSアルゴリズムの逆相関行列をサブバンドごとにラウンドロビン方式で正則化することによって保証される。本質的には、ラウンドロビン正則化は、複数のサブバンドのそれぞれに関してRLS適応フィルタの逆相関行列の行列式が「暴発」しない(すなわち大きい値に達しない)ようにする。
マルチチャネルラウンドロビン正則化エコーキャンセレーションの方法およびシステムは、逆相関行列が発散することによってRLS適応フィルタが発散することを防ぐ新規な方法を提供する。スピーカ信号のチャネルが依存関係にあるときにアルゴリズムが発散しないようにするために、逆相関行列をラウンドロビン方式に基づいてサブバンドごとに周期的に正則化する。
また、マルチチャネルラウンドロビン正則化エコーキャンセレーションの方法およびシステムは、マルチチャネルサブバンドエコーキャンセレーションプロセス(本明細書に記載のRLSラウンドロビン正則化方法など)と、シングルチャネルサブバンドエコーキャンセレーションプロセス(正規化された最小平均二乗法(NLMS)のような適応フィルタリングアルゴリズムを用いたもの)との間の動的な切替を可能にする新規な特徴を含む。それぞれのプロセスの効率的な再初期化により動的な切替を達成して、マルチチャネル処理とモノラル処理の間の切替時の歪みを最小化する。また、マルチチャネルラウンドロビン正則化エコーキャンセレーションの方法およびシステムは、RLSを用いて下位サブバンドを処理し、上位サブバンドに関してNLMSを用いるある種の別の特徴を含む。これにより、処理パワーが制限された環境でマルチチャネルラウンドロビン正則化エコーキャンセレーションの方法およびシステムの動作を可能にする。
(II.概要
図8は、本明細書に開示するマルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法の例示的な実施態様を示すブロック図である。なお、図8は、マルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法を実施し、使用することができるいくつかの方法のうちの1つであることに留意されたい。
図8を参照すると、マルチチャネルラウンドロビン正則化エコーキャンセレーションシステム800は、コンピューティングデバイス810上に存在する。図8において、再生信号P(1),P(2)〜P(N)がシステム800によって内部的に生成される(コンパクトディスクからの音楽など)。代替の一実施形態では、再生信号P(1),P(2)〜P(N)は外部にあり、システム800によって(入力オーディオジャック経由などで)受信される。各再生信号はそれぞれのスピーカを介して再生される。P(1)はスピーカS(1)を通じて再生され、P(2)はスピーカS(2)を通じて再生され、以下同様である。さらに、再生信号P(1)〜P(N)が取得され、マルチチャネルラウンドロビン正則化エコーキャンセレーションシステム800に入力される。
図8に点線で示したように、スピーカS(1)〜S(N)の出力により、エコー820、830、840が部屋(図示せず)の壁850から反射される。これらのエコー820、830、840はマイクロフォン860によってピックアップされる。さらに、マイクロフォンは、所望音声870および背景雑音880をピックアップする。マイクロフォンからの信号865は「捕捉信号」とも呼ばれ、再生信号P(1)〜P(N)の出力とともに、マルチチャネルラウンドロビン正則化エコーキャンセレーションシステム800に入力される。マルチチャネルラウンドロビン正則化エコーキャンセレーションシステム800による処理の後、新たな出力信号890が生成される。出力信号890は、スピーカ信号のエコー820、830、および840が低減された捕捉信号865である。
なお、本発明は音響信号に限定されないことに留意されたい。一般に、N個の送信機S(1)〜S(N)および1つの受信機860があってよく、マルチチャネルラウンドロビン正則化エコーキャンセレーションシステムは、出力信号890における送信信号の量を低減することになる。
また、本発明は、単一の受信機またはマイクロフォン860に限定されないことにも留意されたい。コンピューティングデバイス810は、複数の信号865を生成する複数の受信機860に接続されてもよい。その複数の信号865のそれぞれが、単一の独立したマルチチャネルラウンドロビン正則化エコーキャンセレーションシステム800によって奏されることになろう。そして、これら単一のもののそれぞれが、エコーが低減された単一の出力890を生成することになろう。
(III.例示的なオペレーティング環境
マルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法は、あるコンピューティング環境において、図8に示したコンピューティングデバイス810のようなコンピューティングデバイス上で動作するように設計される。マルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法が動作するコンピューティング環境についてこれから説明する。以下の説明は、マルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法を実施することができる好適なコンピューティング環境の簡単な概要を提供することを意図している。
図9は、図8に示したマルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法を実施することができる好適なコンピューティングシステム環境の一例を示している。コンピューティングシステム環境900は好適なコンピューティング環境の単なる一例であり、本発明の使用または機能の範囲についていかなる限定を示唆するものではない。また、コンピューティング環境900は、例示的なオペレーティング環境900に示されたコンポーネントのいずれかまたはその組合せに関するいかなる依存関係または要件を有するとも解釈されるべきではない。
マルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法は、数多くの他の汎用または専用のコンピューティングシステムの環境または構成とともに動作する。マルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法とともに使用するのに適する可能性のある周知のコンピューティングシステム、環境、および/または構成の例には、パーソナルコンピュータ、サーバコンピュータ、携帯電話やPDAのようなハンドヘルド型、ラップトップ型もしくはモバイル型のコンピュータまたは通信デバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラム可能な民生用電子機器、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたはデバイスのいずれかを含む分散コンピューティング環境等が含まれるが、これらには限定されない。
マルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法は、コンピュータによって実行されるプログラムモジュール等のコンピュータ実行可能命令との一般的関連で記述できる。一般に、プログラムモジュールは、特定のタスクを実行し、または特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含む。マルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法は、通信ネットワークを通じてリンクされたリモート処理デバイスによってタスクが行われる分散コンピューティング環境において実施することもできる。分散コンピューティング環境では、プログラムモジュールはメモリ記憶デバイスを含むローカルおよびリモートの両方のコンピュータ記憶媒体に配置されるこもある。図9を参照すると、マルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法を実施するための例示的なシステムは、コンピュータ910の形態の汎用コンピューティングデバイスを含む。
コンピュータ910のコンポーネントには、処理ユニット920、システムメモリ930、およびシステムメモリを含む種々のシステムコンポーネントを処理ユニット920に接続するシステムバス921が挙げられるが、これらには限定されない。システムバス921は、さまざまなバスアーキテクチャのいずれかを使用するメモリバスまたはメモリコントローラ、ペリフェラルバス、およびローカルバスを含む、いくつかのタイプのバス構造のいずれでもよい。例として、限定ではないが、このようなアーキテクチャには、ISA(Industry Standard Architecture)バス、MCA(Micro Channel Architecture)バス、EISA(Enhanced ISA)バス、VESA(Video Electronics Standards Association)ローカルバス、およびMezzanineバスとも呼ばれるPCI(Peripheral Component Interconnect)バスがある。
コンピュータ910は通常、さまざまなコンピュータ可読媒体を含む。コンピュータ可読媒体は、コンピュータ910によってアクセスできる任意の利用可能な媒体とすることができ、揮発性および不揮発性媒体、リムーバブルおよび非リムーバブル媒体の両方が含まれる。例として、限定ではないが、コンピュータ可読媒体は、コンピュータ記憶媒体および通信媒体を含む。コンピュータ記憶媒体には、コンピュータ可読命令、データ構造、プログラムモジュールまたはその他のデータのような情報の格納のための任意の方法または技術で実現された揮発性および不揮発性、リムーバブルおよび非リムーバブル媒体が含まれる。
コンピュータ記憶媒体には、以下のものに限定されないが、RAM、ROM、EEPROM、フラッシュメモリ等のメモリ技術、CD−ROM、ディジタル多用途ディスク(DVD)等の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ等の磁気記憶デバイス、または所望の情報を格納するために使用することができ、コンピュータ910によってアクセスすることができる任意の他の媒体が含まれる。通信媒体は通常、キャリア波または他のトランスポートメカニズムなどの変調データ信号でコンピュータ可読命令、データ構造、プログラムモジュール等のデータを具現化し、任意の情報配信媒体を含む。
「変調データ信号」という用語は、信号中に情報を符号化するように1つまたは複数の信号の特性を設定または変更した信号を意味する。例として、限定ではないが、通信媒体には、有線ネットワークまたは直接配線接続などの有線媒体、および音響、RF、赤外線等の無線媒体などの無線媒体が含まれる。上記のいずれの組合せもまた、コンピュータ可読媒体の範囲内に含まれるべきである。
システムメモリ930は、読み出し専用メモリ(ROM)931およびランダムアクセスメモリ(RAM)932のような揮発性および/または不揮発性メモリの形態のコンピュータ記憶媒体を含む。起動時などにコンピュータ910内の要素間で情報を転送するのを助ける基本ルーチンが入った基本入出力システム933(BIOS)は通常ROM931に格納される。RAM932は通常、処理ユニット920によって直ちにアクセス可能な、そして/または現在操作されているデータおよび/またはプログラムモジュールを収容する。例として、限定ではないが、図9は、オペレーティングシステム934、アプリケーションプログラム935、他のプログラムモジュール936、およびプログラムデータ937を示している。
コンピュータ910は、他のリムーバブル/非リムーバブル、揮発性/不揮発性のコンピュータ記憶媒体を含むこともある。単なる例として、図9は、非リムーバブル不揮発性磁気媒体の読み書きを行うハードディスクドライブ941、リムーバブル不揮発性磁気ディスク952の読み書きを行う磁気ディスクドライブ951、およびCD−ROM等の光媒体のようなリムーバブル不揮発性光ディスク956の読み書きを行う光ディスクドライブ955を示している。
例示的なオペレーティング環境で使用することができる他のリムーバブル/非リムーバブル、揮発性/不揮発性のコンピュータ記憶媒体には、以下のものに限定されないが、磁気テープカセット、フラッシュメモリカード、ディジタル多用途ディスク、ディジタルビデオテープ、固体RAM、固体ROM等がある。ハードディスクドライブ941は通常、インタフェース940のような非リムーバブルメモリインタフェースを通じてシステムバス921に接続され、磁気ディスクドライブ951および光ディスクドライブ955は通常、インタフェース950のようなリムーバブルメモリインタフェースによりシステムバス921に接続される。
上述し、図9に示したドライブおよびそれらの関連するコンピュータ記憶媒体は、コンピュータ910のためのコンピュータ可読命令、データ構造、プログラムモジュールおよび他のデータのストレージを提供する。図9では、例えば、ハードディスクドライブ941は、オペレーティングシステム944、アプリケーションプログラム945、他のプログラムモジュール946、およびプログラムデータ947を格納するように示されている。なお、これらのコンポーネントは、オペレーティングシステム934、アプリケーションプログラム935、他のプログラムモジュール936、およびプログラムデータ937と同じでも異なっていてもよいことに留意されたい。オペレーティングシステム944、アプリケーションプログラム945、他のプログラムモジュール946、およびプログラムデータ947は、少なくともそれらが別のコピーであることを示すためにここでは異なる番号が与えられている。ユーザは、キーボード962、および一般にマウス、トラックボールまたはタッチパッドと称されるポインティングデバイス961などの入力デバイスを通じてコンピュータ910にコマンドおよび情報を入力することができる。
他の入力デバイス(図示せず)には、マイクロフォン、ジョイスティック、ゲームパッド、サテライトディッシュ、スキャナ、ラジオ受信機、またはテレビもしくは放送ビデオ受信機等が挙げられる。これらおよび他の入力デバイスは、システムバス921に結合されるユーザ入力インタフェース960を通じて処理ユニット920に接続されることが多いが、例えばパラレルポート、ゲームポートまたはユニバーサルシリアルバス(USB)等の他のインタフェースおよびバス構造により接続されることもある。モニタ991または他のタイプのディスプレイデバイスもまた、ビデオインタフェース990のようなインタフェース経由でシステムバス921に接続される。モニタに加えて、コンピュータはスピーカ997やプリンタ996のような他の周辺出力デバイスを含むこともあり、これらは出力周辺インタフェース995を通じて接続することができる。
コンピュータ910は、リモートコンピュータ980のような1つまたは複数のリモートコンピュータへの論理コネクションを用いてネットワーク化された環境で動作することもある。リモートコンピュータ980は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイスまたは他の共通のネットワークノードとすることができ、図9にはメモリ記憶デバイス981のみが示されているが、通常、コンピュータ910に関して上述した要素の多くまたはすべてを含む。図9に示す論理コネクションは、ローカルエリアネットワーク(LAN)971およびワイドエリアネットワーク(WAN)973を含むが、他のネットワークを含んでもよい。このようなネットワーキング環境は、オフィス、企業規模のコンピュータネットワーク、イントラネットおよびインターネットで一般的である。
LANネットワーキング環境で使用されるとき、コンピュータ910はネットワークインタフェースまたはアダプタ970を通じてLAN971に接続される。WANネットワーキング環境で使用されるとき、コンピュータ910は通常、インターネットのようなWAN973を介して通信を確立するためのモデム972等の手段を含む。モデム972は、内蔵または外付けとすることができ、ユーザ入力インタフェース960または他の適当なメカニズムを介してシステムバス921に接続することができる。ネットワーク化環境では、コンピュータ910に関して図示したプログラムモジュールまたはその部分は、リモートメモリ記憶デバイスに格納されてもよい。例として、限定ではないが、図9は、リモートアプリケーションプログラム985がメモリデバイス981上に存在するように示している。理解されるように、図示したネットワークコネクションは例示であり、コンピュータ間に通信リンクを確立する他の手段を使用してもよい。
(IV.動作の概要
次に、図8に示したマルチチャネルラウンドロビン正則化エコーキャンセレーションシステム800の動作について説明する。図10は、図8に示したマルチチャネルラウンドロビン正則化エコーキャンセレーションシステムの全体的な動作を示す全体的な流れ図である。マルチチャネルラウンドロビン正則化エコーキャンセレーション方法は、複数の再生信号を複数のサブバンド信号に分解することによって始まる(ボックス1000)。これらの信号のそれぞれは、再生の1つのチャネルに対応することができる。次に、それぞれが逆相関行列を有する複数の適応フィルタを複数のサブバンド信号に適用する(ボックス1010)。複数の適応フィルタのそれぞれが、各フィルタが順に選択されるようにラウンドロビン順に選択される(ボックス1020)。次に、選択された各適応フィルタに関連する逆相関行列を正則化する(ボックス1030)。以下で詳細に説明するように、正則化とは、相関行列の行列式がゼロに近くならないように逆相関行列を処理することを意味する。そして、正則化された適応フィルタを用いて、複数の再生信号からの捕捉信号865中のエコーを低減する(ボックス1040)。
(V.動作の詳細と実施例
図10に示すマルチチャネルラウンドロビン正則化エコーキャンセレーション方法は、ラウンドロビン方式および正則化を用いて、再生チャネルが依存関係にあるときにエコーキャンセレーションアルゴリズムの適応フィルタが発散しないようにする。上記のように、本方法は、サブバンドの各適応フィルタを選択するラウンドロビン方式を実施し、選択された適応フィルタの逆相関行列を正則化することを含む。ラウンドロビン方式および正則化プロセスはともに、マルチチャネルラウンドロビン正則化エコーキャンセレーション方法のラウンドロビン正則化プロセスを構成する。以下、ラウンドロビン方式および正則化を実施するさまざまな方法について説明する。この説明は、ラウンドロビン方式および正則化プロセスの試験済みの実施態様の例示的な実施例を含む。特に、再帰最小二乗(RLS)アルゴリズムにおいてラウンドロビン正則化を用いるマルチチャネルラウンドロビン正則化エコーキャンセレーション方法の実施例を提示する。なお、この実施例は、ラウンドロビン正則化プロセスを実施することができる単なる1つの方法に過ぎないことに留意されたい。
適応フィルタリングプロセスの数学的記述
再生データのシングルチャネルについて、正則化付きのNLMSアルゴリズムは以下の通りである。
オーディオデータの各フレームn=1,2,...、および各サブバンドm=0...M−1について次を計算する。
Figure 0004955228
ここで、ξはマイクロフォン信号との間の誤差信号、Y(n,m)は推定エコー、ξ*は誤差信号の共役、
Figure 0004955228
は変換領域における推定エコーフィルタ係数、Lは推定エコーフィルタのタップ数、
Figure 0004955228
は最も直近のL個の周波数領域再生サンプルの列ベクトル、μはステップサイズ、βNLMSは正則化ファクタ、そしてPEst(n,m)はm番目のバンドにおけるパワーの推定である。例えば、PEst(n,m)は次のように求めることができる。
Figure 0004955228
ここで‖X(n,m)‖は、複素スピーカ信号X(n,m)の大きさの2乗であり、αは平均化パラメータである。
ある数を別の数で除算するときに、正則化は分母がゼロになり、分数が無限大にならないようにするために、分母に小さい値を加算または減算するプロセスである。式(2)において、βNLMSは、分母が決してゼロにならないようにする正則化ファクタである。PEst(n,m)はパワー推定であり、常に正であるので、βNLMSはPEst(n,m)に加えられる。分数を正則化する別の方法は、分母が正であり、ある閾値よりも小さい場合に、分母をその閾値に設定することである。
マルチチャネル再生信号にNLMSアルゴリズムを用いることの1つの問題は、NLMSがあまりうまく働かないことである。その理由は、マルチチャネル再生信号のチャネル間相関が、適応フィルタの収束を大幅に遅くするためである。再帰最小二乗法(RLS)は、適応フィルタのパラメータ(または重み)を調整するための代替的なアルゴリズムである。RLSの主な利点の1つは、チャネルを無相関化する傾向があるということである。RLSは、マルチチャネル入力スピーカデータの相関行列の逆行列の推定を再帰的に計算するので、スピーカチャネル間の相関を学習し、正しい解に素早く収束することができる。マルチチャネルスピーカ信号について、RLSアルゴリズムは以下の通りである。
Figure 0004955228
各フレームn=1,2,...、およびサブバンドm=0...M−1について、次を計算する。
Figure 0004955228
ここでδは小さい定数、Iは単位行列、
Figure 0004955228
はマルチチャネルカルマンゲインベクトル、Cは再生チャネル数、Lはサブバンドのフィルタ長、
Figure 0004955228
はマルチチャネルスピーカ入力ベクトル、P(n,m)は入力スピーカ信号相関行列R(n,m)の逆行列
Figure 0004955228
λは指数忘却ファクタ、
Figure 0004955228
は重みベクトル、そしてξは誤差の共役である。
なお、RLS適応フィルタは、サブバンドごとに逆相関行列Pを格納し、更新することに留意されたい。このことを本明細書では「逆相関行列を有する」と称する。
ラウンドロビン方式
一般に、マルチチャネルラウンドロビン正則化エコーキャンセレーション方法で用いられるラウンドロビン方式は、システム中の各サブバンドが、そのサブバンドの適応フィルタを正則化することができるように選択されることを確実にする。あるいは、適応フィルタを検査して正則化がその時点で必要であるかどうかを判定することができる。ラウンドロビン方式を用いて、各サブバンドが定期的に検査されることを確実にする。
ラウンドロビン方式は、さまざまな異なる方法で実施することができる。例として、限定ではないが、ラウンドロビン方式は、単一のサブバンドがフレームごとに正則化されるものとして記述することができる。あるいは、ラウンドロビン方式は、いくつかのまたはすべてのサブバンドをフレームごとに正則化することを含んでもよい。別の実施態様において、ラウンドロビン方式は、1つのサブバンドを数フレームごとに正則化することを含んでもよい。実施される実際のラウンドロビン方式に応じて、現在検査中のサブバンドを指すカウンタを更新して、検査される次のサブバンドまたはバンド群を指し、必要であればリセットして最初のバンドに戻る。
図11は、図10に示したマルチチャネルラウンドロビン正則化エコーキャンセレーション方法のラウンドロビン方式の例示的な実施態様を示す全体的な流れ図である。図11に示すように、ラウンドロビン方式は、現フレームを入力することにより始まる(ボックス1100)。次に、正則化のために1つのサブバンドを選択する(ボックス1110)。本実施形態では、新たな現フレームが入力されると順に各サブバンドが選択される。しかし、代替の実施形態では、単一のサブバンドが数フレームごとにのみ選択されてもよいし、数個のサブバンドが1フレームごとに選択されてもよい。
選択されたサブバンドの逆相関行列の逆行列をとって、選択されたサブバンドの相関行列を得る(ボックス1120)。次に、相関行列を正則化する(ボックス1130)。代替的な一実施形態では、ボックス1130は、まず相関行列を検査して正則化が必要かどうかを判定し、必要な場合にのみ正則化を行う。次に、正則化された相関行列の逆行列を再びとり(ボックス1140)、選択されたサブバンドの正則化された逆相関行列を格納する(ボックス1150)。最後に、すべてのサブバンドのすべての適応フィルタを複数のサブバンドの再生信号に適用して、捕捉信号中のエコーを低減する(ボックス1160)。そして、制御はボックス1100に戻り、次の現フレームを取得する。
ラウンドロビン正則化
本明細書に開示するラウンドロビン正則化プロセスをより完全に理解するために以下の説明を提供する。この説明は、再帰的な最小二乗(RLS)アルゴリズムにおけるラウンドロビン正則化プロセスの試験済み実施態様の実施例を含む。なお、この実施例は、ラウンドロビン正則化プロセスを実施することができる単なる1つの方法に過ぎないことに留意されたい。
一般に、ラウンドロビン正則化プロセスは、各適応フィルタの相関行列が特異にならないようにする。この正則化は、逆相関行列が不安定にならないことを確実にする。例示的な実施態様では、ラウンドロビン正則化がRLSアルゴリズムとともに用いられる。この実施態様の詳細を以下に示す。
一般に、RLSは次の正規方程式を解くための高速な方法である。
Figure 0004955228
ここで、wは最適重みベクトル、Rは式(9)で与えられる入力スピーカデータの相関行列、そしてpは入力スピーカデータとマイクロフォンデータの間の相互相関ベクトル
Figure 0004955228
である。Rが特異になり始めると、その逆行列中の値が非常に大きくなり、重みベクトルの有効な推定が求められなくなることがある。相関行列は、その行または列が依存関係にある場合に特異となる。この条件は、オーディオデータのあるチャネルが別のチャネルの線形変換であるときに起こる。例えば、あるチャネルが別のチャネルにあるゲインを乗じたものに等しい場合、相関行列が特異となる。この例は、モノ信号がシステム中の複数のスピーカにわたってパンされることに対応する。純粋にモノラルの信号の場合、各スピーカに対して再生される信号は同一であり、チャネル間のゲインは1に等しい。これらの例の両方で、忘却ファクタの値と、どれくらい長くモノ信号が再生されたかとに応じて、相関行列は急速に特異となる。
相関行列が特異にならないようにするために、ラウンドロビン正則化プロセスを用いて、特定のサブバンドの相関行列を正則化する。上述のように、正則化は、分数の分母がゼロに近づきすぎないようにすることを伴い、それによって分数の値が大きくなりすぎないようにする。
相関行列Rの正則化は、さまざまな異なる方法で達成することができる。相関行列の対角要素は非負であるので、本発明は、対角相関行列の正またはゼロの要素を正則化する必要があるだけである。例として、限定ではないが、相関行列は、次のことを行うことによって正則化できる。すなわち、(1)相関行列の対角要素に小さい値を加えること、および(2)ゼロに近い対角要素の値をある小さい閾値に設定することである。後者の技法では、ある閾値を定義し、相関行列の各要素を検査する。ゼロによる除算の危険がある場合(検査している要素が閾値よりも小さくなるときなど)、相関行列のその要素をその閾値に等しく設定する。閾値は、ゼロより大きい小さい数である。相関行列要素がその閾値よりも大きい場合、相関行列のその要素に対して何もしない。
相関行列の対角要素に小さい値を加えることを伴う第1の正則化技法は、数学的に次のようにまとめることができる。
Figure 0004955228
ここで、R(n,m)は相関行列、P−1(n,m)は逆相関行列の逆行列、βRLSは正則化ファクタ、そしてIは単位行列である。βRLSは、ある小さい定数(16ビットの入力データで1500など)とすることができ、または他の非均一技法(non−uniform techniques)を用いて選択することもできる。ラウンドロビン方式で各サブバンドを正則化することにより、2つの行列逆演算に伴う中央処理装置(CPU)の消費を最小化することができる。
上述のように、ラウンドロビン方式は、単一のバンドまたは複数のバンドがフレームごとに正則化されるか、または1つのバンドが数フレームごとに正則化される場合に実施することができる。実際のラウンドロビン方式に応じて、正則化すべき現在のバンドを指すカウンタを更新して、正則化すべき次のバンドまたはバンド群を指すようにし、必要ならリセットして最初のバンドに戻る。RおよびPは対称であるので、LU分解の代わりにコレスキー分解を用いてP−1からRを求めることができる(LU分解は2倍の演算回数を要する)。しかし、試験的な実施態様では、その数値的性質のために、コレスキー分解の代わりにLU分解を部分ピボット選択とともに用いて逆行列を計算した。さらに、この正則化プロセスでは、行列逆演算について許容可能なパフォーマンスを達成するために、倍精度演算を用いて計算を行った。
このように、ラウンドロビン正則化を用いた新規なRLSアルゴリズムは以下のようになる。
Figure 0004955228
本発明のこの実施形態では、MaxRoundRobinCountが、後述する混合サブバンド処理におけるサブバンドの数に等しくなるように選択される。MaxRoundRobinCountの値の選択は、指数忘却ファクタλの値に依存する。λの値は通常、RLS解の収束精度と追従速度との間のトレードオフとして選ばれる。λが1に非常に近い場合、RLSアルゴリズムは非常に精度の高いタップ重みを得ることになり、それゆえ近端室内で何の動きもなければほとんどのエコーが消去される。しかし、何かあるいは誰かが動くと、RLSアルゴリズムは音響環境中の変化に迅速に追従できない。MaxRoundRobinCountの値は、λMaxRoundRobinCountがあまりに小さすぎる値に到達しない程度の頻度でスピーカ信号の逆相関行列が正則化されるように選ばれるべきである。λMaxRoundRobinCountが小さすぎると、逆相関行列はラウンドロビン更新間で特異になるであろう。この場合、各サブバンドの逆相関行列が正則化される頻度を増やすために、フレームごとに複数のサブバンドの逆相関行列を正則化する必要があるであろう。
図12は、図8に示したマルチチャネルラウンドロビン正則化エコーキャンセレーションのシステム800および方法の例示的な実施態様を示すブロック/流れ図である。この例示的な実施態様は、前述のラウンドロビン正則化技法を用いている。図12は、サブバンドごとに1つのマルチチャネルフィルタを用い、集約されたデータに関して動作する実施態様を示している。詳細には、図12を参照すると、複数の再生チャネルからのサブバンド信号を単一のベクトルに集約する(ボックス1200)。この集約ベクトルを使用して、逆相関行列が式(7)およびラウンドロビン正則化を用いて更新される(ボックス1210)。集約されたサブバンド信号および逆相関行列を使用して、式(4)を用いてカルマンゲインを更新する(ボックス1220)。カルマンゲインを使用して、式(6)を用いてフィルタ係数を更新する(ボックス1230)。これらのフィルタ係数をマルチチャネルフィルタに送り(ボックス1240)、集約ベクトルに適用する。このプロセスは、毎ステップごとに再帰的に継続する。毎ステップごとに、マルチチャネルフィルタの現在の状態を用いて、マルチチャネル信号中のエコーを低減する。エコーが低減された捕捉信号が出力される。
図13は、図8に示したマルチチャネルラウンドロビン正則化エコーキャンセレーションのシステム800および方法の別の例示的な実施態様を示すブロック/流れ図である。この例示的な実施態様は、前述のラウンドロビン正則化技法を用い、図12の各マルチチャネル適応フィルタを複数のシングルチャネルフィルタとして実施する。詳細には、図13を参照すると、複数の再生チャネルからのサブバンド信号を単一のベクトルに集約する(ボックス1300)。式(7)およびラウンドロビン正則化を使用して逆相関行列を更新する(ボックス1310)。集約されたサブバンド信号および逆相関行列を使用して、式(4)を用いてカルマンゲインを更新する(ボックス1320)。カルマンゲインを用いて、フィルタ係数を更新する(ボックス1330)。これらのフィルタ係数は、左右両方のチャネルの係数を含む。チャネル重みを分離し(ボックス1340)、第1チャネルのフィルタ係数を第1チャネルのシングルチャネルフィルタに送り(ボックス1350)、第2チャネルのフィルタ係数を第2チャネルのシングルチャネルフィルタに送る(ボックス1360)。プロセスは、毎ステップごとに再帰的に継続する。毎ステップごとに、シングルチャネルフィルタの現在の状態を用いて、マルチチャネル信号中のエコーを低減する。エコーが低減された捕捉信号が出力される。
モノラルおよびマルチチャネルエコーキャンセレーション間の動的な切替
マルチチャネルラウンドロビン正則化エコーキャンセレーションの方法およびシステムは、モノラル再生信号に最適なエコーキャンセレーションアルゴリズムとマルチチャネル再生信号に最適なエコーキャンセレーションアルゴリズムとの間の動的な切替も含む。動的な切替は、モノAECアルゴリズム(NLMSなど)とマルチチャネルラウンドロビン正則化エコーキャンセレーション方法との間で行われ、それぞれのプロセスを効率的に再初期化することにより、マルチチャネル処理とモノラル処理の間の切替時の歪みを最小化する。
モノ信号(会話など)の期間とマルチチャネル信号(音楽など)の期間を有する信号において、動的な切替アルゴリズムを用いて、信号がモノ(またはほとんどモノ)であるかマルチチャネル信号であるかをインテリジェントに判定する。モノ信号の場合、図1に示したような正規化された最小平均二乗(NLMS)アルゴリズムを用いたモノAECシステムを使用する。マルチチャネル信号の場合、図12に示したようなマルチチャネルラウンドロビン正則化RLSエコーキャンセレーション方法を使用する。切替は動的であり、NLMSとRLSのアルゴリズムの状態が一方から次のアルゴリズムへの切替中に効率的に再初期化されるので、エコー漏れはほとんどまたは全くない。これは、状態変数を共有し、新規な推定技法を用いて、RLSアルゴリズムの相関行列を推定することによって達成される。これにより、グリッチなしでNLMS(モノ)とマルチチャネルラウンドロビン正則化RLSとの間の切替が可能となる。
詳しくは、スピーカへ送られる再生信号が純粋にモノ信号のみであることが分かっている場合、いくつかの理由で、(図1に示したような)モノラル適応フィルタ付きの正規化された最小平均二乗(NLMS)を使用する方が、(図8に示した)ラウンドロビン正則化付きのRLSを使用するよりも有効に動作する傾向がある。複数の再生チャネルにモノ信号がコピーされると、ラウンドロビン正則化付きのRLSは最終的に発散し、発散時間は忘却ファクタλに依存することになる。結果として、AECアルゴリズムは、真の解からずれることがある。しかし、単一の適応フィルタ付きのNLMSはモノ信号に対してうまく機能し、安定であることが知られている。さらに、NLMSは、どのタイプのマルチチャネルRLSよりもCPU消費が大幅に低い。
RLSと同様、NLMSもまた、次の正規方程式を解こうとするものとみなすことができる。
Figure 0004955228
NLMSの場合、正規方程式は最急降下法(method of steepest descent)を用いて統計的に解かれるが、RLSの場合、正規方程式は最小二乗法を用いて決定論的に解かれる。両方法とも、本質的にR−1の推定を計算する。RLSの場合、相関行列の逆行列をPによって推定する。NLMSの場合、R−1は、次の値を持つ対角行列とみなすことができる。
Figure 0004955228
結果として、モノからマルチチャネルAECへ切り替えるときに、逆相関行列推定の状態を容易に初期化できる。NLMSからRLSに遷移するとき、式(10)に示したように対角要素を初期化することができる。また、(図8に示した)マルチチャネルラウンドロビン正則化エコーキャンセレーションの方法およびシステムから(図1に示した)NLMSを用いたモノAECに遷移するとき、状態はデータ履歴のみから導出されるので、状態を明示的に初期化する必要はない。
ラウンドロビン正則化RLSおよびNLMSの混合処理
マルチチャネルラウンドロビン正則化エコーキャンセレーション方法を実行するために必要な中央処理装置(CPU)リソースを低減するために、新規なRLS/NLMS混合処理アルゴリズムを用いる。まず、信号を(マルチチャネル再生信号の低い方の周波数を含む)下位サブバンドおよび(信号の高い方の周波数を含む)上位サブバンドに分ける。下位サブバンドに関し、RLSを用いたマルチチャネルラウンドロビン正則化エコーキャンセレーション方法を使用する。上位サブバンドに関し、NLMSアルゴリズムを使用する。NLMSアルゴリズムは使用するCPUリソースが少なく、上位サブバンドにおいて用いられる。というのは、ステレオ効果はこれらの周波数で減衰するためである。下位周波数では、ステレオ効果が最も顕著であり、より高いCPU処理コストと引き替えに、より優れたマルチチャネルラウンドロビン正則化エコーキャンセレーション方法が用いられる。
図14は、本明細書に記載のマルチチャネルラウンドロビン正則化方法を用いる下位/上位サブバンド混合処理を示している。一般に、処理用件を低減するために、下位サブバンドは、RLSで実施されるマルチチャネルラウンドロビン正則化方法を用いて処理され、上位サブバンドはNLMSを用いて処理される。マルチチャネルラウンドロビン正則化エコーキャンセレーション方法を用いる下位/上位サブバンド混合エコーキャンセレーションシステム1400が示されている。図14に示すように、少なくとも2つの再生信号x(0)およびx(1)が用いられる。再生信号x(1)は右スピーカ1410を通じて再生され、再生信号x(0)は左スピーカ1420を通じて再生される。
マイクロフォン1430は、そのマイクロフォンが位置する部屋(図示せず)からの不要なエコーを捕捉する。マイクロフォン信号yは第1の分析フィルタバンク1440によって処理され、再生信号x(0)およびx(1)は第2の分析フィルタバンク1450および第3のフィルタバンク1460によって処理され、信号x(0)、x(1)およびyが時間領域から周波数領域信号X(0)、X(1)、およびYへそれぞれ変換される。分析フィルタバンク1440、1450、1460は、ウィンドウ付き高速フーリエ変換(FFT)、MCLT、またはその他の周波数領域変換とすることができる。
変換された再生信号X(0)およびX(1)は混合処理分離モジュール1470に送られる。モジュール1470は、分離プロセスを用いて、左の再生信号X(0)を左の下位サブバンド信号1475および左の上位サブバンド信号1480に分ける。同様に、右の再生信号X(1)は、右の下位サブバンド信号1478および右の上位サブバンド信号1483に分けられる。同様に、混合処理分離モジュール1445は、捕捉信号Yを上位サブバンド信号1448および下位サブバンド信号1447に分ける。複数のNLMSプロセッサ1485が、変換されたマイクロフォン信号Y、左の上位サブバンド信号1480および右の上位サブバンド信号1483を処理のために受け取る。各NLMSプロセッサ1485は、式(1)および(2)に示したアルゴリズムを用いて信号を処理し、式(3)のモノ入力スピーカ信号が式(8)のマルチチャネルスピーカ信号で置き換えられる。マルチチャネルラウンドロビン正則化エコーキャンセレーション方法を用いる複数のRLSプロセッサ1490(このプロセッサの例は図13に示した)を用いて、左の下位再生サブバンド信号1475、右の下位再生サブバンド信号1478、および下位サブバンド捕捉信号1447を処理する。処理された下位サブバンド信号および上位サブバンド信号は合成フィルタバンク1495に送られ、そこでエコーが低減された時間領域信号zを出力する。
以上、例示および説明の目的で本発明の説明を提示した。これは、網羅的であったり、または本発明を開示されている通りの形態に限定したりすることを意図するものではない。上記の教示に照らして多くの変更および変形が可能である。本発明の範囲は、この発明の詳細な説明によってではなく、添付の特許請求の範囲によって限定されることが意図されている。
モノ再生信号を処理するために用いられる従来技術のシングルチャネル音響エコーキャンセレーション(AEC)システムを示す。 図1に示したモノAECプロセッサの詳細なブロック図である。 ステレオ再生信号を処理するために用いられる従来技術のステレオAECシステムを示す。 音声通信システムとともに用いられる図3のAECシステムを示す。 マルチチャネル再生信号がステレオ音楽を含む場合の図3のAECシステムを示す。 マルチチャネル信号がモノ音声を含む場合の図3のAECシステムを示す。 図3に示したステレオAECプロセッサの詳細なブロック図である。 本明細書に開示するマルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法の例示的な実施態様を示すブロック図である。 図8に示したマルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法を実施することができる好適なコンピューティングシステム環境の一例を示す。 図8に示したマルチチャネルラウンドロビン正則化エコーキャンセレーションシステムの全体的な動作を示す全体的な流れ図である。 図10に示したマルチチャネルラウンドロビン正則化エコーキャンセレーション方法のラウンドロビン方式の例示的な実施態様を示す全体的な流れ図である。 図8に示したマルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法の例示的な実施態様を示すブロック/流れ図である。 図8に示したマルチチャネルラウンドロビン正則化エコーキャンセレーションのシステムおよび方法の別の例示的な実施態様を示すブロック/流れ図である。 本明細書に記載のマルチチャネルラウンドロビン正則化方法を用いた混合された下位/上位サブバンド処理を示す。
符号の説明
100 音響エコーキャンセレーション(AEC)システム
105 モノ再生信号x
110 右スピーカ
120 左スピーカ
130,140 エコー
150 壁
160 マイクロフォン
165 所望音声
170 背景雑音
175 第1の分析フィルタバンク
180 第2の分析フィルタバンク
185 AECモノプロセッサ
190 合成フィルタバンク
200 適応フィルタ
210 適応フィルタ係数更新部
300 ステレオAECシステム
302 右ステレオチャネルx(0)
305 左ステレオチャネルx(1)
310 右スピーカ
320 左スピーカ
330 第1のエコー
340 第2のエコー
350 壁
355 マイクロフォン
360 所望音声
365 背景雑音
370 第1のフィルタバンク
375 第2のフィルタバンク
380 第3の分析フィルタバンク
385 ステレオAECプロセッサ
390 合成フィルタバンク
400 音声信号
410 音楽
420 音楽
600 モノ音声
700 第1の適応フィルタ
710 第2の適応フィルタ
720 適応フィルタ係数更新部
800 マルチチャネルラウンドロビン正則化エコーキャンセレーションシステム
810 コンピューティングデバイス
820,830,840 エコー
850 壁
860 マイクロフォン
865 捕捉信号
870 所望音声
880 背景雑音
890 出力信号
900 コンピューティングシステム環境
910 コンピュータ
920 処理ユニット
921 システムバス
930 システムメモリ
931 読み出し専用メモリ(ROM)
932 ランダムアクセスメモリ(RAM)
933 基本入出力システム(BIOS)
934 オペレーティングシステム
935 アプリケーションプログラム
936 他のプログラムモジュール
937 プログラムデータ
940 非リムーバブルメモリインタフェース
941 ハードディスクドライブ
944 オペレーティングシステム
945 アプリケーションプログラム
946 他のプログラムモジュール
947 プログラムデータ
950 リムーバブルメモリインタフェース
951 磁気ディスクドライブ
952 磁気ディスク
955 光ディスクドライブ
956 光ディスク
960 ユーザ入力インタフェース
961 ポインティングデバイス
962 キーボード
970 ネットワークインタフェース
971 ローカルエリアネットワーク(LAN)
972 モデム
973 ワイドエリアネットワーク(WAN)
980 リモートコンピュータ
981 メモリ記憶デバイス
985 リモートアプリケーションプログラム
990 ビデオインタフェース
991 モニタ
995 出力周辺インタフェース
996 プリンタ
997 スピーカ
1400 下位/上位サブバンド混合エコーキャンセレーションシステム
1410 右スピーカ
1420 左スピーカ
1430 マイクロフォン
1440 第1の分析フィルタバンク
1445 混合処理分離モジュール
1447 下位サブバンド捕捉信号
1448 上位サブバンド捕捉信号
1450 第2の分析フィルタバンク
1460 第3の分析フィルタバンク
1470 混合処理分離モジュール
1475 左の下位サブバンド再生信号
1478 右の下位サブバンド再生信号
1480 左の上位サブバンド再生信号
1483 右の上位サブバンド再生信号
1485 NLMSプロセッサ
1490 RLSプロセッサ
1495 合成フィルタバンク

Claims (22)

  1. 捕捉信号中の複数の再生信号のエコーをキャンセルする方法であって、
    前記複数の再生信号を複数のサブバンドに分解することと、
    ここで、各サブバンドは、前記再生信号の1つのチャネルに対応し、
    それぞれが逆相関行列を有する複数の再帰最小二乗(RLS)適応フィルタを用いて前記分解されたサブバンドを処理することと、
    前記RLS適応フィルタのそれぞれをラウンドロビン方式で選択することと、
    処理の安定性を保証するために前記各選択されたRLS適応フィルタの逆相関行列を正則化することと、
    ここで、前記選択されたRLS適応フィルタの逆相関行列を正則化することは、
    正則化のために1つのサブバンドを選択することと、
    前記選択されたサブバンドについての前記選択されたRLS適応フィルタの逆相関行列の逆行列を取ることによって、前記選択されたRLS適応フィルタの相関行列を生成することと、
    前記生成されたRLS適応フィルタの相関行列を検査して正則化が必要であるかどうかを判定することと、
    正則化が必要であると判定された前記RLS適応フィルタの相関行列を正則化して正則化された相関行列を生成することと、
    前記生成された正則化された相関行列の逆行列をとることによって、前記RLS適応フィルタの正則化された逆相関行列を生成することと
    を含み、
    前記生成された正則化された逆相関行列を含むRLS適応フィルタの出力を用いて前記捕捉信号中のエコーを低減することと
    を具えたことを特徴とする方法。
  2. 前記複数のRLS適応フィルタを並列に適用することをさらに具えたことを特徴とする請求項1記載の方法。
  3. 前記RLS適応フィルタの長さを、前記複数のサブバンドの低い方の周波数を含む下位サブバンドでは長くし、前記複数のサブバンドの高い方の周波数を含む上位サブバンド信号では短くすることをさらに具えたことを特徴とする請求項1記載の方法。
  4. 前記逆相関行列を正則化することは、相関行列の行列式がゼロに近くならないように前記逆相関行列を処理することをさらに具えたことを特徴とする請求項1記載の方法。
  5. 前記相関行列を正則化することは、前記相関行列の対角要素に小さい正の値を加えることをさらに具えたことを特徴とする請求項1記載の方法。
  6. 前記相関行列を正則化することは、
    閾値を定義することと、
    前記相関行列の各対角要素を前記閾値と比較することと、
    前記相関行列の対角要素が前記閾値よりも小さい場合、前記対角要素を前記閾値に等しく設定することと
    をさらに具えたことを特徴とする請求項1記載の方法。
  7. 前記複数のRLS適応フィルタを用いて前記サブバンドを処理することは、
    前記複数のRLS適応フィルタのそれぞれに対応する複数の重みベクトルを適応させることと、
    前記複数の重みベクトルのそれぞれを分離して、各再生チャネルが1つの対応する単一チャネルフィルタ係数ベクトルを有するように複数の単一チャネルフィルタ係数ベクトルを生成することと、
    前記複数の単一チャネルフィルタ係数ベクトルを前記複数のサブバンド信号に適用することと
    をさらに具えたことを特徴とする請求項1記載の方法。
  8. 前記捕捉信号は、音響信号を含むことを特徴とする請求項1記載の方法。
  9. 前記捕捉信号は、電気信号を含むことを特徴とする請求項1記載の方法。
  10. 前記複数の再生信号は、ステレオ信号であることを特徴とする請求項1記載の方法。
  11. 前記複数のRLS適応フィルタを用いて前記サブバンドを処理することは、前記エコーが存在する部屋の伝達関数を識別することをさらに具えたことを特徴とする請求項1記載の方法。
  12. 前記ラウンドロビン方式は、前記捕捉信号中のオーディオデータの毎フレームごとに単一のRLS適応フィルタを選択することを具えたことを特徴とする請求項1記載のコンピュータ実施方法。
  13. 前記ラウンドロビン方式は、前記捕捉信号中のオーディオデータの数フレームごとに単一のRLS適応フィルタを選択することを具えたことを特徴とする請求項1記載のコンピュータ実施方法。
  14. 前記ラウンドロビン方式は、前記捕捉信号中のオーディオデータの毎フレームごとに複数のRLS適応フィルタを選択することを具えたことを特徴とする請求項1記載のコンピュータ実施方法。
  15. 1つまたは複数の再生信号およびエコーを含む捕捉信号を処理する際に2つの異なるタイプのエコーキャンセレーションプロセスの間で自動的に切替を行うことをさらに具え、前記捕捉信号は、下位捕捉サブバンドおよび上位捕捉サブバンドを含み、
    前記切替を行うことは、
    前記1つまたは複数の再生信号がモノラルであるかどうかを検出することと、
    前記1つまたは複数の再生信号がモノラルである場合、モノラルエコーキャンセレーションを用いて前記捕捉信号および前記1つまたは複数の再生信号を処理することと、
    ここで、モノラルエコーキャンセレーションは、正規化された最小平均二乗(NLMS)エコーキャンセレーション、又は、最小平均二乗(LMS)エコーキャンセレーションであり、
    前記1つまたは複数の再生信号がモノラルでない場合、マルチチャネルラウンドロビン正則化エコーキャンセレーションを用いて、前記捕捉信号および前記1つまたは複数の再生信号を処理することと、
    ここで、マルチチャネルラウンドロビン正則化エコーキャンセレーションは、
    それぞれが逆相関行列を有する複数の最小平均二乗(NLMS)適応フィルタを用いて前記上位捕捉サブバンドを処理することと、
    前記NLMS適応フィルタのそれぞれをラウンドロビン方式で選択することと、
    処理の安定性を保証するために前記各選択されたNLMS適応フィルタの逆相関行列を正則化することであって、前記選択されたNLMS適応フィルタの逆相関行列を正則化することは、
    正則化のために1つの上位捕捉サブバンドを選択することと、
    前記選択された上位捕捉サブバンドについての前記選択されたNLMS適応フィルタの逆相関行列の逆行列をとることによって、前記選択されたNLMS適応フィルタの相関行列を生成することと、
    前記生成されたNLMS適応フィルタの相関行列を検査して正則化が必要であるかどうかを判定することと、
    正則化が必要であると判定された前記NLMS適応フィルタの相関行列を正則化して正則化された相関行列を生成することと、
    前記生成された正則化された相関行列の逆行列をとることによって、前記NLMS適応フィルタの正則化された逆相関行列を生成することと
    を含み、
    前記マルチチャネルラウンドロビン正則化エコーキャンセレーションの相関行列を推定するために推定技法を使用することであって、前記推定技法を使用することは、
    (a)前記マルチチャネルラウンドロビン正則化エコーキャンセレーションから前記モノラルエコーキャンセレーションへの動的な切替のときに最急降下法を用いて統計的に正規方程式を解くことと、
    (b)前記モノラルエコーキャンセレーションから前記マルチチャネルラウンドロビン正則化エコーキャンセレーションへの動的な切替のときに前記最小平均二乗(NLMS)適応フィルタを用いて決定論的に正規方程式を解くことと
    のいずれかを含むことと、
    前記検出が一方から他方のタイプに変化した時に、前記モノラルエコーキャンセレーションプロセスと前記マルチチャネルラウンドロビン正則化エコーキャンセレーションプロセスの間で動的に切替を行うことと
    を具えたことを特徴とする請求項1記載の方法。
  16. 前記モノラルエコーキャンセレーションと前記マルチチャネルラウンドロビン正則化エコーキャンセレーションは、状態変数を共有することを特徴とする請求項15記載の方法。
  17. 前記捕捉信号は、前記捕捉信号の低い方の周波数を含む下位捕捉サブバンドおよび前記捕捉信号の高い方の周波数を含む上位捕捉サブバンドを有し、前記複数の再生信号は、前記複数の再生信号の低い方の周波数を含む下位再生サブバンドおよび前記複数の再生信号の高い方の周波数を含む上位再生サブバンドを有し、
    正規化された最小平均二乗(NLMS)エコーキャンセレーションを用いて前記上位捕捉サブバンドからのエコーをキャンセルすることと、
    マルチチャネルラウンドロビン正則化エコーキャンセレーションを用いて前記下位捕捉サブバンド中のエコーをキャンセルすることと
    をさらに具え、
    前記マルチチャネルラウンドロビン正則化エコーキャンセレーションは、
    それぞれが逆相関行列を有する複数の再帰最小二乗(RLS)適応フィルタを用いて前記下位再生サブバンドを処理することと、
    前記RLS適応フィルタのそれぞれをラウンドロビン方式で選択することと、
    処理の安定性を保証するために前記各選択されたRLS適応フィルタの逆相関行列を正則化することであって、前記選択されたRLS適応フィルタの逆相関行列を正則化することは、
    正則化のために1つの下位再生サブバンドを選択することと、
    前記選択された下位再生サブバンドについての前記選択されたRLS適応フィルタの逆相関行列の逆行列をとることによって、前記選択されたRLS適応フィルタの相関行列を生成することと、
    前記生成されたRLS適応フィルタの相関行列を検査して正則化が必要であるかどうかを判定することと、
    正則化が必要であると判定された前記RLS適応フィルタの相関行列を正則化して正則化された相関行列を生成することと、
    前記生成された正則化された相関行列の逆行列をとることによって、前記RLS適応フィルタの正則化された逆相関行列を生成することと
    を含むことを特徴とする請求項1記載の方法。
  18. コンピュータにより、請求項1〜17記載の方法を実行することが可能な命令を有するコンピュータプログラム。
  19. 請求項18記載のコンピュータプログラムを有するコンピュータ読取り可能な記録媒体。
  20. 捕捉信号中の複数の再生信号のエコーをキャンセルする装置であって、
    前記複数の再生信号を複数のサブバンドに分解することと、
    それぞれが逆相関行列を有する複数の再帰最小二乗(RLS)適応フィルタを用いて前記分解されたサブバンドを処理することと、
    前記RLS適応フィルタのそれぞれをラウンドロビン方式で選択することと、
    処理の安定性を保証するために前記各選択されたRLS適応フィルタの逆相関行列を正則化することであって、前記選択されたRLS適応フィルタの逆相関行列を正則化することは、
    正則化のために1つのサブバンドを選択し、その選択されたサブバンドについての前記選択されたRLS適応フィルタの逆相関行列の逆行列を取ることによって、前記選択されたRLS適応フィルタの相関行列を生成することと、
    前記生成されたRLS適応フィルタの相関行列を検査して正則化が必要であるかどうかを判定することと、
    正則化が必要であると判定された前記RLS適応フィルタの相関行列を正則化して正則化された相関行列を生成することと、
    前記生成された正則化された相関行列の逆行列をとることによって、前記RLS適応フィルタの正則化された逆相関行列を生成することと
    を含み、
    前記生成された正則化された逆相関行列を含むRLS適応フィルタの出力を用いて前記捕捉信号中のエコーを低減することと
    を具えたことを特徴とする装置。
  21. 1つまたは複数の再生信号およびエコーを含む捕捉信号を処理する際に2つの異なるタイプのエコーキャンセレーションプロセスの間で自動的に切替を行うことをさらに具え、前記捕捉信号は、下位捕捉サブバンドおよび上位捕捉サブバンドを含み、
    前記切替を行うことは、
    前記1つまたは複数の再生信号がモノラルであるかどうかを検出することと、
    前記1つまたは複数の再生信号がモノラルである場合、モノラルエコーキャンセレーションを用いて前記捕捉信号および前記1つまたは複数の再生信号を処理することと、
    ここで、モノラルエコーキャンセレーションは、正規化された最小平均二乗(NLMS)エコーキャンセレーション、又は、最小平均二乗(LMS)エコーキャンセレーションであり、
    前記1つまたは複数の再生信号がモノラルでない場合、マルチチャネルラウンドロビン正則化エコーキャンセレーションを用いて、前記捕捉信号および前記1つまたは複数の再生信号を処理することと、
    ここで、マルチチャネルラウンドロビン正則化エコーキャンセレーションは、
    それぞれが逆相関行列を有する複数の最小平均二乗(NLMS)適応フィルタを用いて前記上位捕捉サブバンドを処理することと、
    前記NLMS適応フィルタのそれぞれをラウンドロビン方式で選択することと、
    処理の安定性を保証するために前記各選択されたNLMS適応フィルタの逆相関行列を正則化することであって、前記選択されたNLMS適応フィルタの逆相関行列を正則化することは、
    正則化のために1つの上位捕捉サブバンドを選択することと、
    前記選択された上位捕捉サブバンドについての前記選択されたNLMS適応フィルタの逆相関行列の逆行列をとることによって、前記選択されたNLMS適応フィルタの相関行列を生成することと、
    前記生成されたNLMS適応フィルタの相関行列を検査して正則化が必要であるかどうかを判定することと、
    正則化が必要であると判定された前記NLMS適応フィルタの相関行列を正則化して正則化された相関行列を生成することと、
    前記生成された正則化された相関行列の逆行列をとることによって、前記NLMS適応フィルタの正則化された逆相関行列を生成することと
    を含み、
    前記マルチチャネルラウンドロビン正則化エコーキャンセレーションの相関行列を推定するために推定技法を使用することであって、前記推定技法を使用することは、
    (a)前記マルチチャネルラウンドロビン正則化エコーキャンセレーションから前記モノラルエコーキャンセレーションへの動的な切替のときに最急降下法を用いて統計的に正規方程式を解くことと、
    (b)前記モノラルエコーキャンセレーションから前記マルチチャネルラウンドロビン正則化エコーキャンセレーションへの動的な切替のときに前記最小平均二乗(NLMS)プロセスを用いて決定論的に正規方程式を解くことと
    のいずれかを含むことと、
    前記検出が一方から他方のタイプに変化した時に、前記モノラルエコーキャンセレーションプロセスと前記マルチチャネルラウンドロビン正則化エコーキャンセレーションプロセスの間で動的に切替を行うことと
    を具えたことを特徴とする請求項20記載の装置。
  22. 前記捕捉信号は、前記捕捉信号の低い方の周波数を含む下位捕捉サブバンドおよび前記捕捉信号の高い方の周波数を含む上位捕捉サブバンドを有し、前記複数の再生信号は、前記複数の再生信号の低い方の周波数を含む下位再生サブバンドおよび前記複数の再生信号の高い方の周波数を含む上位再生サブバンドを有し、
    正規化された最小平均二乗(NLMS)エコーキャンセレーションを用いて前記上位捕捉サブバンドからのエコーをキャンセルすることと、
    マルチチャネルラウンドロビン正則化エコーキャンセレーションを用いて前記下位捕捉サブバンド中のエコーをキャンセルすることと
    をさらに具え、
    前記マルチチャネルラウンドロビン正則化エコーキャンセレーションは、
    それぞれが逆相関行列を有する複数の再帰最小二乗(RLS)適応フィルタを用いて前記下位再生サブバンドを処理することと、
    前記RLS適応フィルタのそれぞれをラウンドロビン方式で選択することと、
    処理の安定性を保証するために前記各選択されたRLS適応フィルタの逆相関行列を正則化することであって、前記選択されたRLS適応フィルタの逆相関行列を正則化することは、
    正則化のために1つのサブバンドを選択し、その選択されたサブバンドについての前記選択されたRLS適応フィルタの逆相関行列の逆行列をとることによって、前記選択されたRLS適応フィルタの相関行列を生成することと、
    前記生成されたRLS適応フィルタの相関行列を検査して正則化が必要であるかどうかを判定することと、
    正則化が必要であると判定された前記RLS適応フィルタの相関行列を正則化して正則化された相関行列を生成することと、
    前記生成された正則化された相関行列の逆行列をとることによって、前記RLS適応フィルタの正則化された逆相関行列を生成することと
    を含むことを特徴とする請求項20記載の装置。
JP2005169880A 2004-06-30 2005-06-09 ラウンドロビン正則化を用いたマルチチャネルエコーキャンセレーション Expired - Fee Related JP4955228B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/883,128 2004-06-30
US10/883,128 US7352858B2 (en) 2004-06-30 2004-06-30 Multi-channel echo cancellation with round robin regularization

Publications (3)

Publication Number Publication Date
JP2006018254A JP2006018254A (ja) 2006-01-19
JP2006018254A5 JP2006018254A5 (ja) 2008-07-24
JP4955228B2 true JP4955228B2 (ja) 2012-06-20

Family

ID=35106701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005169880A Expired - Fee Related JP4955228B2 (ja) 2004-06-30 2005-06-09 ラウンドロビン正則化を用いたマルチチャネルエコーキャンセレーション

Country Status (8)

Country Link
US (2) US7352858B2 (ja)
EP (3) EP1612963B1 (ja)
JP (1) JP4955228B2 (ja)
KR (1) KR101137159B1 (ja)
CN (1) CN100573668C (ja)
AT (1) ATE414351T1 (ja)
DE (1) DE602005010942D1 (ja)
ES (2) ES2388575T3 (ja)

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7433463B2 (en) * 2004-08-10 2008-10-07 Clarity Technologies, Inc. Echo cancellation and noise reduction method
US20060035593A1 (en) * 2004-08-12 2006-02-16 Motorola, Inc. Noise and interference reduction in digitized signals
NO328256B1 (no) * 2004-12-29 2010-01-18 Tandberg Telecom As Audiosystem
US20080280679A1 (en) * 2005-03-09 2008-11-13 Pierre Beaupre Sound Filtering System for Gaming Environments
US8014516B2 (en) * 2006-01-27 2011-09-06 Mediatek Inc. Method and apparatus for echo cancellation
US7852889B2 (en) * 2006-02-17 2010-12-14 Cymer, Inc. Active spectral control of DUV light source
US8189765B2 (en) * 2006-07-06 2012-05-29 Panasonic Corporation Multichannel echo canceller
EP1879181B1 (en) * 2006-07-11 2014-05-21 Nuance Communications, Inc. Method for compensation audio signal components in a vehicle communication system and system therefor
US7852792B2 (en) * 2006-09-19 2010-12-14 Alcatel-Lucent Usa Inc. Packet based echo cancellation and suppression
US20080144808A1 (en) * 2006-12-19 2008-06-19 Goodrich Patrick D Circuit for adjusting impedance mismatch and method therefor
US8982744B2 (en) * 2007-06-06 2015-03-17 Broadcom Corporation Method and system for a subband acoustic echo canceller with integrated voice activity detection
US8045645B2 (en) * 2007-06-08 2011-10-25 Telefonaktiebolaget Lm Ericsson (Publ) Signal processor for estimating signal parameters using an approximated inverse matrix
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8223959B2 (en) * 2007-07-31 2012-07-17 Hewlett-Packard Development Company, L.P. Echo cancellation in which sound source signals are spatially distributed to all speaker devices
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8254588B2 (en) 2007-11-13 2012-08-28 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for providing step size control for subband affine projection filters for echo cancellation applications
US8350962B2 (en) * 2008-02-13 2013-01-08 Broadcom Corporation Method and system for video format conversion
US8385557B2 (en) 2008-06-19 2013-02-26 Microsoft Corporation Multichannel acoustic echo reduction
US8170226B2 (en) * 2008-06-20 2012-05-01 Microsoft Corporation Acoustic echo cancellation and adaptive filters
US8605890B2 (en) * 2008-09-22 2013-12-10 Microsoft Corporation Multichannel acoustic echo cancellation
US20100172232A1 (en) * 2009-01-07 2010-07-08 Mario Traeber Noise compensation in data transmission
WO2010106469A1 (en) * 2009-03-17 2010-09-23 Koninklijke Philips Electronics N.V. Audio processing in a processing system
EP2237271B1 (en) 2009-03-31 2021-01-20 Cerence Operating Company Method for determining a signal component for reducing noise in an input signal
US8208649B2 (en) * 2009-04-28 2012-06-26 Hewlett-Packard Development Company, L.P. Methods and systems for robust approximations of impulse responses in multichannel audio-communication systems
US20110058676A1 (en) * 2009-09-07 2011-03-10 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dereverberation of multichannel signal
US8634569B2 (en) * 2010-01-08 2014-01-21 Conexant Systems, Inc. Systems and methods for echo cancellation and echo suppression
USD656507S1 (en) 2010-04-30 2012-03-27 American Teleconferencing Services, Ltd. Display screen portion with an animated image
US9560206B2 (en) 2010-04-30 2017-01-31 American Teleconferencing Services, Ltd. Real-time speech-to-text conversion in an audio conference session
US8626847B2 (en) 2010-04-30 2014-01-07 American Teleconferencing Services, Ltd. Transferring a conference session between client devices
US9189143B2 (en) 2010-04-30 2015-11-17 American Teleconferencing Services, Ltd. Sharing social networking content in a conference user interface
US10372315B2 (en) 2010-04-30 2019-08-06 American Teleconferencing Services, Ltd Location-aware conferencing with calendar functions
USD656942S1 (en) 2010-04-30 2012-04-03 American Teleconferencing Services, Ltd. Display screen portion with an animated image
USD656505S1 (en) 2010-04-30 2012-03-27 American Teleconferencing Services, Ltd. Display screen portion with animated image
US9419810B2 (en) 2010-04-30 2016-08-16 American Teleconference Services, Ltd. Location aware conferencing with graphical representations that enable licensing and advertising
USD642587S1 (en) 2010-04-30 2011-08-02 American Teleconferencing Services, Ltd. Animated graphical user interface for a portion of a display screen
USD656506S1 (en) 2010-04-30 2012-03-27 American Teleconferencing Services, Ltd. Display screen portion with an animated image
USD656941S1 (en) 2010-04-30 2012-04-03 American Teleconferencing Services, Ltd. Display screen portion with an animated image
USD642586S1 (en) 2010-04-30 2011-08-02 American Teleconferencing Services, Ltd. Portion of a display screen with a user interface
US10268360B2 (en) 2010-04-30 2019-04-23 American Teleconferencing Service, Ltd. Participant profiling in a conferencing system
US9106794B2 (en) 2010-04-30 2015-08-11 American Teleconferencing Services, Ltd Record and playback in a conference
USD656504S1 (en) 2010-04-30 2012-03-27 American Teleconferencing Services, Ltd. Display screen portion with an animated image
US9082106B2 (en) 2010-04-30 2015-07-14 American Teleconferencing Services, Ltd. Conferencing system with graphical interface for participant survey
EP2466864B1 (de) * 2010-12-14 2019-02-27 Deutsche Telekom AG Transparente Dekorrelation der Lautsprechersignale bei mehrkanaligen Echokompensatoren
WO2012094528A1 (en) 2011-01-05 2012-07-12 Conexant Systems, Inc., A Delaware Corporation Systems and methods for stereo echo cancellation
US8411132B2 (en) 2011-01-27 2013-04-02 Audio Properties, Inc. System and method for real-time media data review
JP6094479B2 (ja) * 2011-05-19 2017-03-15 日本電気株式会社 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体
US8320577B1 (en) * 2011-05-20 2012-11-27 Google Inc. Method and apparatus for multi-channel audio processing using single-channel components
CN102457632B (zh) * 2011-12-29 2014-07-30 歌尔声学股份有限公司 一种多受话端回声消除方法
US9143862B2 (en) * 2012-12-17 2015-09-22 Microsoft Corporation Correlation based filter adaptation
US9232072B2 (en) * 2013-03-13 2016-01-05 Google Inc. Participant controlled spatial AEC
WO2014168618A1 (en) * 2013-04-11 2014-10-16 Nuance Communications, Inc. System for automatic speech recognition and audio entertainment
US9025711B2 (en) * 2013-08-13 2015-05-05 Applied Micro Circuits Corporation Fast filtering for a transceiver
US9613634B2 (en) * 2014-06-19 2017-04-04 Yang Gao Control of acoustic echo canceller adaptive filter for speech enhancement
US9456276B1 (en) * 2014-09-30 2016-09-27 Amazon Technologies, Inc. Parameter selection for audio beamforming
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9672821B2 (en) * 2015-06-05 2017-06-06 Apple Inc. Robust speech recognition in the presence of echo and noise using multiple signals for discrimination
KR20170032603A (ko) 2015-09-15 2017-03-23 삼성전자주식회사 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체
CN106331402B (zh) * 2016-08-25 2019-03-22 西南交通大学 一种基于系数差成比例子带凸组合自适应回声消除法
WO2018119467A1 (en) * 2016-12-23 2018-06-28 Synaptics Incorporated Multiple input multiple output (mimo) audio signal processing for speech de-reverberation
JP7175441B2 (ja) 2016-12-23 2022-11-21 シナプティクス インコーポレイテッド 雑音のある時変環境のための重み付け予測誤差に基づくオンライン残響除去アルゴリズム
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
CN106782593B (zh) * 2017-02-27 2019-10-25 重庆邮电大学 一种用于声学回声消除的多带结构自适应滤波器切换方法
US10013995B1 (en) * 2017-05-10 2018-07-03 Cirrus Logic, Inc. Combined reference signal for acoustic echo cancellation
GB201709849D0 (en) * 2017-06-20 2017-08-02 Nokia Technologies Oy Processing audio signals
CN110870211B (zh) * 2017-07-14 2021-10-15 杜比实验室特许公司 用于检测且补偿不准确回波预测的方法和系统
US9947338B1 (en) * 2017-09-19 2018-04-17 Amazon Technologies, Inc. Echo latency estimation
CN108200522B (zh) * 2017-11-24 2020-02-18 华侨大学 一种变正则化比例归一化子带自适应滤波方法
WO2019231632A1 (en) 2018-06-01 2019-12-05 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
CN108806709B (zh) * 2018-06-13 2022-07-12 南京大学 基于频域卡尔曼滤波的自适应声回声抵消方法
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
US11417351B2 (en) 2018-06-26 2022-08-16 Google Llc Multi-channel echo cancellation with scenario memory
US10841030B2 (en) * 2018-07-30 2020-11-17 Avago Technologies International Sales Pte. Limited Leg combining by FFT selection
KR20200024066A (ko) * 2018-08-27 2020-03-06 서강대학교산학협력단 스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법
KR102088355B1 (ko) * 2018-08-27 2020-03-12 서강대학교 산학협력단 스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법
KR102088375B1 (ko) * 2018-08-27 2020-03-12 서강대학교 산학협력단 스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법
WO2020061353A1 (en) 2018-09-20 2020-03-26 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
CN110956973A (zh) * 2018-09-27 2020-04-03 深圳市冠旭电子股份有限公司 一种回声消除方法、装置及智能终端
CN111263252B (zh) * 2018-11-30 2021-11-30 上海哔哩哔哩科技有限公司 一种用于直播的连麦消音方法、系统和存储介质
US11094333B2 (en) * 2019-03-15 2021-08-17 Sogang University Research & Business Development Foundation Device and method for stereo noise cancellation
US11438691B2 (en) 2019-03-21 2022-09-06 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality
US11303981B2 (en) 2019-03-21 2022-04-12 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
US11600287B2 (en) * 2019-03-28 2023-03-07 Bose Corporation Cancellation of vehicle active sound management signals for handsfree systems
US11445294B2 (en) 2019-05-23 2022-09-13 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
TW202105369A (zh) 2019-05-31 2021-02-01 美商舒爾獲得控股公司 整合語音及雜訊活動偵測之低延時自動混波器
US11297426B2 (en) 2019-08-23 2022-04-05 Shure Acquisition Holdings, Inc. One-dimensional array microphone with improved directivity
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
US11785380B2 (en) 2021-01-28 2023-10-10 Shure Acquisition Holdings, Inc. Hybrid audio beamforming system
CN114582312B (zh) * 2022-02-14 2022-11-22 中国科学院声学研究所 一种车内抗干扰自适应路噪主动控制方法及控制系统

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4421182A (en) * 1982-03-16 1983-12-20 Moody Arlin R Combination clean-out and drilling tool
US5305307A (en) 1991-01-04 1994-04-19 Picturetel Corporation Adaptive acoustic echo canceller having means for reducing or eliminating echo in a plurality of signal bandwidths
JP3397269B2 (ja) * 1994-10-26 2003-04-14 日本電信電話株式会社 多チャネル反響消去方法
US5677951A (en) * 1995-06-19 1997-10-14 Lucent Technologies Inc. Adaptive filter and method for implementing echo cancellation
JP3397282B2 (ja) * 1995-08-14 2003-04-14 日本電信電話株式会社 周波数帯域分割型反響消去装置
JP3654470B2 (ja) * 1996-09-13 2005-06-02 日本電信電話株式会社 サブバンド多チャネル音声通信会議用反響消去方法
FR2758677B1 (fr) * 1997-01-21 1999-04-02 Matra Communication Procede d'annulation d'echo et annuleur d'echo mettant en oeuvre un tel procede
US6055311A (en) 1997-01-31 2000-04-25 Telefonaktiebolaget L M Ericsson (Publ) Dynamic echo canceller and parameter selection in telephony systems
FR2762467B1 (fr) * 1997-04-16 1999-07-02 France Telecom Procede d'annulation d'echo acoustique multi-voies et annuleur d'echo acoustique multi-voies
US5987098A (en) 1997-12-23 1999-11-16 Nortel Networks Corporation Method and system for sparing echo cancellers
DE69908463T2 (de) 1998-03-05 2004-05-13 Nippon Telegraph And Telephone Corp. Verfahren und Einrichtung zur mehrkanaligen Kompensation eines akustischen Echos
DE19831320A1 (de) 1998-07-13 2000-01-27 Ericsson Telefon Ab L M Digitales adaptives Filter und akustischer Echokompensator
US6408269B1 (en) * 1999-03-03 2002-06-18 Industrial Technology Research Institute Frame-based subband Kalman filtering method and apparatus for speech enhancement
US6870882B1 (en) 1999-10-08 2005-03-22 At&T Corp. Finite-length equalization over multi-input multi-output channels
JP2002009675A (ja) * 2000-06-26 2002-01-11 Nec Corp 多重化回線用エコー除去方法及び装置
GB0027238D0 (en) * 2000-11-08 2000-12-27 Secr Defence Adaptive filter
US6785341B2 (en) 2001-05-11 2004-08-31 Qualcomm Incorporated Method and apparatus for processing data in a multiple-input multiple-output (MIMO) communication system utilizing channel state information
FR2824982B1 (fr) 2001-05-16 2003-07-04 France Telecom Procede de controle adaptatif de systeme d'annulation d'echo multivoies et dispositif pour mettre en oeuvre le procede
US7321568B2 (en) * 2001-06-01 2008-01-22 Texas Instruments Incorporated Realtime management of processing resources
JP2002368658A (ja) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd 多チャネルエコー消去装置、方法、記録媒体及び音声通信システム
FR2841721B1 (fr) * 2002-06-28 2004-08-20 France Telecom Dispositif de traitement d'echo pour systeme de communication de type monovoie ou multivoies
US7227959B2 (en) 2003-03-10 2007-06-05 Shure Incorporated Multi-channel digital feedback reducer system
WO2004098088A2 (en) 2003-04-28 2004-11-11 Solarflare Communications, Inc. Multiple channel interference cancellation
US6925176B2 (en) 2003-06-27 2005-08-02 Nokia Corporation Method for enhancing the acoustic echo cancellation system using residual echo filter
NO320942B1 (no) * 2003-12-23 2006-02-13 Tandberg Telecom As System og fremgangsmate for forbedret stereolyd

Also Published As

Publication number Publication date
EP1612963A2 (en) 2006-01-04
US7925007B2 (en) 2011-04-12
KR20060047950A (ko) 2006-05-18
EP2045928B1 (en) 2012-06-27
EP1612963A3 (en) 2006-07-12
US20060002547A1 (en) 2006-01-05
EP2045929A1 (en) 2009-04-08
US7352858B2 (en) 2008-04-01
CN100573668C (zh) 2009-12-23
CN1716381A (zh) 2006-01-04
ES2388575T3 (es) 2012-10-16
KR101137159B1 (ko) 2012-04-19
US20060002546A1 (en) 2006-01-05
JP2006018254A (ja) 2006-01-19
ATE414351T1 (de) 2008-11-15
DE602005010942D1 (de) 2008-12-24
EP1612963B1 (en) 2008-11-12
ES2388573T3 (es) 2012-10-16
EP2045928A1 (en) 2009-04-08
EP2045929B1 (en) 2012-06-27

Similar Documents

Publication Publication Date Title
JP4955228B2 (ja) ラウンドロビン正則化を用いたマルチチャネルエコーキャンセレーション
US7742592B2 (en) Method and device for removing echo in an audio signal
US6968064B1 (en) Adaptive thresholds in acoustic echo canceller for use during double talk
US9520139B2 (en) Post tone suppression for speech enhancement
US8594320B2 (en) Hybrid echo and noise suppression method and device in a multi-channel audio signal
US11297178B2 (en) Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters
EP2036399B1 (en) Adaptive acoustic echo cancellation
Jeannes et al. Combined noise and echo reduction in hands-free systems: a survey
US7869587B2 (en) Method and apparatus for canceling acoustic echo in a mobile terminal
EP3469591B1 (en) Echo estimation and management with adaptation of sparse prediction filter set
CN112929506B (zh) 音频信号的处理方法及装置,计算机存储介质及电子设备
Fukui et al. Acoustic echo and noise canceller for personal hands-free video IP phone
Henni et al. A new joint noise reduction and echo suppression system based on FBSS and automatic voice activity detector
Garre et al. An Acoustic Echo Cancellation System based on Adaptive Algorithm
Ruiz et al. Distributed combined acoustic echo cancellation and noise reduction using GEVD-based distributed adaptive node specific signal estimation with prior knowledge
Gänsler et al. The WinEC: a real-time hands-free stereo communication system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080606

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080606

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120309

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120315

R150 Certificate of patent or registration of utility model

Ref document number: 4955228

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees