WO2024070461A1

WO2024070461A1 - エコー除去装置、及び、エコー除去方法

Info

Publication number: WO2024070461A1
Application number: PCT/JP2023/031654
Authority: WO
Inventors: 宏正大橋; 潤二荒木
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2022-09-28
Filing date: 2023-08-30
Publication date: 2024-04-04

Abstract

エコー除去装置は、マイク信号を生成し、エコー信号の推定に用いられる適応フィルタを更新し、出力信号と適応フィルタとに基づいて疑似エコー信号を生成し、マイク信号から疑似エコー信号を除去してエコー除去後信号を生成し、目的音信号がエコー除去後信号に含まれているか否かを判定し、判定結果に基づいてエコー除去後信号のゲインを調整し、調整されたエコー除去後信号に基づいて前記出力信号を生成する。

Description

エコー除去装置、及び、エコー除去方法

　本開示は、エコー除去装置、及び、エコー除去方法に関する。

　それぞれがマイクとスピーカを備える複数のユニットを相互に接続した音声会議装置において、拡声された音声の遅延を低減する技術が知られている。

　特許文献１には、マイクが目的の音声信号を収音していないマイクオフ時は、このマイクが集音した音声信号を外部に出力せず、外部から入力された音声信号をスピーカに供給し、マイクが目的の音声信号を収音しているマイクオン時は、このマイクが集音した音声信号を外部に供給し、外部から入力された音声信号をスピーカに供給しない技術が開示されている。

日本国特開２００８－１４７８２２号公報

　しかしながら、特許文献１は、複数のユニットを相互に接続した音声会議装置において、隣接する第１ユニットと第２ユニットの間において、第１ユニットのスピーカから第２ユニットのマイクへ音声が回り込んでエコー音が発生し、そのエコー音を十分に除去することができない。

　本開示の目的は、エコー音を十分に除去することができる技術を提供することにある。

　本開示の一態様に係るエコー除去装置は、スピーカから出力された音が空間を伝搬してマイクに入力された音であるエコー音を除去するエコー除去装置であって、前記マイクから入力される音に基づいてマイク信号を生成するマイク信号生成部と、前記エコー音に関する信号であるエコー信号の推定に用いられる適応フィルタを更新する適応フィルタ更新部と、前記スピーカから出力される音に関する信号である出力信号と前記適応フィルタとに基づいて疑似エコー信号を生成する疑似エコー信号生成部と、前記マイク信号から前記疑似エコー信号を除去してエコー除去後信号を生成するエコー信号除去部と、前記エコー信号とは異なる信号である目的音信号が前記エコー除去後信号に含まれているか否かを判定する目的音判定部と、前記目的音判定部による判定結果に基づいて前記エコー除去後信号のゲインを調整するゲイン調整部と、前記ゲイン調整部によって調整された前記エコー除去後信号に基づいて前記出力信号を生成する出力信号生成部と、を備える。

　本開示の一態様に係るエコー除去方法は、スピーカから出力された音が空間を伝搬してマイクに入力された音であるエコー音を除去するエコー除去方法であって、前記マイクから入力される音に基づいてマイク信号を生成するマイク信号生成ステップと、前記エコー音に関する信号であるエコー信号の推定に用いられる適応フィルタを更新する適応フィルタ更新ステップと、前記スピーカから出力される音に関する信号である出力信号と前記適応フィルタとに基づいて疑似エコー信号を生成する疑似エコー信号生成ステップと、前記マイク信号から前記疑似エコー信号を除去してエコー除去後信号を生成するエコー信号除去ステップと、前記エコー信号とは異なる信号である目的音信号が前記エコー除去後信号に含まれているか否かを判定する目的音判定ステップと、前記目的音判定ステップによる判定結果に基づいて前記エコー除去後信号のゲインを調整するゲイン調整ステップと、前記ゲイン調整ステップによって調整された前記エコー除去後信号に基づいて前記出力信号を生成する出力信号生成ステップと、を含む。

　なお、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム又は記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。

　本開示の技術によれば、エコー音を十分に除去することができる。

実施の形態１に係る音声入出力システムの構成例を示すブロック図実施の形態１に係るエコー除去装置の構成例を示すブロック図実施の形態１に係る、参照信号記憶部、基準値算出部、基準値記憶部及び適応フィルタ更新部を詳細に説明するための図実施の形態２に係るエコー除去装置の構成の第１例を示すブロック図実施の形態２に係るエコー除去装置の構成の第２例を示すブロック図実施の形態２に係るゲイン調整部の処理の第１例を示すフローチャート実施の形態２に係るゲイン調整部の処理の第２例を示すフローチャート実施の形態２に係る周波数領域にてエコー信号を除去する処理例を示すフローチャート実施の形態２に係るエコー除去装置の構成の第３例を示すブロック図実施の形態２に係る目的音判定部の処理例を示すフローチャート

　以下、図面を適宜参照して、本開示の実施の形態について、詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。例えば、すでによく知られた事項の詳細説明及び実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の記載の主題を限定することは意図されていない。

（実施の形態１）
　図１は、実施の形態１に係る音声入出力システム１の構成例を示すブロック図である。

　音声入出力システム１は、ＷＥＢ会議システム２と、ミキサ３と、少なくとも１つのマイク４と、少なくとも１つのスピーカ５とを含む。例えば、図１に示すように、近端側の部屋の音声入出力システム１と、遠端側の部屋の音声入出力システム１とが、通信ネットワーク（図示しない）を介して接続され、近端側の部屋のユーザと、遠端側の部屋のユーザとは、リモート会議を行うことができる。以下では、近端側の部屋の音声入出力システム１に注目して説明するが、以下の説明は、遠端側の部屋の音声入出力システム１にも当てはまる。

　ＷＥＢ会議システム２は、通信ネットワーク（図示しない）を介して、他のＷＥＢ会議システム２と接続される。ＷＥＢ会議システム２は、専用の装置、サーバ又はＰＣとして構成されてよい。なお、遠端側の部屋のＷＥＢ会議システム２がＰＣとして構成され、遠端側のマイク４及びスピーカ５は、ＰＣに接続されたヘッドセットであってもよい。

　ミキサ３は、通信ネットワークを介して、ＷＥＢ会議システム２に接続される。通信ネットワークは、例えば、有線ＬＡＮ（Local Area network）、無線ＬＡＮ、インターネット、又は、ＶＰＮ（Virtual Private Network）によって構成されてよい。なお、ミキサ３は、ラックマウントミキサであってよい。

　ミキサ３には、少なくとも１つのマイク４と少なくとも１つのスピーカ５とが接続される。また、ミキサ３は、少なくとも１つのエコー除去装置１０を備える。エコー除去装置１０は、ミキサ３に追加搭載可能なＤＳＰボードに実装されてもよい。

　エコー音は、ＷＥＢ会議システム２からミキサ３に入力された遠端側のユーザの音声がスピーカ５から出力され、その出力音が、点線矢印９０１に示すように、空間を伝達してマイク４に入力され、この入力音声の信号がＷＥＢ会議システム２を介して遠端側に送信されることで、遠端側のユーザが発した音声が再度遠端側に帰還することにより発生する音である。

　なお、本実施の形態では、遠端側のユーザが発した音声を含む信号であって、遠端側から近端側に送信される信号を、遠端信号と称する。また、近端側のミキサ３から遠端側に送信される信号を、送話信号と称する。

　エコー除去装置１０は、マイク４から入力された入力音声に含まれる遠端側のユーザが発した音声を除去し、その除去した音声（以下、エコー除去後音声と称する）を含む送話信号を、ＷＥＢ会議システム２に出力する。この出力された送話信号は、遠端側のＷＥＢ会議システム２に送信され、遠端側のスピーカ５から出力される。これにより、遠端側のスピーカ５において、エコーが発生することを抑止できる。

　しかし、接続されているマイク４の本数、マイク４が存在する位置及び環境等が変化した場合、エコー音も変化し得る。以下では、このようにマイク４の環境が変動した場合でも、即座にエコー音を除去できるエコー除去装置１０について詳細に説明する。

　図２は、実施の形態１に係るエコー除去装置１０の構成例を示すブロック図である。

　エコー除去装置１０は、マイク信号生成部１１、エコー信号除去部１２、出力信号生成部１３、参照信号記憶部１４、基準値算出部１５、基準値記憶部１６、適応フィルタ更新部１７、疑似エコー信号生成部１８、及び、期間長決定部１９を含む。

　なお、マイク信号生成部１１、エコー信号除去部１２、出力信号生成部１３、基準値算出部１５、適応フィルタ更新部１７、疑似エコー信号生成部１８、及び、期間長決定部１９は、エコー除去装置１０が備える半導体回路として構成されてもよいし、エコー除去装置１０が備えるプロセッサにて実行されるコンピュータプログラムとして実現されてもよい。また、参照信号記憶部１４、及び、基準値記憶部１６は、エコー除去装置１０が備える揮発性又は不揮発性のメモリとして構成されてよい。

　マイク信号生成部１１は、マイク４に入力された入力音声に基づいてマイク信号ｍ［ｉ］を生成し、出力する。ここで、ｉは時刻インデックスを示す。

　エコー信号除去部１２は、マイク信号生成部１１から出力されたマイク信号ｍ［ｉ］から、後述する疑似エコー信号生成部１８によって生成された疑似エコー信号ｙ＾［ｉ］を除去してエコー除去後信号を生成し、出力する。

　出力信号生成部１３は、エコー信号除去部１２から出力されたエコー除去後信号に基づいて送話信号ｅ［ｉ］を生成し、出力する。出力信号生成部１３は、エコー除去後信号をそのまま送話信号として出力してもよいし、エコー除去後信号に所定の処理を施して送話信号を生成及び出力してもよい。

　参照信号記憶部１４は、ＷＥＢ会議システム２からスピーカ５に出力される遠端信号と同等の遠端信号を、所定期間分、参照信号ｘ［ｉ］として記憶する。参照信号記憶部１４の詳細については後述する。

　基準値算出部１５は、参照信号記憶部１４に記憶されている参照信号を用いて基準値を算出する。基準値算出部１５は、互いに異なる複数の期間のそれぞれに対応する複数の基準値を並列に算出してよい。そして、基準値算出部１５は、その算出した複数の期間のそれぞれに対応する複数の基準値を基準値記憶部１６に記憶させる。基準値算出部１５の詳細については後述する。

　基準値記憶部１６は、基準値算出部１５によって算出された複数の期間のそれぞれに対応する複数の基準値を記憶する。基準値記憶部１６の詳細については後述する。

　適応フィルタ更新部１７は、基準値記憶部１６に記憶されている複数の基準値のうちのいずれか１つの基準値と、参照信号と、送話信号とを用いて、適応フィルタを更新（学習）する。

　疑似エコー信号生成部１８は、参照信号と、適応フィルタ更新部１７によって更新される適応フィルタとを用いて、疑似エコー信号を生成する。疑似エコー信号は、上記したエコー信号除去部１２にて使用される。

　期間長決定部１９は、適応フィルタに使用する基準値を選択するための、期間長を決定する。上記の適応フィルタ更新部１７は、期間長決定部１９によって決定された期間長に対応する基準値を基準値記憶部１６から取得して使用する。期間長決定部１９は、ミキサ３に接続されているマイク４の本数に基づいて期間長を決定してよい。また、期間長決定部１９は、ミキサ３に接続されているマイク４の本数が変化した場合、期間長を決定し直してよい。また、期間長決定部１９は、ミキサ３に接続されているマイク４の位置又は周囲の環境が変化した場合、期間長を決定し直してもよい。

　なお、接続されるマイク４の本数と期間長との対応関係は、予め定められてよい。また、当該対応関係は、マイク４が存在する環境毎に異なってよい。例えば、マイク４が存在する環境にて、接続されるマイク４の本数と期間長とを変えながらどの期間長が最もエコー除去効果が高いかを予め測定し、その測定結果に基づいて、接続されるマイク４の本数と期間長との対応関係を定めてよい。

　図３は、実施の形態１に係る、参照信号記憶部１４、基準値算出部１５、基準値記憶部１６、及び、適応フィルタ更新部１７を詳細に説明するための図である。

　参照信号記憶部１４は、所定期間分の参照信号を記憶する。参照信号記憶部１４は、例えばリングバッファ３１として構成され、古い参照信号は新しい参照信号に順次置き換えられてよい。

　参照信号記憶部１４は、例えば、期間［ｉ］～［ｉ－Ｌ３＋１］の参照信号ｘ［ｉ］～ｘ［ｉ－Ｌ３＋１］を記憶する。ここで、ｉは時刻インデックスを示し、ｘ［ｉ］は時刻インデックスｉのときの参照信号を示す。Ｌ０、Ｌ１、Ｌ２、Ｌ３はタップ長を示す整数であり、Ｌ０＜Ｌ１＜Ｌ２＜Ｌ３である。

　基準値算出部１５は、互いに異なる複数のタップ長のそれぞれに対応する複数の基準値を並列に算出する。本実施の形態では、基準値をノルム値とする。例えば、基準値算出部１５は、タップ長Ｌ０のノルム値算出部４０と、タップ長Ｌ１のノルム値算出部４１と、タップ長Ｌ２のノルム値算出部４２と、タップ長Ｌ３のノルム値算出部４３とを有する。タップ長Ｌ０のノルム値算出部４０と、タップ長Ｌ１のノルム値算出部４１と、タップ長Ｌ２のノルム値算出部４２と、タップ長Ｌ３のノルム値算出部４３とは、並列に算出処理を行ってよい。これにより、基準値算出部１５は、４つのノルム値を高速に算出することができる。

　タップ長Ｌ０のノルム値算出部４０は、次の式（１）により、タップ長Ｌ０のノルム値Ｎ_Ｌ０［ｉ］を算出する。

　タップ長Ｌ１のノルム値算出部４１は、次の式（２）により、タップ長Ｌ１のノルム値Ｎ_Ｌ１［ｉ］を算出する。

　タップ長Ｌ２のノルム値算出部４２は、次の式（３）により、タップ長Ｌ２のノルム値Ｎ_Ｌ２［ｉ］を算出する。

　タップ長Ｌ３のノルム値算出部４３は、次の式（４）により、タップ長Ｌ３のノルム値Ｎ_Ｌ３［ｉ］を算出する。

　なお、上記の式（１）は、次の式（５）によって算出されてもよい。

　これは、前回の時刻タイミング［ｉ－１］で算出済みのノルム値Ｎ_Ｌ０［ｉ－１］に、現在の時刻インデックスｉの参照信号の絶対値｜ｘ［ｉ］｜を加算し、期間外となった時刻インデックス［ｉ－Ｌ０］の参照信号の絶対値｜ｘ［ｉ－Ｌ０］｜を減算して、タップ長Ｌ０のノルム値Ｎ_Ｌ０［ｉ］を算出する方法である。これにより、タップ長Ｌ０のすべての参照信号の絶対値を加算する方法と比べて計算量が少なくなるので、高速にノルム値を算出できる。タップ長Ｌ１のノルム値Ｎ_Ｌ１［ｉ］、タップ長Ｌ２のノルム値Ｎ_Ｌ２［ｉ］、タップ長Ｌ３のノルム値Ｎ_Ｌ３［ｉ］についても同様である。

　また、タップ長Ｌ０のノルム値Ｎ_Ｌ０［ｉ］は、上記の式（１）に代えて、次の式（６）によって算出されてもよい。タップ長Ｌ１のノルム値Ｎ_Ｌ１［ｉ］、タップ長Ｌ２のノルム値Ｎ_Ｌ２［ｉ］、タップ長Ｌ３のノルム値Ｎ_Ｌ３［ｉ］についても同様である。

　タップ長Ｌ０のノルム値算出部４０は、算出したタップ長Ｌ０のノルム値Ｎ_Ｌ０［ｉ］を、基準値記憶部１６に格納する。タップ長Ｌ１のノルム値算出部４１は、算出したタップ長Ｌ１のノルム値Ｎ_Ｌ１［ｉ］を、基準値記憶部１６に格納する。タップ長Ｌ２のノルム値算出部４２は、算出したタップ長Ｌ２のノルム値Ｎ_Ｌ２［ｉ］を、基準値記憶部１６に格納する。タップ長Ｌ３のノルム値算出部４３は、算出したタップ長Ｌ３のノルム値Ｎ_Ｌ３［ｉ］を、基準値記憶部１６に格納する。これにより、基準値記憶部１６には、Ｎ_Ｌ０［ｉ］、Ｎ_Ｌ１［ｉ］、Ｎ_Ｌ２［ｉ］、Ｎ_Ｌ３［ｉ］が格納される。

　適応フィルタ更新部１７は、期間長決定部１９による決定に応じて、基準値記憶部１６から、Ｎ_Ｌ０［ｉ］、Ｎ_Ｌ１［ｉ］、Ｎ_Ｌ２［ｉ］、Ｎ_Ｌ３［ｉ］のうちのいずれか１つを選択する。以下、ここで選択されたタップ長をＬと表現し、選択されたノルム値をＮ_Ｌ［ｉ］と表現する。

　適応フィルタ更新部１７は、次の式（７）により、適応フィルタ係数の更新量Δω_（ｉ）［ｌ］を算出する。ここで、ｌはタップインデックスを示し、μ［ｌ］はタップインデックスｌに対応したステップゲインを示し、ｅ［ｉ］は送話信号を示す。φ（）は非線形関数を示す。φ（）の例として、恒等関数ｉｄ（ｘ）＝ｘ、ｓｉｇｎ（）、ｔａｎｈ（）等が挙げられる。例えば、φ（ｅ［ｉ］）は、ｔａｎｈ（αｅ［ｉ］）であってよい。ここで、αはスケーリング係数である。

　適応フィルタ更新部１７は、式（７）で算出した適応フィルタ係数の更新量Δω_（ｉ）［ｌ］を用いて、次の式（８）により、適応フィルタ係数ω_{（ｉ＋１）}［ｌ］を算出する。ここで、ω_（ｉ）［ｌ］は、時刻インデックスｉにおけるｌタップ目の適応フィルタ係数を示す。

　疑似エコー信号生成部１８は、式（８）で算出された適応フィルタ係数を用いて、次の式（９）により、疑似エコー信号ｙ＾［ｉ］を生成する。

　エコー信号除去部１２は、式（９）で算出された疑似エコー信号ｙ＾［ｉ］を用いて、次の式（１０）により、エコー除去後信号（送話信号）ｅ［ｉ］を生成する。すなわち、エコー信号除去部１２は、マイク信号ｍ［ｉ］から疑似エコー信号ｙ＾［ｉ］を除去し、エコー除去後信号（送話信号）ｅ［ｉ］を生成する。

　出力信号生成部１３は、このように生成されたエコー除去後信号（送話信号）ｅ［ｉ］を、ＷＥＢ会議システム２へ出力する。これにより、エコー音を除去した送話信号を送信できる。

　上述した方法によれば、基準値記憶部１６には、最新の時刻インデックスｉにおける、タップ長がそれぞれ異なるノルム値Ｎ_Ｌ０［ｉ］、Ｎ_Ｌ１［ｉ］、Ｎ_Ｌ２［ｉ］、Ｎ_Ｌ３［ｉ］が格納される。よって、適応フィルタ更新部１７は、接続されるマイク４の本数が変わった場合又はマイク４が存在する環境が変わった場合等、エコー音の特性が変化した場合に、基準値記憶部１６に格納されている互いに異なる複数のノルム値のうち、特性が変化したエコー信号の除去に最適なノルム値を選択することにより、適応フィルタを、変化後のエコー信号を適切に除去可能なものに即座に更新できる。すなわち、エコー除去装置１０は、エコー音の特性が変化した場合であっても、即座にエコー音の除去を行うことができる。

　なお、上述では、タップ長の数をＬ０、Ｌ１、Ｌ２、Ｌ３の４つとして説明したが、タップ長の数は２つ以上であればいくつであってもよい。

（実施の形態１のまとめ）
　実施の形態１には次の技術が開示される。

＜技術Ａ１＞
　遠端側から受信した遠端信号に基づいてスピーカ５から出力された音が空間を伝搬してマイク４に入力された音に関する信号であるエコー信号を除去するエコー除去装置１０は、マイク４から入力される音に基づいてマイク信号を生成するマイク信号生成部１１と、エコー信号の推定に用いられる適応フィルタを更新する適応フィルタ更新部１７と、所定期間の遠端信号を参照信号として記憶する参照信号記憶部１４と、参照信号記憶部１４に記憶された参照信号と適応フィルタとに基づいて疑似エコー信号を生成する疑似エコー信号生成部１８と、マイク信号から疑似エコー信号を除去してエコー除去後信号を生成するエコー信号除去部１２と、エコー除去後信号に基づいて送話信号を生成する出力信号生成部１３と、参照信号に基づいて、互いに異なる複数の期間長のそれぞれに対応する複数の基準値を並列に算出する基準値算出部１５と、基準値算出部１５によって算出された複数の基準値を記憶する基準値記憶部１６と、複数の期間長のうちの１つを第１の期間長に決定する期間長決定部１９と、を備え、適応フィルタ更新部１７は、期間長決定部１９にて決定された第１の期間長に対応する基準値である第１の基準値を基準値記憶部１６から取得し、第１の基準値を用いて適応フィルタを更新する。
　これにより、基準値記憶部１６には、互いに異なる複数の期間長のそれぞれに対応する複数の基準値が記憶されているため、適応フィルタ更新部１７は、期間長決定部１９の決定に応じて適切な第１の基準値を基準値記憶部１６から即座に取得して適応フィルタを更新することができる。すなわち、エコー除去装置１０は、マイク４の環境が変化した場合に、即座に適切なエコー除去を行うことができる。

＜技術Ａ２＞
　技術Ａ１に記載のエコー除去装置１０において、期間長は、タップ長であり、基準値は、ノルム値であり、基準値算出部１５は、タップ長に対応する参照信号に基づいて、タップ長に対応するノルム値を算出する。
　これにより、複数のタップ長のそれぞれに対応する複数のノルム値が基準値記憶部１６に記憶される。

＜技術Ａ３＞
　技術Ａ１又はＡ２に記載のエコー除去装置１０において、期間長決定部１９は、接続されているマイクの数に基づいて第１の期間長を決定する。
　これにより、エコー除去装置１０は、接続されているマイク４の数が変化した場合に、即座に適切なエコー除去を行うことができる。

＜技術Ａ４＞
　遠端側から受信した遠端信号に基づいてスピーカ５から出力された音が空間を伝搬してマイク４に入力された音に関する信号であるエコー信号を除去するエコー除去方法は、マイク４から入力される音に基づいてマイク信号を生成するマイク信号生成ステップと、エコー信号の推定に用いられる適応フィルタを更新する適応フィルタ更新ステップと、所定期間の遠端信号を参照信号として参照信号記憶部１４に記憶する参照信号記憶ステップと、参照信号記憶部１４に記憶された参照信号と適応フィルタとに基づいて疑似エコー信号を生成する疑似エコー信号生成ステップと、マイク信号から疑似エコー信号を除去してエコー除去後信号を生成するエコー信号除去ステップと、エコー除去後信号に基づいて送話信号を生成する出力信号生成ステップと、参照信号に基づいて、互いに異なる複数の期間長のそれぞれに対応する複数の基準値を並列に算出する基準値算出ステップと、基準値算出ステップによって算出された複数の基準値を基準値記憶部１６に記憶する基準値記憶ステップと、複数の期間長のうちの１つを第１の期間長に決定する期間長決定ステップと、を含み、適応フィルタ更新ステップは、期間長決定ステップにて決定された第１の期間長に対応する基準値である第１の基準値を基準値記憶部１６から取得し、第１の基準値を用いて前記適応フィルタを更新する。
　これにより、基準値記憶部１６には、互いに異なる複数の期間長のそれぞれに対応する複数の基準値が記憶されているため、適応フィルタ更新ステップは、期間長決定ステップの決定に応じて適切な第１の基準値を基準値記憶部１６から即座に取得して適応フィルタを更新することができる。すなわち、エコー除去装置１０は、マイク４の環境が変化した場合に、即座に適切なエコー除去を行うことができる。

（実施の形態２）
　実施の形態２では、実施の形態１にて説明済みの構成要素については、共通の参照番号を付して説明を省略する場合がある。

　図４Ａ及び図４Ｂは、実施の形態２に係るエコー除去装置１０の構成例を示すブロック図である。

　エコー除去装置１０は、マイク信号生成部１１、エコー信号除去部１２、出力信号生成部１３、参照信号記憶部１４、基準値算出部１５、基準値記憶部１６、適応フィルタ更新部１７、疑似エコー信号生成部１８、期間長決定部１９、目的音判定部２０、ゲイン調整部２１、周波数スペクトル変換部２２Ａ、周波数スペクトル変換部２２Ｂ、参照スペクトル平滑化部２３、疑似エコー信号スペクトル生成部２４、周波数領域適応フィルタ更新部２５、及び、スペクトル減算部２６を含む。

　なお、目的音判定部２０、ゲイン調整部２１、周波数スペクトル変換部２２Ａ、周波数スペクトル変換部２２Ｂ、参照スペクトル平滑化部２３、疑似エコー信号スペクトル生成部２４、周波数領域適応フィルタ更新部２５、及び、スペクトル減算部２６は、エコー除去装置１０が備える半導体回路として構成されてもよいし、エコー除去装置１０が備えるプロセッサにて実行されるコンピュータプログラムとして実現されてもよい。

　マイク信号生成部１１、エコー信号除去部１２、参照信号記憶部１４、基準値算出部１５、基準値記憶部１６、適応フィルタ更新部１７、疑似エコー信号生成部１８、期間長決定部１９については、実施の形態１にて説明済みであるので、ここでは説明を省略する。

　目的音判定部２０は、エコー信号除去部１２から出力されるエコー除去後信号に目的音信号が含まれているか否かを判定する。目的音信号とは、遠端側に送信され、遠端側での受聴が期待される音声の信号である。例えば、マイク入力信号をｍ［ｉ］、近端音声信号をｓ［ｉ］、エコー信号をｙ［ｉ］とした場合、ｍ［ｉ］＝ｓ［ｉ］＋ｙ［ｉ］と表現され、目的音信号はｓ［ｉ］に相当する。このｓ［ｉ］は、マイク４に対する近端話者の発話音声となる。なお、目的音判定部２０の処理の詳細については後述する。

　ゲイン調整部２１は、目的音判定部２０による判定結果に基づいて、エコー信号除去部１２から出力されるエコー除去後信号のゲインを調整し、ゲイン調整後信号を出力する。例えば、ゲイン調整部２１は、目的音判定部２０がエコー除去後信号に目的音信号が含まれていると判定した場合、エコー除去後信号のゲインを増幅させる調整を行う。これにより、受聴者が目的音を良く聞きとれるようになる。例えば、ゲイン調整部２１は、目的音判定部２０がエコー除去後信号に目的音信号が含まれていないと判定した場合、エコー除去後信号のゲインを減衰させる調整を行う。これにより、除去しきれなかったエコー音が不要に大きく遠端へと送話されることを抑止できる。なお、ゲイン調整部２１の処理の詳細については後述する。

　出力信号生成部１３は、ゲイン調整部２１から出力されるゲイン調整後信号に基づいて送話信号を生成し、出力する。出力信号生成部１３は、ゲイン調整後信号をそのまま送話信号として出力してもよいし、ゲイン調整後信号に所定の処理を施して送話信号を生成及び出力してもよい。

　なお、周波数スペクトル変換部２２Ａ、周波数スペクトル変換部２２Ｂ、参照スペクトル平滑化部２３、疑似エコー信号スペクトル生成部２４、周波数領域適応フィルタ更新部２５、及び、スペクトル減算部２６の処理については、後に図６に示すフローチャートを参照しながら説明する。

　次に、ゲイン調整部２１の処理について詳細に説明する。ゲイン調整部２１は、以下の図５Ａ又は図５Ｂのいずれかの処理を行ってよい。

　図５Ａは、実施の形態２に係るゲイン調整部２１の処理の第１例を示すフローチャートである。

　ゲイン調整部２１は、目的音判定部２０による判定結果に基づいてエコー除去後信号に目的音信号が含まれているか否かを判定する（Ｓ２０１）。

　エコー除去後信号に目的音信号が含まれる場合（Ｓ２０１：ＹＥＳ）、ゲイン調整部２１は、次の処理を実行する。

　ゲイン調整部２１は、マイク信号ｍ［ｉ］のピーク値を算出する（Ｓ２０２）。

　ゲイン調整部２１は、ステップＳ２０２で算出したマイク信号のピーク値に基づき、ゲイン調整値γを決定する（Ｓ２０３）。例えば、ゲイン調整部２１は、マイク信号のピーク値が所定の閾値Ｔ１よりも大きい場合、ゲイン調整値γを１よりも小さな値（例えば０．９９９９）に決定し、マイク信号のピーク値が所定の閾値Ｔ２（＜Ｔ１）よりも小さい場合、ゲイン調整値γを１よりも大きな値（例えば１．０００１）に決定する。

　そして、ゲイン調整部２１は、決定したゲイン調整値γをゲイン値ｇに乗算することでゲイン値ｇを更新する（Ｓ２０４）。そして、ゲイン調整部２１は、処理をステップＳ２２０に進める。

　エコー除去後信号に目的音信号が含まれない場合（Ｓ２０１：ＮＯ）、ゲイン調整部２１は、次の処理を実行する。

　ゲイン調整部２１は、前回のゲイン値ｇが１よりも大きいか否かを判定する（Ｓ２１０）。

　前回のゲイン値ｇが１以下である場合（Ｓ２１０：ＮＯ）、ゲイン調整部２１は、処理をステップＳ２２０に進める。

　前回のゲイン値ｇが１よりも大きい場合（Ｓ２１０：ＹＥＳ）、ゲイン調整部２１は、ゲイン調整値γを１よりも小さい値（例えば０．９９９９）に設定する。（Ｓ２１１）。

　そして、ゲイン調整部２１は、決定したゲイン調整値γをゲイン値ｇに乗算することでゲイン値ｇを更新する。そして、ゲイン調整部２１は、処理をステップＳ２２０に進める。

　ゲイン調整部２１は、エコー除去後信号にゲイン値ｇを乗算し、ゲイン調整後信号を生成及び出力する（Ｓ２２０）。そして、ゲイン調整部２１は、処理をステップＳ２０１に戻す。

　以上の処理によれば、エコー除去後信号に目的音信号が含まれていない場合、ゲイン調整値γは１よりも小さくなるので、上述した図５Ａに示す処理を繰り返すことで、エコー除去後信号のレベルは徐々に小さくなる。つまり、除去しきれずエコー除去後信号に残っているエコー音も徐々に減衰する。これにより、除去しきれなかったエコー音が不要に大きくなった送話信号が遠端側に送信されることを抑止できる。

　図５Ｂは、実施の形態２に係るゲイン調整部２１の処理の第２例を示すフローチャートである。

　ゲイン調整部２１は、目的音判定部２０による判定結果に基づいてエコー除去後信号に目的音信号が含まれているか否かを判定する（Ｓ２３１）。

　エコー除去後信号に目的音信号が含まれる場合（Ｓ２３１：ＹＥＳ）、ゲイン調整部２１は、次の処理を実行する。

　ゲイン調整部２１は、マイク信号ｍ［ｉ］のピーク値を算出する（Ｓ２３２）。

　ゲイン調整部２１は、ステップＳ２３２で算出したマイク信号のピーク値に基づき、ゲイン調整値βを決定する（Ｓ２３３）。例えば、ゲイン調整部２１は、マイク信号のピーク値が所定の閾値Ｔ１よりも大きい場合、ゲイン調整値βを正の値（例えば「＋０．０００１」）に決定し、マイク信号のピーク値が所定の閾値Ｔ２（＜Ｔ１）よりも小さい場合、ゲイン調整値βを負の値（例えば「－０．０００１」）に決定する。

　そして、ゲイン調整部２１は、決定したゲイン調整値βをゲイン値ｇに加算することでゲイン値ｇを更新する（Ｓ２３４）。そして、ゲイン調整部２１は、処理をステップＳ２５０に進める。

　エコー除去後信号に目的音信号が含まれない場合（Ｓ２３１：ＮＯ）、ゲイン調整部２１は、次の処理を実行する。

　ゲイン調整部２１は、前回のゲイン値ｇが１よりも大きいか否かを判定する（Ｓ２４０）。

　前回のゲイン値ｇが１以下である場合（Ｓ２４０：ＮＯ）、ゲイン調整部２１は、処理をステップＳ２５０に進める。

　前回のゲイン値ｇが１よりも大きい場合（Ｓ２４０：ＹＥＳ）、ゲイン調整部２１は、ゲイン調整値βを負の値（例えば「－０．０００１」）に設定する。（Ｓ２４１）。

　そして、ゲイン調整部２１は、決定したゲイン調整値βをゲイン値ｇに加算することでゲイン値ｇを更新する。そして、ゲイン調整部２１は、処理をステップＳ２５０に進める。

　ゲイン調整部２１は、エコー除去後信号にゲイン値ｇを乗算し、ゲイン調整後信号を生成及び出力する（Ｓ２５０）。そして、ゲイン調整部２１は、処理をステップＳ２３１に戻す。

　以上の処理によれば、エコー除去後信号に目的音信号が含まれていない場合、ゲイン調整値βは負の値となるので、上述した図５Ｂに示す処理を繰り返すことで、エコー除去後信号のレベルは徐々に小さくなる。つまり、除去しきれずエコー除去後信号に残っているエコー音も徐々に減衰する。これにより、除去しきれなかったエコー音が不要に大きくなった送話信号が遠端側に送話されることを抑止できる。

　図６は、実施の形態２に係る周波数領域にてエコー信号を除去する処理例を示すフローチャートである。

　周波数スペクトル変換部２２Ａは、マイク信号生成部１１からマイク信号を取得し（図４Ａ参照）、周波数スペクトル変換部２２Ｂは参照信号を取得する（Ｓ３０１）。

　周波数スペクトル変換部２２Ａはマイク信号を周波数スペクトルに変換し、周波数スペクトル変換部２２Ｂは参照信号を周波数スペクトルに変換する（Ｓ３０２）。以下、マイク信号を周波数スペクトルに変換したものをマイク信号スペクトルと称し、参照信号を周波数スペクトルに変換したものを参照信号スペクトルと称する。ここで、周波数スペクトルとは時間領域信号を離散フーリエ変換または高速フーリエ変換によって変換することで得られる周波数領域信号を表し、複素スペクトル、その絶対値である振幅スペクトル、または二乗値であるパワースペクトルを表す。

　なお、周波数スペクトル変換部２２Ａは、ステップＳ３０１及びＳ３０２において、図４Ｂに示すように、エコー信号除去部１２からエコー除去後信号を取得し、エコー除去後信号を周波数スペクトルに変換し、マイク信号スペクトルとしてもよい。図４Ａ及び図４Ｂに示すいずれの方法によっても、目的音判定部２０において目的音が存在するか否かの判別が可能である。

　参照スペクトル平滑化部２３は、参照信号スペクトルを平滑化する（Ｓ３０３）。ここで、平滑化は周波数スペクトルを時間方向に平均化する処理を表し、移動平均処理や指数平滑化など、一般的に時系列信号に対して行われる平均化処理を表す。

　疑似エコー信号スペクトル生成部２４は、平滑化した参照信号スペクトルと、周波数領域適応フィルタを用いて、疑似エコー信号の周波数スペクトルに相当する疑似エコースペクトルを生成する。周波数領域適応フィルタ更新部２５は、平滑化した参照信号スペクトルと、スペクトル減算部２６で算出される減算後のスペクトルに基づいて、周波数領域適応フィルタを更新する。周波数領域適応フィルタは、一般にＬＭＳ、ＮＬＭＳ、ＡＰＡ、ＲＬＳ法などの適応アルゴリズムまたはＩＣＡ、ＩＶＡなどの音源分離アルゴリズムを用いて減算後の周波数スペクトルが最小となるように更新される。

　スペクトル減算部２６は、マイク信号スペクトルから疑似エコー信号スペクトルを減算し、近端音声信号の周波数スペクトルに相当する近端音声信号スペクトルを生成する（Ｓ３０５）。ここで、近端音声信号は、近端側のマイク４に入力された話者の音声の信号であり、目的音信号に相当する。

　なお、図７に示すように、周波数スペクトル変換部２２Ａの後段に非線形抑圧部２８、周波数スペクトル逆変換部２９を設け、非線形抑圧部２８にて使用する抑圧量を算出するための抑圧量算出部２７を設けても良い。抑圧量算出部２７は、周波数スペクトル変換部２２Ａによって得られた周波数スペクトルとスペクトル減算部２６で得られた周波数スペクトルとに基づいて、非線形抑圧部２８にて使用する抑圧量を算出する。抑圧量はスペクトルサブトラクション法やウィーナフィルタといった一般的な方法によって算出される。非線形抑圧部２８は、周波数スペクトル変換部２２Ａで得られた周波数領域の複素スペクトルに対し、抑圧量算出部２７で得られた抑圧量を乗算することで非線形抑圧を行う。非線形抑圧が施された複素スペクトルは周波数スペクトル逆変換部２９へと入力される。周波数スペクトル逆変換部２９は入力された複素スペクトル信号を時間領域信号へと変換する処理であり、離散逆フーリエ変換や高速逆フーリエ変換によって求められる。

　図８は、実施の形態２に係る目的音判定部２０の処理例を示すフローチャートである。
本処理は、図６に示す処理の後に実行されてよい。

　目的音判定部２０には、スペクトル減算部２６によって生成された近端音声信号スペクトルが入力される（Ｓ４０１）。

　目的音判定部２０は、所定帯域の近端音声スペクトルを平均化する（Ｓ４０２）。ここで、所定帯域は、人間の音声スペクトルが含まれる帯域であり、例えば０．５ｋＨｚ～４ｋＨｚであってよい。

　目的音判定部２０は、平均化した近端音声信号スペクトルを時間方向に平滑化し、平滑化信号を生成する（Ｓ４０３）。ここで、平滑化は、第１の時間（短時間）の時定数と、当該第１の時間よりも長い第２の時間（長時間）の時定数とによる指数平滑化出力の相加平均として算出されてよい。短時間の平滑化は信号の立ち上がりを素早く検出し、長時間の平滑化は信号の立下りをゆっくりと検出する役割を果たす。

　目的音判定部２０は、平滑化信号に対するノイズフロアレベルを算出する（Ｓ４０４）。

　目的音判定部２０は、平滑化信号及びノイズフロアレベルに基づいて第１の閾値を算出する（Ｓ４０５）。例えば、目的音判定部２０は、ステップＳ４０４で算出したノイズフロアレベルに所定の第２の閾値を加えた値、又は、当該値よりも大きい値を、第１の閾値とする。

　目的音判定部２０は、ステップＳ４０３で算出された平滑化信号のレベルが第１の閾値以上であるか否かを判定する（Ｓ４０６）。

　ステップＳ４０３で算出された平滑化信号のレベルが第１の閾値以上である場合（Ｓ４０６：ＹＥＳ）、目的音判定部２０は、エコー除去後信号に目的音信号が含まれていると判定し（Ｓ４０７）、本処理を終了する。

　ステップＳ４０３で算出された平滑化信号のレベルが第１の閾値未満である場合（Ｓ４０６：ＮＯ）、目的音判定部２０は、エコー除去後信号に目的音信号が含まれていないと判定し（Ｓ４０８）、本処理を終了する。

　なお、目的音判定部２０は、次の方法によってエコー除去後信号に目的音信号が含まれているか否かを判定してもよい。すなわち、目的音判定部２０は、マイク信号のレベルとエコー除去後信号のレベルとの差分が所定の第３の閾値未満である場合、目的音信号がエコー除去後信号に含まれていると判定し、当該差分が第３の閾値以上である場合、目的音信号がエコー除去後信号に含まれていないと判定してもよい。

　以上の処理により、目的音判定部２０は、エコー除去後信号に目的音信号が含まれているか否かを判定できる。また、周波数領域で処理を行うことにより、所定帯域におけるスペクトルの調整及び判定が容易になる。

（実施の形態２のまとめ）
　実施の形態２には次の技術が開示される。

＜技術Ｂ１＞
　スピーカ５から出力された音が空間を伝搬してマイク４に入力された音であるエコー音を除去するエコー除去装置１０は、マイク４から入力される音に基づいてマイク信号を生成するマイク信号生成部１１と、エコー音に関する信号であるエコー信号の推定に用いられる適応フィルタを更新する適応フィルタ更新部１７と、スピーカ５から出力される音に関する信号である出力信号と適応フィルタとに基づいて疑似エコー信号を生成する疑似エコー信号生成部１８と、マイク信号から疑似エコー信号を除去してエコー除去後信号を生成するエコー信号除去部１２と、エコー信号とは異なる信号である目的音信号がエコー除去後信号に含まれているか否かを判定する目的音判定部２０と、目的音判定部２０による判定結果に基づいてエコー除去後信号のゲインを調整するゲイン調整部２１と、ゲイン調整部２１によって調整されたエコー除去後信号に基づいて出力信号を生成する出力信号生成部１３と、を備える。
　これにより、目的音信号がエコー除去後信号に含まれているか否かに応じてゲインを調整することができる。

＜技術Ｂ２＞
　技術Ｂ１に記載のエコー除去装置１０において、目的音判定部２０は、所定期間におけるエコー除去後信号を平滑化した平滑化信号のレベルが所定の第１の閾値以上である場合、目的音信号がエコー除去後信号に含まれていると判定する。
　これにより、目的音判定部２０は、目的音信号がエコー除去後信号に含まれているか否かを判定できる。

＜技術Ｂ３＞
　技術Ｂ２に記載のエコー除去装置１０において、第１の閾値は、平滑化信号に対するノイズフロアレベルに所定の第２の閾値を加えた値、又は、当該値よりも大きい値である。
　これにより、目的音信号がエコー除去後信号に含まれているか否かの判定に用いられる第１の閾値を決定できる。

＜技術Ｂ４＞
　技術Ｂ１に記載のエコー除去装置１０において、目的音判定部２０は、マイク信号のレベルとエコー除去後信号のレベルとの差分が所定の第３の閾値未満である場合、目的音信号がエコー除去後信号に含まれていると判定し、差分が前記第３の閾値以上である場合、目的音信号が前記エコー除去後信号に含まれていないと判定する。
　これにより、目的音判定部２０は、目的音信号がエコー除去後信号に含まれているか否かを判定できる。

＜技術Ｂ５＞
　技術Ｂ１からＢ４のいずれか１つに記載のエコー除去装置１０において、ゲイン調整部２１は、目的音信号がエコー除去後信号に含まれていないという判定結果であった場合、エコー除去後信号のゲインを減衰させる調整を行う。
　これにより、目的音信号を含まないエコー除去後信号のゲインは減衰する。よって、エコー除去後信号に残っているエコー信号が不要に増幅された送話信号が遠端側に送信されることを抑止できる。

＜技術Ｂ６＞
　技術Ｂ１からＢ５のいずれか１つに記載のエコー除去装置１０において、ゲイン調整部２１は、目的音信号がエコー除去後信号に含まれているという判定結果であった場合、マイク信号のピーク値に基づいてエコー除去後信号のゲインの増幅又は減衰を決定する。
　これにより、目的音信号を含むエコー除去後信号のゲインは適切に調整される。よって、聴取者が目的音を良く聞きとれるようになる。

＜技術Ｂ７＞
　技術Ｂ１に記載のエコー除去装置１０において、エコー信号除去部１２からエコー信号除去後信号を取得し、エコー除去後信号を周波数スペクトルに変換する周波数スペクトル変換部２２Ａを備え、目的音判定部２０は、周波数スペクトルに基づき、目的音信号がエコー信号除去後信号に含まれているか否かを判定する。
　これにより、目的音判定部２０は、目的音信号がエコー除去後信号に含まれているか否かを判定できる。

＜技術Ｂ８＞
　スピーカ５から出力された音が空間を伝搬してマイク４に入力された音であるエコー音を除去するエコー除去方法は、マイク４から入力される音に基づいてマイク信号を生成するマイク信号生成ステップと、エコー音に関する信号であるエコー信号の推定に用いられる適応フィルタを更新する適応フィルタ更新ステップと、スピーカ５から出力される音に関する信号である出力信号と適応フィルタとに基づいて疑似エコー信号を生成する疑似エコー信号生成ステップと、マイク信号から疑似エコー信号を除去してエコー除去後信号を生成するエコー信号除去ステップと、エコー信号とは異なる信号である目的音信号がエコー除去後信号に含まれているか否かを判定する目的音判定ステップと、目的音判定ステップによる判定結果に基づいてエコー除去後信号のゲインを調整するゲイン調整ステップと、ゲイン調整ステップによって調整されたエコー除去後信号に基づいて出力信号を生成する出力信号生成ステップと、を含む。
　これにより、目的音信号がエコー除去後信号に含まれているか否かに応じてゲインを調整することができる。

　以上、添付図面を参照しながら実施の形態について説明したが、本開示はかかる例に限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても本開示の技術的範囲に属すると了解される。また、発明の趣旨を逸脱しない範囲において、上述した実施の形態における各構成要素を任意に組み合わせてもよい。

　なお、本出願は、２０２２年９月２８日出願の日本特許出願（特願２０２２－１５５１７０）に基づくものであり、その内容は本出願の中に参照として援用される。

　本開示の技術は、マイクとスピーカを有するシステム及び装置、並びに、当該システム及び装置にてマイクから入力された音声信号を処理する方法及びコンピュータプログラム等に有用である。

１　音声入出力システム
２　ＷＥＢ会議システム
３　ラックマウントミキサ
４　マイク
５　スピーカ
１０　エコー除去装置
１１　マイク信号生成部
１２　エコー信号除去部
１３　出力信号生成部
１４　参照信号記憶部
１５　基準値算出部
１６　基準値記憶部
１７　適応フィルタ更新部
１８　疑似エコー信号生成部
１９　期間長決定部
２０　目的音判定部
２１　ゲイン調整部
３１　リングバッファ
４０　タップ長Ｌ０のノルム値算出部
４１　タップ長Ｌ１のノルム値算出部
４２　タップ長Ｌ２のノルム値算出部
４３　タップ長Ｌ３のノルム値算出部
９０１　点線矢印

Claims

　スピーカから出力された音が空間を伝搬してマイクに入力された音であるエコー音を除去するエコー除去装置であって、
　前記マイクから入力される音に基づいてマイク信号を生成するマイク信号生成部と、
　前記エコー音に関する信号であるエコー信号の推定に用いられる適応フィルタを更新する適応フィルタ更新部と、
　前記スピーカから出力される音に関する信号である出力信号と前記適応フィルタとに基づいて疑似エコー信号を生成する疑似エコー信号生成部と、
　前記マイク信号から前記疑似エコー信号を除去してエコー除去後信号を生成するエコー信号除去部と、
　前記エコー信号とは異なる信号である目的音信号が前記エコー除去後信号に含まれているか否かを判定する目的音判定部と、
　前記目的音判定部による判定結果に基づいて前記エコー除去後信号のゲインを調整するゲイン調整部と、
　前記ゲイン調整部によって調整された前記エコー除去後信号に基づいて前記出力信号を生成する出力信号生成部と、を備える、
　エコー除去装置。
　前記目的音判定部は、
　所定期間における前記エコー除去後信号を平滑化した平滑化信号のレベルが所定の第１の閾値以上である場合、前記目的音信号が前記エコー除去後信号に含まれていると判定する、
　請求項１に記載のエコー除去装置。
　前記第１の閾値は、前記平滑化信号に対するノイズフロアレベルに所定の第２の閾値を加えた値、又は、当該値よりも大きい値である、
　請求項２に記載のエコー除去装置。
　前記目的音判定部は、
　前記マイク信号のレベルと前記エコー除去後信号のレベルとの差分が所定の第３の閾値未満である場合、前記目的音信号が前記エコー除去後信号に含まれていると判定し、前記差分が前記第３の閾値以上である場合、前記目的音信号が前記エコー除去後信号に含まれていないと判定する、
　請求項１に記載のエコー除去装置。
　前記ゲイン調整部は、前記目的音信号が前記エコー除去後信号に含まれていないという前記判定結果であった場合、前記エコー除去後信号のゲインを減衰させる調整を行う、
　請求項１に記載のエコー除去装置。
　前記ゲイン調整部は、前記目的音信号が前記エコー除去後信号に含まれているという前記判定結果であった場合、前記マイク信号のピーク値に基づいて前記エコー除去後信号のゲインの増幅又は減衰を決定する、
　請求項１又は５に記載のエコー除去装置。
　前記エコー信号除去部から前記エコー信号除去後信号を取得し、前記エコー除去後信号を周波数スペクトルに変換する周波数スペクトル変換部を備え、
　前記目的音判定部は、前記周波数スペクトルに基づき、前記目的音信号が前記エコー信号除去後信号に含まれているか否かを判定する、
　請求項１に記載のエコー除去装置。
　スピーカから出力された音が空間を伝搬してマイクに入力された音であるエコー音を除去するエコー除去方法であって、
　前記マイクから入力される音に基づいてマイク信号を生成するマイク信号生成ステップと、
　前記エコー音に関する信号であるエコー信号の推定に用いられる適応フィルタを更新する適応フィルタ更新ステップと、
　前記スピーカから出力される音に関する信号である出力信号と前記適応フィルタとに基づいて疑似エコー信号を生成する疑似エコー信号生成ステップと、
　前記マイク信号から前記疑似エコー信号を除去してエコー除去後信号を生成するエコー信号除去ステップと、
　前記エコー信号とは異なる信号である目的音信号が前記エコー除去後信号に含まれているか否かを判定する目的音判定ステップと、
　前記目的音判定ステップによる判定結果に基づいて前記エコー除去後信号のゲインを調整するゲイン調整ステップと、
　前記ゲイン調整ステップによって調整された前記エコー除去後信号に基づいて前記出力信号を生成する出力信号生成ステップと、を含む、
　エコー除去方法。