JP2020171006A

JP2020171006A - 音響エコーキャンセル装置、音響エコーキャンセル方法及び音響エコーキャンセルプログラム

Info

Publication number: JP2020171006A
Application number: JP2019163681A
Authority: JP
Inventors: 慎一杠; Shinichi Yuzuriha
Original assignee: Panasonic Intellectual Property Corp of America
Current assignee: Panasonic Intellectual Property Corp of America
Priority date: 2018-12-12
Filing date: 2019-09-09
Publication date: 2020-10-15
Anticipated expiration: 2039-09-09
Also published as: JP7373947B2

Abstract

【課題】通話性能を維持することができるとともに、音響エコーを除去するための演算量を削減することができる音響エコーキャンセル装置、音響エコーキャンセル方法及び音響エコーキャンセルプログラムを提供する。【解決手段】音響エコーキャンセル装置１は、少なくとも２つのマイク１１，１２から得られる入力信号と、スピーカ１５へ出力される再生信号とを用いて、入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する第１のエコーキャンセラ１６と、少なくとも２つのマイク１１，１２から出力される少なくとも１つの入力信号と、第１の擬似エコー信号とを用いて、少なくとも１つの入力信号に含まれる第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、第２の擬似エコー信号を用いて少なくとも１つの入力信号の音響エコー成分をキャンセルする第２のエコーキャンセラ１７とを備える。【選択図】図１

Description

本開示は、マイクから出力される入力信号の音響エコー成分をキャンセルする音響エコーキャンセル装置、音響エコーキャンセル方法及び音響エコーキャンセルプログラムに関するものである。

従来、マイクとスピーカとを用いた拡声型の双方向通話システムが存在している。このような拡声型の双方向通話システムにおいて、送話側の話者が話した音声は、送話側のマイクに入力され、送話信号として通信回線を介して受話側の機器へ送信され、受話側のスピーカで再生される。受話側のスピーカで再生された音声は、受話側の空間を伝搬し受話側のマイクに入力され、送話側に送信される。このとき、送話側のスピーカからは、通信回線を通過した時間と受話側の空間を伝搬した時間とを経過した自身の発話した声が再生される。このように、受話側のスピーカからマイクの間で伝搬する音声は音響エコーと呼ばれ、通話品質の劣化に繋がる。

そのため、拡声型の双方向通話システムでは、音響エコーを抑制するエコーキャンセラが用いられる。

また、近年、より自然な通話環境を提供するために複数のマイクを用いた拡声型の双方向通話システムの開発が進められている（例えば、特許文献１参照）。

特許第５８２６７１２号明細書

しかしながら、上記従来の技術では、通話性能を維持するとともに、音響エコーを除去するための演算量を削減することが困難であり、更なる改善が必要とされていた。

本開示は、上記の問題を解決するためになされたもので、通話性能を維持することができるとともに、音響エコーを除去するための演算量を削減することができる音響エコーキャンセル装置、音響エコーキャンセル方法及び音響エコーキャンセルプログラムを提供することを目的とするものである。

本開示の一態様に係る音響エコーキャンセル装置は、少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、前記入力信号に含まれる前記再生信号の成分を示す第１の擬似エコー信号を生成する第１のエコーキャンセラと、前記少なくとも２つのマイクから出力される少なくとも１つの入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記少なくとも１つの入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて前記少なくとも１つの入力信号の音響エコー成分をキャンセルする第２のエコーキャンセラと、を備える。

本開示によれば、通話性能を維持することができるとともに、音響エコーを除去するための演算量を削減することができる。

本開示の実施の形態１における通話装置の構成を示す図である。本開示の実施の形態１における音響エコーキャンセル装置の動作を説明するためのフローチャートである。本開示の実施の形態１の変形例１における通話装置の構成を示す図である。本開示の実施の形態２における通話装置の構成を示す図である。本開示の実施の形態２における音響エコーキャンセル装置の動作を説明するためのフローチャートである。本開示の実施の形態２の変形例における通話装置の構成を示す図である。本開示の実施の形態３における通話装置の構成を示す図である。本開示の実施の形態３における音響エコーキャンセル装置の動作を説明するためのフローチャートである。本開示の実施の形態３の変形例における通話装置の構成を示す図である。本開示の実施の形態１の変形例２における通話装置の構成を示す図である。

（本開示の基礎となった知見）
複数のマイクが用いられる拡声通話システムでは、マイク毎にエコーキャンセラが必要となるため、マイクの数に応じてエコーキャンセラの数も増加し、複数のエコーキャンセラ全体の演算量が多くなってしまう。

上記の従来のマルチチャネルエコー消去装置は、マイクと同じ数のエコーレプリカ生成部を備えており、各エコーレプリカ生成部の構成は同じである。そのため、マイクの数が増加するにつれて、エコーレプリカ生成部の数も増加し、音響エコーを除去するための演算量も増加するおそれがある。

また、上記の従来のマルチチャネルエコー消去装置では、エコーレプリカの生成処理と適応フィルタ係数の更新処理とを有効な波数領域に限定することにより、多数のスピーカとマイクロホンとからなるマルチチャネル拡声通話システムにおいて全体としての演算量を削減している。

しかしながら、従来のマルチチャネルエコー消去装置では、エコーレプリカ生成部の波数領域を限定するため、学習されない波数領域が発生し、波数領域の限定が通話性能の劣化の要因となるおそれがある。

以上の課題を解決するために、本開示の一態様に係る音響エコーキャンセル装置は、少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、前記入力信号に含まれる前記再生信号の成分を示す第１の擬似エコー信号を生成する第１のエコーキャンセラと、前記少なくとも２つのマイクから出力される少なくとも１つの入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記少なくとも１つの入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて前記少なくとも１つの入力信号の音響エコー成分をキャンセルする第２のエコーキャンセラと、を備える。

この構成によれば、第２の擬似エコー信号は、既に生成された第１の擬似エコー信号を用いて生成されるので、第２の擬似エコー信号を生成する際に用いられる適応フィルタのフィルタ長（タップ長）を短くすることができ、通話性能を維持することができるとともに、音響エコーを除去するための演算量を削減することができる。

また、上記の音響エコーキャンセル装置において、前記少なくとも２つのマイクから出力される少なくとも１つの入力信号を遅延させる遅延部をさらに備え、前記第２のエコーキャンセラは、遅延させた前記少なくとも１つの入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、遅延させた前記少なくとも１つの入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて、遅延させた前記少なくとも１つの入力信号の音響エコー成分をキャンセルしてもよい。

この構成によれば、第２のエコーキャンセラに入力する少なくとも１つの入力信号を遅延させることにより、第１のエコーキャンセラによって生成された第１の擬似エコー信号と少なくとも１つの入力信号との時間差がなくなり、確実に第２の擬似エコー信号を生成することができる。

また、上記の音響エコーキャンセル装置において、前記少なくとも２つのマイクは、第１の入力信号を出力する第１のマイクと、第２の入力信号を出力する第２のマイクとを含み、前記遅延部は、前記第１の入力信号を遅延させる第１の遅延部と、前記第２の入力信号を遅延させる第２の遅延部とを含み、前記第１の入力信号と前記第２の入力信号とを加算する加算部をさらに備え、前記第１のエコーキャンセラは、前記加算部からの加算信号と前記再生信号とを用いて、前記加算信号に含まれる前記再生信号の成分を示す前記第１の擬似エコー信号を生成し、前記第２のエコーキャンセラは、遅延させた前記第１の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、遅延させた前記第１の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成し、生成した前記第３の擬似エコー信号を用いて、遅延させた前記第１の入力信号の音響エコー成分をキャンセルする第３のエコーキャンセラと、遅延させた前記第２の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、遅延させた前記第２の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成し、生成した前記第４の擬似エコー信号を用いて、遅延させた前記第２の入力信号の音響エコー成分をキャンセルする第４のエコーキャンセラと、を含んでもよい。

この構成によれば、第３のエコーキャンセラに入力する第１の入力信号を遅延させるとともに、第４のエコーキャンセラに入力する第２の入力信号を遅延させることにより、第１のエコーキャンセラによって生成された第１の擬似エコー信号と第１の入力信号との時間差がなくなるとともに、第１の擬似エコー信号と第２の入力信号との時間差がなくなり、確実に第３の擬似エコー信号及び第４の擬似エコー信号を生成することができる。

また、上記の音響エコーキャンセル装置において、前記少なくとも２つのマイクは、第１の入力信号を出力する第１のマイクと、第２の入力信号を出力する第２のマイクとを含み、前記第１の入力信号と前記第２の入力信号とを加算する加算部をさらに備え、前記第１のエコーキャンセラは、前記加算部からの加算信号と前記再生信号とを用いて、前記加算信号に含まれる前記再生信号の成分を示す前記第１の擬似エコー信号を生成し、前記第２のエコーキャンセラは、前記第１の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第１の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成し、生成した前記第３の擬似エコー信号を用いて前記第１の入力信号の音響エコー成分をキャンセルする第３のエコーキャンセラと、前記第２の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第２の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成し、生成した前記第４の擬似エコー信号を用いて前記第２の入力信号の音響エコー成分をキャンセルする第４のエコーキャンセラと、を含んでもよい。

この構成によれば、少なくとも２つのマイクはそれぞれ配置位置が異なる。そのため、音響エコーとして入力される反射波（エコー信号）の波形はマイク毎に異なる。エコー信号の位相が、話者の音声である入力信号とは逆位相である場合、エコー信号が入力信号に加算されることで、入力信号が消えてしまい、入力信号の音響エコーをキャンセルすることが困難となる。しかしながら、少なくとも２つのマイクからの第１の入力信号と第２の入力信号とが加算されるので、音響エコーの干渉による信号の欠落の影響を低減することができる。

また、上記の音響エコーキャンセル装置において、前記少なくとも２つのマイクは、第１の入力信号を出力する第１のマイクと、第２の入力信号を出力する第２のマイクとを含み、前記第１のエコーキャンセラは、前記第１の入力信号と前記再生信号とを用いて、前記第１の入力信号に含まれる前記再生信号の成分を示す前記第１の擬似エコー信号を生成し、生成した前記第１の擬似エコー信号を用いて前記第１の入力信号の音響エコー成分をキャンセルし、前記第２のエコーキャンセラは、前記第２の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第２の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて前記第２の入力信号の音響エコー成分をキャンセルしてもよい。

また、上記の音響エコーキャンセル装置において、前記少なくとも２つのマイクは、第１の入力信号を出力する第１のマイクと、第２の入力信号を出力する第２のマイクとを含み、前記第１のエコーキャンセラは、前記第１の入力信号と前記第１の擬似エコー信号との誤差を示す第１の誤差信号を算出する第１の算出部と、前記第２の入力信号と前記第１の擬似エコー信号との誤差を示す第２の誤差信号を算出する第２の算出部と、前記第１の誤差信号と前記第２の誤差信号とを加算した加算信号を平均化する平均処理部と、前記平均処理部からの平均信号と前記再生信号とを用いて、前記平均信号に含まれる前記再生信号の成分を示す前記第１の擬似エコー信号を生成する生成部と、を含み、前記第２のエコーキャンセラは、前記第１の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第１の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成し、生成した前記第３の擬似エコー信号を用いて前記第１の入力信号の音響エコー成分をキャンセルする第３のエコーキャンセラと、前記第２の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第２の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成し、生成した前記第４の擬似エコー信号を用いて前記第２の入力信号の音響エコー成分をキャンセルする第４のエコーキャンセラと、を含んでもよい。

この構成によれば、少なくとも２つのマイクはそれぞれ配置位置が異なる。そのため、音響エコーとして入力される反射波（エコー信号）の波形はマイク毎に異なる。エコー信号の位相が、話者の音声である入力信号とは逆位相である場合、エコー信号が入力信号に加算されることで、入力信号が消えてしまい、入力信号の音響エコーをキャンセルすることが困難となる。しかしながら、少なくとも２つのマイクからの第１の入力信号及び第２の入力信号のそれぞれの誤差信号が加算及び平均化されるので、音響エコーの干渉による信号の欠落の影響を低減することができる。

また、上記の音響エコーキャンセル装置において、時間領域の前記入力信号を周波数領域の入力信号に変換する第１の変換部と、時間領域の前記再生信号を周波数領域の再生信号に変換する第２の変換部と、時間領域の前記少なくとも１つの入力信号を周波数領域の少なくとも１つの入力信号に変換する第３の変換部と、時間領域の前記第１の擬似エコー信号を周波数領域の第１の擬似エコー信号に変換する第４の変換部と、をさらに備えてもよい。

この構成によれば、第１のエコーキャンセラ及び第２のエコーキャンセラは、周波数領域の適応アルゴリズムを用いて第１の擬似エコー信号及び第２の擬似エコー信号を生成することができ、畳み込み演算がかけ算により実行することができるので、演算量をさらに削減することができる。

また、上記の音響エコーキャンセル装置において、前記第２のエコーキャンセラのフィルタ長は、前記第１のエコーキャンセラのフィルタ長より短くてもよい。

この構成によれば、第２のエコーキャンセラにおける音響エコーを除去するための演算量を削減することができる。

また、上記の音響エコーキャンセル装置において、前記第１のエコーキャンセラは、前記スピーカから最も近い位置のマイクに対して、前記第１の擬似エコー信号を生成してもよい。

この構成によれば、スピーカから最も近い位置のマイクから出力される入力信号と再生信号とを用いて、入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号が生成され、生成された第１の擬似エコー信号を用いて第２の擬似エコー信号が生成されるので、第２の擬似エコー信号を生成する際に用いられる適応フィルタのフィルタ長（タップ長）を短くすることができる。

本開示の他の態様に係る音響エコーキャンセル方法は、マイクから出力される入力信号の音響エコー成分をキャンセルする音響エコーキャンセル装置における音響エコーキャンセル方法であって、前記少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、前記入力信号に含まれる前記再生信号の成分を示す第１の擬似エコー信号を生成し、前記少なくとも２つのマイクから出力される少なくとも１つの入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記少なくとも１つの入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて前記少なくとも１つの入力信号の音響エコー成分をキャンセルする。

本開示の他の態様に係る音響エコーキャンセルプログラムは、少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、前記入力信号に含まれる前記再生信号の成分を示す第１の擬似エコー信号を生成する第１のエコーキャンセラと、前記少なくとも２つのマイクから出力される少なくとも１つの入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記少なくとも１つの入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて前記少なくとも１つの入力信号の音響エコー成分をキャンセルする第２のエコーキャンセラとしてコンピュータを機能させる。

以下添付図面を参照しながら、本開示の実施の形態について説明する。なお、以下の実施の形態は、本開示を具体化した一例であって、本開示の技術的範囲を限定するものではない。

（実施の形態１）
図１は、本開示の実施の形態１における通話装置の構成を示す図である。なお、通話装置は、自動車等に搭載される拡声型のハンズフリー通話システム、拡声型の双方向通信会議システム及びインターホンシステムなどに利用される。

図１に示す通話装置は、音響エコーキャンセル装置１、第１のマイク１１、第２のマイク１２、入力端子１４、スピーカ１５、第１の出力端子２０及び第２の出力端子２１を備える。

第１のマイク１１及び第２のマイク１２は、送話者がいる空間内に配置され、送話者の音声を収音する。第１のマイク１１は、収音した音声を示す第１の入力信号を音響エコーキャンセル装置１に出力する。第２のマイク１２は、収音した音声を示す第２の入力信号を音響エコーキャンセル装置１に出力する。

入力端子１４は、受話側の通話装置（不図示）から受信した再生信号を音響エコーキャンセル装置１及びスピーカ１５へ出力する。

スピーカ１５は、入力された再生信号を外部へ出力する。ここで、スピーカ１５から出力された音声が、第１のマイク１１及び第２のマイク１２によって収音された場合、受話側のスピーカからは、受話側の話者の発話した音声が遅れて再生されることになり、いわゆる音響エコーが発生する。そこで、音響エコーキャンセル装置１は、第１のマイク１１及び第２のマイク１２から出力される第１の入力信号及び第２の入力信号の音響エコー成分をキャンセルする。

第１の出力端子２０は、音響エコーキャンセル装置１によって音響エコー成分がキャンセルされた第１の入力信号を出力する。第２の出力端子２１は、音響エコーキャンセル装置１によって音響エコー成分がキャンセルされた第２の入力信号を出力する。

なお、入力端子１４、第１の出力端子２０及び第２の出力端子２１は、通信部（不図示）に接続されている。通信部は、ネットワークを介して受話側の通話装置（不図示）へ第１の入力信号及び第２の入力信号を送信するとともに、ネットワークを介して受話側の通話装置（不図示）から再生信号を受信する。ネットワークは、例えば、インターネットである。

音響エコーキャンセル装置１は、加算部１３、第１のエコーキャンセラ１６及び第２のエコーキャンセラ１７を備える。

加算部１３は、第１のマイク１１からの第１の入力信号と第２のマイク１２からの第２の入力信号とを加算する。

第１のエコーキャンセラ１６は、少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

本実施の形態１において、少なくとも２つのマイクから得られる入力信号は、第１のマイク１１からの第１の入力信号と第２のマイク１２からの第２の入力信号とを加算した加算信号である。すなわち、第１のエコーキャンセラ１６は、加算部１３からの加算信号と再生信号とを用いて、加算信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

第１のエコーキャンセラ１６は、適応フィルタ１６１及び誤差算出部１６２を備える。

適応フィルタ１６１は、フィルタ係数と再生信号とを畳み込むことにより、加算信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

誤差算出部１６２は、加算部１３からの加算信号と適応フィルタ１６１からの第１の擬似エコー信号との誤差信号を算出し、算出した誤差信号を適応フィルタ１６１へ出力する。適応フィルタ１６１は、入力された誤差信号に基づいてフィルタ係数を修正し、修正したフィルタ係数と再生信号とを畳み込むことにより第１の擬似エコー信号を生成する。適応フィルタ１６１は、適応アルゴリズムを用いて、誤差信号が最小となるようにフィルタ係数を修正する。適応アルゴリズムとしては、例えば、学習同定法（ＮＬＭＳ（ＮｏｒｍａｒｉｚｅｄＬｅａｓｔＭｅａｎＳｑｕａｒｅ）法）、アフィン射影法又は再帰的最小２乗法（ＲＬＳ（ＲｅｃｕｒｓｉｖｅＬｅａｓｔＳｑｕａｒｅ）法）が用いられる。

第２のエコーキャンセラ１７は、少なくとも２つのマイクから出力される少なくとも１つの入力信号と、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号とを用いて、少なくとも１つの入力信号に含まれる第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した第２の擬似エコー信号を用いて少なくとも１つの入力信号の音響エコー成分をキャンセルする。

第２のエコーキャンセラ１７は、第１の入力信号の音響エコー成分をキャンセルする第３のエコーキャンセラ１８及び第２の入力信号の音響エコー成分をキャンセルする第４のエコーキャンセラ１９を備える。第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号は、第３のエコーキャンセラ１８及び第４のエコーキャンセラ１９に出力される。

第３のエコーキャンセラ１８は、第１の入力信号と、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号とを用いて、第１の入力信号に含まれる第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成し、生成した第３の擬似エコー信号を用いて第１の入力信号の音響エコー成分をキャンセルする。

第３のエコーキャンセラ１８は、適応フィルタ１８１及び誤差算出部１８２を備える。

適応フィルタ１８１は、フィルタ係数と第１の擬似エコー信号とを畳み込むことにより、第１の入力信号に含まれる第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成する。

誤差算出部１８２は、第１のマイク１１からの第１の入力信号と適応フィルタ１８１からの第３の擬似エコー信号との誤差信号を算出し、算出した誤差信号を適応フィルタ１８１へ出力する。適応フィルタ１８１は、入力された誤差信号に基づいてフィルタ係数を修正し、修正したフィルタ係数と第１の擬似エコー信号とを畳み込むことにより第３の擬似エコー信号を生成する。適応フィルタ１８１は、適応アルゴリズムを用いて、誤差信号が最小となるようにフィルタ係数を修正する。適応アルゴリズムとしては、例えば、学習同定法、アフィン射影法又は再帰的最小２乗法が用いられる。

また、誤差算出部１８２は、第１のマイク１１からの第１の入力信号から、適応フィルタ１８１からの第３の擬似エコー信号を減算することにより、第１の入力信号から音響エコー成分をキャンセルする。そのため、誤差算出部１８２は、音響エコー成分をキャンセルした第１の入力信号を第１の出力端子２０へ出力する。

第４のエコーキャンセラ１９は、第２の入力信号と、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号とを用いて、第２の入力信号に含まれる第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成し、生成した第４の擬似エコー信号を用いて第２の入力信号の音響エコー成分をキャンセルする。

第４のエコーキャンセラ１９は、適応フィルタ１９１及び誤差算出部１９２を備える。

適応フィルタ１９１は、フィルタ係数と第１の擬似エコー信号とを畳み込むことにより、第２の入力信号に含まれる第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成する。

誤差算出部１９２は、第２のマイク１２からの第２の入力信号と適応フィルタ１９１からの第４の擬似エコー信号との誤差信号を算出し、算出した誤差信号を適応フィルタ１９１へ出力する。適応フィルタ１９１は、入力された誤差信号に基づいてフィルタ係数を修正し、修正したフィルタ係数と第１の擬似エコー信号とを畳み込むことにより第４の擬似エコー信号を生成する。適応フィルタ１９１は、適応アルゴリズムを用いて、誤差信号が最小となるようにフィルタ係数を修正する。適応アルゴリズムとしては、例えば、学習同定法、アフィン射影法又は再帰的最小２乗法が用いられる。

また、誤差算出部１９２は、第２のマイク１２からの第２の入力信号から、適応フィルタ１９１からの第４の擬似エコー信号を減算することにより、第２の入力信号から音響エコー成分をキャンセルする。そのため、誤差算出部１９２は、音響エコー成分をキャンセルした第２の入力信号を第２の出力端子２１へ出力する。

なお、本実施の形態１において、第２のエコーキャンセラ１７のフィルタ長は、第１のエコーキャンセラ１６のフィルタ長より短い。すなわち、第３のエコーキャンセラ１８の適応フィルタ１８１のフィルタ長は、第１のエコーキャンセラ１６の適応フィルタ１６１のフィルタ長より短く、第４のエコーキャンセラ１９の適応フィルタ１９１のフィルタ長は、第１のエコーキャンセラ１６の適応フィルタ１６１のフィルタ長より短い。

なお、本実施の形態１において、通話装置は、２つのマイクを備えているが、本開示は特にこれに限定されず、３つ以上のマイクを備えてもよい。通話装置が３つ以上のマイクを備える場合、加算部１３は、３つ以上のマイクからの各入力信号を加算し、第１のエコーキャンセラ１６は、３つ以上のマイクのそれぞれに対して設けられたエコーキャンセラへ第１の擬似エコー信号を出力する。

また、本実施の形態１において、通話装置は、１つのスピーカを備えているが、本開示は特にこれに限定されず、２つ以上のスピーカを備えてもよい。通話装置が複数のスピーカを備える場合、通話装置は、複数のスピーカと同じ数の音響エコーキャンセル装置１を備える必要がある。

次に、本開示の実施の形態１における音響エコーキャンセル装置１の動作について説明する。

図２は、本開示の実施の形態１における音響エコーキャンセル装置の動作を説明するためのフローチャートである。

まず、ステップＳ１において、加算部１３は、第１のマイク１１からの第１の入力信号と第２のマイク１２からの第２の入力信号とを加算する。このとき、加算部１３には、第１のマイク１１からの第１の入力信号と第２のマイク１２からの第２の入力信号とが入力される。

次に、ステップＳ２において、第１のエコーキャンセラ１６の適応フィルタ１６１は、フィルタ係数と再生信号とを畳み込むことにより、加算信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

次に、ステップＳ３において、誤差算出部１６２は、加算部１３からの加算信号から、適応フィルタ１６１からの第１の擬似エコー信号を減算することにより、加算信号と第１の擬似エコー信号との誤差信号を算出する。誤差算出部１６２は、算出した誤差信号を適応フィルタ１６１へ出力する。

次に、ステップＳ４において、適応フィルタ１６１は、誤差算出部１６２から入力された誤差信号に基づいてフィルタ係数を修正する。適応フィルタ１６１は、修正したフィルタ係数と再生信号とを畳み込むことにより第１の擬似エコー信号を生成する。

次に、ステップＳ５において、適応フィルタ１６１は、生成した第１の擬似エコー信号を第３のエコーキャンセラ１８及び第４のエコーキャンセラ１９へ出力する。

次に、ステップＳ６において、第３のエコーキャンセラ１８の適応フィルタ１８１は、フィルタ係数と第１の擬似エコー信号とを畳み込むことにより、第１の入力信号に含まれる第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成する。

次に、ステップＳ７において、誤差算出部１８２は、第１のマイク１１からの第１の入力信号から、適応フィルタ１８１からの第３の擬似エコー信号を減算することにより、第１の入力信号と第３の擬似エコー信号との誤差信号を算出する。誤差算出部１８２は、算出した誤差信号を適応フィルタ１８１へ出力する。

次に、ステップＳ８において、適応フィルタ１８１は、誤差算出部１８２から入力された誤差信号に基づいてフィルタ係数を修正する。適応フィルタ１８１は、修正したフィルタ係数と第１の擬似エコー信号とを畳み込むことにより第３の擬似エコー信号を生成する。

次に、ステップＳ９において、誤差算出部１８２は、音響エコー成分をキャンセルした第１の入力信号を第１の出力端子２０へ出力する。すなわち、誤差算出部１８２は、第１のマイク１１からの第１の入力信号から、適応フィルタ１８１からの第３の擬似エコー信号を減算することにより、第１の入力信号から音響エコー成分をキャンセルする。

次に、ステップＳ１０において、第４のエコーキャンセラ１９の適応フィルタ１９１は、フィルタ係数と第１の擬似エコー信号とを畳み込むことにより、第２の入力信号に含まれる第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成する。

次に、ステップＳ１１において、誤差算出部１９２は、第２のマイク１２からの第２の入力信号から、適応フィルタ１９１からの第４の擬似エコー信号を減算することにより、第２の入力信号と第４の擬似エコー信号との誤差信号を算出する。誤差算出部１９２は、算出した誤差信号を適応フィルタ１９１へ出力する。

次に、ステップＳ１２において、適応フィルタ１９１は、誤差算出部１９２から入力された誤差信号に基づいてフィルタ係数を修正する。適応フィルタ１９１は、修正したフィルタ係数と第１の擬似エコー信号とを畳み込むことにより第４の擬似エコー信号を生成する。

次に、ステップＳ１３において、誤差算出部１９２は、音響エコー成分をキャンセルした第２の入力信号を第２の出力端子２１へ出力する。すなわち、誤差算出部１９２は、第２のマイク１２からの第２の入力信号から、適応フィルタ１９１からの第４の擬似エコー信号を減算することにより、第２の入力信号から音響エコー成分をキャンセルする。

なお、音響エコーキャンセル装置１が動作を開始した初期段階では、フィルタ係数が充分に修正されていないため、第１の入力信号及び第２の入力信号から音響エコー成分を充分にキャンセルすることができないが、ステップＳ１〜ステップＳ１３の処理が繰り返し実行されることで、フィルタ係数が充分に修正され、第１の入力信号及び第２の入力信号から音響エコー成分を充分にキャンセルすることができるようになる。

このように、第１のエコーキャンセラ１６によって、少なくとも２つのマイクから得られる入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号が生成され、第２のエコーキャンセラ１７によって、少なくとも１つの入力信号に含まれる第１の擬似エコー信号の成分を示す第２の擬似エコー信号が生成され、生成された第２の擬似エコー信号を用いて少なくとも１つの入力信号の音響エコー成分がキャンセルされる。

したがって、第２の擬似エコー信号は、既に生成された第１の擬似エコー信号を用いて生成されるので、第２の擬似エコー信号を生成する際に用いられる適応フィルタのフィルタ長（タップ長）を短くすることができ、通話性能を維持することができるとともに、音響エコーを除去するための演算量を削減することができる。

特に、第１段目のエコーキャンセラ（第１のエコーキャンセラ１６）によるエコーキャンセル処理は、従来と同じ程度のフィルタ長（演算量）であるが、第２段目以降のエコーキャンセラ（第３のエコーキャンセラ１８及び第４のエコーキャンセラ１９）によるエコーキャンセル処理は、既に生成された第１の擬似エコー信号が用いられるので、従来よりもフィルタ長を短くすることができ、その結果、従来よりも演算量を削減することができる。そのため、マイクの数が増えるほど、従来に比べて演算量をより削減すことができる。

本実施の形態１において、第１のエコーキャンセラ１６は、第１のマイク１１からの第１の入力信号と第２のマイク１２からの第２の入力信号とを加算した加算信号と、スピーカ１５への再生信号とを用いて、第１の擬似エコー信号を生成している。これは、スピーカ１５から、第１のマイク１１と第２のマイク１２との中間位置に配置される仮想的なマイクに入力される音響エコーを推定していると言える。そして、第３のエコーキャンセラ１８は、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号を用いて第３の擬似エコー信号を生成している。これは、仮想的なマイクの位置と第１のマイク１１の位置との差分に相当する音響エコーを推定していると言える。そのため、第３のエコーキャンセラ１８の適応フィルタ１８１のフィルタ長は、第１のエコーキャンセラ１６の適応フィルタ１６１のフィルタ長よりも大幅に短くすることができる。同様に、第４のエコーキャンセラ１９の適応フィルタ１９１のフィルタ長は、第１のエコーキャンセラ１６の適応フィルタ１６１のフィルタ長よりも大幅に短くすることができる。

例えば、第３のエコーキャンセラ１８及び第４のエコーキャンセラ１９の演算量は、第１のエコーキャンセラ１６の演算量の１０分の１程度に低減することができる。そのため、第１のエコーキャンセラ１６、第３のエコーキャンセラ１８及び第４のエコーキャンセラ１９の総演算量は、第１のマイク１１及び第２のマイク１２のそれぞれに第１のエコーキャンセラ１６と同じ演算量の２つのエコーキャンセラを設けた場合の総演算量よりも、充分に少なくすることができる。

また、複数のマイクはそれぞれ配置位置が異なる。そのため、音響エコーとして入力される反射波（エコー信号）の波形は複数のマイク毎に異なる。エコー信号の位相が、話者の音声である入力信号とは逆位相である場合、エコー信号が入力信号に加算されることで、入力信号が消えてしまい、入力信号の音響エコーをキャンセルすることが困難となる。しかしながら、本実施の形態１では、少なくとも２つのマイクからの第１の入力信号と第２の入力信号とが加算されるので、音響エコーの干渉による信号の欠落の影響を低減することができる。

なお、本実施の形態１では、第１のエコーキャンセラ１６には、時間領域の再生信号及び時間領域の加算信号が入力され、第２のエコーキャンセラ１７には、時間領域の第１の入力信号、時間領域の第２の入力信号及び時間領域の第１の擬似エコー信号が入力されるが、本開示は特にこれに限定されず、第１のエコーキャンセラ１６には、周波数領域の再生信号及び周波数領域の加算信号が入力され、第２のエコーキャンセラ１７には、周波数領域の第１の入力信号、周波数領域の第２の入力信号及び周波数領域の第１の擬似エコー信号が入力されてもよい。以下、この実施の形態１の変形例１について説明する。

図３は、本開示の実施の形態１の変形例１における通話装置の構成を示す図である。

図３に示す通話装置は、音響エコーキャンセル装置１Ａ、第１のマイク１１、第２のマイク１２、入力端子１４、スピーカ１５、第１の出力端子２０及び第２の出力端子２１を備える。なお、実施の形態１の変形例１において、実施の形態１と同じ構成については同じ符号を付し、説明を省略する。

音響エコーキャンセル装置１Ａは、加算部１３、第１のエコーキャンセラ１６、第２のエコーキャンセラ１７、高速フーリエ変換部２４，２５，２８，２９及び逆高速フーリエ変換部３０，３１を備える。

高速フーリエ変換部２４，２５，２８，２９は、離散フーリエ変換を高速に行う。高速フーリエ変換部２４は、第１のエコーキャンセラ１６に入力される時間領域の再生信号を周波数領域の再生信号に変換する。高速フーリエ変換部２５は、加算部１３から第１のエコーキャンセラ１６に入力される時間領域の加算信号（入力信号）を周波数領域の加算信号（入力信号）に変換する。

高速フーリエ変換部２８は、第１のマイク１１から第３のエコーキャンセラ１８に入力される時間領域の第１の入力信号（少なくとも１つの入力信号）を周波数領域の第１の入力信号（少なくとも１つの入力信号）に変換する。高速フーリエ変換部２９は、第２のマイク１２から第４のエコーキャンセラ１９に入力される時間領域の第２の入力信号（少なくとも１つの入力信号）を周波数領域の第２の入力信号（少なくとも１つの入力信号）に変換する。

逆高速フーリエ変換部３０，３１は、逆離散フーリエ変換を高速に行う。逆高速フーリエ変換部３０は、第３のエコーキャンセラ１８から第１の出力端子２０に入力される周波数領域の第１の入力信号を時間領域の第１の入力信号に変換する。逆高速フーリエ変換部３１は、第４のエコーキャンセラ１９から第２の出力端子２１に入力される周波数領域の第２の入力信号を時間領域の第２の入力信号に変換する。

第１のエコーキャンセラ１６は、周波数領域の加算信号と周波数領域の再生信号とを用いて、周波数領域の第１の擬似エコー信号を生成する。

第３のエコーキャンセラ１８は、周波数領域の第１の入力信号と、周波数領域の第１の擬似エコー信号とを用いて、周波数領域の第３の擬似エコー信号を生成し、生成した周波数領域の第３の擬似エコー信号を用いて周波数領域の第１の入力信号の音響エコー成分をキャンセルする。

第４のエコーキャンセラ１９は、周波数領域の第２の入力信号と、周波数領域の第１の擬似エコー信号とを用いて、周波数領域の第４の擬似エコー信号を生成し、生成した周波数領域の第４の擬似エコー信号を用いて周波数領域の第２の入力信号の音響エコー成分をキャンセルする。

本実施の形態１の変形例１では、適応フィルタ１６１，１８１，１９１が周波数領域の適応アルゴリズムを用いることができ、畳み込み演算がかけ算により実行することができるので、演算量をさらに削減することができる。

なお、本実施の形態１では、第１のマイク１１の配置位置によっては、第１のマイク１１からの第１の入力信号と、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号とに時間差が発生するおそれがある。例えば、スピーカ１５からの音が第１のマイク１１に入力される場合、第１のマイク１１からの第１の入力信号には、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号よりも時間的に速いエコー信号が含まれるおそれがある。この場合、理論的に、第３のエコーキャンセラ１８は、第１の擬似エコー信号を用いて、第１の入力信号に含まれるエコー信号を推定することができないおそれがある。そこで、音響エコーキャンセル装置は、少なくとも２つのマイクから出力される少なくとも１つの入力信号を遅延させる遅延部をさらに備えてもよい。以下、この実施の形態１の変形例２について説明する。

図１０は、本開示の実施の形態１の変形例２における通話装置の構成を示す図である。

図１０に示す通話装置は、音響エコーキャンセル装置１Ｆ、第１のマイク１１、第２のマイク１２、入力端子１４、スピーカ１５、第１の出力端子２０及び第２の出力端子２１を備える。なお、実施の形態１の変形例２において、実施の形態１と同じ構成については同じ符号を付し、説明を省略する。

音響エコーキャンセル装置１Ｆは、加算部１３、第１のエコーキャンセラ１６、第２のエコーキャンセラ１７及び遅延部８０を備える。

遅延部８０は、少なくとも２つのマイクから出力される少なくとも１つの入力信号を遅延させる。遅延部８０は、第１の遅延部８１及び第２の遅延部８２を備える。

第１の遅延部８１は、第１のマイク１１と第３のエコーキャンセラ１８との間に配置される。第１の遅延部８１は、第１のマイク１１からの第１の入力信号を遅延させる。

第２の遅延部８２は、第２のマイク１２と第４のエコーキャンセラ１９との間に配置される。第２の遅延部８２は、第２のマイク１２からの第２の入力信号を遅延させる。

第２のエコーキャンセラ１７は、遅延させた少なくとも１つの入力信号と、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号とを用いて、遅延させた少なくとも１つの入力信号に含まれる第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した第２の擬似エコー信号を用いて、遅延させた少なくとも１つの入力信号の音響エコー成分をキャンセルする。

第３のエコーキャンセラ１８は、遅延させた第１の入力信号と、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号とを用いて、遅延させた第１の入力信号に含まれる第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成し、生成した第３の擬似エコー信号を用いて、遅延させた第１の入力信号の音響エコー成分をキャンセルする。

第４のエコーキャンセラ１９は、遅延させた第２の入力信号と、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号とを用いて、遅延させた第２の入力信号に含まれる第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成し、生成した第４の擬似エコー信号を用いて、遅延させた第２の入力信号の音響エコー成分をキャンセルする。

本実施の形態１の変形例２では、第１の遅延部８１によって遅延させた第１の入力信号が第３のエコーキャンセラ１８に入力され、第２の遅延部８２によって遅延させた第２の入力信号が第４のエコーキャンセラ１９に入力されるので、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号と第１の入力信号との時間差がなくなるとともに、第１の擬似エコー信号と第２の入力信号との時間差がなくなり、確実に第３の擬似エコー信号及び第４の擬似エコー信号を生成することができる。

なお、本実施の形態１の変形例１において、音響エコーキャンセル装置１Ａは、第１のマイク１１と高速フーリエ変換部２８との間に第１の遅延部８１を備えてもよく、第２のマイク１２と高速フーリエ変換部２９との間に第２の遅延部８２を備えてもよい。

また、本実施の形態１では、加算部１３が第１のマイク１１からの第１の入力信号と第２のマイク１２からの第２の入力信号とを加算し、第１のエコーキャンセラ１６は、加算信号と再生信号とを用いて、加算信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成しているが、本開示は特にこれに限定されず、音響エコーキャンセル装置１は、加算部１３からの加算信号を平均化する平均処理部をさらに備えてもよい。この場合、第１のエコーキャンセラ１６は、平均処理部からの平均化信号と再生信号とを用いて、平均化信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成してもよい。

（実施の形態２）
実施の形態１では、第１のエコーキャンセラによって生成された第１の擬似エコー信号が第３のエコーキャンセラ及び第４のエコーキャンセラに出力され、第３のエコーキャンセラが第１の擬似エコー信号を用いて第１の入力信号の音響エコー成分をキャンセルし、第４のエコーキャンセラが第１の擬似エコー信号を用いて第２の入力信号の音響エコー成分をキャンセルしているが、実施の形態２では、第１のエコーキャンセラが、第１の擬似エコー信号を生成するとともに、第１の擬似エコー信号を用いて第１の入力信号の音響エコー成分をキャンセルし、第２のエコーキャンセラが、第１の擬似エコー信号を用いて第２の入力信号の音響エコー成分をキャンセルする。

図４は、本開示の実施の形態２における通話装置の構成を示す図である。

図４に示す通話装置は、音響エコーキャンセル装置１Ｂ、第１のマイク１１、第２のマイク１２、入力端子１４、スピーカ１５、第１の出力端子２０及び第２の出力端子２１を備える。なお、実施の形態２において、実施の形態１と同じ構成については同じ符号を付し、説明を省略する。

音響エコーキャンセル装置１Ｂは、第１のエコーキャンセラ４１及び第２のエコーキャンセラ４２を備える。

第１のエコーキャンセラ４１は、少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

第１のエコーキャンセラ４１は、スピーカ１５から最も近い位置のマイクに対して、第１の擬似エコー信号を生成することが好ましい。この場合、第１のエコーキャンセラ４１は、スピーカ１５から最も近い位置のマイクから出力される入力信号と再生信号とを用いて、入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。本実施の形態２において、スピーカ１５から最も近い位置のマイクは、第１のマイク１１である。

本実施の形態２において、少なくとも２つのマイクから得られる入力信号は、第１のマイク１１からの第１の入力信号である。すなわち、第１のエコーキャンセラ４１は、第１の入力信号と再生信号とを用いて、第１の入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。また、第１のエコーキャンセラ４１は、生成した第１の擬似エコー信号を用いて第１の入力信号の音響エコー成分をキャンセルする。

第１のエコーキャンセラ４１は、適応フィルタ４１１及び誤差算出部４１２を備える。

適応フィルタ４１１は、フィルタ係数と再生信号とを畳み込むことにより、第１の入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

誤差算出部４１２は、第１のマイク１１からの第１の入力信号と適応フィルタ４１１からの第１の擬似エコー信号との誤差信号を算出し、算出した誤差信号を適応フィルタ４１１へ出力する。適応フィルタ４１１は、入力された誤差信号に基づいてフィルタ係数を修正し、修正したフィルタ係数と再生信号とを畳み込むことにより第１の擬似エコー信号を生成する。適応フィルタ４１１は、適応アルゴリズムを用いて、誤差信号が最小となるようにフィルタ係数を修正する。適応アルゴリズムとしては、例えば、学習同定法、アフィン射影法又は再帰的最小２乗法が用いられる。

また、誤差算出部４１２は、第１のマイク１１からの第１の入力信号から、適応フィルタ４１１からの第１の擬似エコー信号を減算することにより、第１の入力信号から音響エコー成分をキャンセルする。そのため、誤差算出部４１２は、音響エコー成分をキャンセルした第１の入力信号を第１の出力端子２０へ出力する。

第１のエコーキャンセラ４１によって生成された第１の擬似エコー信号は、第２のエコーキャンセラ４２に出力される。

第２のエコーキャンセラ４２は、第２の入力信号と、第１のエコーキャンセラ４１によって生成された第１の擬似エコー信号とを用いて、第２の入力信号に含まれる第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した第２の擬似エコー信号を用いて第２の入力信号の音響エコー成分をキャンセルする。

第２のエコーキャンセラ４２は、適応フィルタ４２１及び誤差算出部４２２を備える。

適応フィルタ４２１は、フィルタ係数と第１の擬似エコー信号とを畳み込むことにより、第２の入力信号に含まれる第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成する。

誤差算出部４２２は、第２のマイク１２からの第２の入力信号と適応フィルタ４２１からの第２の擬似エコー信号との誤差信号を算出し、算出した誤差信号を適応フィルタ４２１へ出力する。適応フィルタ４２１は、入力された誤差信号に基づいてフィルタ係数を修正し、修正したフィルタ係数と第１の擬似エコー信号とを畳み込むことにより第２の擬似エコー信号を生成する。適応フィルタ４２１は、適応アルゴリズムを用いて、誤差信号が最小となるようにフィルタ係数を修正する。適応アルゴリズムとしては、例えば、学習同定法、アフィン射影法又は再帰的最小２乗法が用いられる。

また、誤差算出部４２２は、第２のマイク１２からの第２の入力信号から、適応フィルタ４２１からの第２の擬似エコー信号を減算することにより、第２の入力信号から音響エコー成分をキャンセルする。そのため、誤差算出部４２２は、音響エコー成分をキャンセルした第２の入力信号を第２の出力端子２１へ出力する。

なお、本実施の形態２において、通話装置は、２つのマイクを備えているが、本開示は特にこれに限定されず、３つ以上のマイクを備えてもよい。通話装置が３つ以上のマイクを備える場合、第１のエコーキャンセラ４１は、第１のマイク１１以外の他のマイクのそれぞれに対して設けられたエコーキャンセラへ第１の擬似エコー信号を出力する。

また、本実施の形態２において、通話装置は、１つのスピーカを備えているが、本開示は特にこれに限定されず、２つ以上のスピーカを備えてもよい。通話装置が複数のスピーカを備える場合、通話装置は、複数のスピーカと同じ数の音響エコーキャンセル装置１Ｂを備える必要がある。

次に、本開示の実施の形態２における音響エコーキャンセル装置１Ｂの動作について説明する。

図５は、本開示の実施の形態２における音響エコーキャンセル装置の動作を説明するためのフローチャートである。

まず、ステップＳ２１において、第１のエコーキャンセラ４１の適応フィルタ４１１は、フィルタ係数と再生信号とを畳み込むことにより、第１の入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

次に、ステップＳ２２において、誤差算出部４１２は、第１のマイク１１からの第１の入力信号から、適応フィルタ４１１からの第１の擬似エコー信号を減算することにより、第１の入力信号と第１の擬似エコー信号との誤差信号を算出する。誤差算出部４１２は、算出した誤差信号を適応フィルタ４１１へ出力する。

次に、ステップＳ２３において、適応フィルタ４１１は、誤差算出部４１２から入力された誤差信号に基づいてフィルタ係数を修正する。適応フィルタ４１１は、修正したフィルタ係数と再生信号とを畳み込むことにより第１の擬似エコー信号を生成する。

次に、ステップＳ２４において、誤差算出部４１２は、音響エコー成分をキャンセルした第１の入力信号を第１の出力端子２０へ出力する。すなわち、誤差算出部４１２は、第１のマイク１１からの第１の入力信号から、適応フィルタ４１１からの第１の擬似エコー信号を減算することにより、第１の入力信号から音響エコー成分をキャンセルする。

次に、ステップＳ２５において、適応フィルタ４１１は、生成した第１の擬似エコー信号を第２のエコーキャンセラ４２へ出力する。

次に、ステップＳ２６において、第２のエコーキャンセラ４２の適応フィルタ４２１は、フィルタ係数と第１の擬似エコー信号とを畳み込むことにより、第２の入力信号に含まれる第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成する。

次に、ステップＳ２７において、誤差算出部４２２は、第２のマイク１２からの第２の入力信号から、適応フィルタ４２１からの第２の擬似エコー信号を減算することにより、第２の入力信号と第２の擬似エコー信号との誤差信号を算出する。誤差算出部４２２は、算出した誤差信号を適応フィルタ４２１へ出力する。

次に、ステップＳ２８において、適応フィルタ４２１は、誤差算出部４２２から入力された誤差信号に基づいてフィルタ係数を修正する。適応フィルタ４２１は、修正したフィルタ係数と第１の擬似エコー信号とを畳み込むことにより第２の擬似エコー信号を生成する。

次に、ステップＳ２９において、誤差算出部４２２は、音響エコー成分をキャンセルした第２の入力信号を第２の出力端子２１へ出力する。すなわち、誤差算出部４２２は、第２のマイク１２からの第２の入力信号から、適応フィルタ４２１からの第２の擬似エコー信号を減算することにより、第２の入力信号から音響エコー成分をキャンセルする。

なお、音響エコーキャンセル装置１Ｂが動作を開始した初期段階では、フィルタ係数が充分に修正されていないため、第１の入力信号及び第２の入力信号から音響エコー成分を充分にキャンセルすることができないが、ステップＳ２１〜ステップＳ２９の処理が繰り返し実行されることで、フィルタ係数が充分に修正され、第１の入力信号及び第２の入力信号から音響エコー成分を充分にキャンセルすることができるようになる。

このように、第１のエコーキャンセラ４１によって、第１のマイク１１から得られる第１の入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号が生成され、生成された第１の擬似エコー信号を用いて第１の入力信号の音響エコー成分がキャンセルされ、第２のエコーキャンセラ４２によって、第２の入力信号に含まれる第１の擬似エコー信号の成分を示す第２の擬似エコー信号が生成され、生成された第２の擬似エコー信号を用いて第２の入力信号の音響エコー成分がキャンセルされる。

特に、第１段目のエコーキャンセラ（第１のエコーキャンセラ４１）によるエコーキャンセル処理は、従来と同じ程度のフィルタ長（演算量）であるが、第２段目以降のエコーキャンセラ（第２のエコーキャンセラ４２）によるエコーキャンセル処理は、既に生成された第１の擬似エコー信号が用いられるので、従来よりもフィルタ長を短くすることができ、その結果、従来よりも演算量を削減することができる。そのため、マイクの数が増えるほど、従来に比べて演算量をより削減すことができる。

本実施の形態２において、第１のエコーキャンセラ４１は、第１のマイク１１からの第１の入力信号と、スピーカ１５への再生信号とを用いて、第１の擬似エコー信号を生成している。これは、スピーカ１５から、第１のマイク１１に入力される音響エコーを推定していると言える。そして、第２のエコーキャンセラ４２は、第１のエコーキャンセラ１６によって生成された第１の擬似エコー信号を用いて第２の擬似エコー信号を生成している。これは、第１のマイク１１の位置と第２のマイク１２の位置との差分に相当する音響エコーを推定していると言える。そのため、第２のエコーキャンセラ４２の適応フィルタ４２１のフィルタ長は、第１のエコーキャンセラ４１の適応フィルタ４１１のフィルタ長よりも大幅に短くすることができる。

例えば、第２のエコーキャンセラ４２の演算量は、第１のエコーキャンセラ４１の演算量の１０分の１程度に低減することができる。そのため、第１のエコーキャンセラ４１及び第２のエコーキャンセラ４２の総演算量は、第１のマイク１１及び第２のマイク１２のそれぞれに第１のエコーキャンセラ４１と同じ演算量の２つのエコーキャンセラを設けた場合の総演算量よりも、充分に少なくすることができる。

なお、本実施の形態２において、音響エコーキャンセル装置１Ｂは、第２のマイク１２と第２のエコーキャンセラ４２との間に遅延部を備えてもよい。

なお、本実施の形態２では、第１のエコーキャンセラ４１には、時間領域の再生信号及び時間領域の第１の入力信号が入力され、第２のエコーキャンセラ４２には、時間領域の第２の入力信号及び時間領域の第１の擬似エコー信号が入力されるが、本開示は特にこれに限定されず、第１のエコーキャンセラ４１には、周波数領域の再生信号及び周波数領域の第１の入力信号が入力され、第２のエコーキャンセラ４２には、周波数領域の第２の入力信号及び周波数領域の第１の擬似エコー信号が入力されてもよい。以下、この実施の形態２の変形例について説明する。

図６は、本開示の実施の形態２の変形例における通話装置の構成を示す図である。

図６に示す通話装置は、音響エコーキャンセル装置１Ｃ、第１のマイク１１、第２のマイク１２、入力端子１４、スピーカ１５、第１の出力端子２０及び第２の出力端子２１を備える。なお、実施の形態２の変形例において、実施の形態２と同じ構成については同じ符号を付し、説明を省略する。

音響エコーキャンセル装置１Ｃは、第１のエコーキャンセラ４１、第２のエコーキャンセラ４２、高速フーリエ変換部４５，４６，４９及び逆高速フーリエ変換部５０，５１を備える。

高速フーリエ変換部４５，４６，４９は、離散フーリエ変換を高速に行う。高速フーリエ変換部４５は、第１のエコーキャンセラ４１に入力される時間領域の再生信号を周波数領域の再生信号に変換する。高速フーリエ変換部４６は、第１のマイク１１から第１のエコーキャンセラ４１に入力される時間領域の第１の入力信号を周波数領域の第１の入力信号に変換する。高速フーリエ変換部４９は、第２のマイク１２から第２のエコーキャンセラ４２に入力される時間領域の第２の入力信号を周波数領域の第２の入力信号に変換する。

逆高速フーリエ変換部５０，５１は、逆離散フーリエ変換を高速に行う。逆高速フーリエ変換部５０は、第１のエコーキャンセラ４１から第１の出力端子２０に入力される周波数領域の第１の入力信号を時間領域の第１の入力信号に変換する。逆高速フーリエ変換部５１は、第２のエコーキャンセラ４２から第２の出力端子２１に入力される周波数領域の第２の入力信号を時間領域の第２の入力信号に変換する。

第１のエコーキャンセラ４１は、周波数領域の第１の入力信号と周波数領域の再生信号とを用いて、周波数領域の第１の擬似エコー信号を生成し、生成した周波数領域の第１の擬似エコー信号を用いて周波数領域の第１の入力信号の音響エコー成分をキャンセルする。

第２のエコーキャンセラ４２は、周波数領域の第２の入力信号と、周波数領域の第１の擬似エコー信号とを用いて、周波数領域の第２の擬似エコー信号を生成し、生成した周波数領域の第２の擬似エコー信号を用いて周波数領域の第２の入力信号の音響エコー成分をキャンセルする。

本実施の形態２の変形例では、適応フィルタ４１１，４２１が周波数領域の適応アルゴリズムを用いることができ、畳み込み演算がかけ算により実行することができるので、演算量をさらに削減することができる。

なお、本実施の形態２の変形例において、音響エコーキャンセル装置１Ｃは、第２のマイク１２と高速フーリエ変換部４９との間に遅延部を備えてもよい。

（実施の形態３）
実施の形態１では、第１のエコーキャンセラは、加算部からの加算信号と再生信号とを用いて、加算信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成しているが、実施の形態３では、第１のエコーキャンセラは、第１の入力信号と第１の擬似エコー信号との誤差を示す第１の誤差信号を算出し、第２の入力信号と第１の擬似エコー信号との誤差を示す第２の誤差信号を算出し、第１の誤差信号と第２の誤差信号とを加算した加算信号を平均化し、平均信号と再生信号とを用いて、平均信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

図７は、本開示の実施の形態３における通話装置の構成を示す図である。

図７に示す通話装置は、音響エコーキャンセル装置１Ｄ、第１のマイク１１、第２のマイク１２、入力端子１４、スピーカ１５、第１の出力端子２０及び第２の出力端子２１を備える。なお、実施の形態３において、実施の形態１と同じ構成については同じ符号を付し、説明を省略する。

音響エコーキャンセル装置１Ｄは、第１のエコーキャンセラ６１及び第２のエコーキャンセラ１７を備える。

第１のエコーキャンセラ６１は、少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

本実施の形態３において、少なくとも２つのマイクから得られる入力信号は、第１の入力信号と第１の擬似エコー信号との誤差を示す第１の誤差信号と、第２の入力信号と第１の擬似エコー信号との誤差を示す第２の誤差信号とを加算した加算信号を平均化した平均信号である。すなわち、第１のエコーキャンセラ６１は、平均信号と再生信号とを用いて、平均信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

第１のエコーキャンセラ６１は、適応フィルタ６１１、第１の誤差算出部６１２、第２の誤差算出部６１３及び平均処理部６１４を備える。

適応フィルタ６１１は、フィルタ係数と再生信号とを畳み込むことにより、平均信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

第１の誤差算出部６１２は、第１の入力信号と第１の擬似エコー信号との誤差を示す第１の誤差信号を算出する。第１の誤差算出部６１２は、算出した第１の誤差信号を第２の誤差算出部６１３へ出力する。

第２の誤差算出部６１３は、第２の入力信号と第１の擬似エコー信号との誤差を示す第２の誤差信号を算出するとともに、第１の誤差信号と第２の誤差信号とを加算する。第２の誤差算出部６１３は、第１の誤差信号と第２の誤差信号とを加算した加算信号を平均処理部６１４へ出力する。

平均処理部６１４は、第１の誤差信号と第２の誤差信号とを加算した加算信号を平均化する。平均処理部６１４は、第１の誤差信号と第２の誤差信号とを加算した加算信号を平均化した平均信号を適応フィルタ６１１へ出力する。

適応フィルタ６１１は、平均処理部６１４からの平均信号と再生信号とを用いて、平均信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。適応フィルタ６１１は、入力された平均信号に基づいてフィルタ係数を修正し、修正したフィルタ係数と再生信号とを畳み込むことにより第１の擬似エコー信号を生成する。適応フィルタ６１１は、適応アルゴリズムを用いて、平均信号が最小となるようにフィルタ係数を修正する。適応アルゴリズムとしては、例えば、学習同定法、アフィン射影法又は再帰的最小２乗法が用いられる。

第１のエコーキャンセラ６１によって生成された第１の擬似エコー信号は、第３のエコーキャンセラ１８及び第４のエコーキャンセラ１９に出力される。

なお、本実施の形態３において、通話装置は、２つのマイクを備えているが、本開示は特にこれに限定されず、３つ以上のマイクを備えてもよい。通話装置が３つ以上のマイクを備える場合、第１のエコーキャンセラ６１は、３つ以上のマイクからの各入力信号と第１の擬似エコー信号との各誤差信号を加算及び平均化し、３つ以上のマイクのそれぞれに対して設けられたエコーキャンセラへ第１の擬似エコー信号を出力する。

また、本実施の形態３において、通話装置は、１つのスピーカを備えているが、本開示は特にこれに限定されず、２つ以上のスピーカを備えてもよい。通話装置が複数のスピーカを備える場合、通話装置は、複数のスピーカと同じ数の音響エコーキャンセル装置１Ｄを備える必要がある。

次に、本開示の実施の形態３における音響エコーキャンセル装置１Ｄの動作について説明する。

図８は、本開示の実施の形態３における音響エコーキャンセル装置の動作を説明するためのフローチャートである。

まず、ステップＳ４１において、第１のエコーキャンセラ６１の適応フィルタ６１１は、フィルタ係数と再生信号とを畳み込むことにより、平均信号に含まれる再生信号の成分を示す第１の擬似エコー信号を生成する。

次に、ステップＳ４２において、第１の誤差算出部６１２は、第１のマイク１１からの第１の入力信号から、適応フィルタ６１１からの第１の擬似エコー信号を減算することにより、第１の入力信号と第１の擬似エコー信号との差分である第１の誤差信号を算出する。第１の誤差算出部６１２は、算出した第１の誤差信号を第２の誤差算出部６１３へ出力する。

次に、ステップＳ４３において、第２の誤差算出部６１３は、第２のマイク１２からの第２の入力信号から、適応フィルタ６１１からの第１の擬似エコー信号を減算することにより、第２の入力信号と第１の擬似エコー信号との差分である第２の誤差信号を算出する。

次に、ステップＳ４４において、第２の誤差算出部６１３は、第１の誤差信号と第２の誤差信号とを加算する。第２の誤差算出部６１３は、算出した第１の誤差信号と第２の誤差信号との加算信号を平均処理部６１４へ出力する。

次に、ステップＳ４５において、平均処理部６１４は、第１の誤差信号と第２の誤差信号との加算信号を平均化する。平均処理部６１４は、加算信号を平均化した平均信号を適応フィルタ６１１へ出力する。

次に、ステップＳ４６において、適応フィルタ６１１は、平均処理部６１４から入力された平均信号に基づいてフィルタ係数を修正する。適応フィルタ６１１は、修正したフィルタ係数と再生信号とを畳み込むことにより第１の擬似エコー信号を生成する。

次に、ステップＳ４７において、適応フィルタ６１１は、生成した第１の擬似エコー信号を第３のエコーキャンセラ１８及び第４のエコーキャンセラ１９へ出力する。

次に、ステップＳ４８において、第３のエコーキャンセラ１８の適応フィルタ１８１は、フィルタ係数と第１の擬似エコー信号とを畳み込むことにより、第１の入力信号に含まれる第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成する。

次に、ステップＳ４９において、誤差算出部１８２は、第１のマイク１１からの第１の入力信号から、適応フィルタ１８１からの第３の擬似エコー信号を減算することにより、第１の入力信号と第３の擬似エコー信号との第３の誤差信号を算出する。誤差算出部１８２は、算出した第３の誤差信号を適応フィルタ１８１へ出力する。

次に、ステップＳ５０において、適応フィルタ１８１は、誤差算出部１８２から入力された第３の誤差信号に基づいてフィルタ係数を修正する。適応フィルタ１８１は、修正したフィルタ係数と第１の擬似エコー信号とを畳み込むことにより第３の擬似エコー信号を生成する。

次に、ステップＳ５１において、誤差算出部１８２は、音響エコー成分をキャンセルした第１の入力信号を第１の出力端子２０へ出力する。すなわち、誤差算出部１８２は、第１のマイク１１からの第１の入力信号から、適応フィルタ１８１からの第３の擬似エコー信号を減算することにより、第１の入力信号から音響エコー成分をキャンセルする。

次に、ステップＳ５２において、第４のエコーキャンセラ１９の適応フィルタ１９１は、フィルタ係数と第１の擬似エコー信号とを畳み込むことにより、第２の入力信号に含まれる第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成する。

次に、ステップＳ５３において、誤差算出部１９２は、第２のマイク１２からの第２の入力信号から、適応フィルタ１９１からの第４の擬似エコー信号を減算することにより、第２の入力信号と第４の擬似エコー信号との第４の誤差信号を算出する。誤差算出部１９２は、算出した第４の誤差信号を適応フィルタ１９１へ出力する。

次に、ステップＳ５４において、適応フィルタ１９１は、誤差算出部１９２から入力された第４の誤差信号に基づいてフィルタ係数を修正する。適応フィルタ１９１は、修正したフィルタ係数と第１の擬似エコー信号とを畳み込むことにより第４の擬似エコー信号を生成する。

次に、ステップＳ５５において、誤差算出部１９２は、音響エコー成分をキャンセルした第２の入力信号を第２の出力端子２１へ出力する。すなわち、誤差算出部１９２は、第２のマイク１２からの第２の入力信号から、適応フィルタ１９１からの第４の擬似エコー信号を減算することにより、第２の入力信号から音響エコー成分をキャンセルする。

なお、音響エコーキャンセル装置１Ｄが動作を開始した初期段階では、フィルタ係数が充分に修正されていないため、第１の入力信号及び第２の入力信号から音響エコー成分を充分にキャンセルすることができないが、ステップＳ４１〜ステップＳ５５の処理が繰り返し実行されることで、フィルタ係数が充分に修正され、第１の入力信号及び第２の入力信号から音響エコー成分を充分にキャンセルすることができるようになる。

このように、第１のエコーキャンセラ６１によって、少なくとも２つのマイクから得られる入力信号に含まれる再生信号の成分を示す第１の擬似エコー信号が生成され、第２のエコーキャンセラ１７によって、少なくとも１つの入力信号に含まれる第１の擬似エコー信号の成分を示す第２の擬似エコー信号が生成され、生成された第２の擬似エコー信号を用いて少なくとも１つの入力信号の音響エコー成分がキャンセルされる。

特に、第１段目のエコーキャンセラ（第１のエコーキャンセラ６１）によるエコーキャンセル処理は、従来と同じ程度のフィルタ長（演算量）であるが、第２段目以降のエコーキャンセラ（第３のエコーキャンセラ１８及び第４のエコーキャンセラ１９）によるエコーキャンセル処理は、既に生成された第１の擬似エコー信号が用いられるので、従来よりもフィルタ長を短くすることができ、その結果、従来よりも演算量を削減することができる。そのため、マイクの数が増えるほど、従来に比べて演算量をより削減することができる。

また、複数のマイクはそれぞれ配置位置が異なる。そのため、音響エコーとして入力される反射波（エコー信号）の波形は複数のマイク毎に異なる。エコー信号の位相が、話者の音声である入力信号とは逆位相である場合、エコー信号が入力信号に加算されることで、入力信号が消えてしまい、入力信号の音響エコーをキャンセルすることが困難となる。しかしながら、本実施の形態３では、少なくとも２つのマイクからの第１の入力信号及び第２の入力信号のそれぞれの誤差信号が加算及び平均化されるので、音響エコーの干渉による信号の欠落の影響を低減することができる。

なお、本実施の形態３において、音響エコーキャンセル装置１Ｄは、第１のマイク１１と第３のエコーキャンセラ１８との間に第１の遅延部８１を備えてもよく、第２のマイク１２と第４のエコーキャンセラ１９との間に第２の遅延部８２を備えてもよい。

なお、本実施の形態３では、第１のエコーキャンセラ６１には、時間領域の再生信号、時間領域の第１の入力信号及び時間領域の第２の入力信号が入力され、第２のエコーキャンセラ１７には、時間領域の第１の入力信号、時間領域の第２の入力信号及び時間領域の第１の擬似エコー信号が入力されるが、本開示は特にこれに限定されず、第１のエコーキャンセラ６１には、周波数領域の再生信号、周波数領域の第１の入力信号及び周波数領域の第２の入力信号が入力され、第２のエコーキャンセラ１７には、周波数領域の第１の入力信号、周波数領域の第２の入力信号及び周波数領域の第１の擬似エコー信号が入力されてもよい。以下、この実施の形態３の変形例について説明する。

図９は、本開示の実施の形態３の変形例における通話装置の構成を示す図である。

図９に示す通話装置は、音響エコーキャンセル装置１Ｅ、第１のマイク１１、第２のマイク１２、入力端子１４、スピーカ１５、第１の出力端子２０及び第２の出力端子２１を備える。なお、実施の形態３の変形例において、実施の形態３と同じ構成については同じ符号を付し、説明を省略する。

音響エコーキャンセル装置１Ｅは、第１のエコーキャンセラ６１、第２のエコーキャンセラ１７、高速フーリエ変換部６４，６５，６６及び逆高速フーリエ変換部６９，７０を備える。

高速フーリエ変換部６４，６５，６６は、離散フーリエ変換を高速に行う。高速フーリエ変換部６４は、第１のエコーキャンセラ６１に入力される時間領域の再生信号を周波数領域の再生信号に変換する。高速フーリエ変換部６５は、第１のマイク１１から出力される時間領域の第１の入力信号を周波数領域の第１の入力信号に変換する。高速フーリエ変換部６６は、第２のマイク１２から出力される時間領域の第２の入力信号を周波数領域の第２の入力信号に変換する。

逆高速フーリエ変換部６９，７０は、逆離散フーリエ変換を高速に行う。逆高速フーリエ変換部６９は、第３のエコーキャンセラ１８から第１の出力端子２０に入力される周波数領域の第１の入力信号を時間領域の第１の入力信号に変換する。逆高速フーリエ変換部７０は、第４のエコーキャンセラ１９から第２の出力端子２１に入力される周波数領域の第２の入力信号を時間領域の第２の入力信号に変換する。

第１のエコーキャンセラ６１は、周波数領域の第１の入力信号と周波数領域の第２の入力信号と周波数領域の再生信号とを用いて、周波数領域の第１の擬似エコー信号を生成する。

本実施の形態３の変形例では、適応フィルタ６１１，１８１，１９１が周波数領域の適応アルゴリズムを用いることができ、畳み込み演算がかけ算により実行することができるので、演算量をさらに削減することができる。

なお、本実施の形態３の変形例において、音響エコーキャンセル装置１Ｅは、第１のマイク１１と第３のエコーキャンセラ１８との間に第１の遅延部８１を備えてもよく、第２のマイク１２と第４のエコーキャンセラ１９との間に第２の遅延部８２を備えてもよい。この場合、第１のマイク１１と誤差算出部１８２との間の分岐点と、第１の誤差算出部６１２との間に高速フーリエ変換部６５が配置され、分岐点と誤差算出部１８２との間に第１の遅延部８１及び高速フーリエ変換部が配置される。また、第２のマイク１２と誤差算出部１９２との間の分岐点と、第２の誤差算出部６１３との間に高速フーリエ変換部６６が配置され、分岐点と誤差算出部１９２との間に第２の遅延部８２及び高速フーリエ変換部が配置される。

なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。

本開示の実施の形態に係る装置の機能の一部又は全ては典型的には集積回路であるＬＳＩ（ＬａｒｇｅＳｃａｌｅＩｎｔｅｇｒａｔｉｏｎ）として実現される。これらは個別に１チップ化されてもよいし、一部又は全てを含むように１チップ化されてもよい。また、集積回路化はＬＳＩに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。ＬＳＩ製造後にプログラムすることが可能なＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）、又はＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

また、本開示の実施の形態に係る装置の機能の一部又は全てを、ＣＰＵ等のプロセッサがプログラムを実行することにより実現してもよい。

また、上記で用いた数字は、全て本開示を具体的に説明するために例示するものであり、本開示は例示された数字に制限されない。

また、上記フローチャートに示す各ステップが実行される順序は、本開示を具体的に説明するために例示するためのものであり、同様の効果が得られる範囲で上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時（並列）に実行されてもよい。

本開示に係る音響エコーキャンセル装置、音響エコーキャンセル方法及び音響エコーキャンセルプログラムは、通話性能を維持することができるとともに、音響エコーを除去するための演算量を削減することができるので、マイクから出力される入力信号の音響エコー成分をキャンセルする音響エコーキャンセル装置、音響エコーキャンセル方法及び音響エコーキャンセルプログラムとして有用である。

１，１Ａ，１Ｂ，１Ｃ，１Ｄ，１Ｅ，１Ｆ音響エコーキャンセル装置
１１第１のマイク
１２第２のマイク
１３加算部
１４入力端子
１５スピーカ
１６，４１，６１第１のエコーキャンセラ
１７，４２第２のエコーキャンセラ
１８第３のエコーキャンセラ
１９第４のエコーキャンセラ
２０第１の出力端子
２１第２の出力端子
２４，２５，２８，２９，４５，４６，４９，６４，６５，６６高速フーリエ変換部
３０，３１，５０，５１，６９，７０逆高速フーリエ変換部
８０遅延部
８１第１の遅延部
８２第２の遅延部
１６１，１８１，１９１，４１１，４２１，６１１適応フィルタ
１６２，１８２，１９２，４１２，４２２誤差算出部
６１２第１の誤差算出部
６１３第２の誤差算出部
６１４平均処理部

Claims

少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、前記入力信号に含まれる前記再生信号の成分を示す第１の擬似エコー信号を生成する第１のエコーキャンセラと、
前記少なくとも２つのマイクから出力される少なくとも１つの入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記少なくとも１つの入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて前記少なくとも１つの入力信号の音響エコー成分をキャンセルする第２のエコーキャンセラと、
を備える音響エコーキャンセル装置。
前記少なくとも２つのマイクから出力される少なくとも１つの入力信号を遅延させる遅延部をさらに備え、
前記第２のエコーキャンセラは、遅延させた前記少なくとも１つの入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、遅延させた前記少なくとも１つの入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて、遅延させた前記少なくとも１つの入力信号の音響エコー成分をキャンセルする、
請求項１記載の音響エコーキャンセル装置。
前記少なくとも２つのマイクは、第１の入力信号を出力する第１のマイクと、第２の入力信号を出力する第２のマイクとを含み、
前記遅延部は、前記第１の入力信号を遅延させる第１の遅延部と、前記第２の入力信号を遅延させる第２の遅延部とを含み、
前記第１の入力信号と前記第２の入力信号とを加算する加算部をさらに備え、
前記第１のエコーキャンセラは、前記加算部からの加算信号と前記再生信号とを用いて、前記加算信号に含まれる前記再生信号の成分を示す前記第１の擬似エコー信号を生成し、
前記第２のエコーキャンセラは、
遅延させた前記第１の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、遅延させた前記第１の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成し、生成した前記第３の擬似エコー信号を用いて、遅延させた前記第１の入力信号の音響エコー成分をキャンセルする第３のエコーキャンセラと、
遅延させた前記第２の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、遅延させた前記第２の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成し、生成した前記第４の擬似エコー信号を用いて、遅延させた前記第２の入力信号の音響エコー成分をキャンセルする第４のエコーキャンセラと、
を含む、
請求項２記載の音響エコーキャンセル装置。
前記少なくとも２つのマイクは、第１の入力信号を出力する第１のマイクと、第２の入力信号を出力する第２のマイクとを含み、
前記第１の入力信号と前記第２の入力信号とを加算する加算部をさらに備え、
前記第１のエコーキャンセラは、前記加算部からの加算信号と前記再生信号とを用いて、前記加算信号に含まれる前記再生信号の成分を示す前記第１の擬似エコー信号を生成し、
前記第２のエコーキャンセラは、
前記第１の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第１の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成し、生成した前記第３の擬似エコー信号を用いて前記第１の入力信号の音響エコー成分をキャンセルする第３のエコーキャンセラと、
前記第２の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第２の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成し、生成した前記第４の擬似エコー信号を用いて前記第２の入力信号の音響エコー成分をキャンセルする第４のエコーキャンセラと、
を含む、
請求項１記載の音響エコーキャンセル装置。
前記少なくとも２つのマイクは、第１の入力信号を出力する第１のマイクと、第２の入力信号を出力する第２のマイクとを含み、
前記第１のエコーキャンセラは、前記第１の入力信号と前記再生信号とを用いて、前記第１の入力信号に含まれる前記再生信号の成分を示す前記第１の擬似エコー信号を生成し、生成した前記第１の擬似エコー信号を用いて前記第１の入力信号の音響エコー成分をキャンセルし、
前記第２のエコーキャンセラは、前記第２の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第２の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて前記第２の入力信号の音響エコー成分をキャンセルする、
請求項１記載の音響エコーキャンセル装置。
前記少なくとも２つのマイクは、第１の入力信号を出力する第１のマイクと、第２の入力信号を出力する第２のマイクとを含み、
前記第１のエコーキャンセラは、
前記第１の入力信号と前記第１の擬似エコー信号との誤差を示す第１の誤差信号を算出する第１の算出部と、
前記第２の入力信号と前記第１の擬似エコー信号との誤差を示す第２の誤差信号を算出する第２の算出部と、
前記第１の誤差信号と前記第２の誤差信号とを加算した加算信号を平均化する平均処理部と、
前記平均処理部からの平均信号と前記再生信号とを用いて、前記平均信号に含まれる前記再生信号の成分を示す前記第１の擬似エコー信号を生成する生成部と、
を含み、
前記第２のエコーキャンセラは、
前記第１の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第１の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第３の擬似エコー信号を生成し、生成した前記第３の擬似エコー信号を用いて前記第１の入力信号の音響エコー成分をキャンセルする第３のエコーキャンセラと、
前記第２の入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記第２の入力信号に含まれる前記第１の擬似エコー信号の成分を示す第４の擬似エコー信号を生成し、生成した前記第４の擬似エコー信号を用いて前記第２の入力信号の音響エコー成分をキャンセルする第４のエコーキャンセラと、
を含む、
請求項１記載の音響エコーキャンセル装置。
時間領域の前記入力信号を周波数領域の入力信号に変換する第１の変換部と、
時間領域の前記再生信号を周波数領域の再生信号に変換する第２の変換部と、
時間領域の前記少なくとも１つの入力信号を周波数領域の少なくとも１つの入力信号に変換する第３の変換部と、
時間領域の前記第１の擬似エコー信号を周波数領域の第１の擬似エコー信号に変換する第４の変換部と、
をさらに備える、
請求項１〜６のいずれか１項に記載の音響エコーキャンセル装置。
前記第２のエコーキャンセラのフィルタ長は、前記第１のエコーキャンセラのフィルタ長より短い、
請求項１〜７のいずれか１項に記載の音響エコーキャンセル装置。
前記第１のエコーキャンセラは、前記スピーカから最も近い位置のマイクに対して、前記第１の擬似エコー信号を生成する、
請求項１〜８のいずれか１項に記載の音響エコーキャンセル装置。
マイクから出力される入力信号の音響エコー成分をキャンセルする音響エコーキャンセル装置における音響エコーキャンセル方法であって、
前記少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、前記入力信号に含まれる前記再生信号の成分を示す第１の擬似エコー信号を生成し、
前記少なくとも２つのマイクから出力される少なくとも１つの入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記少なくとも１つの入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、
生成した前記第２の擬似エコー信号を用いて前記少なくとも１つの入力信号の音響エコー成分をキャンセルする、
音響エコーキャンセル方法。
少なくとも２つのマイクから得られる入力信号と、スピーカへ出力される再生信号とを用いて、前記入力信号に含まれる前記再生信号の成分を示す第１の擬似エコー信号を生成する第１のエコーキャンセラと、
前記少なくとも２つのマイクから出力される少なくとも１つの入力信号と、前記第１のエコーキャンセラによって生成された前記第１の擬似エコー信号とを用いて、前記少なくとも１つの入力信号に含まれる前記第１の擬似エコー信号の成分を示す第２の擬似エコー信号を生成し、生成した前記第２の擬似エコー信号を用いて前記少なくとも１つの入力信号の音響エコー成分をキャンセルする第２のエコーキャンセラとしてコンピュータを機能させる音響エコーキャンセルプログラム。