JPWO2007049644A1

JPWO2007049644A1 - エコー抑圧方法及び装置

Info

Publication number: JPWO2007049644A1
Application number: JP2007542623A
Authority: JP
Inventors: 宝珠山　治; 治宝珠山
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2005-10-26
Filing date: 2006-10-25
Publication date: 2009-04-30
Anticipated expiration: 2026-10-25
Also published as: JP4702372B2; EP1942583A1; CN101346896B; US20090154717A1; KR20080066051A; EP1942583A4; KR100974371B1; US8433074B2; WO2007049644A1; EP1942583B1; CN101346896A

Abstract

変換部１００は、収音器の出力信号または収音器の出力信号からエコーキャンセラの出力信号を減じた信号のいずれか一方を第１の信号としたとき、第１の信号へ洩れこむエコーの洩れこみ量の推定値を示す洩れこみ推定値を用いて第１の信号を補正し、第１の信号の補正後の信号が推定した近端雑音よりも小さくならないように制限する。

Description

本発明はスピーカによる拡声とマイクロホンによる収音とが同時に行われたときに発生するエコーを抑圧するためのエコー抑圧方法及び装置に関する。

図１は第１従来例のエコー抑圧装置の構成を示すブロック図である。

図１はハンズフリー電話器で発生するエコーを抑圧するためのエコー抑圧装置の構成例を示している。

図１において、入力端子１０から入力された通話相手の音声信号（以下、遠端信号と称す）はスピーカ２から遠端音声として拡声される。一方、マイクロホン１には、例えば話者の声（以下、近端音声と称す）が収音されると共にスピーカ２から拡声された不要な遠端音声が入力される。このスピーカ２からマイクロホン１に入力される音はエコーと呼ばれる。また、遠端信号からマイクロホン１の出力信号までの音響伝達系はエコー経路と呼ばれる。音響伝達系にはスピーカ２及びマイクロホン１が含まれる。

エコー抑圧装置の出力端子９から近端信号として出力したいのは近端音声のみであり、近端信号に含まれる不要な遠端音声は除去したい。特に近端信号に大きな遠端音声の信号成分が含まれている場合、通話相手は遅延した遠端音声をエコーとして聞くことになるため通話が困難になる。このような問題に対しては、従来から線形エコーキャンセラを用いて近端信号からエコーを除去する方法が採用されている。線形エコーキャンセラについては、例えば非特許文献１（Eberhard HANSLERによる論文“The hands-free telephone problem:an annotated bibliography update」、annals of telecommunications”，1994年，p360-367）に記載されている。

線形エコーキャンセラ３は、エコー経路の伝達関数を推定（エコー経路推定）し、この推定した伝達関数に基づきスピーカ２の入力信号（遠端信号）からマイクロホン１へ入力されるエコーの模擬信号（エコーレプリカ信号）を生成する。

線形エコーキャンセラ部３で生成されたエコーレプリカ信号は減算器４へ入力され、減算器４によりマイクロホン１の出力信号からエコーレプリカ信号を減ずることで近端信号が出力される。

音声検出部５は、マイクロホン１の出力信号、線形エコーキャンセラ３の出力信号、減算器４の出力信号及び遠端信号を受信し、それらの信号からマイクロホン１の出力信号に近端音声が含まれているか否かを検出し、その検出結果を線形エコーキャンセラ３へ出力する。

音声検出部５は、線形エコーキャンセラ３の動作を制御するために、マイクロホン１の出力信号から近端音声を検出した場合は音声検出結果として「０」あるいは極めて小さな値を出力し、近端音声を検出しない場合は大きな値を出力する。

図２は図１に示した線形エコーキャンセラの一構成例を示すブロック図である。

図２に示すように、線形エコーキャンセラ３は、線形フィルタである適応フィルタ３０及び乗算器３５を備えた構成である。適応フィルタ３０には、ＦＩＲ型、ＩＩＲ型、ラチス型等の様々なフィルタが用いられる。

適応フィルタ３０は、端子３１から入力された遠端信号をフィルタリングし、その処理結果を端子３２から減算器４へ出力する。適応フィルタ３０は、端子３３から入力される減算器４の出力信号が最小となるように所定の相関演算を用いてフィルタ係数を更新する。そのため、適応フィルタ３０は、減算器４の出力信号のうち、遠端信号と相関がある成分が最小となるように動作する。すなわち、減算器４の出力信号からエコー（遠端音声）が除去されることになる。

ところで、適応フィルタ３０は、マイクロホン１の出力信号に近端音声が含まれている状態でフィルタ係数を更新すると、フィルタ係数の変動によりエコーの除去能力が低下することがある。

乗算器３５は、適応フィルタ３０によるフィルタ係数の更新を制御するために備え、減算器４の出力信号と音声検出部５の出力信号とを乗算し、その演算結果を適応フィルタ３０へ出力する。マイクロホン１の出力信号に近端音声が含まれているとき、上述したように音声検出部５の出力信号は０あるいは極めて小さな値であるため、適応フィルタ３０によるフィルタ係数の更新が抑制され、フィルタ係数の変動が小さくなる。その結果、エコーの除去能力の低下が抑制される。

このように第１従来例のエコー抑圧装置では適応フィルタを用いることで遠端信号のエコーを除去している。

次に第２従来例のエコー抑圧装置について説明する。

第２従来例のエコー抑圧装置は、折りたたみ型の携帯電話装置において、ヒンジ部の角度に応じてエコーの抑圧に用いる擬似エコー（エコーレプリカ信号）を修正する構成である。このような構成は、例えば特開平８−９００５号公報に記載されている。

第２従来例のエコー抑圧装置は、ヒンジ部の角度を検出し、その角度に応じた制御信号を出力する制御信号発生部と、該制御信号に基づいてエコーを抑圧するエコー制御部とを有する構成である。

エコー制御部は、ヒンジ部の角度によって変動するエコー経路に対応した擬似エコーを生成するために、予め設定された複数のエコー経路追従係数を保持しておき、制御信号発生部から出力される制御信号をアドレス信号に用いてエコー経路追従係数を選択する係数選択回路と、係数選択回路で選択されたエコー経路追従係数に基づき擬似エコーを修正するための擬似エコー修正信号を出力する適応制御回路と、擬似エコー修正信号に基づき擬似エコーを生成する擬似エコー発生回路と、生成した擬似エコーを音声入力部（マイクロホン）の出力信号から減ずる減算回路とを備えている。

次に第３従来例のエコー抑圧装置について説明する。

第３従来例のエコー抑圧装置は、例えば特開平９−１１６４６９号公報に記載された構成である。

第３従来例のエコー抑圧装置では、遠端信号のパワーと周囲雑音のパワーとの推定値に基づいてゲイン係数を決定し、マイクロホンの出力信号からエコーレプリカ信号を減算した信号にゲイン係数を乗じることにより、適応フィルタだけでは消去しきれないエコーおよび周囲の雑音の影響を抑圧している。

次に第４従来例のエコー抑圧装置について説明する。

第４従来例のエコー抑圧装置は、例えば特開２００４−０５６４５３号公報に記載された技術である。第４従来例のエコー抑圧装置では、マイクロホン（収音器）の出力信号、または収音器の出力信号からエコーキャンセラの出力信号を減じた信号のいずれか一方を第１の信号とし、エコーキャンセラの出力信号を第２の信号としたとき、第１の信号（近端信号）へ洩れこむ第２の信号（遠端信号、エコー）の洩れこみ量を推定し、この推定結果に基づいて第１の信号を補正する。

このエコーの洩れこみ量の推定値には、近端音声が検出されない期間における第２の信号の振幅または電力に応じた量と、第１の信号の振幅または電力に応じた量との比を用いる。第４従来例のエコー抑圧装置では、第１の信号及び第２の信号の周波数成分毎に、第１の信号と第２の信号とからエコーの洩れこみ量の推定値を算出し、この算出した推定値に基づいて第１の信号を補正している。

なお、収音器と拡声器間の音響結合によるエコーを抑圧するための技術ではないが、入力信号に含まれる雑音を除去するための技術が、例えば特開２００４−１２８８４号公報に記載されている（以下、第５従来例と称す）。

第５従来例では、所定の周波数領域毎に入力音声スペクトルから雑音スペクトルを推定し、入力音声スペクトルから雑音スペクトルの推定値を減算している。但し、減算量が大きくなり過ぎないように周知のフロアリング係数βを設定し、減算結果が「β×入力音声のスペクトル」以下とならないように制限している。

ところで、上述した第１従来例及び第２従来例のエコー抑圧装置では、エコー経路が持つ歪等の非線形要素が小さいときにはエコーを十分に抑圧できる。しかしながら、実際の装置ではスピーカ等が大きな非線形要素を持っている。歪を含むエコー経路の伝達関数は非線形であり、線形エコーキャンセラ３でエコー経路の正確な伝達関数を模擬できない。特に携帯電話装置等で用いる小型のスピーカから大音量が発せられる場合、その音声の歪は大きいため、エコーが２０ｄＢ程度しか抑圧されない。その場合、エコーが近端信号として送信され、通話相手の話者にも聞こえるために通話が困難になる。

これに対して、第３従来例及び第４従来例、特に第４従来例によれば、エコー経路の歪が大きくてもエコーが十分に抑圧される。しかしながら、第４従来例のエコー抑圧装置では、近端騒音等の影響によってエコーの洩れこみ量を正しく推定できない場合、それに基づいて補正される第１の信号の補正後の信号が劣化する。すなわち、エコーが十分に抑圧されないか、近端信号（近端音声＋近端雑音）に大きな歪が生じる。歪が生じた場合、近端信号の音が遠端信号によって変調されたような音になる。具体的には、遠端信号が大きい時にだけこもったような音になる。例えば、近端信号が定常的な「ザー」という雑音である場合、遠端音声によって「ゾワ、ゾワ」と変調されたような音になる。また、近端信号が音声である場合、遠端信号が大きい時にだけこもったような音になる。後者については、近端音声自体が大きく変化するため、遠端信号によって変調された音（不快音）は近端音声に埋没してあまり感じない。しかしながら、前者については定常的に発生している雑音が遠端信号によって変調された音となるため、不快音として感じる。特に、第４従来例では、近端音声と共に大きな騒音が入力される環境で使用する場合、音声検出結果の誤差が大きくなる可能性が高いため、エコーの洩れこみ量の推定精度が低下し、より不快感が大きい音となる。

そこで、本発明は、エコー経路に起因して発生する歪が大きい場合でもエコーを十分に抑圧でき、かつ不快な遠端信号による近端信号の変調音を低減できるエコー抑圧方法及び装置を提供することを目的とする。

上記目的を達成するため本発明では、収音器の出力信号または収音器の出力信号からエコーキャンセラの出力信号を減じた信号のいずれか一方を第１の信号とし、エコーキャンセラの出力信号を第２の信号としたとき、第１の信号へ洩れこむエコーである第２の信号の洩れこみ量の推定値を示す洩れこみ推定値を用いて第１の信号を補正し、該補正後の信号が推定した近端雑音の推定値よりも小さくならないように制限する。

エコーキャンセラが線形エコーキャンセラである場合、該エコーキャンセラの出力には遠端信号に含まれる高調波成分がほぼそのまま現れる。また、このエコーキャンセラが非線形エコーキャンセラであっても該エコーキャンセラの出力には遠端信号に含まれる高調波成分が少なからず含まれる。

一方、収音器（マイクロホン）の出力信号には、近端雑音、収音器と拡声器間の音響結合による遠端信号のエコー及び音響系の歪により発生する高調波成分が含まれる。これらの高調波成分の比、すなわち非線形成分によるエコーの洩れこみ具合の推定値と第２の信号から第１の信号に含まれるエコーの量を推定し、第１の信号から減ずる、または洩れこみ推定値、第１の信号及び第２の信号から第１の信号に含まれる近端信号の割合を推定し、この推定した割合を第１の信号に乗ずることで、第１の信号からエコーの非線形成分を除去できる。そして、洩れこみ推定値を用いて第１の信号を補正した補正後の信号が推定した近端雑音よりも小さくならないように制限すれば、誤った洩れこみ推定値によってエコーの非線形成分を除去したことに伴う不快な遠端信号による近端信号の変調音を低減できる。

本発明によれば、洩れこみ推定値を用いて第１の信号を補正することで、エコー経路に起因して発生した歪が大きい場合でもエコーを十分に抑圧でき、かつ第１の信号の補正後の信号が近端雑音の推定値よりも小さくならないように制限することで、不快な遠端信号による近端信号の変調音を低減できる。

図１は第１従来例のエコー抑圧装置の構成を示すブロック図である。図２は図１に示した線形エコーキャンセラの一構成例を示すブロック図である。図３は本発明のエコー抑圧装置の一構成例を示すブロック図である。図４は図３に示した変換部の一構成例を示すブロック図である。図５はエコーレプリカ信号と残留エコーのスペクトルの相関を調べた実験結果を示すグラフである。図６は複数のスピーカ及びマイクロホンを備えた携帯電話装置の構成例を示す模式図である。図７はエコーを十分に抑圧できる洩れこみ係数と線形エコーキャンセラの出力信号の電力との関係を示すグラフである。図８は本発明のエコー抑圧装置の第１実施例の構成を示すブロック図である。図９は図８に示した係数発生部の一構成例を示すブロック図である。図１０は図８に示した係数発生部の他の構成例を示すブロック図である。図１１は図８に示したスペクトルサブトラクション部の一構成例を示すブロック図である。図１２は図１１に示したフーリエ係数減算器の一構成例を示すブロック図である。図１３は図１２に示したスペクトル推定部の一構成例を示すブロック図である。図１４は図１２に示した雑音推定部の一構成例を示すブロック図である。図１５は本発明のエコー抑圧装置の第２実施例の構成を示すブロック図である。図１６は本発明のエコー抑圧装置の第３実施例の構成を示すブロック図である。図１７は図１６に示したスペクトルサプレッション部の一構成例を示すブロック図である。図１８は図１７に示したフーリエ係数乗算器の第１構成例を示すブロック図である。図１９は図１８に示した利得変換部の一構成例を示すブロック図である。図２０は図１８に示したスペクトル推定部の第２構成例を示すブロック図である。図２１は図２０に示した振幅抽出部の一構成例を示すブロック図である。図２２は図２０に示した振幅抽出部の他の構成例を示すブロック図である。図２３は本発明のエコー抑圧装置の第４実施例の構成を示すブロック図である。図２４は本発明のエコー抑圧装置の第５実施例の構成を示すブロック図である。図２５は図２４に示したエコーキャンセラの一構成例を示すブロック図である。図２６は図２４に示したスペクトルサブトラクション部の一構成例を示すブロック図である。図２７は本発明のエコー抑圧装置の第６実施例の構成を示すブロック図である。図２８は本発明のエコー抑圧装置の第７実施例の構成を示すブロック図である。

図３は本発明のエコー抑圧装置の一構成例を示すブロック図である。

図３に示すように、本発明のエコー抑圧装置は、図１に示した第１従来例のエコー抑圧装置に加えて、マイクロホン１とスピーカ２の音響結合により発生する、近端信号へ洩れこむ遠端信号（エコー）の洩れこみ量の算出に用いる係数（以下、洩れこみ係数と称す）を生成する係数発生部２００と、マイクロホン１の出力信号または減算器４の出力信号のいずれか一方を第１の信号とし、線形エコーキャンセラ３の出力信号を第２の信号としたとき、係数発生部２００で生成した洩れこみ係数と第２の信号とに基づいて第１の信号を補正し、第１の信号からエコーを除去した近端信号を出力する変換部１００とをさらに有する構成である。スピーカ２に入力される遠端信号は端子１０から入力され、近端信号は端子９から出力される。なお、線形エコーキャンセラ３は、非線形エコーキャンセラであってもよい。

変換部１００は、第１の信号及び第２の信号からエコーの洩れこみ量を推定し、この推定値（以下、洩れこみ推定値と称す）に基づいて第１の信号を補正する。または、係数発生部２００で生成した洩れこみ係数を洩れこみ推定値に用いて第１の信号を補正する。その際、洩れこみ推定値を用いて補正した補正後の第１の信号（絶対値）が別途推定した近端雑音の推定値（絶対値）よりも小さくならないように制限する。このような処理は、第１の信号及び第２の信号を所定の周波数領域毎に分割し、該周波数領域毎に実施する。また、係数発生部２００は予め設定された所定の使用状況に応じて洩れこみ係数を切り替えることが好ましい。

図４は図３に示した変換部の一構成例を示すブロック図である。

図４に示すように、変換部１００は、周波数分割部１６０、周波数分割部１６１、Ｍ個の補正部１６６ｍ（ｍ＝１〜Ｍ）及び周波数合成部１６４を備えた構成である。

周波数分割部１６０は、端子１６２を介して入力された第１の信号を所定の周波数領域毎にＭ分割し、該周波数領域に対応する補正部１６６ｍへ出力する。周波数分割部１６１は、端子１６３を介して入力された第２の信号を所定の周波数領域毎にＭ分割し、該周波数領域に対応する補正部１６６ｍへ出力する。

補正部ｍは、端子１６７を介して入力される音声検出部５の音声検出結果、当該周波数領域の第１の信号及び第２の信号を用いて算出した洩れこみ推定値と第２の信号とを用いて第１の信号を補正し、補正後の信号を周波数合成部１６４へ出力する。または、補正部ｍは、端子６７を介して入力される、係数発生部２００で生成した洩れこみ係数を洩れこみ推定値として使用し、該推定値と第２の信号とを用いて第１の信号を補正し、補正後の信号を周波数合成部１６４へ出力する。周波数合成部１６４は、補正部ｍの出力信号を周波数合成して端子１６５から出力する。

洩れこみ推定値には、洩れこみ係数または第１の信号及び第２の信号から算出した値のいずれか一方を常に使用してもよく、これらを適宜切り替えて使用してもよい。洩れこみ推定値を切り替える方法としては、例えば近端音声が所定のしきい値よりも大きいときは第１の信号及び第２の信号から洩れこみ推定値を算出し、近端音声が所定のしきい値よりも小さいときは洩れこみ係数を洩れこみ推定値として用いる方法がある。

補正部１６６ｍは、洩れこみ推定値を用いて第１の信号を補正し、補正後の信号が周波数領域毎に推定した近端雑音の推定値よりも小さくならないように制限する。具体的には、洩れこみ推定値と第２の信号を用いて第１の信号に含まれるエコーの量を推定し、この推定したエコーの量を第１の信号から減じ、その減算後の信号が近端雑音の推定値よりも小さくならないように制限する。

または、洩れこみ推定値と第２の信号を用いて第１の信号に含まれるエコーの量を推定し、この推定したエコーの量を第１の信号から減じ、その減算後の信号を近端雑音の推定値よりも小さくならないように制限して第３の信号とする。そして、この第３の信号と第１の信号から第１の信号に含まれる近端信号の割合を推定し、その推定した割合を第１の信号に乗じてもよい。

周波数分割部１６０、１６１は、フーリエ変換、コサイン変換、サブバンド分析フィルタバンク等の任意の線形変換を用いて周波数分割を行う。周波数合成部１６４は、周波数分割部１６０、１６１で用いる線形変換に対応する逆フーリエ変換、逆コサイン変換、サブバンド合成フィルタバンク等を用いて周波数合成を行う。

本発明のエコー抑圧装置は、洩れこみ推定値を用いて第１の信号を補正し、補正後の信号が近端雑音の推定値よりも小さくならないように制限する点で第４従来例のエコー抑圧装置と異なっている。本発明のエコー抑圧装置によれば、補正後の第１の信号が近端雑音よりも小さくなることがないため、洩れこみ推定値が誤っていても不快な遠端信号による近端信号の変調音を低減できる。

また、本発明のエコー抑圧装置は、洩れこみ係数を定数とする点でエコーの洩れこみ量を第１の信号及び第２の信号から適宜算出する第４従来例と異なっている。第４従来例では、エコーの洩れこみ量が遠端信号の周波数スペクトル分布に依存するため、洩れこみ係数を定数とすることは不適当であると認定していた。しかしながら、本発明者は、音声通話を目的とする限り、女性と男性の音声周波数スペクトル分布の相違程度では、洩れこみ係数を定数にしても十分にエコーを抑圧できることを実験により確認した。以下、この点について詳述する。

図５はエコーレプリカ信号と残留エコーのスペクトルの相関を調べた実験結果を示すグラフである。図５に示すグラフの横軸はエコーレプリカ信号の振幅（線形エコーキャンセラ３の出力振幅）を示し、縦軸は残留エコーの振幅（第１の信号に含まれるエコー成分）を示している。

相関の傾き（残留エコーの振幅／エコーレプリカの振幅）はエコーの歪の大きさを示し、傾きが大きいほど歪が大きいことを示している。すなわち、相関の傾きは洩れこみ係数に相当する。

図５に示すように、同じ女性の声であっても周波数によって相関の傾きが異なることが分かる。男性の場合も同様である。しかしながら、同一の周波数で比較すると、女性の声の相関の傾きと男性の声の相関の傾きは、ほぼ同じになっている。図５では示していないが、音楽のように人の声とスペクトル分布が著しく異なる音を遠端信号とした場合、図５のグラフに示した周波数と同じ周波数であっても（１２５０Ｈｚ、３１２５Ｈｚ）、相関の傾きは人の声と全く異なっている。その理由は、より低い周波数成分を含む音楽等では、残留エコーの原因である高調波の発生元となる周波数成分が人の声よりも遥かに多いからである。

このようにエコーレプリカ信号と残留エコーの相関の傾きは、遠端信号の周波数スペクトル分布に依存するが、女性と男性の音声周波数スペクトル分布の相違程度では周波数毎の相関の傾きが類似していることが確かめられた。この結果から、音声通話を目的とする限り、同一の洩れこみ係数を用いても良いことが分かる。

但し、図５に示すように、エコーレプリカ信号と残留エコーの相関の傾きは周波数によって異なる。そのため、係数発生部２００にて第１の信号の周波数領域毎に異なる洩れこみ係数を生成し、変換部１００にて周波数領域に応じた洩れ込み係数を用いて第１の信号を補正すればエコーを十分に抑圧できる。

ところで、線形エコーキャンセラ３で十分に抑圧できないと言われるエコーの歪音は、スピーカ２自体から発生する歪音と、マイクロホン１やスピーカ２が実装された筐体が振動することで発生する歪音とに大別される。さらに、それらの歪音はエコーの抑圧対象である装置の利用状況によっても変化する。したがって、係数発生部２００は、エコーの抑圧対象である装置の利用状況に応じて洩れこみ係数を切り替えて出力することが望ましい。

以下、携帯電話装置を例にして利用状況に応じて洩れこみ係数を切り替える例について説明する。

スピーカ２自体から発生する歪音の原因はスピーカ特性の非線形性にある。したがって、図６に示すように複数のスピーカ３０１〜３０３を適宜切り替える携帯電話装置では、個々のスピーカ特性が相違する場合、利用するスピーカによってエコーの歪音が相違する。そのような使用状況では、使用するスピーカを検出し、検出したスピーカに応じて洩れこみ係数を切り替えればよい。

また、スピーカ２を１つしか実装していない携帯電話装置でも、マイクロホン１との位置関係によってスピーカ２からマイクロホン１へ到達する歪音の大きさが変わるため、エコーの歪も変化する。そのような使用状況では、スピーカ２とマイクロホン１の相対位置を検出し、検出した相対位置に応じて洩れこみ係数を切り替えればよい。例えば、図６に示す折りたたみ型の携帯電話装置３００の場合、スピーカ２とマイクロホン１の位置関係はヒンジ部３２１の角度によって決まるため、ヒンジ部３２１の角度を検出し、該角度に応じて洩れこみ係数を切り替えればよい。

また、図６に示す折りたたみ型の携帯電話装置３００において、複数のマイクロホン３１１、３１２を適宜切り替えて使用する場合、使用するマイクロホンによってスピーカ２との相対位置が変わる。そのような使用状況では、使用するマイクロホンを検出し、検出したマイクロホンの位置に応じて予め設定された洩れこみ係数に切り替えればよい。

一方、筐体の振動に起因する歪音は、主として部品どうしの接合部で発生する。例えば、スピーカ２の出力音によって筐体が振動し、部品どうしの接合部から歪んだ音が発生する場合、この歪音がエコーの歪としてマイクロホン１に入力される。したがって、スピーカ２の音量が変化すると、スピーカ２から筐体へ伝わる音響エネルギーが変化し、部品どうしの接合部で生じる歪音も変化する。そのような使用状況では、スピーカ２の音量設定値を検出し、該音量設定値に応じて洩れこみ係数を切り替えればよい。

また、図６に示した折りたたみ型の携帯電話装置３００では、完全に折り畳まれているか否かによって筐体の振動量が変化し、部品どうしの接合部で発生する歪音も変化する。そのような使用状況では、携帯電話装置３００が完全に折り畳まれているか否かを検出し、その検出結果に応じて洩れこみ係数を切り替えればよい。

また、図６に示した折りたたみ型の携帯電話装置３００では、折り曲げ角度によってスピーカの位置が変化するため、筐体内の同じ部位であってもヒンジ部３２１の角度によってスピーカ２から伝わる音響エネルギーが変化し、部品どうしの接合部で生じる歪音が変化する。したがって、そのような使用状況でもヒンジ部３２１の角度を検出し、該角度に応じて洩れこみ係数を切り替えればよい。

なお、スライド型の携帯電話装置では、スライドの有無やスライド量を検出し、その検出結果に応じて洩れこみ係数を切り替えればよい。スライド機構と折りたたみ機構の両方を備えた携帯電話装置では、ヒンジ部の角度、携帯電話装置が折り畳まれているか否か、スライドの有無、あるいはスライド量を検出し、その検出結果に応じて洩れこみ係数を切り替えればよい。また、スライド型でも折りたたみ型でもない携帯電話装置では、例えば筐体内の部品どうしの接合部に伝わる音響エネルギーが変化する要因やエコーの音量変化に影響する要因を検出し、その検出結果に応じて洩れこみ係数を切り替えればよい。

さらに、本発明者は、線形エコーキャンセラ３から出力される信号の電力あるいは振幅が大きくなると、エコー経路の非線形性が変化することを実験により確認した。すなわち、マイクロホン１の出力信号に近端信号を全く含まない状態において歪のあるエコーを発生させたとき、エコーを十分に抑圧できる洩れこみ係数と線形エコーキャンセラ３の出力信号の電力との関係を調べると、図７に示すような結果が得られた。なお、図７は、１８７５Ｈｚを中心とする周波数帯域における線形エコーキャンセラ３の出力信号とそれに応じた洩れこみ係数の関係を示している。図７に示すグラフの横軸は線形エコーキャンセラ３の出力信号の電力を示し、縦軸はエコーを十分に抑圧できる洩れこみ係数を示している。

図７に示すプロット点の分布から分かるように、エコーを十分に抑圧できる洩れこみ係数は、線形エコーキャンセラ３の出力信号の電力値が２００００００を境にして急変している。これは、線形エコーキャンセラ３の出力信号の電力が大きいとき、線形エコーキャンセラ３の入力信号、すなわちスピーカ２へ入力する遠端信号の電力も大きいため、スピーカ特性の非線形性に起因するエコーの歪が急激に増えるためと考えられる。

したがって、本発明のエコー抑圧装置では、線形エコーキャンセラ３から出力される信号の電力あるいは振幅を使用状況として検出し、その検出値に応じて洩れこみ係数を切り替える。このような方法は、線形エコーキャンセラ３の出力信号の電力や振幅の代わりに、遠端信号の電力や振幅、あるいは遠端信号に含まれる特定の周波数成分の電力や振幅を用いることも可能である。

線形エコーキャンセラ３の出力信号に基づき洩れこみ係数を切り替える方法は、スピーカ２の音量設定値に基づき洩れこみ係数を切り替える方法と類似している。しかしながら、後者は遠端信号が全く無いためにエコーの抑圧が不要の場合でも音量設定に応じた洩れこみ係数を選択してしまう。一方、前者はそのような洩れこみ係数を誤って選択することが無い点で優れている。

以上説明した洩れこみ係数を切り替える方法は、上述した全ての使用状況を検出して洩れこみ係数を切り替える必要はなく、その内の１つあるいは複数の使用状況を検出して洩れこみ係数を切り替えてもよい。

例えば、複数のカメラを装備した携帯電話装置を用いて互いの映像を交換しながら通話を行う状況において（いわゆるテレビ電話）、該携帯電話装置が使用するカメラに応じてマイクロホンやスピーカが自動的に切り替わる構成の場合、使用するマイクロホンやスピーカを直接検出する代わりに、カメラで撮影した画像情報から使用しているマイクロホンやスピーカを検出してもよい。

洩れこみ係数の切り替えに用いる使用状況が決定したら、該使用状況に対応する最適な洩れこみ係数を実験やコンピュータによるシミュレーションによって決定し、洩れこみ係数を使用状況に対応付けて係数発生部２００に保存しておく。

なお、ヒンジ部の角度、スピーカの音量設定値、使用するスピーカ等、エコー抑圧装置の外部に設けたセンサ等で検出可能な使用状況は、その検出結果を係数発生部２００に入力すればよい。一方、遠端信号の電力や振幅、線形エコーキャンセラ３の出力信号の電力や振幅、遠端信号に含まれる特定の周波数成分の電力や振幅等の使用状況は、エコー抑圧装置内で検出し、その検出結果を係数発生部２００に入力すればよい。

本発明のエコー抑圧装置によれば、洩れこみ推定値を用いて第１の信号を補正し、補正後の信号が近端雑音の推定値よりも小さくならないように制限するため、洩れこみ推定値を誤って算出しても不快な遠端信号による近端信号の変調音を低減できる。また、所定の使用状況に応じて予め設定された定数である洩れこみ係数を洩れこみ推定値として用いれば、定数である洩れこみ係数は雑音に影響されないため、近端音声として大きな雑音が入力される環境でもエコー経路に起因して発生するエコーを十分に抑圧できる。

次に本発明のエコー抑圧装置の実施例について図面を用いて説明する。
［第１実施例］
図８は本発明のエコー抑圧装置の第１実施例の構成を示すブロック図である。

第１実施例のエコー抑圧装置は、図３に示した変換部１００として、スペクトルサブトラクション部６を用いる例である。

第１実施例の係数発生部２００は、上述したようにマイクロホン１とスピーカ２の音響結合により発生するエコーの洩れこみ量を示す洩れこみ係数を生成する。

スペクトルサブトラクション部６には、減算器４の出力信号、線形エコーキャンセラ３の出力信号、係数発生部２００で生成された洩れこみ係数及び音声検出部５の音声検出結果が入力される。

スペクトルサブトラクション部６は、減算器４の出力信号と線形エコーキャンセラ３の出力信号とをそれぞれ所定の周波数領域毎に分割し、分解後の周波数領域の信号成分毎にエコーを除去する。
＜係数発生部２００＞
図９は図８に示した係数発生部の一構成例を示すブロック図である。

図９に示す係数発生部２００は、帯域１から帯域Ｍの各周波数領域に適した洩れこみ係数を保持する係数記憶部２０１を備えた構成である。

係数発生部２００は、係数記憶部２０１に格納された周波数領域（帯域）毎の洩れこみ係数を読み出し、スペクトルサブトラクション部６へ出力する。これら洩れこみ係数は、例えば図５に示した周波数１２５０Ｈｚにおける相関の傾きや周波数３１２５Ｈｚにおける相関の傾きに相当する。

図１０は図８に示した係数発生部の他の構成例を示すブロック図である。

図１０に示す係数発生部２００は、帯域１から帯域Ｍの各周波数領域に適した洩れこみ係数群を保持する係数記憶部２０２と、本発明のエコー抑圧装置を備えたシステムの各種使用状況を検出する使用状況検出部２０３とを備えた構成である。

図１０に示す係数発生部２００は、各周波数領域に対応した洩れこみ係数群のうち、使用状況検出部２０３で検出された使用状況に対応する洩れこみ係数を係数記憶部２０２から読み出し、スペクトルサブトラクション部６へ出力する。

図１０に示した構成では、各周波数領域に対応した洩れこみ係数群に、使用状況１用の洩れこみ係数、使用状況２用の洩れこみ係数、…、使用状況Ｎ用の洩れこみ係数を備えている。Ｎは２以上の任意の値とする。

例えば、使用状況の一例として、スピーカ２の音量設定値を検出する場合、使用状況検出部２０３は、スピーカ２の音量設定値を検出するセンサと、検出した音量設定値と所定の閾値とを比較し、比較結果を２値以上のデジタル値に変換する弁別部とを有する。

使用状況の他の例として、折りたたみ型携帯電話装置におけるヒンジ部の角度を検出する方法がある。この場合、使用状況検出部２０３は、ヒンジ部の角度を検出するセンサ（不図示）と、検出角度と所定の閾値とを比較し、比較結果を２値以上のデジタル値に変換する弁別部（不図示）とを有する。

使用状況の他の例として、複数のスピーカを備えた携帯電話装置から使用しているスピーカを検出する場合、使用状況検出部２０３は、どのスピーカが用いられているかを判定し、判定結果を２値以上のデジタル値で出力する判定部（不図示）を有する。

使用状況の他の例として、複数のマイクロホンを備えた携帯電話装置から使用しているマイクロホンを検出する場合、使用状況検出部２０３は、どのマイクロホンが用いられているかを判定し、判定結果を２値以上のデジタル値で出力する判定部（不図示）を有する。

使用状況の他の例として、線形エコーキャンセラ３の出力信号の電力または振幅を検出する場合、使用状況検出部２０３は、線形エコーキャンセラ３の出力信号の電力または振幅を検出する検出部（不図示）と、検出された電力または振幅を閾値判定して２値以上のデジタル値に変換する弁別部（不図示）とを有する。例えば、本発明のエコー抑圧装置を含むシステムに、図５のグラフで示した特性を備えている場合、線形エコーキャンセラ３の出力電力が２００００００を境にして必要な洩れこみ係数が１から２０に急変するため、閾値を２００００００に設定し、２００００００以下であれば「０」を出力し、２００００００を越えていれば「１」を出力すればよい。

その他、使用状況にはエコーの洩れこみ量に影響するものであれば、どのようなものでも使用できる。また、複数の使用状況を組み合わせて用いることも可能である。

係数記憶部２０２は、各周波数領域に対応して予め登録された複数の洩れこみ係数の中から、使用状況検出部２０３の出力信号に対応する１つを選択し、選択した洩れこみ係数をスペクトルサブトラクション部６へ出力する。

例えば、図７に示した線形エコーキャンセラ３の出力信号の電力特性を使用状況として用いる場合、１８７５Ｈｚを中心とする周波数領域に対応して図７の太い実線で示す「１」と「２０」の２つの洩れこみ係数を保持し、使用状況検出部２０３から「０」が出力された場合は洩れこみ係数として「１」を出力し、使用状況検出部２０３から「１」が出力された場合は洩れこみ係数として「２０」を出力する。
＜スペクトルサブトラクション部６＞
図１１は図８に示したスペクトルサブトラクション部の一構成例を示すブロック図である。

図１１に示すように、スペクトルサブトラクション部６は、フーリエ変換器６０、フーリエ変換器６１、フーリエ係数減算器６６ｍ（ｍ＝１〜Ｍ）及び逆フーリエ変換機６４を備えた構成である。

フーリエ変換器６０は、減算器４の出力信号に対してＭ点フーリエ変換処理を実施し、処理結果（振幅と位相）を第１のフーリエ係数として各周波数領域に対応するフーリエ係数減算器６６ｍ（ｍ＝１〜Ｍ）へ出力する。

フーリエ変換器６１は、線形エコーキャンセラ３から出力されたエコーレプリカ信号に対してＭ点フーリエ変換処理を実施し、処理結果（振幅と位相）を第２のフーリエ係数として各周波数領域に対応するフーリエ係数減算器６６ｍへ出力する。

フーリエ係数減算器６６ｍは、フーリエ変換器６０から出力された第１のフーリエ係数と、フーリエ変換器６１から出力された第２のフーリエ係数と、図８に示した係数発生部２００から出力された洩れこみ係数及び音声検出部５から出力された音声検出結果とを受け取り、それらの振幅成分を用いた減算処理を実施することでフーリエ係数を算出し、算出結果（振幅と位相）を逆フーリエ変換器６４に出力する。

逆フーリエ変換器６４は、フーリエ係数減算部６６１〜６６Ｍから出力されたフーリエ係数群の逆フーリエ変換処理を実施し、処理結果の実数部を端子６５から出力する。

次に図１１に示したフーリエ係数減算器６６ｍ（ｍ＝１〜Ｍ）について図１１２を用いて説明する。

図１２は図１１に示したフーリエ係数減算器の一構成例を示すブロック図である。

図１２に示すように、フーリエ係数減算器６６ｍは、スペクトル推定部７７１、雑音推定部７７８及びリミッタ７７２を備えた構成である。

図１１に示したフーリエ変換器６０から出力された周波数領域毎の第１のフーリエ係数は端子７００を介してスペクトル推定部７７１及び雑音推定部７７８へ供給される。

図１１に示したフーリエ変換器６１から出力された第２のフーリエ係数は端子７０３を介してスペクトル推定部７７１へ供給される。また、係数発生部２０で生成された洩れこみ係数は端子６７を介してスペクトル推定部７７１へ出力され、音声検出部５から出力された音声検出結果は端子１６７を介してスペクトル推定部７７１へ出力される。

スペクトル推定部７７１は、端子７００から供給された第１のフーリエ係数からそのエコー成分を減じ、演算結果をリミッタ７７２へ出力する。雑音推定部７７８は、端子７００から供給された第１のフーリエ係数から近端雑音の値を推定し、推定結果をリミッタ７７２へ出力する。

リミッタ７７２は、スペクトル推定部７７１から受け取った信号の上限値及び下限値を、雑音推定部７７８から受け取った近端雑音の推定値により制限する。リミッタ７７２の出力信号は、端子７９９を介して図９に示した逆フーリエ変換器６４へ出力される。

次に図１２に示したスペクトル推定部７７１について図１３を用いて説明する。

図１３は図１２に示したスペクトル推定部の一構成例を示すブロック図である。

図１３に示すように、スペクトル推定部７７１は、推定部７９１、推定部７９２、減算器７０６及び乗算器７０７を備えた構成である。

図１２に示した端子７００から入力された第1のフーリエ係数は減算器７０６及び推定部７９２へ供給される。また、図１２に示した端子７０３から入力された第２のフーリエ係数は、乗算器７０７及び推定部７９２へ供給される。

推定部７９２は、端子１６７を介して入力された音声検出結果、第１のフーリエ係数及び端子７０３を介して入力された第２のフーリエ係数から、エコーの洩れこみ推定値を算出し、算出した洩れこみ推定値を選択部７９１へ出力する。

エコーの洩れこみ推定値の算出方法としては、例えば第３従来例に記載された方法を用いればよい。すなわち、洩れこみ推定値には、マイクロホンの出力信号から近端音声が検出されない期間における第２の信号の振幅または電力に相当する値に対する第１の信号の振幅または電力に相当する値の比、またはこの比の平滑値を用いることができる。

また、マイクロホンの出力信号から近端音声が検出されない期間における第２の信号の振幅または電力に相当する値の平滑値に対する第１の信号の振幅または電力に相当する値の平滑値の比を、さらに平滑した値を用いることもできる。

第１の信号及び第２の信号の振幅または電力に相当する値の平滑処理の時定数は、第１の信号及び第２の信号が減少するときに比べて増加するときの方が小さくなるように制御してもよい。

また、上記比の平滑処理の時定数は、近端音声が検出されているときは長い値または無限大とし、それ以外は短くするように制御するとよい。あるいは近端音声が検出されていないときに比べて検出されているときの値を非常に大きな値とし、かつ近端音声が検出されていないとき、または上記比が減少するときに比べて増加するときの値が小さくなるように制御してもよい。

選択部７９１は、端子６７を介して入力された洩れこみ係数及び推定部７９２で算出された値のいずれか一方を選択し、エコーの洩れこみ推定値として乗算器７０７へ出力する。

選択部７９１は、上記２つの入力のいずれか一方を常に選択してもよく、適宜切り替えて出力してもよい。選択部７９１による洩れこみ推定値の選択方法としては、例えば近端音声や近端雑音の有無により、それらが所定のしきい値以上のときは推定部７９２で算出された値を選択し、それ以外のときは端子６７から入力された洩れこみ係数を選択する方法がある。

乗算器７０７は、選択部７９１から出力された洩れこみ推定値を、端子７０３を介して入力された第２のフーリエ係数の振幅に乗じ、その演算結果をエコーの推定値として減算器７０６へ出力する。

減算器７０６は、乗算器７０７から出力されたエコーの推定値を、端子７００を介して入力された第１のフーリエ係数から減じ、その演算結果をエコー抑圧後の信号のフーリエ係数の推定値として端子７９８から出力する。端子７９８から出力されたフーリエ係数の推定値は、図１０に示したリミッタ７７２へ出力される。

次に図１２に示した雑音推定部７７８について図１４を用いて説明する。

図１４は図１２に示した雑音推定部の一構成例を示すブロック図である。

図１４に示すように、雑音推定部７７８は、減算器８０１、乗算器８０２、加算器８０３、遅延器８０４、リミッタ８０７及び平滑化係数決定部８１０を備えた構成である。

図１４に示すように、雑音推定部７７８には、フーリエ変換器６０から出力された第１のフーリエ係数が端子８００を介して入力される。

減算器８１０は、第１のフーリエ係数から遅延器８０４の出力信号（雑音推定部７７８の出力信号）を減じ、その演算結果を平滑化係数決定部８１０及び乗算器８０２へ出力する。乗算器８０２は、減算器８０１の出力信号と平滑化係数決定部８１０の出力信号とを乗じ、その演算結果を加算器８０３へ出力する。加算器８０３は、乗算器８０２の出力信号と遅延器８０４の出力信号とを加算し、その演算結果をリミッタ８０７へ出力する。リミッタ８０７は、加算器８０３の出力信号を、予め設定した所定の範囲を越えないように上限値及び下限値をそれぞれ制限し、その制限後の信号を出力端子８９９及び遅延器８０４へ出力する。遅延器８０４は、リミッタ８０７の出力信号を１サンプル時間だけ遅延させ、遅延後の出力信号を減算器８０１及び加算器８０３へ出力する。

図１４に示す雑音推定部７７８は、いわゆるリーク積分器、または一次ＩＩＲ型低域フィルタと呼ばれる構成である。但し、図１４に示す雑音推定部７７８では、その時定数を決定する係数が定数ではなく、平滑化係数決定部８１０から変数として供給される。なお、平滑化係数と平滑化の時定数とは反比例の関係になる。平滑化係数決定部８１０は、減算器８０１の出力信号が正である場合、すなわち減算器８０１の出力信号が増加するときは比較的小さな係数、例えば０．０１を出力し、減算器８０１の出力値が負である場合、すなわち減算器８０１の出力信号が減少するときは比較的大きな係数、例えば０．５を出力する。

このように平滑化係数を制御すると、雑音推定部７７８の出力信号が増大する速度、すなわち立ち上がり速度が遅くなり、雑音推定部７７８の出力信号が減少する速度、すなわち立ち下がり速度が速くなる。そのため、図１２に示した雑音推定部７７８に入力される信号のうち、信号レベルが低い定常的に存在する信号成分の振幅値が出力される。定常的に存在する成分とは、すなわち近端雑音であり、雑音推定部７７８の出力信号は近端雑音の推定値（振幅値）と考えることができる。

図１２に示したリミッタ７７２は、例えばスペクトル推定部７７１から出力されたエコーの抑圧後の信号のフーリエ係数の推定値と、雑音推定部７７８から出力された近端雑音のフーリエ係数の推定値とを比較し、その大きい値を出力する構成である。リミッタ７７２の他の構成例については後述する。

ここで、図１２に示したフーリエ係数減算器６６ｍの動作について数式を用いて説明する。

まず、推定部７９２で算出された値を洩れこみ推定値として用いる場合の動作を説明する。

近端信号のフーリエ係数をＳとし、それに含まれる近端音声の信号成分をＡ、エコー成分をＥ、雑音成分をＮとすると、
Ｓ＝Ａ＋Ｅ＋Ｎ …（１）
の関係がある。

また、遠端信号のフーリエ係数をＲとすると、Ｒとエコー成分Ｅの位相は時間軸があっているために、ほぼ同じと考えられる。

近端音声の信号成分Ａが無い場合、すなわち近端音声が無いとき、近端信号ＳはＥ＋Ｎであり、全て除去すべき信号である。この信号Ｅ＋Ｎを遠端信号のフーリエ係数Ｒから推定し、近端音声がある場合に近端信号からＥ＋Ｎを減算することを考える。音声検出結果を用いて近端音声がないときのＳ／Ｒを平滑した結果Ｐ１は、
Ｐ１＝Ａｖ[Ｓ／Ｒ]＝Ａｖ[（Ｅ＋Ｎ）／Ｒ] …（２）
となる。ここでＡｖ[・]は平滑化を表している。

このＰ１は、遠端信号Ｒが近端信号にエコーとして洩れこむ割合の近似値を示しており、エコー経路におけるエコーのゲインに相当する。

したがって、このＰ１にＲを乗じた値Ｐ２（乗算器７０７の出力信号に相当）は、エコー成分及び雑音成分の推定値になる。

Ｐ２＝Ｐ１×Ｒ
＝Ｒ×Ａｖ[（Ｅ＋Ｎ）／Ｒ]
＝Ｅｘ[Ｅ＋Ｎ] …（３）
ここでＥｘ[・]は、推定値を表している。

このＰ２をＳから引いた値Ｐ３（減算器７０６の出力信号に相当）は、
Ｐ３＝Ｓ−Ｐ２
＝Ｓ−（Ｒ×Ａｖ[（Ｅ＋Ｎ）／Ｒ]）
＝（Ａ＋Ｅ＋Ｎ）−Ｅｘ[Ｅ＋Ｎ]
＝Ｅｘ[Ａ] …（４）
となる。すなわち、減算器７０６の出力信号Ｐ３は、エコー成分Ｅ及び雑音成分Ｎが除去された、近端音声のフーリエ係数成分Ａとなる。

次に、係数発生部２００で生成した洩れこみ係数をエコーの洩れこみ推定値として用いる場合のフーリエ係数減算器６６ｍの動作を説明する。

上述したように、近端信号のフーリエ係数をＳとし、それに含まれる近端音声の信号成分をＡ、エコー成分をＥ、雑音成分をＮとすると、それらの値には上記式（１）が成り立つ。

また、遠端信号のフーリエ係数をＲとし、洩れこみ係数の値をＰ１とする。洩れこみ係数Ｐ１は、遠端信号Ｒが近端信号にエコーとして洩れこむ割合の近似値であり、エコー経路におけるエコーのゲインに相当する。

したがって、このＰ１にＲを乗じた値Ｐ２（乗算器７０７の出力信号に相当）は、エコー成分の推定値になる。

Ｐ２＝Ｐ１×Ｒ
＝Ｅｘ[Ｅ] …（３’）
このとき、Ｐ２をＳから減じた値Ｐ３（減算器７０６の出力信号に相当）は、
Ｐ３＝Ｓ−Ｐ２
＝Ｓ−Ｐ１×Ｒ
＝（Ａ＋Ｅ＋Ｎ）−Ｅｘ[Ｅ]
＝Ｅｘ[Ａ＋Ｎ] …（４’）
となる。すなわち、減算器７０６の出力信号Ｐ３は、エコー成分Ｅが除去された、近端音声のフーリエ係数成分Ａと雑音成分Ｎの和の推定値となる。

以上説明したように、理想的な状況下では、推定部７９２で算出された洩れこみ推定値を用いることでエコー成分Ｅ及び雑音成分Ｎを除去することが可能であり、係数発生部２００で生成した洩れこみ係数を用いることでエコー成分Ｅを除去できる。

しかしながら、実際には音声検出結果の誤り等が原因で、推定部７９２で算出した洩れこみ推定値が正しくない場合がある。また、係数発生部２００で生成する洩れこみ係数も使用条件の選択ミス等が原因で誤った値となることがある。その場合、エコーが十分に抑圧されずに近端信号（近端音声＋近端雑音）に大きな歪が発生し、近端信号が遠端信号によって変調される現象が起きる。特に、推定部７９２で算出する洩れこみ推定値を用いると、雑音成分Ｎも抑圧しようとするため、この近端信号が遠端信号によって変調される現象がより顕著に現れる。このような現象は、リミッタ７７２を用いることで以下に記載するように軽減できる。

例えば、図１２に示したリミッタ７７２が無い場合、上述したＰ１×Ｒがエコー成分Ｅを十分に近似していないとき、Ａ＋Ｎに歪が発生する。この歪が雑音成分Ｎの変調音として聞こえるために不快な音となる。

このような状況では、上記式（４’）の３行目の式と等価なＰ３＝Ａ＋Ｎ＋（Ｅ−Ｅｘ［Ｅ］）において、近端音声Ａが小さな値であり、（Ｅ−Ｅｘ［Ｅ］）が雑音成分Ｎに匹敵する値である場合、Ｐ３の値が雑音成分Ｎの値に比べて非常に小さくなることがあり、雑音成分Ｎが変調されているように知覚される。

一方、リミッタ７７２がある場合、リミッタ７７２の出力値Ｐ４は、
Ｐ４＝Ｍａｘ（Ａ＋Ｎ＋Ｅ−Ｅｘ［Ｅ］，Ｅｘ［Ｎ］）≧Ｅｘ［Ｎ］ …（５）
で表すことができる。ここで、Ｍａｘ（ａ，ｂ）は、ａとｂのうち、大きい方を選択する操作を表している。

式（５）で示すように、リミッタ７７２の出力値Ｐ４は常にＥｘ［Ｎ］よりも大きくなる。したがって、リミッタ７７２の出力値Ｐ４は雑音成分Ｎよりも小さな値となることがないため、雑音成分Ｎの変調音が低減する。

第１実施例のエコー抑圧装置は、線形エコーキャンセラ３と、スペクトルサブトラクション部６による周波数領域の非線形演算とを備え、互いの不得手な処理を補うことで十分なエコーの除去能力を得ている。

すなわち、エコー経路に歪がある場合や線形エコーキャンセラ３でエコー経路推定を誤った場合等、線形エコーキャンセラ３だけではエコーを十分に抑圧できない場合でもスペクトルサブトラクション部６によってエコーを抑圧できる。

また、線形エコーキャンセラ３の出力信号を用いてマイクロホンの出力信号を補正することで、スペクトルサブトラクション部６による周波数領域の非線形演算だけでは対応できない時間的なずれを考慮することなく、振幅値だけを用いた簡単な推定処理により歪の原因となる高調波成分を抑圧できる。

また、近端雑音の推定値Ｅｘ［Ｎ］をリミッタ８０７により制限することで近端雑音の変調音を低減できる。

さらに、スペクトルサブトラクション部６で用いる洩れこみ係数Ｐ１を使用状況に応じて予め設定した定数を用いることで、例えば近端騒音が大きい環境等において使用状況を変更した場合でも、エコーを十分に抑圧して、歪の少ない近端音声が得られる。
［第２実施例］
図１５は本発明のエコー抑圧装置の第２実施例の構成を示すブロック図である。

第２実施例のエコー抑圧装置は、スペクトルサブトラクション部６に減算器４の出力信号ではなくマイクロホン１の出力信号を入力する点で第１実施例のエコー抑圧装置と異なっている。

第１実施例のエコー抑圧装置では線形エコーキャンセラ３によってエコーの主要成分を除去していたが、第２実施例のエコー抑圧装置ではスペクトルサブトラクション部６によってエコーの主要成分を除去する。その他の構成及び動作は第１実施例と同様であり、第１実施例と同様に歪に起因するエコーの除去効果についても同様に得られる。

したがって、第２実施例のエコー抑圧装置も、第１実施例と同様に音響伝達系に歪がある場合や線形エコーキャンセラ３でエコー経路推定を誤ったときのように線形エコーキャンセラ３だけではエコーを十分に抑圧できない場合でも、スペクトルサブトラクション部６によってエコーを十分に抑圧できる。また、スペクトルサブトラクション部６で用いる洩れこみ推定値Ｐ１として、使用状況に応じて予め設定した定数を用いることで、近端騒音が大きい環境において使用状況を変更した場合でも、エコーを十分に抑圧して、歪の少ない近端音声を得ることができる。さらに、近端雑音の変調音も低減できる。

なお、スペクトルサブトラクション部６は、第１実施例及び第２実施例で示した構成以外に、例えば非特許文献２（Xiaojian Lu、Benoit Champagneによる論文“Acoustical EchoCancellation Over A Non-Linear Channel”, International Workshop on Acoustic Echo and Noise Control 2001）に記載されたスペクトラルサブトラクション（Spectral Subtraction）、あるいは非特許文献３（A．Alvarez等による“A Speech Enhancement System Based On Negative Beamforming And Spectral Subtraction”, International Workshop on Acoustic Echo and Noise Control 2001）に記載されたスペクトラルサブトラクション（Spectral Subtraction）を用いることも可能である。
［第３実施例］
図１６は本発明のエコー抑圧装置の第３実施例の構成を示すブロック図である。

第３実施例のエコー抑圧装置は、図８に示したスペクトルサブトラクション部６に代わってスペクトルサプレッション部７を用いる点で第１実施例のエコー抑圧装置と異なっている。その他の構成及び動作は第1実施例と同様であるため、その詳細な説明は省略する。

以下、図１６に示したスペクトルサプレッション部７について図面を用いて説明する。

図１７は図１６に示したスペクトルサプレッション部の一構成例を示すブロック図である。

図１７に示すように、スペクトルサプレッション部７は、フーリエ変換器７０、フーリエ変換器７１、フーリエ係数乗算器７６ｍ（ｍ＝１〜Ｍ）及び逆フィーリエ変換器７４を備えた構成である。

フーリエ変換器７０は、端子７２を介して入力される、図１６に示した減算器４の出力信号に対してＭ点フーリエ変換処理を実施し、処理結果（振幅と位相）を第１のフーリエ係数として各周波数領域に対応するフーリエ係数乗算器７６ｍ（ｍ＝１〜Ｍ）へ出力する。

フーリエ変換器７１は、端子７３を介して入力される、図１６に示した線形エコーキャンセラ３の出力信号（エコーレプリカ信号）に対してＭ点フーリエ変換処理を実施し、処理結果（振幅と位相）を第２のフーリエ係数として各周波数領域に対応するフーリエ係数乗算器７６ｍへ出力する。

フーリエ係数乗算器７６ｍは、フーリエ変換器７０から出力された第１のフーリエ係数と、フーリエ変換器７１から出力された第２のフーリエ係数と、端子６７を介して入力される、図１６に示した係数発生部２００から出力された洩れこみ係数と、端子１６７を介して入力される、図１６に示した音声検出部５から出力された音声検出結果を受け取り、それらの振幅成分を用いた乗算処理を実施することでフーリエ係数を算出し、算出結果（振幅と位相）を逆フーリエ変換器７４へ出力する。

逆フーリエ変換器７４は、フーリエ係数乗算器７６ｍ（ｍ＝１〜Ｍ）から出力されたフーリエ係数群の逆フーリエ変換処理を実施し、処理結果の実数部を端子７５から出力する。図１７に示す構成では、フーリエ係数乗算器７６ｍ（ｍ＝１〜Ｍ）によってエコー成分が抑圧された近端信号が得られる。

次に、フーリエ係数乗算器７６ｍ（ｍ＝１〜Ｍ）の構成及び動作について図１６を用いて説明する。

図１８は図１７に示したフーリエ係数乗算器の第１構成例を示すブロック図である。

図１８に示すように、第１構成例のフーリエ係数乗算器７６ｍは、スペクトル推定部７７１、雑音推定部７７８、リミッタ７７２、利得変換部７７３及び乗算器７７４を備えた構成である。

図１７に示したフーリエ変換器７０から出力された周波数領域毎の第１のフーリエ係数は端子７００を介してスペクトル推定部７７１及び雑音推定部７７８へ供給される。

図１７に示したフーリエ変換器７１から出力された第２のフーリエ係数は端子７０３を介してスペクトル推定部７７１へ供給される。また、係数発生部２０で生成された洩れこみ係数は端子６７を介してスペクトル推定部７７１へ供給され、音声検出部５から出力された音声検出結果は端子１６７を介してスペクトル推定部７７１へ供給される。

スペクトル推定部７７１は、端子７００から供給された第１のフーリエ係数からそのエコー成分を減じ、演算結果をリミッタ７７２へ出力する。雑音推定部７７８は、端子７００から供給された第１のフーリエ係数から、近端雑音の値を推定し、推定結果をリミッタ７７２へ出力する。

リミッタ７７２は、スペクトル推定部７７１から受け取った信号の下限値を雑音推定部７７８から受け取った近端雑音の推定値により制限する。リミッタ７７２の出力信号は利得変換部７７３へ出力される。

リミッタ７７２の出力信号（エコー抑圧後の近端音声及び近端雑音の推定値）の誤差は、一般にミュージカルノイズと呼ばれる。利得変換部７７３は、リミッタの出力信号に対して平滑処理等を行うことでミュージカルノイズを低減するために設けられている。

乗算器７７４は、利得変換部７７３の出力信号と端子７００を介して入力された第１のフーリエ係数とを乗じ、その演算結果を端子７９８を介して出力する。

ここで、図１８に示した利得変換部７７３について図面を用いて説明する。

図１９は図１８に示した利得変換部の一構成例を示すブロック図である。

図１９に示すように、利得変換部７７３は、振幅抽出部７７３３、振幅抽出部７７３４、除算器７７３５及び平滑部７７３６を備えた構成である。

図１８に示したリミッタ７７２の出力信号は、端子７７３１を介して振幅抽出部７７３３へ入力される。また、図１８に示した端子７００から入力された第１のフーリエ係数は、端子７７３２を介して振幅抽出部７７３４へ入力される。

振幅抽出部７７３３及び振幅抽出部７７３４は、入力信号の振幅値を検出し、その検出結果を除算器７３５へ出力する。除算器７７３５は、振幅抽出部７７３３の出力信号を振幅抽出部７７３４の出力信号で除算し、その演算結果を平滑部７７３６へ出力する。平滑部７７３６は、除算器７７３５の出力信号を平滑し、平滑後の信号を端子７７３９を介して図１８に示した乗算器７７４へ出力する。平滑部７７３６には、例えば平滑化係数決定部８１０で生成する平滑化係数が異なることを除けば、図１４に示した雑音推定部７７８と同様の構成を用いることができる。

平滑部７７３６として図１４に示した構成を採用すると、平滑化係数の値によって平滑部７７３６の出力信号が増大する速度、すなわち立ち上がり速度を遅くし、平滑部７７３６の出力信号が減少する速度、すなわち立ち下がり速度が速くできる。

一般に、音声や音楽の振幅変化、すなわち包絡線特性は、立ち上がり時が速く、立ち下がり時が遅い場合が多い。図１４に示した構成を採用すると、このような包絡線特性を備えることが可能であり、近端信号に含まれる近端音声及び近端騒音の割合の推定精度を改善できる。

ここで、平滑部７７３６の出力値について式を用いて説明する。

上述したフーリエ係数減算部６６ｍの説明で用いた式（４’）の第２行目の全体をＳで除算することで平滑した値Ｐ５は下記式（６）のように表すことができる。この式（６）の第１行目の右辺は図１９に示す平滑部７７３６の出力値に相当する。

Ｐ５＝Ａｖ[Ｍａｘ（（Ｓ−Ｐ１×Ｒ）／Ａｖ[Ｓ]，Ｅｘ[Ｎ]／Ａｖ[Ｓ]）]
…式（６）
ここで、Ｍａｘ（ａ，ｂ）は、ａとｂのうち、大きい方を選択する操作を表している。

図１８に示したリミッタ７７２が動作していない場合、式（６）の選択操作では左項が選択されるため、Ｐ５は、
Ｐ５＝Ａｖ[（Ｓ−Ｐ１×Ｒ）／Ａｖ[Ｓ]）]
＝Ａｖ[（Ａ＋Ｅ＋Ｎ）−Ｅｘ[Ｅ] ）／Ａｖ[Ｓ]]
＝Ａｖ[Ｅｘ[Ａ＋Ｎ]／Ａｖ[Ｓ]]
＝Ｅｘ[（Ａ＋Ｎ）／Ｓ] …（７）
となる。式（７）より、平滑部７７３６の出力値Ｐ５は、近端信号に含まれる近端音声及び近端雑音の割合の推定値であることが分かる。

したがって、図１７に示したスペクトルサプレッション部７からは、エコーが抑圧された近端音声及び近端雑音が得られることが分かる。

一方、図１８に示したリミッタ７７２が動作している場合、式（６）の選択操作では右項が選択されるため、Ｐ５は、
Ｐ５＝Ａｖ[Ｅｘ［Ｎ］／Ａｖ[Ｓ]）]
＝Ｅｘ[Ｎ／Ｓ] …（８）
となる。

式（８）により、平滑部７７３６の出力値Ｐ５は、近端信号に含まれる近端雑音の割合の推定値であることが分かる。

したがって、この場合も図１７に示したスペクトルサプレッション部７からは、エコーが抑圧された近端音声及び近端雑音が得られることが分かる。

図２０は図１８に示したスペクトル推定部の第２構成例を示すブロック図である。

図２０に示すスペクトル推定部７７１は、推定部７９２、係数発生部７９１、振幅抽出部７９３、振幅抽出部７９４、減算器７０６及び乗算器７０７を備えた構成である。

図２０に示すスペクトル推定部７７１は、端子７００から減算器７０６の経路に振幅抽出部７９３が挿入され、端子７０３から乗算器７０７の経路に振幅抽出部７９４が挿入された点で図１３に示したスペクトル推定部と異なっている。

振幅抽出部７９３は、入力信号の振幅を検出し、該検出値を出力する。振幅抽出部７９３には、図２１及び図２２に示す構成を用いることができる。

図２１は図２０に示した振幅抽出部の一構成例を示すブロック図であり、図２２は図２０に示した振幅抽出部の他の構成例を示すブロック図である。

図２１に示す振幅抽出部７９３は、入力信号の絶対値を計算する絶対値計算部７３１０と、絶対値計算部７３１０の出力信号を平滑して出力する平滑部７４００とを備えた構成である。一方、図２２に示す振幅抽出部７９３は、入力信号の二乗を計算する二乗計算部７３２０と、二乗計算部７３２０の出力信号を平滑する平滑部７４００と、平滑部７４００の出力信号の平方根を算出し、その算出結果を出力する平方根計算部７４２０とを備えた構成である。振幅抽出部７９４も振幅抽出部７９３と同様の構成である。

このような構成では、平滑部７７３６の出力値Ｐ６が以下のようになる。

Ｐ６＝Ａｖ[Ｍａｘ（（Ａｖ［Ｓ］−Ｐ１×Ａｖ［Ｒ］）／Ａｖ[Ｓ]，Ｅｘ[Ｎ]／Ａｖ[Ｓ]）] …（９）
したがって、図１８に示したリミッタ７７２が動作していない場合のＰ６は、
Ｐ６＝Ａｖ[（Ａｖ［Ｓ］−Ｐ１×Ａｖ［Ｒ］）／Ａｖ[Ｓ]）]
＝Ａｖ[（Ａｖ[（Ａ＋Ｅ＋Ｎ）−Ｅｘ[Ｅ] ）／Ａｖ[Ｓ]]
＝Ａｖ[Ｅｘ[Ａ＋Ｎ]／Ａｖ[Ｓ]]
＝Ｅｘ[（Ａ＋Ｎ）／Ｓ] …（１０）
となる。式（１０）より、平滑部７７３６の出力値Ｐ６は、式（７）で示したＰ５と同様に、近端信号に含まれる近端音声及び近端雑音の割合の推定値であることが分かる。したがって、スペクトル推定部７７１として図２０に示した構成を用いても、図１７に示したスペクトルサプレッション部７からは、エコーが抑圧された近端音声及び近端雑音が得られることが分かる。
［第４実施例］
図２３は本発明のエコー抑圧装置の第４実施例の構成を示すブロック図である。

第４実施例のエコー抑圧装置は、スペクトルサプレッション部７に減算器４の出力信号ではなくマイクロホン１の出力信号を入力する点で図１６に示した第３実施例のエコー抑圧装置と異なっている。

そのため、第３実施例のエコー抑圧装置では線形エコーキャンセラ３によってエコーの主要成分を除去しているが、第４実施例のエコー抑圧装置ではスペクトルサプレッション部７によってエコーの主要成分を除去している。

その他の構成及び動作は第３実施例と同様であり、第３実施例と同様の効果を得ることができる。

以上、本発明の実施例について説明したが、本発明は上述した第１実施例〜第４実施例に限らず、以下に示すような各種の変更も可能である。

第１従来例〜第４従来例では、図１２や図１８に示したリミッタ７７２として、２つの入力値のうちのいずれか大きい方を選択する簡単な構成例を示した。しかしながら、リミッタ７７２は、その信号出力が近端雑音の推定値よりも小さくならなければどのような構成であってもよい。例えば、上記Ｐ３が近端雑音の推定値Ｅｘ［Ｎ］よりも大きな値の時、近端雑音の推定値へ近づくにつれて大きな値となる関数を用いて選択する構成であってもよい。

また、第１従来例〜第４従来例では、スペクトルサブトラクション部６及びスペクトルサプレッション部７において、所定のサンプル周期毎にフーリエ変換を行う例で説明したが、所定のサンプル周期毎に限らず、一定間隔のフレーム単位で処理することも可能である。

また、フレームをオーバーラップさせて処理することも可能である。その際、オーバーラップセーブやオーバーラップアドなどの手法を用いて、演算量を削減することも可能である。オーバーラップセーブやオーバーラップアドについては、例えば非特許文献４（John J. Shynkによる論文“Frequency-Domain and Multirate Adaptive Filtering”, IEEE Signal Processing Magazine, 1992年1月、pp.14-37）に記載されている。

また、第１従来例〜第４従来例では、スペクトルサブトラクション部６及びスペクトルサプレッション部７においてフーリエ変換を行う例で説明したが、フーリエ変換以外に、コサイン変換やフィルタバンク等の線形変換を用いることも可能であり、サブバンド領域に変換して後、処理を行うことも可能である。その場合、フーリエ係数用の減算器や乗算器は、それらの線形変換に対応して変更すればよい。例えばコサイン変換を用いる場合は、コサイン係数用の減算器、コサイン係数用の乗算器を用いればよい。それら各種の演算器の動作は上述した第１従来例〜第４従来例で示した線形変換にフーリエ変換を用いる場合と同様である。
［第５実施例］
第１実施例〜第４実施例では線形エコーキャンセラ３を用いる例を示したが、エコーの抑圧には変換領域エコーキャンセラを用いることも可能である。その場合、変換領域エコーキャンセラの変換領域を上述したスペクトルサブトラクション部６やスペクトルサプレッション部７と同一の変換領域とすれば、エコー抑圧装置全体の演算量の削減及び演算に伴う遅延時間を短縮できる。

なお、変換領域エコーキャンセラとは、線形変換によって展開された変換領域においてエコーの抑圧処理を行い、逆線形変換によって元の領域に再合成するエコーキャンセラを指す。

以下、変換領域エコーキャンセラとして、例えば上記非特許文献４に記載されたフーリエ変換領域エコーキャンセラを用いる例で説明する。

図２４は本発明のエコー抑圧装置の第５実施例の構成を示すブロック図である。

第５実施例のエコー抑圧装置は、エコーキャンセラ１３及びスペクトルサブトラクション部１６がフーリエ変換領域において処理を行う構成である。エコーキャンセラ１３は変換領域信号群１及び変換領域信号群２をスペクトルサブトラクション部１６に出力する。

図２５は図２４に示したエコーキャンセラの一構成例を示すブロック図である。

図２５に示すエコーキャンセラ１３は、フーリエ変換器３５、適応フィルタ群３８、逆フーリエ変換器３６、フーリエ変換器３７及び乗算器３９ｍ（ｍ＝１〜Ｍ）を備えた構成である。

端子３１より入力された遠端信号は、フーリエ変換器３５によってフーリエ変換領域に展開され、周波数領域毎に適応フィルタ群３８へ出力される。また、図２４に示した減算器４から端子３３を経由して入力された減算結果は、フーリエ変換器３７によりフーリエ変換領域に展開され、周波数領域毎にそれぞれ乗算器３９ｍ（ｍ＝１〜Ｍ）へ出力される。

乗算器３９ｍ（ｍ＝１〜Ｍ）は、フーリエ変換器３７から受信した信号に端子３４を介して受信した音声検出結果を乗じ、その演算結果を適応フィルタ群３８へ出力する。

適応フィルタ群３８は、Ｍ個の適応フィルタを備え、フーリエ変換器３５から出力された信号群２と乗算器３９ｍ（ｍ＝１〜Ｍ）から出力された信号群１とを受信し、対応する信号を用いて適応フィルタによる処理を行う。適応フィルタの処理によって得られたフィルタ出力は逆フーリエ変換器３６へ出力される。

逆フーリエ変換器３６は、適応フィルタ群３８で処理されたフィルタ出力の逆フーリエ変換処理を実施し、その処理結果を端子３２から出力する。端子３２から出力される信号がエコーキャンセラとしての出力信号となる。

また、エコーキャンセラ１３は、スペクトルサブトラクション部１６で用いる、フーリエ変換器３７の出力信号を変換領域信号群１としてベクトル型出力端子４１から出力し、適応フィルタ群３８の出力を変換領域信号群２としてベクトル型出力端子４２から出力する。

変換領域信号群１は、図２４に示した減算器４の出力信号をフーリエ変換した信号であり、変換領域信号群２は、図２４に示したエコーキャンセラ１３から減算器４へ出力される信号をフーリエ変換した信号と解釈できる。

次に、図２４に示したスペクトルサブトラクション部１６の構成及び動作について図面を用いて説明する。

図２６は図２４に示したスペクトルサブトラクション部の一構成例を示すブロック図である。

図２６に示すスペクトルサブトラクション部１６は、図１１に示したフーリエ変換器６０及びフーリエ変換器６１が削除され、変換領域信号群１及び変換領域信号群２が入力される点で第１実施例のエコー抑圧装置で用いたスペクトルサブトラクション部６と異なっている。

上述したように、変換領域信号群１は、図２４に示した減算器４の出力信号をフーリエ変換した信号であり、変換領域信号群２は、図２４に示したエコーキャンセラ１３から減算器４へ出力される信号をフーリエ変換した信号と解釈できる。これらの信号群は、図１１に示したスペクトルサブトラクション部６が備えるフーリエ係数減算器６６ｍ（ｍ＝１〜Ｍ）に入力される２つの信号と全く同一である。そのため、図２６に示すスペクトルサブトラクション部１６は、図１１に示したスペクトルサブトラクション部６と全く同一の信号を出力する。したがって、図２４に示した第５実施例のエコー抑圧装置も本発明の第１実施例のエコー抑圧装置と同様の効果を備えている。

第５実施例のエコー抑圧装置では、スペクトルサブトラクション部１６へエコーキャンセラ１３から出力された変換領域信号群１及び変換領域信号群２を供給することで、スペクトルサブトラクション部１６のフーリエ変換処理を低減できる。

このような構成は、第２実施例〜第４実施例で示したエコー抑圧装置にも適用可能である。また、フーリエ変換領域以外にコサイン変換領域等を用いることも可能である。
［第６実施例］
第１実施例〜第４実施例では線形エコーキャンセラ３を用いる例を示したが、エコーの抑圧には、例えば非特許文献４に記載されたサブバンド領域エコーキャンセラを用いることも可能である。その場合、スペクトルサブトラクション部６やスペクトルサプレッション部７の処理をサブバンド領域で処理を行えば、サブバンド領域に変換するためのフィルタを省略できる。

図２７は本発明のエコー抑圧装置の第６実施例の構成を示すブロック図である。

第６実施例のエコー抑圧装置は、サブバンド領域においてエコーキャンセラ及びスペクトルサブトラクション部による処理を行う。

図２７に示すように、第６実施例のエコー抑圧装置では、マイクロホン１の出力信号がサブバンド分析フィルタバンク９１によってＮ個の周波数帯域に展開され、遠端信号がサブバンド分析フィルタバンク９２によってＮ個の周波数帯域に展開される。

エコーキャンセラ部９３ｎ、減算器９４ｎ、音声検出部９５ｎ及びスペクトルサブトラクション部９６ｎ（ここでｎ＝１〜Ｎ）は、サブバンド分析フィルタバンク９１及びサブバンド分析フィルタバンク９２によって展開された周波数帯域に対応して備えている。

スペクトルサブトラクション部９６ｎの出力信号は、サブバンド合成フィルタバンク９９によって元の信号領域へ逆変換され、近端信号として出力される。

各周波数帯域における、減算器９４ｎ、音声検出部９５ｎ及びスペクトルサブトラクション部９６ｎ（ここでｎ＝１〜Ｎ）の処理は、エコーキャンセラのタップ数や、スペクトルサブトラクション部のフーリエ変換器の規模が異なる点を除けば、図８に示した第１実施例のエコー抑圧装置と同様に動作する。したがって、これらの装置の構成や動作についての説明は省略する。

第６実施例のエコー抑圧装置では、全ての処理がサブバンド領域に展開されて行われるため、線形エコーキャンセラ３における合成フィルタバンク、及びスペクトルサブトラクション部におけるサブバンド分析フィルタバンクを省略できる。そのため、サブバンド分析フィルタバンク及びサブバンド合成フィルタバンクに相当する演算量を削減でき、さらにその演算に相当する遅延時間を短縮できる。

図２７に示した第６実施例の構成は、第２実施例〜第４実施例で示したエコー抑圧装置にも適用可能である。また、フーリエ変換領域以外にコサイン変換領域等を用いることも可能である。
［第７の実施例］
図２８は本発明のエコー抑圧装置の第７実施例の構成を示すブロック図である。

第７実施例のエコー抑圧装置は、エコーキャンセラ及びスペクトルサブトラクションの処理をフーリエ変換領域で行う。

図２８に示すように、第７実施例のエコー抑圧装置では、マイクロホン１の出力信号がフーリエ変換器１９１によってＭ個の周波数帯域に展開され、遠端信号がフーリエ変換器１９２によってＭ個の周波数帯域に展開される。

エコーキャンセラ部１９３ｍ、減算器１９４ｍ、音声検出部１９５ｍ及びフーリエ係数減算器６６ｍ（ｍ＝１〜Ｍ）は、フーリエ変換器１９１及びフーリエ変換器１９２によって展開された周波数帯域に対応して備えている。

周波数帯域毎のフーリエ係数減算器６６ｍの出力信号は、逆フーリエ変換器１９９によって元の信号領域へ逆変換され、近端信号として出力される。

各周波数帯域における、減算器１９４m、音声検出部１９５mの処理は、エコーキャンセラのタップ数が異なる点を除けば、図８に示した第１実施例のエコー抑圧装置と同様に動作する。したがって、これらの装置の構成や動作についての説明は省略する。

第７実施例のエコー抑圧装置は、第６実施例と同様にエコーキャンセラ及びスペクトルサブトラクション部の処理を変換領域において行っているが、フーリエ変換領域で処理を行うために周波数帯域の数Ｍが第６実施例よりも多くなり、スペクトルサブトラクション部に代わってフーリエ係数減算器６６ｍを用いる点で第６実施例のエコー抑圧装置と異なっている。

第７実施例のエコー抑圧装置では、フーリエ変換領域に展開して処理するため、スペクトルサブトラクションの処理のためにフーリエ変換を行う必要がない。そのため、第７実施例では、スペクトルサブトラクション部が備えるフーリエ変換器及び逆フーリエ変換器が不要となり、フーリエ係数減算器６６ｍのみでスペクトルサブトラクションの処理に必要な動作を行っている。

第７実施例のエコー抑圧装置では、省略したフーリエ変換器及び逆フーリエ変換器に相当する演算量を削減できる。

図２８に示した第７実施例の構成は、第２実施例〜第４実施例で示したエコー抑圧装置にも適用可能である。また、フーリエ変換領域以外にコサイン変換領域等を用いることも可能である。

なお、第７実施例では線形エコーキャンセラを用いる例を示したが、エコーの抑圧には非線形エコーキャンセラを用いることも可能である。その場合もスペクトルサブトラクション部やスペクトルサプレッション部の処理をフーリエ変換領域で行えば、上記と同様の効果が得られる。

以上、本発明のエコー抑圧装置をハンズフリー電話器を例にして説明したが、本発明は、スピーカから音楽が拡声されている状態で収音する場合や、ハンドセットが備えるレシーバからのエコーが問題となるような場合等、スピーカによる拡声とマイクロホンによる収音とが同時に行われる各種の装置に適用可能である。

Claims

収音器と拡声器間の音響結合により発生するエコーを抑圧するためのエコー抑圧方法であって、
前記収音器の出力信号または前記収音器の出力信号からエコーキャンセラの出力信号を減じた信号のいずれか一方を第１の信号とし、前記エコーキャンセラの出力信号を第２の信号としたとき、
前記第１の信号へ洩れこむ前記エコーである前記第２の信号の洩れこみ量の推定値を示す洩れこみ推定値を用いて前記第１の信号を補正し、該補正後の信号が推定した近端雑音の推定値よりも小さくならないように制限するエコー抑圧方法。
前記第１の信号を所定の周波数領域毎に分割し、
各周波数領域に対応する前記洩れこみ推定値を用いて前記第１の信号を補正し、該補正後の信号が周波数領域毎に推定した近端雑音の推定値よりも小さくならないように制限する請求項１記載のエコー抑圧方法。
前記洩れこみ推定値と前記第２の信号から前記第１の信号に含まれるエコーの量を推定し、該推定したエコーの量を前記第１の信号から減じ、該減算後の信号が近端雑音の推定値よりも小さくならないように制限する請求項１または２記載のエコー抑圧方法。
前記洩れこみ推定値と前記第２の信号から前記第１の信号に含まれるエコーの量を推定し、該推定したエコーの量を前記第１の信号から減じ、該減算後の信号が近端雑音の推定値よりも小さくならないように制限した信号を第３の信号とし、該第３の信号と前記第１の信号から前記第１の信号に含まれる近端信号の割合を推定し、該推定した割合を前記第１の信号に乗ずる請求項１または２記載のエコー抑圧方法。
入力信号に比べて出力信号が増大するときの平滑処理の時定数が大きく、出力信号に比べて入力信号が減少するときの平滑処理の時定数が小さい平滑化回路に前記第１の信号を通過させることで前記近端雑音を推定する請求項１乃至４のいずれか１項記載のエコー抑圧方法。
前記洩れこみ推定値は、
前記第１の信号へ洩れこむ前記エコーの洩れこみ量の算出に用いる、予め設定された値である洩れこみ係数である請求項１乃至４のいずれか１項記載のエコー抑圧方法。
予め設定された複数の洩れこみ係数のうち、前記第１の信号の補正に用いる洩れこみ係数を所定の使用状況に応じて選択する請求項６記載のエコー抑圧方法。
前記使用状況は、
前記エコーキャンセラの出力信号の電力または振幅、遠端信号の電力または振幅、前記遠端信号の特定の周波数成分の電力または振幅のいずれかである請求項７記載のエコー抑圧方法。
前記使用状況は、
前記拡声器の音量設定値である請求項７記載のエコー抑圧方法。
前記使用状況は、
前記収音器と前記拡声器との相対的な位置関係である請求項７記載のエコー抑圧方法。
前記使用状況は、
前記収音器または前記拡声器の少なくとも一方が複数存在するとき、使用する収音器または拡声器である請求項７記載のエコー抑圧方法。
前記第１の信号と前記第２の信号から前記洩れこみ推定値を算出する請求項１乃至４のいずれか１項記載のエコー抑圧方法。
収音器と拡声器間の音響結合により発生するエコーを抑圧するエコー抑圧装置であって、
前記エコーを模擬したエコーレプリカ信号を生成するエコーキャンセラと、
前記収音器の出力信号または前記収音器の出力信号から前記エコーキャンセラの出力信号を減じた信号のいずれか一方を第１の信号とし、前記エコーキャンセラの出力信号を第２の信号としたとき、近端雑音の値を推定する雑音推定部と、
前記第１の信号へ洩れこむ前記エコーである前記第２の信号の洩れこみ量の推定値を示す洩れこみ推定値を用いて前記第１の信号を補正する補正部と、
前記第１の信号の補正後の信号が前記推定した近端雑音よりも小さくならないように制限するリミッタと、
を有するエコー抑圧装置。
収音器と拡声器間の音響結合により発生するエコーを抑圧するエコー抑圧装置であって、
前記エコーを模擬したエコーレプリカ信号を生成するエコーキャンセラと、
前記収音器の出力信号または前記収音器の出力信号から前記エコーキャンセラの出力信号を減じた信号のいずれか一方を第１の信号とし、前記エコーキャンセラの出力信号を第２の信号としたとき、前記第１の信号を所定の周波数領域毎に分割する周波数分割部と、
前記分割された前記第１の信号の周波数領域毎に近端雑音の値を推定する雑音推定部と、
前記第１の信号の周波数領域毎に、前記第１の信号へ洩れこむ前記エコーである前記第２の信号の洩れこみ量の推定値を示す洩れこみ推定値を用いて前記第１の信号を補正する補正部と、
前記第１の信号の補正後の信号が前記周波数領域毎に推定した近端雑音の推定値よりも小さくならないように制限するリミッタと、
前記リミッタから出力された前記周波数領域毎に補正された前記第１の信号の補正後の信号を合成する周波数合成部と、
を有するエコー抑圧装置。
収音器と拡声器間の音響結合により発生するエコーを抑圧するエコー抑圧装置であって、
前記エコーを模擬したエコーレプリカ信号を生成する変換領域エコーキャンセラと、
前記収音器の出力信号から前記変換領域エコーキャンセラの出力信号を減じた信号を前記変換領域エコーキャンセラ内で所定の周波数領域毎に分割した信号を第１の信号とし、前記変換領域エコーキャンセラ内における逆線形変換前の周波数領域毎の信号を第２の信号とするとき、前記第１の信号の周波数領域毎に近端雑音の値を推定する雑音推定部と、
前記第１の信号の周波数領域毎に、前記第１の信号へ洩れこむ前記エコーである前記第２の信号の洩れこみ量の推定値を示す洩れこみ推定値を用いて前記第１の信号を補正する補正部と、
前記第１の信号の補正後の信号が前記周波数領域毎に推定した近端雑音の推定値よりも小さくならないように制限するリミッタと、
前記リミッタから出力された前記周波数領域毎に補正された前記第１の信号の補正後の信号を合成する周波数合成部と、
を有するエコー抑圧装置。
収音器と拡声器間の音響結合により発生するエコーを抑圧するエコー抑圧装置であって、
前記エコーを模擬したエコーレプリカ信号を生成するエコーキャンセラと、
前記収音器の出力信号と前記拡声器の出力信号を所定の周波数領域毎に展開するサブバンド分析フィルタと、
前記周波数領域に展開された前記収音器の出力信号または前記周波数領域に展開された前記収音器の出力信号から前記エコーキャンセラの出力信号を減じた信号のいずれか一方を第１の信号とし、前記エコーキャンセラの出力信号を第２の信号としたとき、前記第１の信号の周波数領域毎に近端雑音の値を推定する雑音推定部と、
前記第１の信号の周波数領域毎に、前記第１の信号へ洩れこむ前記エコーである前記第２の信号の洩れこみ量の推定値を示す洩れこみ推定値を用いて前記第１の信号を補正する補正部と、
前記第１の信号の補正後の信号が前記周波数領域毎に推定した近端雑音の推定値よりも小さくならないように制限するリミッタと、
前記リミッタから出力された前記周波数領域毎に補正された前記第１の信号の補正後の信号を合成する周波数合成部と、
を有するエコー抑圧装置。
収音器と拡声器間の音響結合により発生するエコーを抑圧するエコー抑圧装置であって、
前記エコーを模擬したエコーレプリカ信号を生成するエコーキャンセラと、
前記収音器の出力信号と前記拡声器の出力信号を所定の周波数領域毎に展開するフーリエ変換器と、
前記周波数領域に展開された前記収音器の出力信号または前記周波数領域に展開された前記収音器の出力信号から前記エコーキャンセラの出力信号を減じた信号のいずれか一方を第１の信号とし、前記エコーキャンセラの出力信号を第２の信号としたとき、前記第１の信号の周波数領域毎に近端雑音の値を推定する雑音推定部と、
前記第１の信号の周波数領域毎に、前記第１の信号へ洩れこむ前記エコーである前記第２の信号の洩れこみ量の推定値を示す洩れこみ推定値を用いて前記第１の信号を補正する補正部と、
前記第１の信号の補正後の信号が前記周波数領域毎に推定した近端雑音の推定値よりも小さくならないように制限するリミッタと、
前記リミッタから出力された前記周波数領域毎に補正された前記第１の信号の補正後の信号を合成する周波数合成部と、
を有するエコー抑圧装置。
前記雑音推定部は、
入力信号に比べて出力信号が増加するときの平滑処理の時定数が大きく、出力信号に比べて入力信号が減少するときの平滑処理の時定数が小さい、前記第１の信号を平滑して出力する平滑化回路である請求項１乃至４のいずれか１項記載のエコー抑圧装置。
前記洩れこみ推定値は、
前記第１の信号へ洩れこむ前記エコーの洩れこみ量の算出に用いる、予め設定された値である洩れこみ係数である請求項１３乃至１７のいずれか１項記載のエコー抑圧装置。
前記補正部は、
予め設定された複数の洩れこみ係数のうち、前記第１の信号の補正に用いる洩れこみ係数を所定の使用状況に応じて選択する請求項１９記載のエコー抑圧装置。
前記使用状況は、
前記エコーキャンセラの出力信号の電力または振幅、遠端信号の電力または振幅、前記遠端信号の特定の周波数成分の電力または振幅のいずれかである請求項２０記載のエコー抑圧装置。
前記使用状況は、
前記拡声器の音量設定値である請求項２０記載のエコー抑圧装置。
前記使用状況は、
前記収音器と前記拡声器との相対的な位置関係である請求項２０記載のエコー抑圧装置。
前記使用状況は、
前記収音器または前記拡声器の少なくとも一方が複数存在するとき、使用する収音器または拡声器である請求項２０記載のエコー抑圧装置。
前記第１の信号と前記第２の信号から前記洩れこみ推定値を算出する請求項１３乃至１７のいずれか１項記載のエコー抑圧装置。