JP7323959B2

JP7323959B2 - 音声信号処理装置と音声信号処理方法

Info

Publication number: JP7323959B2
Application number: JP2022097148A
Authority: JP
Inventors: 一浩鬼塚; 徹相川; 靖仁菊原; 友里実方
Original assignee: Audio Technica KK
Current assignee: Audio Technica KK
Priority date: 2017-06-12
Filing date: 2022-06-16
Publication date: 2023-08-09
Anticipated expiration: 2038-03-15
Also published as: EP3641141A1; CN110741563B; CN110741563A; US20200105289A1; WO2018230062A1; JPWO2018230062A1; JP7122756B2; US11227618B2; JP2022125069A; EP3641141A4

Description

本発明は、音声信号処理装置と、音声信号処理方法と、に関する。

近年、インターネットなどの通信回線を利用した電話会議システムやテレビ会議システムなどの通信会議システムが、物理的に離れた拠点間での会議に使用されている。このような通信会議システムでは、一方の拠点から受信した音声信号（以下「受話信号」という。）に基づく音声が他方の拠点のスピーカから出力されたとき、その出力された音声を他方の拠点のマイクロホンが収音することにより、音響エコーが発生する。

音響エコーは、通常、通信会議システムが備えるエコーキャンセラにより抑制・除去される。一般的なエコーキャンセラは、受話信号と、音響エコーに応じたエコー信号と、に基づいて、エコー信号を除去する除去信号を生成する適応フィルタを備え、除去信号とエコー信号とを加算または減算することにより、エコー信号を除去する。

このようなエコーキャンセラとして、複数のマイクロホンからのエコー信号を抑制・除去する多チャンネル対応のエコーキャンセラが提案されている（例えば、特許文献１参照。）

特開２００２－２５２５７７号公報

特許文献１に開示されているエコーキャンセラは、複数のマイクロホンそれぞれに対応する複数のエコーキャンセル部を備え、各エコーキャンセル部が対応するマイクロホンからの入力信号に含まれるエコー信号を除去することにより、多チャンネルに対応する。すなわち、特許文献１に開示されているエコーキャンセラでは、マイクロホンと同数のエコーキャンセル部が必要となるため、回路構成や信号処理が複雑となる。

本発明は、以上のような従来技術の問題点を解消するためになされたもので、簡易な回路構成で複数のマイクロホンそれぞれからの入力信号に含まれるエコー信号を除去可能な音声信号処理装置と、音声信号処理方法と、を提供することを目的とする。

本発明にかかる音声信号処理装置は、受話信号を出力する出力部と、受話信号のエコー成分と、話者の音声と、を収音して、エコー成分に応じたエコー信号と、話者の音声に応じた音声信号と、を生成する複数のマイクロホンそれぞれから入力される信号を合成して送話信号を生成する入力部と、送話信号に含まれるエコー信号を除去する除去信号をフィルタ係数に基づいて生成する除去信号生成部と、複数のマイクロホンそれぞれに対応する個別フィルタ係数を算出し、個別フィルタ係数を合成してフィルタ係数を算出する制御部と、送話信号と除去信号とに基づいて、エコー除去信号を生成する除去部と、フィルタ係数を記憶する記憶部と、を有してなる音声信号処理装置であって、受話信号は、音声信号処理装置が設置されている拠点と異なる他拠点の話者の音声に応じた信号であり、制御部は、前記送話信号に前記エコー信号が含まれていて、かつ、前記送話信号に前記音声信号が含まれていないとき、フィルタ係数を更新する、ことを特徴とする。

本発明によれば、簡易な回路構成で複数のマイクロホンそれぞれからの入力信号に含まれるエコー信号を除去することができる。

本発明にかかる音声信号処理装置の実施の形態を示す機能ブロック図である。本発明にかかる音声信号処理方法の実施の形態を示すフローチャートである。図２の音声信号処理方法に含まれる初期化処理のフローチャートである。図２の音声信号処理方法に含まれる初期学習処理のフローチャートである。図４の初期学習処理での信号の流れを示す機能ブロック図である。図２の音声信号処理方法に含まれるエコー信号除去処理のフローチャートである。図６のエコー信号除去処理での信号の流れを示す機能ブロック図である。図６の信号処理に含まれる特定処理のフローチャートである。図８の特定処理での信号の流れを示す機能ブロック図である。図８の信号処理に含まれる更新処理のフローチャートである。図１０の更新処理での信号の流れを示す機能ブロック図である。本発明の別の実施の形態を示す機能ブロック図である。

以下、図面を参照しながら、本発明にかかる音声信号処理装置と、音声信号処理方法と、の実施の形態について説明する。

●音声信号処理装置●
先ず、本発明にかかる音声信号処理装置（以下「本装置」という。）の実施の形態について、説明する。

●音声信号処理装置の構成
図１は、本装置の実施の形態を示す機能ブロック図である。
本装置１は、音声や楽音を電気信号に変換するマイクロホン３などの機器からの信号（入力信号）の混合、分配、バランス調整などの処理を行う。本装置１は、例えば、ミキサである。

以下、例えば、本装置１が設置されている第１拠点の話者と、第１拠点とは物理的に離れた第２拠点の話者と、の間で行われるテレビ会議において、本装置１が使用される場合であって、本装置１が、第１拠点に配置されている１つのスピーカ２と、６つのマイクロホン３ａ，３ｂ，３ｃ，３ｄ，３ｅ，３ｆ（いわゆる６チャンネル）と、に接続されている場合を例に説明する。第１拠点と第２拠点とは、例えば、会議室などの部屋である。

スピーカ２から室内の空間に出力された第２拠点からの音声（音）の一部は、同室内の空間を経由して、マイクロホン３に収音される。このとき、マイクロホン３は、スピーカ２から出力された音声（音）の一部（以下「エコー成分」という。）に応じた信号（以下「エコー信号」という。）ｅｓを生成して、エコー信号ｅｓを出力する。マイクロホン３は、第１拠点の話者が発話したとき、同話者の音声に応じた信号（以下「音声信号」という。）ｓ１を生成して、音声信号ｓ１を出力する。すなわち、第１拠点の話者と第２拠点の話者とが発話しているとき、マイクロホン３から出力される信号は、音声信号ｓ１と、エコー信号ｅｓと、を含む。一方、第２拠点の話者のみが発話しているとき、マイクロホン３から出力される信号は、エコー信号ｅｓを含む。

本装置１は、第１入力部１０と、第１出力部２０と、第２入力部３０と、切替部４０と、制御部５０と、記憶部６０と、除去信号生成部７０と、除去部８０と、第２出力部９０と、を有してなる。

本装置１は、パーソナルコンピュータなどで実現される。本装置１では、本発明にかかる情報処理プログラム（以下「本プログラム」という。）が動作して、本プログラムが本装置１のハードウェア資源と協働して、後述する本発明にかかる音声信号処理方法（以下「本方法」という。）を実現する。

なお、コンピュータ（不図示）に本プログラムを実行させることで、同コンピュータを本装置と同様に機能させて、同コンピュータに本方法を実行させることができる。

第１入力部１０は、第２拠点の通信装置４と通信ケーブルなどの通信回線５を介して接続されて、第２拠点からの音声信号（以下「受話信号」という。）ｓ２を受信する。第１入力部１０は、例えば、コネクタや端子などの通信インターフェイス（Ｉ／Ｆ）、増幅器、などにより構成される。第１入力部１０からの受話信号ｓ２は、第１出力部２０と、制御部５０と、除去信号生成部７０と、に入力される。

第１出力部２０は、第１入力部１０からの受話信号ｓ２や制御部５０からの基準信号ｓ３を、スピーカ２に出力する。第１出力部２０は、例えば、Ｉ／Ｆ、増幅器、などにより構成される。第１出力部２０は、本発明における出力部である。「基準信号ｓ３」は、本装置１が後述する本方法を実行するとき、スピーカ２を介して放出する基準音（例えば、ホワイトノイズ）に対応する信号である。基準信号ｓ３は、制御部５０により生成される。

第２入力部３０は、各マイクロホン３ａ－３ｆと接続されて、同マイクロホン３ａ－３ｆそれぞれからの信号を受信する。第２入力部３０は、例えば、Ｉ／Ｆ、増幅器、ＡＤ変換器、可変抵抗、などにより構成される。第２入力部３０は、本発明における入力部である。第２入力部３０は、受信した各信号のゲインを調整した信号（以下「個別送話信号」という。）ｓ４１，ｓ４２，ｓ４３，ｓ４４，ｓ４５，ｓ４６を生成すると共に、各個別送話信号ｓ４１－ｓ４６を合成した信号（以下「送話信号」という。）ｓ４を生成する。すなわち、第２入力部３０は、各個別送話信号ｓ４１－ｓ４６、換言すれば、各マイクロホン３ａ－３ｆそれぞれからの信号、を合成して送話信号ｓ４を生成する。第２入力部３０は、送話信号ｓ４と各個別送話信号ｓ４１－ｓ４６それぞれに対応する７つの伝送路（不図示）を備える。生成された送話信号ｓ４と各個別送話信号ｓ４１－ｓ４６とは、切替部４０に入力される。以下、個別送話信号ｓ４１－ｓ４６を区別することなく総称する場合、各個別送話信号ｓ４１－ｓ４６を個別送話信号ｓ４０と記載する。

各信号のゲインの調整は、公知のゲインシェアリングのアルゴリズムを用いて実行される。「ゲインシェアリング」は、各マイクロホン３ａ－３ｆからの入力と、同入力の和と、を比較（例えば、マイクロホン３ａからのみ信号の入力があるときと、マイクロホン３ａ－３ｆから信号の入力があるときと、を比較）して、トータルのゲイン値Ｇが一定値になるように各マイクロホン３ａ－３ｆからの信号の伝送路（増幅器）に設定されるゲイン値ｇ１，ｇ２，ｇ３，ｇ４，ｇ５，ｇ６を調節するアルゴリズムである。換言すれば、ゲインシェアリングは、各伝送路のトータルのゲイン値Ｇが一定値になるように、各マイクロホン３ａ－３ｆに対応するゲイン値ｇ１－ｇ６を調節するアルゴリズムである。各伝送路に設定されたゲイン値ｇ１－ｇ６は、記憶部６０に記憶される。以下、各ゲイン値ｇ１－ｇ６を区別することなく総称する場合、各ゲイン値ｇ１－ｇ６をゲイン値ｇと記載する。

送話信号ｓ４と個別送話信号ｓ４１－ｓ４６とは、前述のとおり、各マイクロホン３ａ－３ｆそれぞれからの信号に基づいて生成される。すなわち、送話信号ｓ４と個別送話信号ｓ４１－ｓ４６とは、第１拠点の話者が発話しているとき音声信号ｓ１とエコー信号ｅｓとを含み、第１拠点の話者が発話していないときエコー信号ｅｓを含む。

切替部４０は、制御部５０からの切替信号に基づいて、第２入力部３０の伝送路を切り替えることにより、第２入力部３０から制御部５０や除去部８０に入力される信号を切り替える。すなわち、切替部４０は、６つのマイクロホン３ａ－３ｆそれぞれに対応する個別送話信号ｓ４０や送話信号ｓ４のうち、制御部５０や除去部８０に入力される信号を切り替える。切替部４０は、例えば、ロータリースイッチやスライドスイッチなどで構成される。切替部４０の動作については、後述する。

制御部５０は、本装置１が後述する本方法を実行するために必要な係数の算出、音声信号ｓ１や受話信号ｓ２の検出、エコーリターンロスの測定、などを実行する。制御部５０は、例えば、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＤＳＰ（Digital Signal Processor）などのプロセッサや、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）などの集積回路により構成される。制御部５０の動作と、エコーリターンロスと、については、後述する。

記憶部６０は、本装置１が後述する本方法を実行するために必要な情報を記憶する手段である。記憶部６０は、例えば、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）などの記録装置や、ＲＡＭ（Random Access Memory）、フラッシュメモリなどの半導体メモリ素子、などにより構成される。記憶部６０に記憶される情報については、後述する。

除去信号生成部７０は、受話信号ｓ２とフィルタ係数Ｆとに基づいて、除去信号ｓ５を生成する。除去信号生成部７０は、例えば、公知のＦＩＲ（Finite Impulse Response）フィルタである。「除去信号ｓ５」は、送話信号ｓ４に含まれるエコー信号ｅｓを除去（抑制）する信号である。すなわち、例えば、除去信号ｓ５は、送話信号ｓ４に含まれるエコー信号ｅｓと同位相（あるいは、限りなく同位相に近い）信号である。除去信号生成部７０による除去信号ｓ５の生成については、後述する。

「フィルタ係数Ｆ」は、除去信号生成部７０が受話信号ｓ２に対してＦＩＲ処理を実行し、除去信号ｓ５を生成するために用いる係数である。すなわち、除去信号生成部７０は、フィルタ係数Ｆに基づいて、受話信号ｓ２に対してＦＩＲ処理を実行して、除去信号ｓ５を生成する。フィルタ係数Ｆは、前述のとおり、制御部５０により算出される。制御部５０によるフィルタ係数Ｆの算出については、後述する。

除去部８０は、送話信号ｓ４と除去信号ｓ５とに基づいて、送話信号ｓ４に含まれるエコー信号ｅｓを除去して、エコー除去信号ｓ６を生成する。除去部８０は、例えば、減算回路や加算回路などの演算回路である。除去部８０によるエコー除去信号ｓ６の生成については、後述する。

「エコー除去信号ｓ６」は、前述のとおり、送話信号ｓ４からエコー信号ｅｓを除去（抑制）した信号である。エコー除去信号ｓ６は、第１拠点の話者が発話しているとき音声信号ｓ１と残留エコー信号ｒｅｓとを含み、第１拠点の話者が発話していないとき残留エコー信号ｒｅｓを含む。「残留エコー信号ｒｅｓ」は、エコー信号ｅｓと除去信号ｓ５との差分信号である。すなわち、例えば、エコー除去信号ｓ６がエコー信号ｅｓを完全に除去したとき（エコー信号ｅｓと除去信号ｓ５との位相が同位相のとき）、両信号を減算して生成される残留エコー信号ｒｅｓの信号レベルは、「０」である。エコー除去信号ｓ６は、制御部５０と第２出力部９０とに入力される。

第２出力部９０は、通信回線５に接続されて、同通信回線５にエコー除去信号ｓ６を出力する。第２出力部９０は、例えば、Ｉ／Ｆ、増幅器、などにより構成される。第２出力部９０からのエコー除去信号ｓ６は、通信回線５を介して、第２拠点の通信装置４に入力される。

●音声信号処理方法●
次に、本方法について説明する。

図２は、本方法の実施の形態を示すフローチャートである。
本装置１は、本方法において、初期化処理（ＳＴ１）と、初期学習処理（ＳＴ２）と、エコー信号除去処理（ＳＴ３）と、後述する特定処理（ＳＴ４）（図８参照）と、後述する更新処理（ＳＴ５）（図１０参照）と、を実行する。本装置１は、本方法において、各処理（ＳＴ１－ＳＴ５）を実行することにより、共通する１つのＦＩＲフィルタ（除去信号生成部７０）で６つのマイクロホン３（６チャンネル）に対応し、かつ、後述するように環境変化に自動的に対応したエコーキャンセルを実現する。

本装置１は、本装置１の電源投入後、初期化処理（ＳＴ１）を実行する。

●初期化処理
図３は、初期化処理（ＳＴ１）のフローチャートである。
「初期化処理（ＳＴ１）」は、パラメータの初期化や、環境測定などを実行する処理である。

先ず、本装置１は、パラメータの初期化を行う（ＳＴ１０１）。「パラメータ」は、後述する個別フィルタ係数ｋの算出に用いられるアルゴリズム（適応アルゴリズム）に設定される値である。

次いで、本装置１は、制御部５０を用いて、本装置１とスピーカ２とマイクロホン３とが設置されている第１拠点の環境測定を実行する（ＳＴ１０２）。「環境測定」は、本装置１とスピーカ２とマイクロホン３とが設置されている第１拠点のスピーカ２からマイクロホン３までのエコー成分の伝達経路（環境）に関する項目（例えば、残響時間、遅延時間、最大エコー量、暗騒音）の測定である。本装置１は、スピーカ２を介して基準音を第１拠点内に出力して、同基準音のエコー成分をマイクロホン３を介して収音する。制御部５０は、残響時間と、遅延時間と、最大エコー量と、暗騒音と、を測定する。環境測定は、マイクロホン３ａ－３ｆごとに実行される。

「残響時間」は、第１拠点内に基準音を出力（放射）して、同基準音の出力を停止してから同音の残響音のエネルギー密度が６０ｄＢ減衰するまでに要する時間である。「遅延時間」は、スピーカ２から出力した基準音をマイクロホン３が収音するまでに要する時間である。「最大エコー量」は、第１拠点内でマイクロホン３が収音するエコー成分の最大量である。「暗騒音」は、第１拠点内の騒音（空調の音や室外の車の音など）の音圧レベルである。

次いで、本装置１は、マイクロホン３ａ－３ｆそれぞれに対応する環境測定の測定結果を記憶部６０に記憶する（ＳＴ１０３）。

次いで、本装置１は、マイクロホン３ａ－３ｆそれぞれに対応する環境測定の測定結果に基づいてパラメータを特定する（ＳＴ１０４）。パラメータは、環境測定の測定結果に基づいて新規に算出され、あるいは、環境測定の測定結果に基づいて予め記憶部６０に記憶されている複数のパラメータ群から１のパラメータ群が選択されることにより、特定される。

●初期学習処理
図４は、初期学習処理（ＳＴ２）のフローチャートである。
図５は、初期学習処理（ＳＴ２）での信号の流れを示す機能ブロック図である。
同図は、初期学習処理（ＳＴ２）での信号の流れのうち、主要な流れを矢印で示す。

「初期学習処理（ＳＴ２）」は、本装置１の電源投入後などに、本装置１がフィルタ係数Ｆを最初に算出（学習）する処理である。

先ず、本装置１は、切替部４０と制御部５０とを用いて、第２入力部３０の伝送路をマイクロホン３ａからの伝送路に切り替える（ＳＴ２０１）。切替部４０による伝送路の切替は、制御部５０からの切替信号に基づいて、行われる。

次いで、本装置１は、第２入力部３０を用いて、マイクロホン３ａに対応する個別送話信号ｓ４１を生成する（ＳＴ２０２）。制御部５０は、基準信号ｓ３を生成して、基準信号ｓ３を第１出力部２０に入力する。本装置１は、スピーカ２から基準音を出力して、同基準音のエコー成分を前述の処理（ＳＴ２０１）で切り替えた伝送路に対応するマイクロホン３（マイクロホン３ａ）により収音する。第２入力部３０は、マイクロホン３ａから入力される信号に基づいて、マイクロホン３ａに対応する個別送話信号ｓ４１を生成する。同個別送話信号ｓ４１は、基準音のエコー成分に応じたエコー信号ｅｓを含む。個別送話信号ｓ４１は、第２入力部３０から切替部４０を介して、除去部８０に入力される。

次いで、本装置１は、制御部５０と除去信号生成部７０とを用いて、個別除去信号ｓ５１を生成する（ＳＴ２０３）。「個別除去信号ｓ５１」は、個別送話信号ｓ４１に含まれるエコー信号（以下「個別エコー信号」という。）ｅｓ１を除去する信号である。以下、個別除去信号ｓ５１－ｓ５６を区別することなく総称する場合、個別除去信号ｓ５１－ｓ５６を個別除去信号ｓ５０と記載する。

制御部５０は、記憶部６０からマイクロホン３ａに対応する個別フィルタ係数ｋ１の初期値を読み出し、除去信号生成部７０に入力（設定）する。除去信号生成部７０は、基準信号ｓ３と個別フィルタ係数ｋ１とに基づいて、個別除去信号ｓ５１を算出する。個別除去信号ｓ５１は、除去部８０に入力される。

「個別フィルタ係数ｋ１」は、スピーカ２からマイクロホン３ａに至る音響伝達経路の伝達関数である。すなわち、個別フィルタ係数ｋ１は、除去信号生成部７０が参照信号に対してＦＩＲ処理を実行して、個別除去信号ｓ５１を生成するために用いる係数である。「参照信号」は、除去信号生成部７０が個別フィルタ係数ｋ１に基づいて個別除去信号ｓ５１を生成する基となる信号（初期学習処理（ＳＴ２）では基準信号ｓ３、エコー信号除去処理（ＳＴ３）と特定処理（ＳＴ４）と更新処理（ＳＴ５）とでは受話信号ｓ２）である。

次いで、本装置１は、除去部８０を用いて、個別送話信号ｓ４１に含まれる個別エコー信号ｅｓ１を除去して、個別エコー除去信号ｓ６１を生成する（ＳＴ２０４）。除去部８０は、個別送話信号ｓ４１と個別除去信号ｓ５１とに基づいて、個別エコー除去信号ｓ６１を生成する。個別エコー除去信号ｓ６１は、除去部８０から制御部５０と第２出力部９０とに入力される。このとき、第２出力部９０は、個別エコー除去信号ｓ６１をミュートする。その結果、個別エコー除去信号ｓ６１は、第２拠点に送信されない。

なお、第２出力部は、個別エコー除去信号をアッテネートしてもよく、あるいは、個別エコー除去信号をミュートした上でダミーノイズ（ピンクノイズ）を第２拠点に送信してもよい。

「個別エコー除去信号ｓ６１」は、個別送話信号ｓ４１から個別エコー信号ｅｓ１を除去（抑制）した信号である。個別エコー除去信号ｓ６１は、個別残留エコー信号ｒｅｓ１１を含む。以下、個別エコー除去信号ｓ６１－ｓ６６を区別することなく総称する場合、個別エコー除去信号ｓ６１－ｓ６６を個別エコー除去信号ｓ６０と記載する。「個別残留エコー信号ｒｅｓ１１」は、個別エコー信号ｅｓ１と個別除去信号ｓ５１との差分信号である。除去部８０は、個別送話信号ｓ４１から個別除去信号ｓ５１を減算して、個別エコー除去信号ｓ６１を生成する。以下、個別残留エコー信号ｒｅｓ１１－ｒｅｓ１６を区別することなく総称する場合、個別残留エコー信号ｒｅｓ１１－ｒｅｓ１６を個別残留エコー信号ｒｅｓ１０と記載する。

次いで、本装置１は、制御部５０を用いて、マイクロホン３ａに対応する個別フィルタ係数ｋ１を算出する（ＳＴ２０５）。制御部５０は、マイクロホン３ａからの信号の伝送路に設定された（マイクロホン３ａに対応する）ゲイン値ｇ１を記憶部６０から読み出す。次いで、制御部５０は、読み出されたゲイン値ｇ１と、基準信号ｓ３と、個別エコー除去信号ｓ６１（すなわち、個別エコー除去信号ｓ６１に含まれる個別残留エコー信号ｒｅｓ１１）と、に基づいて、公知の適応アルゴリズムを用いて、マイクロホン３ａに対応する個別フィルタ係数ｋ１を算出する。

算出された個別フィルタ係数ｋ１は、記憶部６０に記憶される（ＳＴ２０６）。その結果、記憶部６０に記憶されている個別フィルタ係数ｋ１は、初期値から算出値へ更新される。

本装置１は、全てのマイクロホン３ａ－３ｆに対応する個別フィルタ係数ｋ１－ｋ６を算出するまで（ＳＴ２０７の「いいえ」）、処理（ＳＴ２０１－ＳＴ２０６）を繰り返す。ここで、前述のとおり、適応アルゴリズムのパラメータは、マイクロホン３それぞれに対応する環境測定の測定結果に基づいて、特定される。換言すれば、制御部５０は、マイクロホン３それぞれに対応する環境測定の測定結果に基づいて、マイクロホン３それぞれに対応する個別フィルタ係数ｋを算出する。

全てのマイクロホン３ａ－３ｆに対応する個別フィルタ係数ｋ１－ｋ６が算出されたとき（ＳＴ２０７の「はい」）、本装置１は、制御部５０を用いて、フィルタ係数Ｆを算出する（ＳＴ２０８）。制御部５０は、各マイクロホン３ａ－３ｆからの信号の伝送路のゲイン値ｇ１－ｇ６と、各個別フィルタ係数ｋ１－ｋ６と、を記憶部６０から読み出し、ゲイン値ｇ１－ｇ６と個別フィルタ係数ｋ１－ｋ６とに基づいて、フィルタ係数Ｆを算出する。フィルタ係数Ｆは、各個別フィルタ係数ｋ１－ｋ６を合成して算出される。以下、個別フィルタ係数ｋ１－ｋ６を区別することなく総称する場合、個別フィルタ係数ｋ１－ｋ６を個別フィルタ係数ｋと記載する。

各個別フィルタ係数ｋ１－ｋ６の合成は、各マイクロホン３ａ－３ｆに対応する個別フィルタ係数ｋ１－ｋ６ごとに、個別フィルタ係数ｋにゲイン値ｇを乗算して、その結果を加算することにより、実行される。すなわち、フィルタ係数Ｆは、マイクロホン３ａに対応する個別フィルタ係数ｋ１とゲイン値ｇ１とを乗算した値と、マイクロホン３ｂに対応する個別フィルタ係数ｋ２とゲイン値ｇ２とを乗算した値と、マイクロホン３ｃに対応する個別フィルタ係数ｋ３とゲイン値ｇ３とを乗算した値と、マイクロホン３ｄに対応する個別フィルタ係数ｋ４とゲイン値ｇ４とを乗算した値と、マイクロホン３ｅに対応する個別フィルタ係数ｋ５とゲイン値ｇ５とを乗算した値と、マイクロホン３ｆに対応する個別フィルタ係数ｋ６とゲイン値ｇ６とを乗算した値と、を加算して算出される。

算出されたフィルタ係数Ｆは、記憶部６０に記憶されると共に、除去信号生成部７０に入力（設定）される（ＳＴ２０９）。その結果、除去信号生成部７０は、フィルタ係数Ｆに基づいて、除去信号ｓ５の生成が可能となる。

このように、本方法は、各マイクロホン３ａ－３ｆに対応する個別フィルタ係数ｋ１－ｋ６を算出して、合成することで、フィルタ係数Ｆを算出する。そのため、本装置１は、マイクロホンごとにエコーキャンセル部を備える従来の装置とは異なり、１つのエコーキャンセル部（制御部５０と除去信号生成部７０と除去部８０とに相当）により各マイクロホン３ａ－３ｆからの信号に含まれるエコー信号ｅｓを除去可能である。すなわち、本装置１は、６つのマイクロホン３ａ－３ｆからの入力に対して、共通する１つのＦＩＲフィルタ（除去信号生成部７０）によりエコーキャンセルを実行する。つまり、本装置１は、従来の装置と比較して、簡易な回路構成で各マイクロホン３ａ－３ｆからの信号に含まれるエコー信号ｅｓを除去可能である。

●エコー信号除去処理
図６は、エコー信号除去処理（ＳＴ３）のフローチャートである。
図７は、エコー信号除去処理（ＳＴ３）での信号の流れを示す機能ブロック図である。
同図は、エコー信号除去処理（ＳＴ３）での信号の流れのうち、主要な流れを矢印で示す。

「エコー信号除去処理（ＳＴ３）」は、例えば、第１拠点と第２拠点との間の会議中など、第１入力部１０が受信した信号に受話信号ｓ２が含まれるとき、送話信号ｓ４から受話信号ｓ２に対応するエコー信号ｅｓを除去する処理である。前述のとおり、第１入力部１０からの信号（受話信号ｓ２）は、第１出力部２０と、制御部５０と、除去信号生成部７０と、に入力される。

先ず、本装置１は、制御部５０を用いて、第１入力部１０からの信号に受話信号ｓ２が含まれるか否か、つまり、受話信号ｓ２の有無を検出する（ＳＴ３０１）。制御部５０は、例えば、第１入力部１０からの信号（信号レベル）と、所定の閾値Ｖ１と、を比較することにより、受話信号ｓ２の有無を検出する。受話信号ｓ２が有るとき、送話信号ｓ４は、受話信号ｓ２に対応するエコー信号ｅｓを含む。

「閾値Ｖ１」は、制御部５０が第１入力部１０からの信号に受話信号ｓ２が含まれるか否かを検出するための閾値である。閾値Ｖ１は、記憶部６０に記憶されている。

第１入力部１０からの信号（信号レベル）が閾値Ｖ１より小さい（受話信号ｓ２が無い）とき（ＳＴ３０１の「いいえ」）、本装置１は、受話信号ｓ２の有無の検出を繰り返す。

一方、第１入力部１０からの信号が閾値Ｖ１以上（受話信号ｓ２が有る）のとき（ＳＴ３０１の「はい」）、本装置１は、切替部４０と制御部５０とを用いて、第２入力部３０の伝送路を送話信号ｓ４の伝送路に切り替える（ＳＴ３０２）。

次いで、本装置１は、第２入力部３０を用いて、送話信号ｓ４を生成する（ＳＴ３０３）。送話信号ｓ４は、切替部４０を介して、第２入力部３０から制御部５０と除去部８０とに入力される。

次いで、本装置１は、制御部５０と除去信号生成部７０とを用いて、除去信号ｓ５を生成する（ＳＴ３０４）。制御部５０は、記憶部６０からフィルタ係数Ｆを読み出して、除去信号生成部７０に入力（設定）する。除去信号生成部７０は、制御部５０から入力されたフィルタ係数Ｆに基づいて、受話信号ｓ２から除去信号ｓ５を生成する。フィルタ係数Ｆは、初期学習処理（ＳＴ２）において算出されたフィルタ係数Ｆ、または、後述する更新処理（ＳＴ５）において算出して更新されたフィルタ係数Ｆである。

次いで、本装置１は、除去部８０を用いて、送話信号ｓ４に含まれるエコー信号ｅｓを除去して、エコー除去信号ｓ６を生成する（ＳＴ３０５）。除去部８０は、送話信号ｓ４と除去信号ｓ５とに基づいて、エコー除去信号ｓ６を生成する。エコー除去信号ｓ６は、制御部５０と第２出力部９０とに入力される。

次いで、本装置１は、制御部５０を用いて、エコーリターンロス（Echo Return Loss：ＥＲＬ）を測定する（ＳＴ３０６）。

「ＥＲＬ」は、送話信号ｓ４とエコー除去信号ｓ６のレベル差、すなわち、エコー除去信号ｓ６に含まれる残留エコー信号ｒｅｓの大きさ（信号レベル）である。ＥＲＬは、例えば、マイクロホン３の設置場所の変更や、スピーカ２の出力レベルの変動などに影響を受ける。すなわち、例えば、ＥＲＬは、話者によりマイクロホン３の位置が動かされ、エコー成分の伝達経路が変化（環境変化）したときに悪化する。制御部５０は、送話信号ｓ４の信号レベルと、エコー除去信号ｓ６の信号レベルと、に基づいて、ＥＲＬを測定する。すなわち、制御部５０は、送話信号ｓ４の信号レベルからエコー除去信号ｓ６の信号レベルを減算することにより、ＥＲＬを測定する。

次いで、本装置１は、制御部５０を用いて、測定したＥＲＬと、所定の閾値Ｖ２と、を比較する（ＳＴ３０７）。「閾値Ｖ２」は、本装置１によるエコー信号ｅｓの除去が十分か否か（残留エコー信号ｒｅｓの信号レベルが大きいか否か）の閾値である。すなわち、本装置１によるエコー信号ｅｓの除去が不十分なとき、ＥＲＬは、閾値Ｖ２以上となる（悪化する）。一方、本装置１によるエコー信号ｅｓの除去が十分なとき、ＥＲＬは、閾値Ｖ２より小さい。閾値Ｖ２は、本発明における基準値である。閾値Ｖ２は、記憶部６０に記憶されている。

ＥＲＬが閾値Ｖ２より小さいとき（ＳＴ３０７の「いいえ」）、本装置１は、第２出力部９０を用いて、エコー除去信号ｓ６を第２拠点の通信装置４に出力して（ＳＴ３０８）、処理（ＳＴ３０１）に戻る。

一方、ＥＲＬが閾値Ｖ２以上のとき（ＳＴ３０７の「はい」）、本装置１は、制御部５０を用いて、送話信号ｓ４に音声信号ｓ１が含まれているか否か（音声信号ｓ１の有無）を検出する（ＳＴ３０９）。制御部５０は、例えば、第２入力部３０からの送話信号ｓ４（信号レベル）と、所定の閾値Ｖ３と、を比較することにより、音声信号ｓ１の有無を検出する。

「閾値Ｖ３」は、制御部５０が第２入力部３０からの送話信号ｓ４に音声信号ｓ１が含まれるか否かを検出するための閾値である。閾値Ｖ３は、記憶部６０に記憶されている。

送話信号ｓ４の信号レベルが閾値Ｖ３以上（音声信号ｓ１が有る）のとき（ＳＴ３０９の「はい」）、本装置１は、第２出力部９０を用いて、エコー除去信号ｓ６を第２拠点の通信装置４に出力して（ＳＴ３０８）、処理（ＳＴ３０１）に戻る。

一方、送話信号ｓ４の信号レベルが閾値Ｖ３より小さい（音声信号ｓ１が無い）とき（ＳＴ３０９の「いいえ」）、本装置１は、第２出力部９０を用いて、エコー除去信号ｓ６を第２拠点の通信装置４に出力して（ＳＴ３１０）、特定処理（ＳＴ４）を実行する。

このように、本装置１は、ＥＲＬが閾値Ｖ２以上のとき、受話信号ｓ２が有り、かつ、音声信号ｓ１が無いタイミング、で特定処理（ＳＴ４）を実行する。すなわち、本装置１は、ＥＲＬと閾値Ｖ２との比較結果に基づいて、送話信号ｓ４にエコー信号ｅｓが含まれており、かつ、送話信号ｓ４に音声信号ｓ１が含まれていないとき、特定処理（ＳＴ４）を実行する。換言すれば、本装置１は、エコー信号除去処理（ＳＴ３）の実行中に環境変化を検知すると、特定処理（ＳＴ４）を実行する。

なお、ＥＲＬの値が負の値として測定されるとき、閾値Ｖ２は負の値であり、本装置１は前述の処理（ＳＴ３０７）でのＥＲＬと閾値Ｖ２との大小の比較を逆にしてもよい。すなわち、例えば、負の値であるＥＲＬが閾値Ｖ２以下のとき、本装置は、制御部を用いて、送話信号に音声信号が含まれているか否か（音声信号の有無）を検出してもよい。

●特定処理
図８は、特定処理（ＳＴ４）のフローチャートである。
図９は、特定処理（ＳＴ４）での信号の流れを示す機能ブロック図である。
同図は、特定処理（ＳＴ４）での信号の流れのうち、主要な流れを矢印で示す。同図は、説明の便宜上、マイクロホン３ａ－３ｆのうち、マイクロホン３ａからの信号に対応する各信号のみを示す。

「特定処理（ＳＴ４）」は、マイクロホン３を特定マイクロホン、または、非特定マイクロホンとして特定する処理である。「特定マイクロホン」は、対応する個別フィルタ係数ｋが適正でない（ずれている）マイクロホン３、すなわち、個別フィルタ係数ｋの更新の対象となるマイクロホン３である。ＥＲＬの悪化は、エコー信号ｅｓに対するフィルタ係数Ｆのずれ、すなわち、各個別エコー信号ｅｓ１－ｅｓ６に対する各個別フィルタ係数ｋ１－ｋ６のずれ、に起因する。そのため、特定マイクロホンに対応する個別フィルタ係数ｋは、適正な値に更新する必要がある。「非特定マイクロホン」は、対応する個別フィルタ係数ｋが適正な（ずれていない）マイクロホン３、すなわち、個別フィルタ係数ｋの更新の対象とならないマイクロホン３である。

先ず、本装置１は、制御部５０を用いて、送話信号ｓ４に音声信号ｓ１が含まれているか否か（音声信号ｓ１の有無）を検出する（ＳＴ４０１）。音声信号ｓ１の有無の検出（ＳＴ４０１）は、エコー信号除去処理（ＳＴ３）における音声信号ｓ１の有無の検出（ＳＴ３０９）と同様の処理である。

送話信号ｓ４に音声信号ｓ１が含まれていない（音声信号ｓ１が無い）とき（ＳＴ４０１の「いいえ」）、本装置１は、切替部４０と制御部５０とを用いて、第２入力部３０の伝送路をマイクロホン３ａからの信号の伝送路に切り替える（ＳＴ４０２）。

次いで、本装置１は、第２入力部３０を用いて、マイクロホン３ａからの信号に基づいて、個別送話信号ｓ４１を生成する（ＳＴ４０３）。個別送話信号ｓ４１は、切替部４０を介して、除去部８０へ入力される。

次いで、本装置１は、制御部５０と除去信号生成部７０とを用いて、個別除去信号（特定除去信号）ｓ５１を生成する（ＳＴ４０４）。制御部５０は、記憶部６０からマイクロホン３ａに対応する個別フィルタ係数ｋ１を読み出して、除去信号生成部７０に入力する。除去信号生成部７０は、受話信号ｓ２と個別フィルタ係数ｋ１とに基づいて、個別除去信号ｓ５１を生成する。個別除去信号ｓ５１は、除去部８０に入力される。

次いで、本装置１は、除去部８０を用いて、個別送話信号ｓ４１に含まれる個別エコー信号ｅｓ１を除去して、個別エコー除去信号ｓ６１を生成する（ＳＴ４０５）。除去部８０は、個別送話信号ｓ４１と個別除去信号ｓ５１とに基づいて、個別エコー除去信号ｓ６１を生成する。個別エコー除去信号ｓ６１は、除去部８０から制御部５０と第２出力部９０とに入力される。

次いで、本装置１は、制御部５０を用いて、個別ＥＲＬを測定する（ＳＴ４０６）。

「個別ＥＲＬ」は、個別送話信号ｓ４１と個別エコー除去信号ｓ６１のレベル差、すなわち、個別エコー除去信号ｓ６１に含まれる個別残留エコー信号ｒｅｓ１１の大きさ（信号レベル）である。制御部５０は、個別送話信号ｓ４１の信号レベルと、個別エコー除去信号ｓ６１の信号レベルと、に基づいて、個別ＥＲＬを測定する。すなわち、制御部５０は、個別送話信号ｓ４１の信号レベルから個別エコー除去信号ｓ６１の信号レベルを減算することにより、個別ＥＲＬを測定する。

次いで、本装置１は、制御部５０を用いて、測定した個別ＥＲＬと所定の閾値Ｖ４とを比較する（ＳＴ４０７）。

「閾値Ｖ４」は、本装置１による個別エコー信号ｅｓ１の除去が十分か否か（個別残留エコー信号ｒｅｓ１１の信号レベルが大きいか否か）の閾値である。すなわち、本装置１による個別エコー信号ｅｓ１の除去が不十分なとき、個別ＥＲＬは、閾値Ｖ４以上となる（悪化する）。一方、本装置１による個別エコー信号ｅｓ１の除去が十分なとき、個別ＥＲＬは、閾値Ｖ４より小さい。閾値Ｖ４は、本発明における個別基準値である。閾値Ｖ４は、記憶部６０に記憶されている。

個別ＥＲＬが閾値Ｖ４より小さいとき（ＳＴ４０７の「いいえ」）、本装置１は、マイクロホン３ａを非特定マイクロホンとして特定する（ＳＴ４０８）。一方、個別ＥＲＬが閾値Ｖ４以上のとき（ＳＴ４０７の「はい」）、本装置１は、マイクロホン３ａを特定マイクロホンとして特定する（ＳＴ４０９）。特定結果は、記憶部６０に記憶される（ＳＴ４１０）。このとき、個別エコー除去信号ｓ６１は、第２出力部９０から出力される。

本装置１は、全てのマイクロホン３ａ－３ｆを特定マイクロホン、または、非特定マイクロホンとして特定するまで、残りのマイクロホン３ｂ－３ｆからの信号に対して処理（ＳＴ４０１－ＳＴ４１０）を繰り返す（ＳＴ４１１の「いいえ」）。すなわち、本装置１は、切替部４０を用いて、残りのマイクロホン３ｂ－３ｆそれぞれに対応する個別送話信号ｓ４２－ｓ４６を切り替えながら除去部８０に入力して、各マイクロホン３ａ－３ｆを、特定マイクロホン、または、非特定マイクロホンのいずれかに決定する。

本装置１は、各マイクロホン３ａ－３ｆを特定マイクロホン、または、非特定マイクロホンとして特定したとき（ＳＴ４１１の「はい」）、更新処理（ＳＴ５）を実行する。このとき、マイクロホン３は、特定マイクロホンと、非特定マイクロホンと、で構成される。

送話信号ｓ４に音声信号ｓ１が含まれている（音声信号ｓ１が有る）とき（ＳＴ４０１の「はい」）、本装置１は、特定処理（ＳＴ４）を終了（中断）して、エコー信号除去処理（ＳＴ３）を実行する。すなわち、特定処理（ＳＴ４）が完了する前に制御部５０が音声信号ｓ１を検出したとき、本装置１は特定処理（ＳＴ４）を中断してエコー信号除去処理（ＳＴ３）を実行する。特定処理（ＳＴ４）を中断した場合、本装置１は、エコー信号除去処理（ＳＴ３）において送話信号ｓ４に音声信号ｓ１が含まれないと判定したとき、中断された処理（特定マイクロホン、または、非特定マイクロホンとして特定されていないマイクロホン３からの信号に対する処理）から特定処理（ＳＴ４）を実行する（再開する）。すなわち、例えば、各マイクロホン３ａ－３ｆのうち、マイクロホン３ｄまで特定処理（ＳＴ４）が実行された段階で中断されていれば、特定処理（ＳＴ４）は、マイクロホン３ｅから再開される。

なお、本装置は、特定処理を中断したとき、特定処理を最初から、つまり、全てのマイクロホンに対して実行してもよい。

また、個別ＥＲＬの値が負の値として測定されるとき、閾値Ｖ４は負の値であり、本装置１は前述の処理（ＳＴ４０７）での個別ＥＲＬと閾値Ｖ４との大小の比較を逆にしてもよい。すなわち、例えば、負の値である個別ＥＲＬが閾値Ｖ４以下のとき、本装置は、同個別ＥＲＬに対応するマイクロホン３を特定マイクロホンとして特定してもよい。

このように、本装置１は、個別ＥＲＬと個別基準値（閾値Ｖ４）との比較結果に基づいて、複数のマイクロホン３ａ－３ｆの中から個別フィルタ係数ｋの更新の対象となる特定マイクロホンと、個別フィルタ係数ｋの更新の対象とならない非特定マイクロホンと、を決定する。すなわち、本装置１は、ＥＲＬが悪化したとき、送話信号ｓ４にエコー信号ｅｓが含まれ、かつ、送話信号ｓ４に音声信号ｓ１が含まれないタイミングで特定マイクロホンを決定する。そのため、本装置１は、個別フィルタ係数ｋの更新が必要なマイクロホン３を限定し、個別フィルタ係数ｋの更新と、フィルタ係数Ｆの更新と、に必要な時間や、処理負荷を低減する。

●更新処理
図１０は、更新処理（ＳＴ５）のフローチャートである。
図１１は、更新処理（ＳＴ５）での信号の流れを示す機能ブロック図である。
同図は、更新処理（ＳＴ５）での信号の流れのうち、主要な流れを矢印で示す。同図は、マイクロホン３ｃからの信号に対応する各信号のみを示す。

「更新処理（ＳＴ５）」は、特定マイクロホンとして特定されたマイクロホン３に対応する個別フィルタ係数ｋを更新することにより、フィルタ係数Ｆを更新する処理である。すなわち、例えば、マイクロホン３ａが特定マイクロホンとして特定されたとき、本装置１は、マイクロホン３ａに対応する個別フィルタ係数ｋ１を更新してフィルタ係数Ｆを更新する。また、マイクロホン３ｅ，３ｆが特定マイクロホンとして特定されたとき、本装置１は、マイクロホン３ｅ，３ｆに対応する個別フィルタ係数ｋ５，ｋ６を更新してフィルタ係数Ｆを更新する。以下、マイクロホン３ｃが特定マイクロホンとして特定された場合を例に説明する。

先ず、本装置１は、制御部５０を用いて、送話信号ｓ４（または、個別送話信号ｓ４３）に音声信号ｓ１が含まれているか否か（音声信号ｓ１の有無）を検出する（ＳＴ５０１）。音声信号ｓ１の有無の検出（ＳＴ５０１）は、エコー信号除去処理（ＳＴ３）における音声信号ｓ１の有無の検出（ＳＴ３０９）と同様の処理である。

先ず、本装置１は、切替部４０と制御部５０とを用いて、第２入力部３０の伝送路を特定マイクロホン（マイクロホン３ｃ）からの信号の伝送路に切り替える（ＳＴ５０２）。

次いで、本装置１は、特定マイクロホン（マイクロホン３ｃ）からの信号に基づいて、個別送話信号ｓ４３を生成する（ＳＴ５０３）。

次いで、本装置１は、制御部５０と除去信号生成部７０とを用いて、個別除去信号ｓ５３を生成する（ＳＴ５０４）。制御部５０は、記憶部６０から特定マイクロホンに対応する個別フィルタ係数ｋ３を読み出して、除去信号生成部７０に入力する。除去信号生成部７０は、受話信号ｓ２と個別フィルタ係数ｋ３とに基づいて、個別除去信号ｓ５３を生成する。個別除去信号ｓ５３は、本発明における特定除去信号である。個別除去信号ｓ５３は、除去部８０に入力される。

次いで、本装置１は、除去部８０を用いて、個別送話信号ｓ４３に含まれる個別エコー信号ｅｓ３を除去して、個別エコー除去信号ｓ６３を生成する（ＳＴ５０５）。個別エコー除去信号ｓ６３は、本発明における特定エコー除去信号である。個別エコー除去信号ｓ６３は、制御部５０と第２出力部９０とに入力される。

次いで、本装置１は、制御部５０を用いて、個別エコーリターンロス（個別ＥＲＬ）を測定する（ＳＴ５０６）。

次いで、本装置１は、制御部５０を用いて、測定した個別ＥＲＬと所定の閾値Ｖ４とを比較する（ＳＴ５０７）。

個別ＥＲＬが閾値Ｖ４以上のとき（ＳＴ５０７の「はい」）、本装置１は、制御部５０を用いて、個別フィルタ係数ｋ３を算出する（ＳＴ５０８）。制御部５０は、特定マイクロホンからの信号の伝送路に設定したゲイン値ｇ３を記憶部６０から読み出す。制御部５０は、読み出されたゲイン値ｇ３と、個別エコー除去信号ｓ６３（すなわち、個別（特定）エコー除去信号ｓ６３に含まれる個別残留エコー信号ｒｅｓ１３）と、受話信号ｓ２と、環境測定結果と、に基づいて、個別フィルタ係数ｋ３を算出する。

次いで、本装置１は、算出した個別フィルタ係数ｋ３を記憶部６０に記憶して、すなわち、記憶部６０に記憶されている個別フィルタ係数ｋ３を更新して（ＳＴ５０９）、処理（ＳＴ５０４）に戻る。

一方、個別ＥＲＬが閾値Ｖ４より小さいとき（ＳＴ５０７の「いいえ」）、本装置１は、制御部５０を用いて、記憶部６０に記憶されているフィルタ係数Ｆを更新する（ＳＴ５１０）。制御部５０は、更新された特定マイクロホンに対応する個別フィルタ係数ｋ３と、非特定マイクロホンに対応する個別フィルタ係数ｋ１，ｋ２，ｋ４－ｋ６と、各伝送路に設定されたゲイン値ｇ１－ｇ６と、を記憶部６０から読み出し、フィルタ係数Ｆを算出する。フィルタ係数Ｆは、初期学習処理（ＳＴ２）の処理（ＳＴ２０８）と同様に算出される。

次いで、本装置１は、算出したフィルタ係数Ｆを記憶部６０に記憶して、すなわち、記憶部６０に記憶されているフィルタ係数Ｆを更新して（ＳＴ５１１）、エコー信号除去処理（ＳＴ３）に戻る。

このように、本装置１は、特定処理（ＳＴ４）において個別ＥＲＬが悪化したマイクロホン３を特定マイクロホンとして特定し、特定マイクロホンに対してのみ更新処理（ＳＴ５）を実行する。その結果、フィルタ係数Ｆの更新にかかる処理負荷は軽減され、同処理時間は短縮される。

また、本装置１は、エコー信号除去処理（ＳＴ３）において、常にＥＲＬと閾値Ｖ２とを比較（すなわち、ＥＲＬを監視）する。ＥＲＬが閾値Ｖ２以上のとき、本装置１は、送話信号ｓ４にエコー信号ｅｓが含まれ、かつ、音声信号ｓ１が含まれないタイミングで、特定処理（ＳＴ４）と更新処理（ＳＴ５）とを実行する。特定処理（ＳＴ４）において、本装置１は、マイクロホン３ごとに個別ＥＲＬと閾値Ｖ４とを比較する。個別ＥＲＬが閾値Ｖ４以上のとき、本装置１は、個別フィルタ係数ｋの更新の対象となる特定マイクロホンを決定する。更新処理（ＳＴ５）において、本装置１は、受話信号ｓ２と、個別エコー除去信号（特定エコー除去信号）ｓ６０に含まれる個別残留エコー信号ｒｅｓ１０と、に基づいて、特定マイクロホンに対応する個別フィルタ係数ｋを算出する。本装置１は、特定マイクロホンに対応する個別フィルタ係数ｋと、非特定マイクロホンに対応する個別フィルタ係数ｋと、に基づいて、フィルタ係数Ｆを算出・更新する。

●まとめ
以上説明した実施の形態によれば、制御部５０は、複数のマイクロホン３ａ－３ｆそれぞれに対応する個別フィルタ係数ｋ１－ｋ６を算出し、各個別フィルタ係数ｋ１－ｋ６を合成してフィルタ係数Ｆを算出する。除去信号生成部７０は、算出したフィルタ係数Ｆに基づいて、除去信号ｓ５を生成する。除去部８０は、送話信号ｓ４と除去信号ｓ５とに基づいて、送話信号ｓ４に含まれるエコー信号ｅｓを除去する（エコー除去信号ｓ６を生成する）。そのため、本装置１は、複数のマイクロホンそれぞれに対応するエコーキャンセル部を備える従来の装置と異なり、共通する１つのＦＩＲフィルタ（除去信号生成部７０）により複数のマイクロホン３（多チャンネル）からの信号に含まれるエコー信号ｅｓを除去することができる。すなわち、本装置１は、従来の装置と比較して簡易な回路構成を実現する。つまり、本装置１は、１つの共通するＦＩＲフィルタを用いるという簡易な回路構成で複数のマイクロホン３からの信号に含まれるエコー信号ｅｓを除去する。

また、以上説明した実施の形態によれば、制御部５０は、送話信号ｓ４に音声信号ｓ１が含まれてなく、かつ、送話信号ｓ４にエコー信号ｅｓが含まれているとき（受話信号ｓ２があるとき）、フィルタ係数Ｆを算出（更新）する。そのため、本装置１は、常にフィルタ係数を算出（更新）する従来の装置と比較して、フィルタ係数Ｆの算出（更新）の処理負荷を低減する。

さらに、以上説明した実施の形態によれば、切替部４０は、送話信号ｓ４に音声信号ｓ１が含まれず、かつ、送話信号ｓ４にエコー信号ｅｓが含まれているとき（受話信号ｓ２があるとき）、各個別送話信号ｓ４１－ｓ４６を切り替えながら制御部５０に入力する。制御部５０は、複数のマイクロホン３ａ－３ｆそれぞれからの信号に基づいて、各マイクロホン３ａ－３ｆに対応する個別フィルタ係数ｋ１－ｋ６を算出する。すなわち、本装置１は、切替部４０により個別送話信号ｓ４１－ｓ４６を切り替えながら、個別フィルタ係数ｋ１－ｋ６を算出する。そのため、本装置１は、共通する１つのＦＩＲフィルタ（除去信号生成部７０）により６つのマイクロホン３ａ－３ｆに対応する個別フィルタ係数ｋ１－ｋ６を算出することができる。つまり、本装置１は、簡易な回路構成で複数のマイクロホン３に対応する個別フィルタ係数ｋを算出し、同個別フィルタ係数ｋに基づいてフィルタ係数Ｆを算出する。その結果、本装置１は、簡易な回路構成で複数のマイクロホン３からの信号に含まれるエコー信号ｅｓを除去する。

さらにまた、以上説明した実施の形態によれば、制御部５０は、受話信号ｓ２と、個別エコー除去信号ｓ６０に含まれる個別残留エコー信号ｒｅｓ１０と、に基づいて、個別フィルタ係数ｋを算出する。すなわち、本装置１は、個別残留エコー信号ｒｅｓ１０が限りなく「０」に近づくように繰り返し個別フィルタ係数ｋを算出することにより、フィルタ係数Ｆの精度を向上させて、送話信号ｓ４から確実にエコー信号ｅｓを除去（抑制）する。

さらにまた、以上説明した実施の形態によれば、制御部５０は、複数のマイクロホン３ａ－３ｆそれぞれに対応するゲイン値ｇ１－ｇ６に基づいて、個別フィルタ係数ｋ１－ｋ６を更新する。そのため、本装置１は、各マイクロホン３ａ－３ｆがエコー成分を収音したときのゲイン値ｇ１－ｇ６で個別フィルタ係数ｋ１－ｋ６を算出することができる。その結果、本装置１は、フィルタ係数Ｆの精度を向上させて、送話信号ｓ４から確実にエコー信号ｅｓを除去（抑制）することができる。

さらにまた、以上説明した実施の形態によれば、制御部５０は、エコー信号除去処理（ＳＴ３）において常にＥＲＬを測定する。次いで、制御部５０は、ＥＲＬが基準値（閾値Ｖ２）以上、かつ、送話信号ｓ４に音声信号ｓ１が含まれていないとき、記憶部６０に記憶されているフィルタ係数Ｆを更新する。すなわち、本装置１は、ＥＲＬが悪化したタイミングで環境変化を検知し、フィルタ係数Ｆを更新する。つまり、本装置１は、常にフィルタ係数Ｆを算出（更新）する従来の装置と比較して、フィルタ係数Ｆの算出（更新）の処理負荷を低減する。

さらにまた、以上説明した実施の形態によれば、制御部５０は、ＥＲＬと基準値（閾値Ｖ２）との比較結果に基づいて、個別ＥＲＬを測定する。その結果、本装置１は、ＥＲＬが悪化したとき、各マイクロホン３ａ－３ｆに対応するＥＲＬの測定結果から、フィルタ係数Ｆのずれ（エコー信号ｅｓの除去・抑制効果の悪化）を検出する。

さらにまた、以上説明した実施の形態によれば、制御部５０は、個別ＥＲＬと個別基準値（閾値Ｖ４）との比較結果に基づいて、複数のマイクロホン３ａ－３ｆの中から個別フィルタ係数ｋの更新の対象となる特定マイクロホンを決定する。すなわち、本装置１は、ＥＲＬが悪化したとき、特定マイクロホンを決定することにより、個別フィルタ係数ｋの更新と、フィルタ係数Ｆの更新と、に必要な時間、処理負荷を低減する。

さらにまた、以上説明した実施の形態によれば、制御部５０は、特定マイクロホンの個別フィルタ係数ｋを算出する。次いで、制御部５０は、算出した特定マイクロホンの個別フィルタ係数ｋと、非特定マイクロホンの個別フィルタ係数ｋと、に基づいて、記憶部６０に記憶されているフィルタ係数Ｆを更新する。そのため、本装置１は、特定マイクロホンの個別フィルタ係数ｋのみを算出（更新）することにより、フィルタ係数Ｆを更新する。すなわち、本装置１は、個別フィルタ係数ｋの更新と、フィルタ係数Ｆの更新と、に必要な時間、処理負荷を低減する。

さらにまた、以上説明した実施の形態によれば、制御部５０は、マイクロホン３ごとの環境測定を実行して、同環境測定の測定結果に基づいて、個別フィルタ係数ｋを算出する。そのため、本装置１は、本装置１を設置する部屋（空間）の環境に応じて、フィルタ係数Ｆを算出することができる。

このように、以上説明した実施の形態によれば、本装置１は、初期化処理（ＳＴ１）と初期学習処理（ＳＴ２）とに基づいてフィルタ係数Ｆを算出し、同フィルタ係数Ｆに基づいてエコーキャンセルを実行する（エコー信号除去処理（ＳＴ３）を実行する）。本装置１は、エコー信号除去処理（ＳＴ３）の実行中に環境変化を検知すると、特定処理（ＳＴ４）と更新処理（ＳＴ５）とを実行することにより、フィルタ係数Ｆの自動調整を実現する。その結果、本装置１は、共通する１つのフィルタにより多チャンネルのエコーキャンセルを実行すると共に、環境変化に対して自動的に追従してエコーキャンセルを実行する。

なお、第２入力部に接続されるマイクロホンの数は、複数であればよく、「６」に限定されない。

また、以上説明した実施の形態では、本装置１は、１組の除去信号生成部７０と除去部８０とを備える構成であった。そのため、除去信号生成部７０は、特定処理（ＳＴ４）や更新処理（ＳＴ５）において、個別除去信号ｓ５０の生成に専有される。その結果、本装置１は、エコー信号除去処理（ＳＴ３）と、特定処理（ＳＴ４）や更新処理（ＳＴ５）と、を同時に実行しない。

これに代えて、本装置は、エコー信号除去処理に用いられる１組の除去信号生成部と除去部と、特定処理と更新処理とに用いられる１組の除去信号生成部と除去部と、の２組の除去信号生成部と除去部とを備えてもよい。

図１２は、本装置の別の実施の形態を示す機能ブロックである。
同図は、本装置１Ａが、第１除去信号生成部７０Ａと、第２除去信号生成部７０Ｂと、第１除去部８０Ａと、第２除去部８０Ｂと、を有してなる音声信号処理装置であることを示す。第１除去信号生成部７０Ａと第１除去部８０Ａとは、特定処理（ＳＴ４）と更新処理（ＳＴ５）とを実行する。第２除去信号生成部７０Ｂと第２除去部８０Ｂとは、エコー信号除去処理（ＳＴ３）を実行する。

この構成によれば、本装置１Ａは、エコー信号除去処理（ＳＴ３）と、特定処理（ＳＴ４）と更新処理（ＳＴ５）と、を同時に実行することができる。そのため、本装置１Ａは、２つのエコーキャンセラ部を備える簡易な回路構成で、２以上のマイクロホン３からの信号に含まれるエコー信号ｅｓを除去（抑制）することができる。

１音声信号処理装置
１Ａ音声信号処理装置
２０第１出力部（出力部）
３０第２入力部（入力部）
４０切替部
５０制御部
６０記憶部
７０除去信号生成部
７０Ａ第１除去信号生成部
７０Ｂ第２除去信号生成部
８０除去部
８０Ａ第１除去部
８０Ｂ第２除去部
ｓ１音声信号
ｓ２受話信号
ｓ３基準信号
ｓ４送話信号
ｓ４０個別送話信号
ｓ５除去信号
ｓ５０個別除去信号
ｓ６エコー除去信号
ｓ６０個別エコー除去信号
ｅｓエコー信号
ｒｅｓ残留エコー信号
ｒｅｓ１０個別残留エコー信号
Ｆフィルタ係数
ｋ個別フィルタ係数

Claims

受話信号を出力する出力部と、
前記受話信号のエコー成分と、話者の音声と、を収音して、前記エコー成分に応じたエコー信号と、前記話者の音声に応じた音声信号と、を生成する複数のマイクロホンそれぞれから入力される信号を合成して送話信号を生成する入力部と、
前記送話信号に含まれる前記エコー信号を除去する除去信号をフィルタ係数に基づいて生成する除去信号生成部と、
前記複数のマイクロホンそれぞれに対応する個別フィルタ係数を算出し、前記個別フィルタ係数を合成して前記フィルタ係数を算出する制御部と、
前記送話信号と前記除去信号とに基づいて、エコー除去信号を生成する除去部と、
前記フィルタ係数を記憶する記憶部と、
を有してなる音声信号処理装置であって、
前記受話信号は、前記音声信号処理装置が設置されている拠点と異なる他拠点の話者の音声に応じた信号であり、
前記制御部は、前記送話信号に前記エコー信号が含まれていて、かつ、前記送話信号に前記音声信号が含まれていないとき、前記フィルタ係数を更新する、
ことを特徴とする音声信号処理装置。
前記除去信号生成部は、前記受話信号と前記フィルタ係数とに基づいて、前記除去信号を生成する、
請求項１記載の音声信号処理装置。
前記記憶部は、基準値を記憶し、
前記制御部は、
前記送話信号の信号レベルと、前記エコー除去信号の信号レベルと、に基づいて、エコーリターンロスを測定し、
前記エコーリターンロスと、前記基準値と、の比較結果に基づいて、前記フィルタ係数を更新する、
請求項１記載の音声信号処理装置。
前記制御部は、前記比較結果に基づいて、前記複数のマイクロホンそれぞれに対応する個別エコーリターンロスを測定する、
請求項３記載の音声信号処理装置。
前記記憶部は、個別基準値、を記憶し、
前記制御部は、
前記複数のマイクロホンごとに、前記個別エコーリターンロスと、前記個別基準値と、を比較し、
前記個別エコーリターンロスと、前記個別基準値と、の比較結果に基づいて、前記複数のマイクロホンの中から前記個別フィルタ係数の更新の対象となる特定マイクロホンを決定する、
請求項４記載の音声信号処理装置。
前記複数のマイクロホンは、
前記特定マイクロホンと、
前記特定マイクロホンとは異なる非特定マイクロホンと、
で構成され、
前記除去信号生成部は、前記特定マイクロホンからの信号に含まれる前記エコー信号を除去する特定除去信号を、前記特定マイクロホンに対応する前記個別フィルタ係数に基づいて生成し、
前記除去部は、前記特定マイクロホンからの信号と、前記特定除去信号と、に基づいて、特定エコー除去信号を生成し、
前記制御部は、
前記受話信号と、前記特定エコー除去信号に含まれる個別残留エコー信号と、に基づいて、前記特定マイクロホンに対応する前記個別フィルタ係数を算出し、
前記非特定マイクロホンに対応する前記個別フィルタ係数と、前記特定マイクロホンに対応する前記個別フィルタ係数と、に基づいて、前記記憶部に記憶されている前記フィルタ係数を更新する、
請求項５記載の音声信号処理装置。
受話信号を出力する出力部と、
前記受話信号のエコー成分と、話者の音声と、を収音して、前記エコー成分に応じたエコー信号と、前記話者の音声に応じた音声信号と、を生成する複数のマイクロホンそれぞれから入力される信号を合成して送話信号を生成する入力部と、
前記送話信号に含まれる前記エコー信号を除去する除去信号をフィルタ係数に基づいて生成する除去信号生成部と、
前記複数のマイクロホンそれぞれに対応する個別フィルタ係数を算出し、前記個別フィルタ係数を合成して前記フィルタ係数を算出する制御部と、
前記送話信号と前記除去信号とに基づいて、エコー除去信号を生成する除去部と、
前記フィルタ係数を記憶する記憶部と、
を備える音声信号処理装置により実行される音声信号処理方法であって、
前記受話信号は、前記音声信号処理装置が設置されている拠点と異なる他拠点の話者の音声に応じた信号であり、
前記制御部が、前記送話信号に前記エコー信号が含まれていて、かつ、前記送話信号に前記音声信号が含まれていないとき、前記フィルタ係数を更新する、
ことを特徴とする音声信号処理方法。
前記記憶部は、基準値と個別基準値と、を記憶し、
前記制御部が、前記複数のマイクロホンごとに、
前記送話信号の信号レベルと、前記エコー除去信号の信号レベルと、に基づいて、エコーリターンロスを測定し、
前記エコーリターンロスと、前記基準値と、の比較結果に基づいて、前記複数のマイクロホンそれぞれに対応する個別エコーリターンロスを測定し、
前記個別エコーリターンロスと、前記個別基準値と、の比較結果に基づいて、前記複数のマイクロホンの中から前記個別フィルタ係数の更新の対象となる特定マイクロホンを決定して、
前記フィルタ係数を更新する、
請求項７記載の音声信号処理方法。