JP4383416B2

JP4383416B2 - ハウリング防止方法、装置、プログラム、及びこのプログラムを記録した記録媒体

Info

Publication number: JP4383416B2
Application number: JP2006036529A
Authority: JP
Inventors: 和則小林; 賢一古家; 陽一羽田; 章俊片岡
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2006-02-14
Filing date: 2006-02-14
Publication date: 2009-12-16
Anticipated expiration: 2026-02-14
Also published as: JP2007221219A

Description

本発明は、ＴＶ会議や音声会議などハンズフリー通信のハウリング防止方法、装置、プログラム及び記録媒体に関する。

従来技術のハウリング防止装置について説明する。
図１２は特許文献１で開示された従来技術のハウリング防止装置の構成図である。従来技術のハウリング防止装置は、減衰量算出部７０２と、送受話判定部７０３と、減衰量制御部７０４と、受話側の減衰器７０１Ｒと、送話側の減衰器７０１Ｓと、音響結合量推定部７０５により構成される。
本ハウリング防止装置は、スピーカとマイクロホンを用いた拡声通話において生じるハウリングを防止する。入力信号は、通話相手から受信信号である受話信号と、自地点のマイクロホンで受音した信号であるマイク受音信号であり、出力信号は、自地点のスピーカから出力する信号であるスピーカ出力信号と、通話相手への送話信号である。本装置は、受話信号に減衰を与えてスピーカ出力信号とし、マイク受音信号に減衰を与えて送話信号とすることで、受話端ＴＲから送話端ＴＳまでの利得を１以下に抑えてハウリングを防止する装置である。

以下に、本装置の詳細について述べる。
音響結合量推定部７０５は、スピーカとマイク間の伝達関数の振幅値である音響結合量Ａ（Ω）を求める。スピーカ出力信号とマイク受音信号をそれぞれ周波数領域変換し、変換後の信号の絶対値の比をとって、音響結合量Ａ（Ω）を求める。スピーカ出力信号の周波数領域変換をＸ（Ω）、マイク受音信号の周波数領域変換をＹ（Ω）とした場合、音響結合量Ａ（Ω）は式（１）により求められる。
Ａ（Ω）＝｜Ｙ（Ω）｜／｜Ｘ（Ω）｜式（１）
ただし、｜・｜は絶対値を表し、Ωは周波数領域変換の帯域分割に対応する離散的な周波数を表す。

減衰量算出部７０２は、音響結合量Ａ（Ω）を入力とし、ハウリングを起こさない減衰量を算出する。
ハウリングを起こさない減衰量は、音響結合量Ａ（Ω）から以下のように求められる。ハウリングを起こさないための十分条件は、すべての周波数に対して受話端ＴＲから送話端ＴＳまでの伝達関数の振幅が１未満となることである。また、送話側の減衰器７０１Ｓのゲインをｇ_ｓとし、受話側の減衰器７０１Ｒのゲインをｇ_ｒとすれば、トータルでのゲインはＧ＝ｇ_ｓ・ｇ_ｒとなる。したがってハウリングを起こさないための十分条件は式（２）で表される。

Ｇ・ＭＡＸ_Ω｛Ａ（Ω）｝＜１式（２）
ただし、ＭＡＸ_Ω｛・｝はΩについて最大値をとることを表す。
したがって、ハウリングを起こさないための減衰量は式（３）で表される。
Ｇ＝ｇ_ｓ・ｇ_ｒ＝Ｃ／ＭＡＸ_Ω｛Ａ（Ω）｝式（３）
ただし、Ｃは１未満の定数であり、あらかじめ与えられる。
送受話判定部７０３は、受話信号とマイク受音信号より、送受話の判定をする。受話検出は、受話信号のレベルを観測し、そのレベルからあらかじめ与えた固定閾値と、受話雑音レベルを定数倍した閾値を越えた場合に受話と判定する。送話検出は、マイク受音信号のレベルを観測し、そのレベルがあらかじめ与えた固定閾値と送話雑音レベルを定数倍した閾値を越え、さらに、音響結合量Ａ（Ω）にスピーカ出力信号の絶対値｜Ｘ（Ω）｜を乗じた推定音響エコーレベルを定数倍した閾値を越えた場合に送話と判定する。送話、受話が両方とも検出されない無音区間や、送話、受話が両方とも検出されるダブルトーク区間は、その前の送受話判定状態などから送話か受話のどちらかに判定を行う。また、送受話判定の頻繁な切り替わりを防ぐため、ハングオーバー時間を設け、送話判定状態または受話判定状態をある一定時間保持するようにする。

減衰量制御部７０４は、減衰量算出部７０２で求められたハウリングを起こさないトータルでのゲインＧと、送受話判定部７０３で判定された送受話判定結果から、トータルでのゲインを送話側のゲインｇ_ｓ＝１、受話側のゲインｇ_ｒ＝Ｇとし、受話と判定された場合には、送話側のゲインｇ_ｓ＝Ｇ、受話側のゲインｇ_ｒ＝１とする。
受話側の減衰器７０１Ｒは受話側のゲインｇ_ｒを受話信号に常時、スピーカ出力信号を得る。受話側の減衰器７０１Ｓは送話側のゲインｇ_ｓをマイク受音信号に乗じ、送話信号を得る。

これにより送話の場合にはマイク受音信号をそのまま通過させ送話信号とし、受話の場合には受話信号をそのまま通過させスピーカ出力信号とすることができ、シングルトークの場合にはスムーズな会話が可能となる。また、ゲインの不連続な変化は、音質の劣化を生じさせるので、ゲインは、時間的に滑らかに変化するように動作させている。
特許第３２６８５７２号明細書

しかし、従来技術のハウリング防止方法では、必ず送話か受話のいずれか一方に減衰が与えられるため、送話音声と受話音声が同時に存在するダブルトーク時に、いずれか一方の音声が設定した減衰量だけレベルが小さくなり、音声の切断感が生じてしまう。これにより双方向通話性能が著しく低下する。
図７Ｂにその様子を示す。図中ＡＲは受話信号、ＡＳは送話信号を示す。図示する例では送話信号ＡＳ系に減衰が与えられた場合を示す。送話系に減衰が与えられることにより送話信号ＡＳの全体がレベルの低下を来し、これにより音声の切断感が生じる。

本発明の目的は送話音声と受話音声が同時に存在するダブルトーク時の双方向通話性能を向上するハウリング防止方法及びこの方法を適用して動作するハウリング防止装置を提供しようとするものである。

この発明によるハウリング防止方法は、受話信号を２以上Ｎ個の周波数成分に変換する第１周波数領域変換処理と、マイク受音信号を２以上Ｎ個の周波数成分に変換する第２周波数領域変換処理と、第１周波数領域変換処理で周波数成分に変換された受話信号を各周波数帯域ごとに設定された減衰量に従って減衰させる受話側減衰処理と、第２周波数領域変換処理で周波数成分に変換されたマイク受音信号を各周波数帯域ごとに設定された減衰量に従って減衰させる送話側減衰処理と、受話側減衰処理された受話信号をスピーカ出力信号に変換する第１逆周波数変換処理と、送話側減衰処理されたマイク受音信号を送話信号に変換する第２逆周波数変換処理と、スピーカ出力信号をＮ個の周波数成分に変換する処理を実行する第３周波数領域変換処理と、第２周波数領域変換処理で得られたマイク受音信号の各周波数成分と第３周波数領域変換処理で得られたスピーカ出力信号の各周波数成分とによってスピーカとマイク間の各周波数帯域ごとの音響結合量を推定する音響結合量推定処理と、この音響結合量推定処理で得られた音響結合量から、第１周波数領域変換処理及び第２周波数領域変換処理で得られた各周波数帯域ごとに受話端から送話端までの伝達関数の振幅が１未満となる減衰量を算出する減衰量算出処理と、第１周波数領域変換処理で周波数領域に変換された受話信号により周波数帯域ごとに受話状態を判定し、第２周波数領域変換処理で周波数領域に変換されたマイク受音信号と、第３周波数領域変換処理で周波数領域に変換されたスピーカ出力信号と、音響結合量とにより周波数帯域ごとに送話状態を判定する送受話判定処理と、送受話判定処理の判定結果が送話と判定された周波数帯域では受話側減衰処理に設定する減衰量を減衰量算出処理で算出された減衰量に、送話側減衰処理に設定する減衰量をゼロにそれぞれ設定し、送受話判定結果が受話と判定された周波数帯域では受話側減衰処理に設定する減衰量をゼロに、送話側減衰処理に設定する減衰量を減衰量算出処理で算出された減衰量にそれぞれ設定する減衰量制御処理とを実行する。

そして受話側減衰処理と送話側減衰処理に与える減衰量を、第１周波数領域変換処理及び第２周波数領域変換処理のそれぞれにおいて、各周波数領域ごとの周波数領域変換特性に起因して互いに隣接する周波数領域の各境界部分で発生する利得上昇特性を抑圧する周波数特性を持つ減衰量に補正する減衰量補正処理を付加したことを特徴とする。
更に、本発明によるハウリング防止方法は前記記載のハウリング防止方法において、第１周波数領域変換処理で周波数領域に変換された受話信号から受音信号の全帯域での平均レベルを求め、第２周波数変換処理で周波数領域に変換されたマイク受音信号からマイク受音信号の全帯域での平均レベルを求め、受話信号の全帯域での平均レベルに予め設定した０から１の間の固定値である正規化係数を乗じた値とマイク受音信号の全帯域での平均レベルとを加算したものを受話側正規化重みとして算出し、マイク受音信号の全帯域での平均レベルに正規化係数を乗じた値と受話信号の全帯域での平均レベルとを加算したものを送話側正規化重みとして算出する正規化重み算出処理を更に有し、
周波数帯域ごとの送受話判定処理は、第１周波数変換処理で周波数領域に変換された受話信号を受話側正規化重みで正規化した信号と、第２周波数領域変換処理で周波数領域に変換されたマイク受音信号を送話側正規化重みで正規化した信号とにより、周波数帯域ごとに送話状態であるか受話状態であるかを判定することを特徴とする。

更に、本発明によるハウリング防止方法によれば前記何れかに記載のハウリング防止方法において、第１周波数領域変換処理で周波数領域に変換された受話信号と、第２周波数領域変換処理で周波数領域に変換されたマイク受音信号から、全帯域での送受話状態を判定するフルバンド送受話判定処理を付加し、フルバンド送受話判定処理の判定結果が送話の場合には、周波数帯域ごとの送受話判定処理はマイク受音信号を強調して検出処理を実行し、フルバンド送受話判定処理の判定結果が受話の場合には、周波数帯域ごとの送受話判定処理は受話信号を強調して検出処理することを特徴とする。

本発明によれば、送話と受話の信号に対し、帯域別にハウリング防止のための減衰量を与えることで、送話音声と受話音声の両方が存在するダブルトーク区間においても、ハウリング防止をしながら、音声レベルの変動を抑え、高品質な双方向通信を行うことが可能である。
さらに本発明によれば、周波数領域変換部の周波数特性が理想的でないことによるハウリング抑圧性能の低下を防ぐことができる。更に本発明によれば、送受話音声のどちらか一方が大きいレベルであるような場合でも、送受話検出を正確に行うことができる。更に本発明によれば送受話のうち、どちらか一方だけ音声が存在するシングルトーク時の音質を改善することができ、送受話で雑音のみが存在する無音区間における、雑音の音質を改善することができる。更に本発明によれば、演算する帯域数を削減し、演算量を削減するこができる。

本発明によるハウリング防止方法及びこのハウリング防止方法を適用して動作するハウリング防止装置を実現するには、ハードウェアによって構成することも可能であるが、最も簡素に実現するにはコンピュータに本発明で提案するハウリング防止プログラムをインストールし、コンピュータに本発明によるハウリング防止プログラムを実行させ、コンピュータにハウリング防止装置として機能させる形態が最良の実施形態である。

図１に本発明によるハウリング防止方法を適用して動作するハウリング防止装置の実施例を示す。この実施例では受話端ＴＲに入力される受話信号を２以上Ｎ個の周波数成分に変換する周波数領域変換処理を実行する第１周波数領域変換部１０１Ｒと、
マイク受音信号を２以上N個の周波数成分に変換する周波数領域変換処理を実行する第２周波数領域変換部１０１Ｓと、
第１周波数領域変換部１０１Ｒで周波数成分に変換された受話信号を各周波数帯域ごとに設定された減衰量に従って減衰させる受話側減衰処理を実行する受話側減衰部ＡＴＴ−１と、
第２周波数領域変換部１０１Ｓで周波数成分に変換されたマイク受音信号を各周波数帯域ごとに設定された減衰量に従って減衰させる送話側減衰部ＡＴＴ−２と、
受話側減衰部ＡＴＴ−１により減衰処理された受話信号をスピーカ出力信号に変換する逆周波数領域変換処理を実行する第１逆周波数領域変換部１０２Ｒと、
送話側減衰部ＡＴＴ−２により減衰処理された送話信号を逆周波数領域変換処理して送話端ＴＳから送話信号を出力する第２逆周波数領域変換部１０２Ｓと、
スピーカ出力信号をＮ個の周波数成分に変換する処理を実行する第３周波数領域変換部１０７と、
第２周波数領域変換部１０１Ｓで得られたマイク受音信号の各周波数成分と、第３周波数領域変換部１０７で得られたスピーカ出力信号の周波数成分とによってスピーカとマイク間の各周波数ごとの音響結合量を推定する音響結合量推定部１０８_１〜１０８_Ｎと、
この音響結合量推定部で１０８_１〜１０８_Ｎで得られた音響結合量から、第１周波数領域変換部１０１Ｒ及び第２周波数領域変換部１０１Ｒで得られた各周波数帯域ごとに受話端ＴＲと送話端ＴＳまでの伝達関数の振幅が１未満となる減衰量を算出する減衰量算出部１０４_１〜１０４_Ｎと、
第１周波数領域変換部１０１Ｒで周波数領域に変換された受話信号と、第２周波数領域変換部１０１Ｓで周波数領域に変換されたマイク受音信号と、スピーカ出力信号を周波数領域に変換する第３周波数領域変換部１０７で周波数領域に変換されたスピーカ出力信号と、音響結合量とにより周波数帯域ごとに送話状態及び受話状態を判定する送受話判定部１０５_１〜１０５_Ｎと、
この送受話判定部１０５_１〜１０５_Ｎの判定結果が送話と判定された周波数領域では受話側減衰部ＡＴＴ−１に設定する減衰量を減衰量算出部１０４_１〜１０４_Ｎで算出した減衰量に設定し、送話側減衰部ＡＴＴ−２に設定する減衰量をそれぞれ設定し、送受話判定結果が受話と判定された周波数帯域では受話側減衰部ＡＴＴ−１に設定する減衰量をゼロに、送話側減衰部ＡＴＴ−２に設定する減衰量を減衰量算出部１０４_１〜１０４_Ｎで算出された減衰量にそれぞれ設定する減衰量制御部１０６_１〜１０６_Ｎとによって構成するものである。

本実施例のハウリング防止装置の入力信号は、電話相手から受話端ＴＲに入力される受話信号と、自地点のマイクロホンで受音した信号であるマイク受音信号である。出力信号は、自地点のスピーカから出力する信号であるスピーカ出力信号と、送話端ＴＳから通話相手へ送話される送話信号である。各入力信号は、ＡＤ変換（特に図示しない）により、アナログ信号から離散時間の信号に変換され、各出力信号は、離散時間信号からＤＡ変換（特に図示しない）によりアナログ信号に変換されている。
本実施例では、マイク受音信号と受話信号をそれぞれＮ個の周波数帯域信号に分割し、周波数帯域ごとで送受話の判定を行う。ただし、Ｎは２以上の整数である。この周波数帯域ごとの送受話判定結果に基づいて、周波数帯域ごとの減衰量の制御を行う。この周波数帯域ごとの処理により、受話側の信号が大きい帯域では、受話側の減衰部ＡＴＴ−１のゲインが１（減衰量がゼロの状態）になり、送話側の信号が大きい帯域では、送話側の減衰部ＡＴＴ−２のゲインが１になる。このような減衰量の設定によって、受話音声と送話音声が同時に存在するダブルトーク期間であっても、音声レベルの減衰を抑え、双方向通話性能を向上させることができる。

以下に、本実施例の処理の詳細を述べる。
第１周波数領域変換部１０１Ｒは、受話信号をＮ個の周波数成分に変換する。周波数領域への変換はフーリエ変換や帯域分割フィルタバンクにより行なうことができる。変換後の受話信号はＲ（Ω）で表される。ただし、Ωは、周波数領域変換でのＮ個の周波数帯域の中心周波数ω_０〜ω_Ｎ−１に対応した離散的な周波数であり、ω_０〜ω_Ｎ−１の離散値をとる。この周波数領域変換は、１サンプル以上の複数サンプルごとに行われる。この周波数領域変換が行われる間隔を１フレームと表す。このような処理により、１フレームごとに、周波数領域に変換された受話信号Ｒ（Ω）が得られる。

第２周波数領域変換部１０１Ｓは、第１周波数領域変換部１０１Ｒと同様の処理によりマイク受音信号をＮ個の周波数成分に変換する。変換後のマイク受音信号はＹ（Ω）で表される。
スピーカ出力信号の第３周波数領域変換部１０７は、受話側の第１周波数領域変換部１０１Ｒと同様の処理によりスピーカ出力信号をＮ個の周波数成分に変換する。変換後のスピーカ出力信号はＸ（Ω）で表される。
周波数帯域ごとに設けられた音響結合量推定部１０８_１〜１０８_Ｎは、周波数帯域ごとの音響結合量Ａ（Ω）を求める。音響結合量とは、スピーカとマイク間の伝達関数の振幅値であり、周波数領域変換後のスピーカ出力信号Ｘ（Ω）とマイク受音信号Ｙ（Ω）の絶対値の比で求められる。スピーカ出力信号の周波数領域変換結果をＸ（Ω）、マイク受音信号の周波数領域変換結果をＹ（Ω）とした場合、音響結合量Ａ（Ω）は式（４）により求められる。

Ａ（Ω）＝｜Ｙ（Ω）｜／｜Ｘ（Ω）｜式（４）
ただし、｜・｜は絶対値を表す。
さらに、音響結合量の精度を向上するために、音響結合量Ａ（Ω）の時間平滑化を行う。
周波数帯域ごとに設けられた減衰量算出部１０４_１〜１０４_Ｎは、音響結合量推定部１０８_０〜１０８_Ｎで求められた音響結合量Ａ（Ω）からハウリングを起こさない減衰量を算出する。

ハウリングを起こさない減衰量は、音響結合量Ａ（Ω）から以下のように求められる。ハウリングを起こさないための十分条件は、すべての周波数に対して受話端ＴＲから送話端ＴＳまでの伝達関数の振幅が１未満になることである。また、周波数帯域ごとの送話側の減衰部ＡＴＴ−２のゲインをｇ_ｓ（Ω）とし、周波数帯域ごとの受話側減衰部ＡＴＴ−１のゲインをｇ_ｒ（Ω）とすれば、トータルでのゲインはＧ（Ω）＝ｇ_ｓ（Ω）・ｇ_ｒ（Ω）となる。したがってハウリングを起こさないための十分条件は音響結合量Ａ（Ω）とトータルでのゲインＧ（Ω）が１未満となることであり、式（５）で表される。

Ｇ（Ω）・Ａ（Ω）＜１式（５）
したがって、ハウリングを起こさないための減衰量Ｇ（Ω）は式（６）で表される。
Ｇ（Ω）＝ｇ_ｓ（Ω）・ｇ_ｒ（Ω）-＝Ｃ／Ａ（Ω）式（６）
ただし、Ｃは１未満の定数であり、あらかじめ与えられる。また、Ｃを周波数ごとで異なる値に設定してＣ（Ω）としてもよい。
周波数帯域ごとに設けられた送受話判定部１０５_１〜１０５_Ｎは、周波数領域に変換された受話信号Ｒ（Ω）と、マイク受音信号Ｙ（Ω）と、スピーカ出力信号Ｘ（Ω）と、音響結合量Ａ（Ω）より、周波数帯域ごとで送受話の判定をする。

受話検出は、受話信号Ｒ（Ω）の周波数ごとのレベルＰ_R（Ω）を観測し、そのレベルがあらかじめ与えた固定閾値Ｔ_R（Ω）と受話信号Ｒ（Ω）の雑音レベルＮ_R（Ω）にあらかじめ設定した１以上の定数Ｂを乗じた閾値Ｔ_ＮＲ（Ω）の両方を越えた場合に受話と判定する。この判定条件を式で示せば、式（７）と式（８）の条件を両方満たす場合に受音と判定する。また、この判定は周波数帯域ごとに行われ、周波数帯域ごとに判定結果が得られる。
Ｐ_R（Ω）＞Ｔ_R（Ω）式（７）
Ｐ_R（Ω）＞Ｔ_ＮＲ（Ω）＝Ｂ・Ｎ_R（Ω）式（８）
ここで受話信号のレベルＰ_R（Ω）は、受話信号Ｒ（Ω）の瞬時レベル｜Ｒ（Ω）｜や、瞬時レベル｜Ｒ（Ω）｜を時間平滑化して計算される。時間平滑化を用いた受話信号レベルは、例えば式（９）により計算される。‖
Ｐ_R（Ω）＝ｗ・Ｐ'_Ｒ（Ω）＋（１−ｗ）・｜Ｒ（Ω）｜式（９）
ただし、ｗは０から１までのあらかじめ与えられる定数であり、Ｐ'_Ｒ（Ω）は、１フレーム前の受話信号レベルであり、｜・｜は絶対値をとることを意味する。ノイズレベルＮ_Ｒ（ｔ）は、受話レベルＰ_Ｒ（Ω）の最小値保持（ディップホールド）をすることで推定することができる。これは、例えば式（１０）を用いて行われる。

N_R(Ω)＝P_R(Ω) for N'_R(Ω)＞P_R(Ω)
N_R(Ω)＝u・N'_R(Ω)＋(1＋u)・P_R(Ω) for N'_R(Ω)＞P_R(Ω) 式（１０）
uは推定ノイズレベル上昇時の平滑化係数であり０から１までの値をとり、あらかじめ設定される。uが１に近いと緩やかなノイズレベル上昇となり、ディップホールドの効果が得られる。Ｎ'_R(Ω)は、１時刻前の受話信号レベルである。
次に送話検出は、マイク受音信号Ｙ（Ω）の周波数ごとのレベルR_Y(Ω)を観測し、そのレベルがあらかじめ与えた固定閾値Ｔ_Y(Ω)と、マイク受音信号Ｙ（Ω）の雑音レベルＮ_Y(Ω)にあらかじめ設定した１以上の定数Dを乗じた閾値T_NY(Ω)の両方を越え、さらに、音響結合量A(Ω)にスピーカ出力信号のレベルP_X(Ω)を乗じた推定音響エコーレベルP_E(Ω)に、あらかじめ設定した定数Eを乗じた閾値T_EY(Ω)を越えた場合に送話と判定する。この判定条件を式で示せば、式（１１）と式（１２）と式（１３）の全ての条件を満たす場合に送話と判定する。

また、この判定は周波数帯域ごとに行われ、周波数帯域ごとに判定結果が得られる。
P_Y(Ω)＞Ｔ_Y(Ω) 式（１１）
P_Y(Ω)＞Ｔ_NY(Ω)＝D・N_Y(Ω) 式（１２）
P_Y(Ω)＞Ｔ_EY(Ω)＝E・A(Ω)・P_X(Ω) 式（１３）
ここで、レベルP_Y(Ω)とP_X(Ω)と雑音レベルN_Y(Ω)は、受話判定と同様にして求められる。
送話、受話が両方とも検出されない無音区間や、送話、受話が両方とも検出されるダブルトーク区間は、その前の送受話判定状態を保持するなどして、送話か受話のどちらかに判定を行う。また、送受話判定の頻繁な切り替わりを防ぐため、ハングオーバー時間を設け、送話判定状態または受話判定状態をある一定時間保持するようにする。

周波数帯域ごとに設けられた減衰量制御部１０６_１〜１０６_Nは、減衰量算出部１０４_１〜１０４_Nで求められた周波数帯域ごとのハウリングを起こさないトータルでのゲインG(Ω)と、送受話判定部１０５_１〜１０５_Nで判定された送受話判定結果から、トータルでのゲインＧ（Ω）を送話側減衰部ＡＴＴ−２のゲインｇ_ｓ（Ω）と受話側減衰部ＡＴＴ−１のゲインｇ_ｒ（Ω）に配分する。送話と判定された場合には、送話側のゲインｇ_ｓ（Ω）＝１、受話側のゲインｇ_ｒ（Ω）＝Ｇ（Ω）＜１とし、受話と判定された場合には、送話側のゲインｇ_ｓ（Ω）＝Ｇ（Ω）＜１、受話側のゲインｇ_ｒ（Ω）＝１（Ω）とする。この送受話の減衰量の減衰量の設定は周波数帯域ごとに行われる。また、ゲインの不連続な変化は、音質の劣化を生じさせるので、ゲインは、時間的に滑らかに変化するようにする。例えば、時間平滑化後の送話側ゲインg'_s(Ω)は以下の式を用いて求められる。

g'_s(Ω)＝ｖ・g''_s(Ω)＋（１−ｖ）・g_s(Ω) 式（１４）
ただし、g''_s(Ω)は１時刻前の時間平滑化後の送話側ゲインであり、ｖはあらかじめ設定する平滑化係数で、０から１の間の値をとる。
時間平滑化後の受話側ゲインg'_r(Ω)も、送話側と同様にして求められる。
受話側減衰部ＡＴＴ−１を構成する各減衰器１０３Ｒ_１〜１０３Ｒ_Nは、減衰量算出部１０４_１〜１０４_Nで計算された周波数帯域ごとの時間平滑化後の受話側ゲインg'_r(Ω)を、周波数領域変換後の受話信号Ｒ（Ω）に、周波数帯域ごとに乗算する。

送話側の減衰部ＡＴＴ−２を構成する各減衰器１０３Ｓ_１〜１０３Ｓ_Nは、減衰量算出部１０４_１〜１０４_Nで計算された周波数帯域ごとの時間平滑化後の送話側ゲインg'_s(Ω)を、周波数領域変換後のマイク受音信号Ｙ（Ω）に、周波数帯域ごとで乗算する。
第１逆周波数領域変換部１０２Ｒは、受話側の減衰器１０３Ｒ_１〜１０３Ｒ_Nの出力信号を逆周波数領域変換して、スピーカ出力信号を出力する。
第２逆周波数領域変換部１０２Ｓは、送話側の減衰器１０３Ｓ_１〜１０３Ｓ_Nの出力信号を逆周波数領域変換して、送話信号を出力する。

以上の処理により、送話音声のレベルが大きい周波数帯域は送話信号をそのまま通過させ、受話信号は減衰される。受話音声のレベルが大きい周波数帯域はその受話信号をそのまま通過させスピーカから放音される。送受話いずれかのみ音声が存在するシングルトーク、さらに送受話の両方で音声が存在するダブルトークの場合でも、音声の切断感の少ないスムーズな会話を実現することができる。
図７Ａ、図７Ｂ、図７Ｃに示すダブルトーク時の送受話音声の周波数スペクトル図から、本発明の効果を説明する。図７Ａはハウリング抑圧処理前の送受話音声の周波数スペクトルであり、図７Ｂは、従来のハウリング抑圧装置通過後の送受話音声の周波数スペクトルである。従来のハウリング抑圧装置では、送受話のいずれかにフルバンドでロスを挿入するため、図７Ｂに示すように、どちらかの音声の全体のレベルが大幅に減少し、一方の音声が聞き取りづらいレベルになってしまう。これに対し、図７Ｃに示す本発明のハウリング抑圧装置通過後の送受話音声の周波数スペクトルでは、送受話音声のレベルの低い周波数成分のみが抑圧され、レベルの高い周波数成分はそのまま出力される。これにより、音声レベルの現象は、従来のハウリング抑圧装置に比べ小さくなる。

以上示したように、本発明の第１の実施例によれば、送受話の両方で音声が存在するダブルトークの場合でも、ハウリングを防止しながら、音声の切断感の少ないスムーズな会話を実現できる。

図２は、本発明の第２の実施例であるハウリング防止装置のブロック図である。
本実施例のハウリング防止装置は、本発明の第１の実施例に、受話側の減衰量補正部２０１Ｒと、送話側の減衰量補正部２０１Ｓを追加した構成である。
受話側の減衰量補正部２０１Ｒは、周波数帯域ごとに設けられた減衰量制御部１０６_１〜１０６_Nで設定された時間平滑化後の受話側のゲインg'_r(Ω)の周波数特性を、第１及び第２周波数領域変換部１０１Ｒと第２周波数領域変換部１０１Ｓの周波数特性に基づいて、所望の減衰量が全ての帯域で実現されるように補正する。

送話側の減衰量補正部２０１Ｓは、受話側の減衰量補正部２０１Ｒと同様にして、受話側のゲインg'_r(Ω)の周波数特性を補正する。
以下に補正の詳細を説明する。
第１及び第２周波数領域変換部１０１Ｒ、１０１Ｓの各周波数帯域の周波数特性は、理想的には図１３に示すように各周波数帯域毎に矩形であれば問題は生じない（図１３では見易くするために各矩形の間に隙間を表示しているが、現実にはこの隙間は存在しない）。然し乍ら現実には図８に示すように両端がなだらかに減衰する特性を持つ。第１及び第２周波数領域変換部１０１Ｒ、１０１Ｓの周波数特性の例として、図８には、ハニング窓を乗じてからフーリエ変換したときのｋ番目の周波数帯域の周波数特性の絶対値｜Ｆ_ｋ(ω)｜を示す。この帯域の中心周波数ω_ｋを頂点にして、緩やかな減衰を持つ特性となっていることが分かる。その減衰量は、隣の帯域の中心周波数ω_ｋ−1で−１０ｄＢ、ω_ｋとω_ｋ−１の中間で−３ｄＢである。このために互いに隣接する周波数帯域の減衰特性が重なり合うことになり、周波数帯域の境界部分に利得設定値とは異なる高利得部分が発生することになる。つまり、離散的な周波数Ω（ω_０〜ω_N-1）に対して、受話側のゲインg'_r(Ω)を与えたとしても、実際に実現される連続値ωでの周波数特性は、与えた値と異なる周波数特性を呈することになる。このように、理想的でない周波数特性を持つ周波数領域変換部を用いたときに実現される周波数特性g'_s(ω)は、ｋ番目の周波数帯域の周波数特性をＦ_ｋ(ω)としたときに式（１５）と式（１６）で表される。

これら実際に実現された周波数特性g'_ｒ(ω)とg'_s(ω)を乗じた値が、全ての周波数において、ハウリングを起こさないためのトータルでのゲインG(Ω)以下とならなくてはならない。G(Ω)を直線近似等の補間処理して連続周波数に変換したものをG(ω)としてこの条件を式で表せば、式（１９）となる。
｜g'_ｒ(ω)｜・｜g'_s(ω)｜≦G(ω) 式（１９）
式（１９）を満たすように、受話側の減衰量補正部２０１Ｒと、送話側の減衰量補正部２０１Ｓは、それぞれg'_ｒ(ω)とg'_s(ω)を補正する。

例えば、補正は図９に示すように受話側のゲインg'_ｒ(Ω)の隣り合う周波数領域のゲイン値が異なる場合に、そのゲイン値の大きいほうの値を、その隣り合う周波数帯域の２つのゲイン値の重み付き平均値に置き換えることにより行われる。平均の重みｑは、あらかじめ固定値が設定される。隣り合う周波数帯域の２つのゲイン値のうち小さい値のほうをg'_ｒ(Ω_１)とし、大きい値の方をg'_ｒ(Ω_２)とし、g'_ｒ(Ω_２)＞g'_ｒ(Ω_１)の関係がある場合、平均重みをｑとし、補正後のゲイン値g'''_ｒ(Ω_１)とg'''_ｒ(Ω_２)を式で表せば、式（２０）と式（２０）となる。

g'''_ｒ(Ω_１)＝g'_ｒ(Ω_１) 式（２０）
g'''_ｒ(Ω_２)＝ｑ・g'_ｒ(Ω_２)＋(１−ｑ)・g'_ｒ(Ω_１) 式（２１）
ただし、平均重みｑは０から１の値をとり、１のときには補正が行われず、値が小さくなるにしたがって、強い補正がかけられる。
送話側の減衰量補正部２０１Ｓも同様にしてg'_ｓ(Ω)を補正してg'''_ｓ(Ω_１)を求める。
また、補正は、重み付き平均ではなく、以下のような計算であってもよい。隣り合う周波数帯域のゲイン値が異なる場合に、隣り合う周波数帯域の２つのゲイン値g'_r(Ω_１)とg'_ｒ(Ω_２)のうち小さい値の方をg'_ｒ(Ω_１)とし、大きい値の方をg'_ｒ(Ω_２)とし、g'_ｒ(Ω_２)＞g'_ｒ(Ω_１)の関係がある場合、小さい方の値g'_ｒ(Ω_１)は、そのままの値として、式（２２）で補正後のゲイン値g'''_ｒ(Ω_１)を求める。

g'''_ｒ(Ω_１)＝g'_ｒ(Ω_１) 式（２２）
大きい値を持つゲイン値g'_ｒ(Ω_２)は、小さい値を持つゲイン値g'_ｒ(Ω_１)に事前に設定される１以上の固定係数をｑ'を乗じた値に、g'_ｒ(Ω_２)＞ｑ'g'_ｒ(Ω_１)の関係が成立する場合に、置き換える。これは式（２３）で表される。
g'''_ｒ(Ω_１)＝ｑ'・g'_ｒ(Ω_１) 式（２３）
g'_ｒ(Ω_２)≦ｑ'・g'_ｒ(Ω_１)の関係が成り立つ場合には、そのままの値として、式（２４）により補正後のゲイン値g'''_ｒ(Ω_１)を求める。

g'''_ｒ(Ω_２)＝g'_ｒ(Ω_２) 式（２４）
ただし、固定係数ｑ'は１以上の値をとり、１のときには強い補正がかけられ、値が大きくなるにしたがって、補正が弱くなる。
送話側の減衰量補正部２０１Ｓも同様にしてg'_ｓ(Ω)を補正して、補正後のゲイン値g'''_ｒ(Ω)を求める。
以上、示したように受話側の減衰量補正部２０１Ｒと、送話側の減衰量補正部２０１Ｓは、それぞれg'_ｒ(Ω)とg'_ｓ(Ω)を補正して補正後のゲインg'''_ｒ(Ω)とg'''_ｓ(Ω)を求める。

これ以外の部分は、本発明の第１の実施例と同様であるので説明を省略する。
図１０には、補正前に実現されたゲイン値g'_ｒ(Ω)及びg'_ｓ(Ω)と、トータルゲインの周波数特性を示す。周波数領域変換部１０１Ｒと１０１Ｓの各周波数帯域の周波数特性は、理想的な矩形状ではなく、両端がなだらかに減衰する特性を持つ。このため、周波数帯域ごとに１つずつのゲイン値（図１０に示す各ポイントＰＲ_１〜ＰＲ_６及びＰＳ_１〜ＰＳ_６）を設定したときに、その間の周波数（図１０に示す例ではω_２〜ω_３とω_４〜ω_５）では、トータルゲインは設定値と異なるゲイン値となる。このため、補正前に実現されるトータルでのゲイン｜g'_ｒ(ω)｜・｜g'_ｓ(ω)｜は、所望の損失G(Ω)を越えてしまう場合がある。このため、ハウリング抑圧性能の低下が起こる。

これを防止するため、式（２０）と式（２１）を用いて、ゲイン値を補正した場合の周波数特性を図１１に示す。補正後に実現されたトータルゲイン｜ｇ'''_ｓ(ω)｜・｜g'''_ｒ(ω)｜は、所望の損失G(Ω)以下に抑えることができ、所望のハウリング抑圧性能を実現することができる。
以上示したように、本発明の第２の実施例によれば、本発明の第１の実施例の効果に加え、第１及び第２周波数領域変換部１０１Ｒ、１０１Ｓの各周波数特性が理想的でないことによるハウリング抑圧性能の低下を防ぐことができる。

図３は、本発明の第３の実施例であるハウリング防止装置のブロック図である。
本発明の第３の実施例は、本発明の第１または第２の実施例に正規化重み算出部３０１を設け、送受話判定部１０５_１〜１０５_Nを周波数領域に変換された受話信号R(Ω)と、マイク受音信号Y(Ω)と、スピーカ出力信号X(Ω)と、音響結合量A(Ω)と、正規化重み算出部３０１で求められた正規化重みを用いて送受話判定部１０５_１〜１０５_Nの判定に重み付けを行う構成とした実施例である。
つまり、回線の不具合等の理由により、例えば受話信号のレベルが正規のレベルより大きく低下してしまったと仮定した場合、このような状況下では送受話判定部１０５_１〜１０５_Nは全周波数帯域にわたって優先的に送話と判定してしまう不都合が生じる。

このため、本実施例では、受話信号の全帯域の平均レベルと送話信号の全帯域の平均レベルとを比較し、その比較結果に従って送話と受話の平均レベルを平均化するための正規化重みを算出し、この正規化重みを送受話判定に適用することにより上記不都合を解消するものである。
正規化重み算出部３０１は、送話側の第２周波数領域変換部１０１Ｓの出力である周波数領域変換後のマイク受音信号Y(Ω)の振幅を平均して、周波数スペクトルの周波数平均レベルG_sを算出する。これは、式（２５）または式（２６）により求められる。

次に、あらかじめ設定した正規化係数ｚを用いて、マイク受音信号に対する正規化重みWsと受話信号に対する正規化重みWrを算出する。送話音声に対する正規化重みWsは、受話信号の周波数平均レベルGrと、マイク受音信号の周波数平均レベルGsに正規化係数zを乗じた値を加算することにより得る。受話信号に対する正規化重みWrは、マイク受音信号の周波数平均レベルGsと、受話信号の周波数平均レベルGrに正規化係数zを乗じた値を加算することにより得る。これらを式で表せば、式（２９）と式（３０）となる。

Ws＝Gr+z・Gs 式（２９）
Wr＝Gs+z・Gr 式（３０）
ただし、正規化係数zには０から１の間の固定値があらかじめ設定され、z＝０の場合には、完全な正規化が行われ、受話音声レベルと送話音声レベルにそれぞれ正規化重みを乗じて求めた正規化レベルの周波数平均値は、送受話で同じ値となる。また、ｚ＝１の場合には、送受話の正規化重みは同じ値となり、正規化は行われない。
周波数帯域ごとに設けられた送受話判定部１０５_１〜１０５_Nは、周波数領域に変換された受話信号R(Ω)と、マイク受音信号Y(Ω)と、スピーカ出力信号X(Ω)と、音響結合量A(Ω)と、正規化重み算出部３０１で求められた正規化重みWsとWrにより、周波数帯域ごとで送受話の判定をする。

送受話判定部１０５_１〜１０５_Nは、それぞれ受話信号R(Ω)の周波数ごとのレベルP_R(Ω)を計算する。次に、あらかじめ与えた固定閾値T_R(Ω)と、受話信号R(Ω)の雑音レベルN_R(Ω)にあらかじめ設定した１以上の定数Bを乗じた閾値T_NR(Ω)うち、大きい方の値を受話閾値L_R(Ω)とする。受話信号のレベルP_R(Ω)から受話閾値L_R(Ω)を減じた値に、受話音声に対する正規化重みWrを乗じ、正規化後の受話信号レベルR_norm(Ω)を計算する。ここで受話信号のレベルP_R(Ω)と、ノイズレベルN_R(ｔ)は、本発明の実施例１と同様にして求められる。正規化後の受話信号レベルR_norm(Ω)を式で表せば、式（３１）となる。

R_norm(Ω)＝Wr・(P_R(Ω)−L_R(Ω)) 式（３１）
次に、それぞれマイク受音信号Y(Ω)の周波数ごとのレベルP_Y(Ω)を計算する。また、あらかじめ与えた固定閾値T_Y(Ω)と、マイク受音信号Y(Ω)の雑音レベルN_Y(Ω)にあらかじめ設定した１以上の定数Dを乗じた閾値T_NY(Ω)のうち、大きいほうの値を送話閾値L_S(Ω)とする。音響結合量A(Ω)にスピーカ出力信号のレベルP_X(Ω)を乗じた推定音響エコーレベルP_E(Ω)に、あらかじめ設定した定数Eを乗じた閾値T_EY(Ω)を求める。マイク受音信号のレベルP_Y(Ω)から送話閾値L_S(Ω)とエコー閾値T_EY(Ω)を減じた値に、送話音声に対する正規化重みWsを乗じ、正規化後の送話信号レベルS_norm(Ω)を計算する。ここで、レベルP_Y(Ω)とP_X(Ω)と雑音レベルN_Y(Ω)は、受話側と同様にして求められる。正規化後の送話信号レベルS_norm(Ω)を式で表せば、式（３２）となる。

S_norm(Ω)＝Ws・（P_Y(Ω)−L_ｓ(Ω)−T_EY(Ω)）式（３２）
以上のように、受話信号レベルR_norm(Ω)と、送話信号レベルS_norm(Ω)を正規化することで、送受話信号間のレベル差を小さくすることができる。
次に、求められた正規化後の受話信号レベルR_norm(Ω)と、正規化後の送話信号レベルS_norm(Ω)を比較し、送受話の判定を行なう。比較した結果が、受話信号レベルR_norm(Ω)が大きい場合は受話と判定し、送話信号レベルS_norm(Ω)が大きいかまたは等しい場合は送話と判定する。受話信号レベルR_norm(Ω)と正規化後の送話信号レベルS_norm(Ω)が両方とも負の値となる区間は、その前の送受話判定状態を保持し、送話か受話のどちらかに判定を行なう。また、送受話判定の頻繁な切り替わりを防ぐため、ハングオーバー時間を設け、送話判定状態をある一定時間保持するようにする。

以上示したように、本実施例によれば、本発明の第１または第２の実施例の効果に加えて、送話レベルと受話レベルを、正規化重みを用いて正規化してから、送受話判定を行なうことで、送受話音声のレベル差の影響が軽減され、送受話音声のどちらか一方が大きいレベルであるような場合でも、送受話検出を正確に行なうことだできる。

図４は、本発明の第４の実施例であるハウリング防止装置のブロック図である。
本発明の第４の実施例は、本発明の第１〜３の実施例にフルバンド送受話判定部４０１を設け、送受話判定部１０５_１〜１０５_Nを、フルバンド送受話判定部４０１の判定結果に基づいて送話または受話の判定を強調するように変更した構成である。
フルバンド送受話判定部４０１は、周波数領域に変換された受話信号R(Ω)と、マイク受音信号Y(Ω)と、スピーカ出力信号X(Ω)と、音響結合量A(Ω)より、全帯域での送受話の判定をする。例えば、本発明の第１の実施例と同様にして、周波数帯域ごとの受話判定結果を得る。次に、いくつかの周波数帯域で受話と判定されたかをカウントし、そのカウント値が、あらかじめ設定した受話検出カウント閾値を越える場合に受話と判定する。送話側も同様に、本発明の第１の実施例と同様にして、周波数帯域ごとの送話判定結果を得る。次に、いくつの周波数帯域で送話と判定されたかをカウントし、そのカウント値が、あらかじめ設定した送話検出カウント閾値を越える場合に送話と判定する。

送話、受話が両方とも検出されない無音区間や、送話、受話が両方とも検出されるダブルトーク区間は、その前の送受話判定状態を保持して、送話か受話のどちらかに判定を行なう。また、送受話判定の頻繁な切り替わりを防ぐため、ハングオーバー時間を設け、送話判定状態または受話判定状態をある一定時間保持するようにする。
周波数帯域ごとに設けられた送受話判定部１０５_１〜１０５_Nは、本発明の第１〜３の実施例に記載の送受話判定処理に、フルバンド送受話判定結果に基づいた処理を加え、フルバンド送受話判定結果が送話であった場合は、周波数帯域ごとの送受話判定で送話と判定しやすくし、フルバンド送受話判定結果が受話であった場合は、周波数帯域ごとの送受話判定で受話と判定しやくすし、送受話の判定をする。

本発明の第１または第２の実施例に適用した場合の送受話判定部１０５_１〜１０５_Nは、本発明の第１または第２の実施例と同様にして、受話信号の周波数ごとのレベルP_R(Ω)と、あらかじめ与えた固定閾値T_R(Ω)と、受話信号T_R(Ω)の雑音レベルN_R(Ω)にあらかじめ設定した１以上の定数Bを乗じた閾値T_NR(Ω)を求める。次に、固定閾値T_R(Ω)と閾値P_NR(Ω)のうち大きい方の値を受話閾値L_R(Ω)とし、受話信号のレベルP_R(Ω)から受話閾値L_R(Ω)を減じた値P'_R(Ω)を式（３３）により計算する。
P'_R(Ω)＝P_R(Ω)−L_R(Ω) 式（３３）
次に、本発明の第１または第２の実施例と同様にして、マイク受音信号の周波数ごとのレベルP_Y(Ω)と、あらかじめ与えた固定閾値T_Y(Ω)と、マイク受音信号Y(Ω)にスピーカ出力信号のレベP_X(Ω)を乗じた推定音響エコーレベルP_E(Ω)にあらかじめ設定した定数Eを乗じた閾値T_EY(Ω)を求める。固定閾値T_Y(Ω)と閾値T_NY(Ω)のうち大きいほうの値を送話閾値L_ｓ(Ω)とする。次に、マイク受音信号のレベルP_Y(Ω)から送話閾値L_ｓ(Ω)とエコー閾値T_EY(Ω)を減じた値P'_Y(Ω)を式（３４）により計算する。

P'_Y(Ω)＝P_Y(Ω)−L_ｓ(Ω)−T_EY(Ω) 式（３４）
次に、フルバンド送受話判定部４０１での判定結果が受話であった場合には、閾値減算後の受話信号レベルP'_R(Ω)に、あらかじめ設定した１以上の定数である受話検出強調係数を乗じてから、閾値減算後のマイク受音信号レベルP'_S(Ω)ｊと比較し、閾値減算後のマイク受音信号レベルP'_S(Ω)が大きければ、送話と検出する。閾値減算後のマイク受音信号レベルP'_S(Ω)が小さいまたは等しい場合は、受話と検出する。
フルバンド送受話判定部４０１での判定結果が送話であった場合には、閾値減算後のマイク受音信号レベルP'_S(Ω)に、あらかじめ設定した１以上の定数である送話検出強調係数を乗じてから、閾値減算後の受話信号レベルP'_R(Ω)と比較し、閾値減算後の受話信号レベルP'_R(Ω)が大きければ、受話と判定する。閾値減算後の受話信号レベルP'_R(Ω)が小さいまたは等しい場合は送話と判定する。

閾値減算後の受話信号レベルP'_R(Ω)と閾値減算後のマイク受音信号レベルP'_S(Ω)が両方とも負の値となる区間は、フルバンド送受話判定部４０１での判定結果が送話であった場合は送話と判定し、受話であった場合は受話と判定する。また、送受話判定の頻繁な切り替わりを防ぐため、ハングオーバー時間を設け、送話判定状態または受話判定状態をある一定時間保持するようにする。
本発明の第３の実施例に適用した場合の送受話判定部１０５_１〜１０５_Nは、本発明の第３の実施例と同様にして、正規化後の受話信号レベルをR_norm(Ω)と正規化後の送話信号レベルS_norm(Ω)を計算する。

次に、フルバンド送受話判定部４０１での判定結果が受話であった場合には、正規化後の受話信号レベルR_norm(Ω)に、あらかじめ設定した１以上の定数である受話検出強調係数を乗じてから、正規化後の受話信号レベルR_norm(Ω)に、あらかじめ設定した１以上の定数である受話検出強調係数を乗じてから正規化後の送話信号レベルS_norm(Ω)と比較し、正規化後の送話信号レベルS_norm(Ω)が大きければ、送話と判定する。正規化後の送話信号レベルS_norm(Ω)が小さいまたは等しい場合は、受話と判定する。
フルバンド送受話判定部４０１での判定結果が送話であった場合には、正規化後の送話信号レベルS_norm(Ω)に、あらかじめ設定した１以上の定数である送話検出強調係数を乗じてから、正規化後の受話信号レベルR_norm(Ω)と比較し、正規化後の受話信号レベルR_norm(Ω)が大きければ、受話と判定する。正規化後の受話信号レベルR_norm(Ω)が小さいまたは等しい場合は、送話と判定する。

受話信号レベルR_norm(Ω)と正規化後の送話信号レベルS_norm(Ω)が両方とも負の値となる区間は、フルバンド送受話判定部４０１での判定結果が送話であった場合は送話と判定し、受話であった場合は受話と判定する。また、送受話判定の頻繁な切り替わりを防ぐため、ハングオーバー時間を設け、送話判定状態または受話判定状態をある一定時間保持するようにする。
以上のように、フルバンドでの送受話検出結果が送話であった場合には、周波数帯域ごとの送受話判定において送話と判定されやすくなり、フルバンドでの送受話検出結果が受話であった場合には、周波数帯域ごとの送受話判定において受話と判定されやすくなることで、送受話のどちらか一方のみ音声が存在するシングルトーク状態では、ほぼ全ての帯域において周波数帯域ごとの送受話判定結果が送話か受話の一方のみとなる。これにより、音声の周波数成分が小さい帯域における、シングルトーク時の誤判定を防止して、音質を改善することができる。また、送話と受話で音声が存在しない無音区間では、フルバンドの送受話判定結果に基づいて帯域ごとの送受話判定が行われるので、ほぼ全ての帯域において周波数帯域ごとの送受話判定結果が送話か受話の一方のみとなる。これにより、無音区間における背景雑音の周波数特性が、ハウリング抑圧処理と同様になり、自然な音質の背景雑音となる。

以上示したように、本実施例によれば、本発明の第１〜３の実施例の効果に加えて、フルバンドでの送受話判定結果に基づいた、帯域ごとの送受話判定の強調処理により、送受話のうちどちらか一方だけ音声が存在するシングルトーク時の誤判定を防ぎ、シングルトーク時の音質を改善することができる。さらに、送受話で雑音のみが存在する無音区間における、雑音の音質を改善することができる。

図５及び図６は、本発明の第５の実施例であるハウリング防止装置のブロック図である。図５は主に受話側の構成を示し、図６は主に送話側の構成を示す。
本発明の第５の実施例は、本発明の第１〜４の実施例にスピーカ出力信号の帯域分割数変換部５０１（図５）と、受話側の帯域分割数変換部５０２（図５）と、送話側の帯域分割数変換部５０３（図６）と、受話側ゲインの帯域分割数変換部５０４（図５）と、送話側ゲインの帯域分割数変換部５０５（図６）が新たに設けられ、音響結合量推定部１０８_１〜１０８_Nと、減衰量算出部１０４_１〜１０４_Nと、送受話判定部１０５_１〜１０５_Nと、減衰量制御部１０６_１〜１０６_Nの個数が、変換後の帯域分割数N'に変更され、受話側の減衰器１０３Ｒ_１〜１０３Ｒ_Nまたは受話側の減衰量補正部２０１Ｒの入力信号が受話側ゲインの帯域分割数変換部５０４の出力に変更され、送話側の減衰部ＡＴＴ−１または送話側の減衰量補正部２０１Ｓの入力信号が送話側ゲインの帯域分割数変換部５０５の出力数N'に変更した構成である。

スピーカ出力信号の帯域分割数変換部５０１は、スピーカ出力信号の第３周波数領域変換部１０７の出力信号である周波数領域変換後のスピーカ出力信号X(Ω)の帯域分割数をNからN'に変換する。ただし、N'はN未満の整数であり、変換後のX(Ω)をX'（Ω）とする。
変換は、変換前の複数の帯域を１つの帯域にまとめることにより行われ、例えばΩ＝ωn,…,ωmの範囲のK個の帯域を、１つの帯域Ω'に変換するときには、変換前の複数の振幅の平均値を、変換後の振幅とする。平均値は、式（３５）または式（３６）により行われる。

受話側の帯域分割数変換部５０２は、スピーカ出力信号の帯域分割数変換部５０１と同様の処理により、受話側の周波数領域変換部１０１Ｒの出力信号である周波数領域変換後の受話信号R(Ω)の帯域分割数をNからN'に変換する。
送話側の帯域分割数変換部５０３は、スピーカ出力信号の帯域分割数変換部５０１と同様の処理により、送話側の第２周波数領域変換部１０１Ｓの出力信号である周波数領域変換後のマイク受音信号Y(Ω)の帯域分割数をNからN'に変換する。

音響結合量推定部１０８_１〜１０８_Nと、減衰量算出部１０４_１〜１０４_Nと、送受話判定部１０５_１〜１０５_Nと、減衰量制御部１０６_１〜１０６_Nは、変換後の帯域分割数N'と同数あり、それぞれ帯域分割数変換後の信号を入力として、本発明の第１〜４の実施例と同様の処理を行う。
正規化重み算出部３０１とフルバンド送受話判定部４０１は、帯域分割数変換後の信号を入力とし、帯域分割数をN'として、本発明の第１〜４の実施例と同様の処理を行う。
受話側ゲインの帯域分割数変換部５０４は、減衰量制御部１０６_１〜１０６_Nの出力であるN'帯域の受話側ゲインを周波数領域変換部の帯域分割数Nのゲインに変換する。変換は変換前の１つの帯域を複数の帯域に分割するようにして行われる。例えば帯域Ω'を、Ω＝ωn,…,ωmのK個の帯域に分割する場合、変換前の帯域Ω'のゲイン値を、変換後のK個の帯域Ω＝ωn,…,ωmのゲイン値とする。

送話側ゲインの帯域分割数変換部５０５は、受話側ゲインの帯域分割数変換部５０４と同様にして、減衰量制御部１０６_１〜１０６_Nの出力であるN'帯域の送話側ゲインを周波数領域変換部の帯域分割数Nのゲインに変換する。
減衰量補正部２０１Ｒと２０１Ｓを有さない実施例に適用する場合には、受話側減衰部ＡＴＴ−１を構成する各減衰器１０３Ｒ_１〜１０３Ｒ_Nと、送話側減衰部ＡＴＴ−２を構成する各減衰器１０３Ｓ_１〜１０３Ｓ_Nは、それぞれ受話側ゲインの帯域分割数変換部５０４と送話側ゲインの帯域分割数変換部５０５により帯域分割数が変換されたゲイン値を入力とし、本発明の第１〜４の実施例と同様の処理を行う。

減衰量補正部２０１Ｒと２０１Ｓを有する実施例に適用する場合には、受話側の減衰量補正部２０１Ｒと、送話側の減衰量補正部２０１Ｓは、それぞれ受話側ゲインの帯域分割数変換部５０４と送話側ゲインの帯域分割数変換部５０５により帯域分割数が変換されたゲイン値を入力とし、本発明の第１〜４の実施例と同様の処理を行う。
これら以外の部分については、本発明の第１〜４の実施例と同様であるので、説明を省略する。
以上示したように、本実施例によれば、本発明の第１〜４の実施例の効果に加えて、帯域分割数を一部の処理で少なくすることで、演算量の削減を行うことができる。

本発明によるハウリング防止プログラムはコンピュータが解読可能なプログラム言語によって記述される。この記述をコンピュータに備えられたCPUが解読してコンピュータに上述した本発明によるハウリング防止方法を実行させる。プログラムはコンピュータが読み取り可能な例えば磁気ディスク、CD-ROM或いは半導体メモリに記録され、これらの各種記録媒体から或いは通信回線を通じてコンピュータにインストールされる。インストールされたプログラムはCPUに解読されてハウリング防止方法を実行する。

本発明によるハウリング防止方法及びこのハウリング防止方法を適用して動作するハウリング防止装置はテレビ会議システム或いは音声会議システム等のハンズフリー通信の分野に活用される。

本発明のハウリング防止装置の第１の実施例を説明するためのブロック図。本発明のハウリング防止装置の第２の実施例を説明するためのブロック図。本発明のハウリング防止装置の第３の実施例を説明するためのブロック図。本発明のハウリング防止装置の第４の実施例を説明するためのブロック図。本発明のハウリング防止装置の第５の実施例の一部を説明するためのブロック図。本発明のハウリング防止装置の第５の実施例の他方の一部を示すブロック図。ハウリング抑圧装置通過前の送受話音声スペクトル、従来のハウリング抑圧装置通過後の送受話音声スペクトル、本発明のハウリング抑圧装置通過後の送受話音声スペクトルを説明するための図。周波数領域変換部の１つの帯域の周波数特性を示す特性曲線。本発明の第２の実施例におけるゲイン値の補正を説明するためのグラフ。本発明の第２の実施例により実現される各減衰部のゲインの周波数特性を示す図。本発明の第２の実施例により実現される各減衰部のゲインの周波数特性を示す図。従来のハウリング防止装置を示すブロック図。周波数領域変換部の理想的な周波数特性を説明するための図。

符号の説明

１０１Ｒ第１周波数領域変換部１０１Ｓ第２周波数領域変換部
１０２Ｒ第１逆周波数領域変換部１０２Ｓ第２逆周波数領域変換部
ＡＴＴ−１受話側減衰部ＡＴＴ−２送話側減衰部
１０４_１〜１０３_N 減衰量算出部１０５_１〜１０５_N 送受話判定部
１０６_１〜１０６_N 減衰量制御部１０７第３周波数領域変換部
１０４_１〜１０４_N 減衰量算出部３０１正規化重み算出部
２０１Ｒ、２０１Ｓ減衰量補正部５０１〜５０５帯域分割数変換部
４０１フルバンド送受話判定部

Claims

受話信号を２以上Ｎ個の周波数成分に変換する第１周波数領域変換処理と、
マイク受音信号を２以上Ｎ個の周波数成分に変換する第２周波数領域変換処理と、
第１周波数領域変換処理で周波数成分に変換された受話信号を各周波数帯域ごとに設定された減衰量に従って減衰させる受話側減衰処理と、
第２周波数領域変換処理で周波数成分に変換されたマイク受音信号を各周波数帯域ごとに設定された減衰量に従って減衰させる送話側減衰処理と、
受話側減衰処理された受音信号をスピーカ出力信号に変換する第１逆周波数変換処理と、
送話側減衰処理されたマイク受音信号を送話信号に変換する第２逆周波数領域変換処理と、
スピーカ出力信号をＮ個の周波数成分に変換する処理を実行する第３周波数領域変換処理と、
上記第２周波数領域変換処理で得られたマイク受音信号の各周波数成分と上記第３周波数領域変換処理で得られたスピーカ出力信号の各周波数成分とによってスピーカとマイク間の各周波数帯域ごとの音響結合量を推定する音響結合量推定処理と、
この音響結合量推定処理で得られた音響結合量から、上記第１周波数領域変換処理及び第２周波数領域変換処理で得られた各周波数帯域ごとに受話端から送話端までの伝達関数の振幅が１未満となる減衰量を算出する減衰量算出処理と、
上記第１周波数領域変換処理で周波数領域に変換された受話信号により周波数帯域ごとに受話状態を判定し、上記第２周波数領域変換処理で周波数領域に変換されたマイク受音信号と、上記第３周波数領域変換処理で周波数領域に変換されたスピーカ出力信号と、上記音響結合量とにより周波数帯域ごとに送話状態を判定する送受話判定処理と、
上記送受話判定処理の判定結果が送話と判定された周波数帯域では上記受話側減衰処理に設定する減衰量を上記減衰量算出処理で算出された減衰量に、上記送話側減衰処理に設定する減衰量をゼロにそれぞれ設定し、上記送受話判定結果が受話と判定された周波数帯域では上記受話側減衰処理に設定する減衰量をゼロに、上記送話側減衰処理に設定する減衰量を上記減衰量算出処理で算出された減衰量にそれぞれ設定する減衰量制御処理と、
上記受話側減衰処理と送話側減衰処理に与える減衰量を、上記第１周波数領域変換処理及び第２周波数領域変換処理のそれぞれにおいて、各周波数領域ごとの周波数領域変換特性に起因して互いに隣接する周波数領域の各境界部分で発生する利得上昇特性を抑圧する周波数特性を持つ減衰量に補正する減衰量補正処理と、
を実行することを特徴とするハウリング防止方法。
請求項１に記載のハウリング防止方法において、
上記第１周波数領域変換処理で周波数領域に変換された受話信号から受音信号の全帯域での平均レベルを求め、上記第２周波数変換処理で周波数領域に変換されたマイク受音信号からマイク受音信号の全帯域での平均レベルを求め、上記受話信号の全帯域での平均レベルに予め設定した０から１の間の固定値である正規化係数を乗じた値と上記マイク受音信号の全帯域での平均レベルとを加算したものを受話側正規化重みとして算出し、上記マイク受音信号の全帯域での平均レベルに上記正規化係数を乗じた値と上記受話信号の全帯域での平均レベルとを加算したものを送話側正規化重みとして算出する正規化重み算出処理を更に有し、
上記周波数帯域ごとの送受話判定処理は、上記第１周波数変換処理で周波数領域に変換された受話信号を上記受話側正規化重みで正規化した信号と、上記第２周波数領域変換処理で周波数領域に変換されたマイク受音信号を上記送話側正規化重みで正規化した信号と、により、周波数帯域ごとに送話状態であるか受話状態であるかを判定することを特徴とするハウリング防止方法。
請求項１又は２に記載のハウリング防止方法において、
上記第１周波数領域変換処理で周波数領域に変換された受話信号と、上記第２周波数領域変換処理で周波数領域に変換されたマイク受音信号から、全帯域での送受話状態を判定するフルバンド送受話判定処理を付加し、
上記フルバンド送受話判定処理の判定結果が送話の場合には、上記周波数帯域ごとの送受話判定処理はマイク受音信号を強調して検出処理を実行し、上記フルバンド送受話判定処理の判定結果が受話の場合には、上記周波数帯域ごとの送受話判定処理は受話信号を強調して検出処理することを特徴とするハウリング防止方法。
受話信号を２以上Ｎ個の周波数成分に変換する第１周波数領域変換部と、
マイク受音信号を２以上Ｎ個の周波数成分に変換する第２周波数領域変換部と、
第１周波数領域変換部で周波数成分に変換された受話信号を各周波数帯域ごとに設定された減衰量に従って減衰させる受話側減衰部と、
第２周波数領域変換部で周波数成分に変換されたマイク受音信号を各周波数帯域ごとに設定された減衰量に従って減衰させる送話側減衰部と、
受話側減衰部により減衰処理された受話信号をスピーカ出力信号に変換する第１逆周波数変換部と、
送話側減衰処理されたマイク受音信号を送話信号に変換する第２逆周波数変換部と、
スピーカ出力信号をＮ個の周波数成分に変換する処理を実行する第３周波数領域変換部と、
上記第２周波数領域変換部で得られたマイク受音信号の各周波数成分と、上記第３周波数領域変換部で得られたスピーカ出力信号の各周波数成分とによってスピーカとマイク間の各周波数帯域ごとの音響結合量を推定する音響結合量推定部と、
この音響結合量推定部で得られた音響結合量から、上記第１周波数領域変換部及び第２周波数領域変換部で得られた各周波数帯域ごとに受話端から送話端までの伝達関数の振幅が１未満となる減衰量を算出する減衰量算出部と、
上記第１周波数領域変換処理で周波数領域に変換された受話信号により周波数帯域ごとに受話状態を判定し、上記第２周波数領域変換処理で周波数領域に変換されたマイク受音信号と、上記第３周波数領域変換部で周波数領域に変換されたスピーカ出力信号と、上記音響結合量とにより周波数帯域ごとに送話状態を判定する送受話判定部と、
上記送受話判定部の判定結果が送話と判定された周波数帯域では上記受話側減衰部に設定する減衰量を上記減衰量算出部で算出された減衰量に、上記送話側減衰部に設定する減衰量をゼロにそれぞれ設定し、上記送受話判定結果が受話と判定された周波数帯域では上記受話側減衰部に設定する減衰量をゼロに、上記送話側減衰部に設定する減衰量を上記減衰量算出部で算出された減衰量にそれぞれ設定する減衰量制御部と、
上記受話側減衰部と送話側減衰部に与える減衰量を、上記第１周波数領域変換部及び第２周波数領域変換部のそれぞれにおいて、各周波数領域ごとの周波数領域変換特性に起因して互いに隣接する周波数領域の各境界部分で発生する利得上昇特性を抑圧する周波数特性を持つ減衰量に補正する減衰量補正部と、
を備えたことを特徴とするハウリング防止装置。
請求項４に記載のハウリング防止装置において、
上記第１周波数領域変換部で周波数領域に変換された受話信号から受話信号の全帯域での平均レベルを求め、上記第２周波数変換部で周波数領域に変換されたマイク受音信号からマイク受音信号の全帯域での平均レベルを求め、上記受話信号の全帯域での平均レベルに予め設定した０から１の間の固定値である正規化係数を乗じた値と上記マイク受音信号の全帯域での平均レベルとを加算したものを受話側正規化重みとして算出し、上記マイク受音信号の全帯域での平均レベルに上記正規化係数を乗じた値と上記受話信号の全帯域での平均レベルとを加算したものを送話側正規化重みとして算出する正規化重み算出部を付加し
上記周波数帯域ごとの送受話判定部は、上記第１周波数変換部で周波数領域に変換された受話信号を上記受話側正規化重みで正規化した信号と、上記第２周波数領域変換部で周波数領域に変換されたマイク受音信号を上記送話側正規化重みで正規化した信号と、により、周波数帯域ごとで送話状態であるか受話状態であるかを判定することを特徴とするハウリング防止装置。
請求項４又は５に記載のハウリング防止装置において、
上記第１周波数領域変換部で周波数領域に変換された受話信号と、上記第２周波数領域変換部で周波数領域に変換されたマイク受音信号から、全帯域での送受話状態を判定するフルバンド送受話判定部を付加し、
上記フルバンド送受話判定部の判定結果が送話の場合には、上記周波数帯域ごとの送受話判定部はマイク受音信号を強調して検出処理を実行し、上記フルバンド送受話判定部の判定結果が受話の場合には、上記周波数帯域ごとの送受話判定部は受話信号を強調して検出処理することを特徴とするハウリング防止装置。
コンピュータが解読可能なプログラム言語によって記述され、コンピュータに請求項１乃至３の何れかに記載のハウリング防止方法を実行させるハウリング防止プログラム。
コンピュータが読み取り可能な記録媒体によって構成され、この記録媒体に請求項７記載のハウリング防止プログラムを記録した記録媒体。