JP5346350B2

JP5346350B2 - 反響消去装置とその方法とプログラム

Info

Publication number: JP5346350B2
Application number: JP2011082571A
Authority: JP
Inventors: 翔一郎齊藤; 末廣島内
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2011-04-04
Filing date: 2011-04-04
Publication date: 2013-11-20
Anticipated expiration: 2031-04-04
Also published as: JP2012222389A

Description

この発明は、反響消去装置とその方法に係り、特に周囲雑音レベルが大きな環境下でも受話音声を聞き取り易くすることのできる反響消去装置と、その方法とプログラムに関する。

近年、通話時の利便性を高める目的で、送受話器を手に持つことなく通話が行えるハンズフリー通話を可能にした各種の機器が急増している。双方向通信を行う際に、音声を再生する側（受話側）の周囲雑音レベルが大きいと通信相手の受話音声が聞き取り難くなる。この現象は、スピーカと受話者の耳との距離が大きいハンズフリーによる双方向通信を行う際により顕著である。

周囲雑音レベルが大きな環境において受話音声を聞き取り易くするためには、受話音量を大きくすることが直接的な解決方法である。しかし、受話音量を大きくするとハウリングやエコーの原因になる。特にスピーカからマイクに入る音量が大きな小型端末においてハウリングが起き易くなる。また、ハウリングやエコーを抑制しようとすると、反響消去装置の性能の限界から最大音量が制限され、十分な音量が出せないことから、受話音声が聞き取り難い状態で、送受話器を使い続けなければならない場合もある。

受話音量を上げた場合にエコー（反響音）の戻りやハウリングを起こさないような反響消去方法としては、例えば特許文献１に開示された反響消去装置５００が知られている。図１０に、反響消去装置５００の構成図を示して、その動作を簡単に説明する。

反響消去装置５００は、反響消去部２００と損失制御部３００とから成る。反響消去部２００は、送話信号s(n)から反響路を模擬して推定した擬似反響信号y^(n)を減じた誤差信号e(n)と、送話手段（マイクロホン）４２０で収音した反響信号y(n)と送話信号s(n)とが重畳した入力信号z(n)を、損失制御部３００に出力する。

損失制御部３００の損失量決定手段３１０は、入力信号z(n)と誤差信号e(n)とから、反響路の音響結合量を求め、受話信号側又は送話信号側のどちらか一方の通信路に挿入する損失量を決定する。この損失量によって、エコーの量を低減し、特に反響路の音響結合量が大きい場合、つまり、受話音声の送話側への入力が大きい場合でも通信路の１巡ループ利得が１を超えないように制御することができる。その結果、ハウリングの発生を防止することが可能である。

特許第３２６８５７２号

従来の反響消去装置においては、反響路の音響結合量が大きい場合に、通信路に損失量を挿入してその１巡ループ利得が１を超えないようにするので、ハウリングの発生を防止することができる。しかし、損失量を挿入するので、相手と自分の音声が時間的に重なった場合、本来通したい通話音声の音量が下がり、相手と自分のどちらかの音声が聞き取りづらくなる。また、従来の反響消去装置５００では、そもそも受話音声が周囲雑音に対して相対的に小さくて聞き取り難い場合を想定していないので、その場合の解決策を提供できない。

この発明は、このような課題に鑑みてなされたものであり、受話音声が周囲雑音レベルよりも小さくて聞き取り難い状態でもエコーの増加やハウリングを起こすことなく、受話信号を聞き取り易くすることが出来るハンズフリー送受話器に利用して好適な反響消去装置と、その方法とプログラムを提供することを目的とする。

この発明の反響消去装置は、再生音制御部と反響消去部とで構成される。再生制御部は、雑音レベル推定部と、受話音声制御量生成部と、フィルタ部と、を備える。雑音レベル推定部は、周波数領域の収音信号から擬似エコー信号を減じた誤差信号を入力としてその誤差信号の雑音レベルを推定する。受話音声制御量生成部は、スピーカ特性と音声の平均スペクトルの積で近似したスピーカ音声レベルを、雑音レベルで除したＳＮ値と、上限雑音閾値と下限雑音閾値とをそれぞれ比較して、ＳＮ比と閾値の上下関係により受話信号を抑圧または強調するようなフィルタを出力する。フィルタ部は、受話端に入力される受話信号を、入力されたフィルタでフィルタリングした信号レベル調整済み受話信号を出力する。

反響消去部は、適応フィルタ部と、差信号生成部とを備える。適応フィルタ部は、信号レベル調整済み受話信号から擬似エコー信号を生成する。差信号生成部は、収音信号から擬似エコー信号を減じた送話端に出力される送話信号となる誤差信号を生成する。

この発明の反響消去装置によれば、フィルタ部が、雑音レベルとスピーカ音声レベルとの比が閾値以下の周波数に関しては受話信号を強調し、閾値以上の周波数に関しては受話信号を抑圧する。その結果、受話信号の全ての周波数の音量を上げるよりも効率的に、受話信号を聞き取り易くすることができる。

また、受話音量を単純に上げるのと異なり、雑音より十分パワーの大きな周波数に関しては増幅しない若しくは減衰させるため、スピーカ・マイク間の回り込み量が大きい周波数に対してエコーの返りが大きくなるなどの悪影響を与えることが少ない。

この発明の反響消去装置１００の機能構成例を示す図。反響消去装置１００の動作フローを示す図。この発明の反響消去装置１１０の機能構成例を示す図。ゲイン量F(ω)によって受話信号x(n)を強調及び抑制した信号レベル調整済み受話信号x′(n)の近似ＳＮ比の様子を示す図。この発明の反響消去装置１２０の機能構成例を示す図。この発明の反響消去装置１４０の機能構成例を示す図。この発明の反響消去装置１６０の機能構成例を示す図。この発明の反響消去装置１８０の機能構成例を示す図。この発明の反響消去装置２１０の機能構成例を示す図。従来の反響消去装置５００の機能構成を示す図。

以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには
同じ参照符号を付し、説明は繰り返さない。

図１に、この発明の反響消去装置１００の機能構成例を示す。その動作フローを図２に示す。反響消去装置１００は、再生音制御部１１０と反響消去部２００′と、周波数領域変換部５と、時間領域変換部１２とから構成される。反響消去部２００′は、従来技術で説明した反響消去装置９００の反響消去部２００と、基本的に同じものである。反響消去装置１００は、例えばＲＯＭ、ＲＡＭ、ＣＰＵ等で構成されるコンピュータに所定のプログラムが読み込まれて、ＣＰＵがそのプログラムを実行することで実現される。

周波数領域変換部５では、サンプリング周波数f_sを用いて、収音信号y(n)を周波数領域の収音信号Y(ω)に変換する。nはディジタル信号のサンプル番号である。ωは離散周波数であり、０からL-1の整数である。

時間領域変換部１２では、再生音制御部１００が出力する誤差信号E₁(ω)をサンプリング周波数f_sで再合成して時間領域の送話信号e（n）に変換する。

周波数領域変換部５と時間領域変換部１２とでは、各信号をL個のサンプルを持つフレームに格納して変換を行う。フレーム長Lは２以上の偶数で、例えば音声がf_s=16kHzサンプリングの場合、L=160(10ms相当)などの値を用いる。

反響消去部２００′は、適応フィルタ部７と、差信号生成部６と、周波数領域変換部８と、を備える。反響消去部２００′は、背景技術で説明した従来の反響消去装置５００の反響消去部２００と基本的に同じ動作を行うものであり、適応フィルタ部７と差信号生成部６とが周波数領域で動作する点のみが異なる。

適応フィルタ部７は、周波数領域の信号レベル調整済み受話信号X′(ω)を入力とし、適応フィルタ^H(ω)を用いて擬似エコー信号^Y(ω)を生成する（ステップＳ７）。

ωは離散周波数であり、０からL-1の整数である。

さらに適応フィルタ部７は、X′(ω)と、以下で説明する差信号生成部６で生成される誤差信号E₁(ω)を入力とし、収音信号Y(ω)と擬似エコー信号^Y(ω)との差が小さくなるように適応フィルタ^H(ω)を更新する。

差信号生成部６は、周波数領域の収音信号Y(ω)から周波数領域の擬似エコー信号^Y(ω)を減じて誤差信号E₁(ω)を生成する（ステップＳ６）。

再生音制御部１１０は、雑音レベル推定部９と、受話音声制御量生成部１０と、フィルタ部１１と、を備える。雑音レベル推定部９は、周波数領域の収音信号Y(ω)から擬似エコー信号^Y(ω)を減じた誤差信号E₁(ω)を入力としてその誤差信号E₁(ω)の雑音レベル^N(ω)を推定する（ステップＳ９）。雑音レベル^N(ω)の推定は、例えば誤差信号E₁(ω)のパワーレベル分布のヒストグラムを用いて雑音レベルを推定する公知の方法（参考文献：特許第３３０９８９５号）等を用いる。なお、図１では、受話信号x(n)をアナログ信号に変換するＤＡ変換器と、収音信号y(n)をディジタル信号に変換するＡＤ変換器の表記を省略している。

受話音声制御量生成部１０は、スピーカの周波数特性S(ω)と音声の平均スペクトルP(ω)の積で近似したスピーカ音声レベルS(ω)・P(ω)を、雑音レベル^N(ω)で除したＳＮ値と、上限雑音閾値T_highと下限雑音閾値T_lowとをω毎にそれぞれ比較して、ＳＮ値が上限雑音閾値T_highより大きいとき受話信号x(n)のωに当たる周波数成分を抑圧し、ＳＮ値が下限雑音閾値T_lowより小さいとき受話信号x(n)のωに当たる周波数成分を強調する時間領域のフィルタf(n)を出力する（ステップＳ１０）。

上記した音声の平均スペクトルP(ω)は、例えば標準的なレベルのパワーが周波数に反比例するピンクノイズなどで、各周波数ω毎に予め値を計測するか設定しておく定数である。また、S(ω)はスピーカの周波数特性であり、各周波数ω毎に予め値を計測するか、予め値を入力するなどして設定しておく定数である。音声の平均スペクトルP(ω)及びスピーカ３の周波数特性S(ω)は図示しない記憶部に記憶しておき、受話音声制御量生成部１０では該記憶部に記憶された音声の平均スペクトルP(ω)及びスピーカの周波数特性S(ω)を読み出して使用する。受話音声制御量生成部１０は、ＳＮ値、つまりS(ω)・P(ω)/^N(ω)と上限雑音閾値T_high(ω)，下限雑音閾値T_low(ω)を比較して次式に示す処理を行う。T_high(ω)，T_low(ω)は、ＳＮ比の閾値である。

式（２）のT_N(ω)は、雑音の閾値であり、雑音レベル推定部９で推定した雑音レベル^N(ω)がT_N(ω)未満の場合、受話端１に入力された受話信号x(n)がフィルタ部１１をそのまま通過させる時間領域のフィルタf(n)に対応した制御量F(ω)を出力する。受話音声制御量生成部１０は、雑音レベルN(ω)が閾値T_N(ω)未満の場合、F(ω)=1の制御量を出力するだけの処理を行う。

制御量F(ω)は、受話信号X(ω)の振幅を制御するゲイン量である。以降、F(ω)をゲイン量と称する。つまり、受話音声制御量生成部１０は、受話信号x(n)がスピーカ２で出力された際のある周波数のＳＮ比が、フィルタ部１１において望ましい範囲に調整されるようなゲイン量を生成する。ここで、望ましいＳＮ比の範囲とは、受話信号X(ω)が聞き取り易いＳＮ比の範囲のことである。よって、下限雑音閾値T_lowは、受話音声が聞き取れる下限のＳＮ比に相当し、例えば-3dB（≒0.7079）程度に設定される。上限雑音閾値T_highに関しては、ある周波数帯域で受話音声が大き過ぎる場合にのみ作用するのが望ましいので、例えば30dBなどの大きめの値が設定される。

このように計算したゲイン量F(ω)から、時間領域のフィルタf(n)を計算してフィルタ部１１に出力する。具体的なフィルタf(n)の計算方法の一例を次式に示す。

フィルタ部１１では、受話端１に入力される受話信号x(n)を、受話音声制御部１０が出力する時間領域のフィルタf(n)で畳み込み演算した信号レベル調整済み受話信号x′(n)を出力する。

この信号レベル調整済み受話信号x′(n)は、スピーカ2で音響信号に変換され、出力される。その音響信号に変換された音は、信号レベル調整済み受話信号x′(n)が聞き取り易いＳＮ比の範囲に調整されたものなので、聞き取り易いものになる。

〔変形例１〕
なお、受話音声制御量生成部１０で計算したゲイン量F(ω)を、周波数領域の受話信号X（ω)に乗じて信号レベル調整済み受話信号X′(ω)を生成するようにしてもよい（式（７））。

そうした場合の反響消去装置１１０の機能構成例を図３に示す。反響消去装置１１０は、再生音制御部１２０と反響消去部２００″とで構成される。反響消去装置１１０は、反響消去装置１００に対して、受話信号側に周波数領域変換部１３と時間領域変換部１５を備える点で異なる。

再生音制御部１２０は、再生音制御部１１０に対して受話音声制御量生成部１０′がゲイン量F(ω)をフィルタ部１１′に出力する点でのみ異なる。反響消去部２００″は、周波数領域変換部１３が新たに設けられたことによって不要となった周波数領域変換部８が削除されている点でのみ異なる。

周波数領域変換部１３は、受話端１に入力される時間領域の受話信号x(ω)を周波数領域の受話信号X（ω)に変換してフィルタ部１１に入力する。フィルタ部１１′は、その受話信号X（ω)にゲイン量F(ω)を乗じた信号レベル調整済み受話信号X′(ω)を、反響消去部２００″に出力する。

信号レベル調整済み受話信号X′(ω)は、時間領域変換部１５で時間領域の信号に変換された後に、スピーカ２によって音響信号に変換される。適用フィルタ部７と差信号生成部６の動作は、上記した反響消去部２００′と同じである。

このように、受話音声制御量生成部１０で計算した周波数領域のゲイン量F(ω)を、周波数領域の受話信号X（ω)に乗算する方法でも、実施例１の反響消去装置１００と同じ効果を奏する。

受話音声制御量生成部１０において、閾値T_high(ω)とT_low(ω)のそれぞれに、受話信号x(n)を強調や抑圧する最大値を設定した実施例２を次に説明する。フィルタ部１１で受話信号x(n)を増幅する量には、ハウリングを防止する目的で制限を加えた方が好ましい。また減衰する量には、元の音質音量を損なわないよう下限値を設定する方が好ましい。

下限雑音閾値T_low(ω)側の最大値をT_low(ω)/M_low(ω)、上限雑音閾値T_high(ω)側の抑圧の上限を与える閾値をT_high(ω)/M_high(ω)、M_low(ω)>1，M_high(ω)<1と置く。M_low(ω)は例えば10dB(≒3.162)、M_high(ω)は例えば-10dB(≒0.316)等の値を設定する。M_high(ω)とM_low(ω)の値は、スピーカ２からマイク３までの音の回り込みの大きさを表すエコー経路H(ω)に応じて変える。なお、エコー経路H(ω)は予め測定しておく。

エコー経路H(ω)が大きい周波数では、増幅量が大きいとエコーが目立ったり、ハウリングの原因になるのでM_low(ω)を小さめに設定する。M_low(ω)の設定の基準は、例えばM_low(ω) H(ω)<1等とする。

実施例２では、上記した式（２）〜（４）に代えて次式を用いる。

図４に、ゲイン量F(ω)によって受話信号x(n)を強調及び抑制した信号レベル調整済み受話信号x′(n)のＳＮ比の様子を示す。図４の横軸はスピーカ音声レベルと雑音レベルから計算される近似ＳＮ比、縦軸はゲイン量F(ω)で増幅した後の近似ＳＮ比である。

なお、スピーカ特性S(ω)の代わりに予め測定したエコー経路H(ω)を用いてH（ω)・P(ω)を計算しても良い。更に、予め測定したエコー経路H(ω)を、適応フィルタ部７で推定されたエコー経路^H(ω)に置き換えても良い（図３に破線で示す^H(ω)）。適応フィルタ部７で推定したエコー経路^H(ω)は、スピーカ特性以外のスピーカマイク間の伝達特性等も含むため、音声スペクトルの推定精度は粗くなるが、予めスピーカ特性が測定できない場合の代替手段となる。当然、適応フィルタ部７で推定したエコー経路^H(ω)をM₁(ω)の設定の基準に用いても良い。この考えは、全ての実施例に適用することが可能である。

図５に、受話信号x(n)のパワーが変動した影響を考慮した反響消去装置１２０の機能構成例を示す。反響消去装置１２０は、反響消去装置１００（図１）に対して音響結合量推定部１６とノイズ・エコー抑圧部１７を備える点で異なる。

音響結合量推定部１６は、信号レベル調整済み受話信号X′(ω)と、差信号生成部６が出力する誤差信号E₁(ω)を入力としてその両信号の音響結合量A(ω)を推定する。ノイズ・エコー抑圧部１７は、音響結合量A(ω)と受話音声制御量生成部１０で計算されたゲイン量F(ω)を入力として、誤差信号E₁(ω)の残留エコーとノイズを除去する。

ノイズ・エコー抑圧部１７は通常、音響結合量A(ω)が与えられた時、自身の利得G(ω)を式（１１）のように計算し、誤差信号E₁(ω)の残留エコーを式（１２）に示すように消去する。

S(ω)は、相手に送りたい話者の音声であり、１つ前のフレームで計算した送話信号のパワーなどで代用する。αは原音付加率０≦α≦１の実数である。E₂(ω)は、ノイズ・エコー抑圧部１７が出力する残留エコーを消去した誤差信号である。

ここで、ノイズ・エコー抑圧部１７は、受話音声制御量生成部１０で計算したゲイン量F(ω)を用いて利得G(ω)を次式に示すように計算する。これにより、F(ω)によって受話信号が持ち上げられた周波数は、エコーとしても大きくマイクロホンに入力されるが、F(ω)の分G(ω)の値は小さくなるので、結果消し残りのエコーが小さくなり、受話信号を持ち上げた影響は相殺される。同様に、F(ω)によって受話信号が抑圧された周波数は、F(ω)の分G(ω)の値は大きくなり、送話信号を潰しすぎず、送話音質への影響を軽減できる。

上記した説明では、音声の平均スペクトルP(ω)を、例えば標準的なレベルのパワーが周波数に反比例するピンクノイズなどで各周波数ω毎に予め値を設定した定数としたが、このP(ω)を信号レベル調整済み受話信号X′(ω)から別途計算して求めるようにしても良い。

図６に、音声の平均スペクトルP(ω)を、信号レベル調整済み受話信号X′(ω)から計算して求めるようにした反響消去装置１４０の機能構成例を示す。反響消去装置１４０は、反響消去装置１２０に対して受話音声制御量生成部６０に、信号レベル調整済み受話信号X′(ω)が入力されている点のみが異なる。

音声の平均スペクトルP(ω)の計算は、例えば信号レベル調整済み受話信号X′(ω)の音声パワーがある程度以上大きい箇所を抜き出して、そのスペクトルを加算平均するなどの方法が考えられる。良好な平均スペクトルを得るために受話信号をある程度長時間に渡って解析する必要はあるが、例えば通話相手側のマイクロホンの低域特性が不十分等の送話側の送話特性の影響により、予め音声の平均スペクトルの特性を設定するのが難しい場合に効果がある。

時間領域のフィルタf(n)を、受話音声制御量生成部１０において毎回計算するのではなく、予めＦＩＲフィルタを計算、記憶しておき、ゲイン量F(ω)に応じて一意に定まるＦＩＲフィルタを選択して用いる。

例えば、各周波数帯域ω（0≦ω≦L/2-1）においてインデックスI(ω)を式（１４）に示すように計算する。これにより、任意のF(ω)はL/２個のインデックスI(ω)によって対応付けられる。このインデックスの組み合わせは(Imax)^L/2個あり、その個数分のＦＩＲフィルタ（タップ長はL）を記憶部に格納しておく。そして、F(ω)が与えられた時、対応するI(ω)を用いてメモリスペースM内に格納されたフィルタの値を、式（１５）〜（１８）に示すように参照して求める。T_I(ω)は予め設定する閾値である。記憶部は、スピーカの周波数特性S(ω)を記憶する上記した記憶部と同じものである。これによりメモリの消費量は多くなるが、フィルタf(ｎ)を計算する演算量を削減することが可能である。

予め計算しておくf(n)の決定方法は、例えば

として式（５）と式（６）を用いる。

図７に、選択的にフィルタ部１１を動作させるようにした反響消去装置１６０の機能構成例を示す。反響消去装置１６０は、再生音制御部１７０が周波数領域変換部１２を含み、本来、反響消去装置が備える送受話検出部７０と受話損失挿入部７１と送話損失挿入部７２とを明記した点で異なる。上記した実施例では、説明の必要の無い送受話検出部と受話損失挿入部と送話損失挿入部とを省略していた。

送受話検出部７０は、信号レベル調整済み受話信号X′(ω)と誤差信号E₂(ω)を入力として、送話音声の有無と受話音声の有無を表す送話音声フラグf_sと受話音声フラグｆ_ｒを、受話音声制御量生成部７３に出力する。

受話音声制御量生成部７３は、送話音声なし（例えばf_s=0）で且つ受話音声あり（例えばｆ_ｒ=1）の場合のみ、求めた時間領域のフィルタf(n)をフィルタ部１１に転送するという処理を新たに行う。これにより、送話音声がある時には音声強調を行わないため、送話音声内に含まれるエコーの増加を防ぐことができる。

図８に、受話音声制御量生成部７３で計算するゲイン量F(ω)に基づいて、受話側と送話側に挿入する損失量を制御するようにした反響消去装置１８０の機能構成例を示す。反響消去装置１８０は、反響消去装置１６０（図７）の受話音声制御量生成部７３が出力するゲイン量F(ω)がノイズ・エコー抑圧部１７ではなく、送受話検出部７０に入力される点で異なる。

例えば、受話損失挿入部７１の挿入損失が０で、送話損失挿入部７２の挿入損失がｇ＜１であるような場合に、ゲイン量F(ω)によって受話音量が平均的にα倍の大きさになることが分かっていれば、送話損失挿入部７２の挿入損失をｇ/αとする。

αは、例えばゲイン量F(ω)の重み付け平均値であり次式で求めることができる。

ただし、αはｇを超えない値とする。P(ω)は前出の音声の平均スペクトルである。αはF(ω)による全帯域での凡その音量変化を表す。これを損失に用いることで、送話音質をF(ω)によって変化させた時、音量が大きくなった場合はエコーがその分返るので損失を大きく、音量が小さくなった場合はエコーの大きさが小さくなるので損失を小さくする、ということが可能となり、音質面の劣化が抑えられる。そのため、実施例３のような周波数ごとではなくなるものの、F(ω)による音声強調の影響に対処することができる。

図９に、受話音声の大きさを制御するようにしたこの発明の反響消去装置２１０の機能構成例を示す。反響消去装置２１０は、反響消去装置１８０に対して利得制御部９０を備える点のみが異なる。

利得制御部９０は、受話損失挿入部７１が出力する受話信号x(n)を入力として受話信号~x(n)をフィルタ部１１に出力する。受話信号~x(n)は、受話音声x(n)のある区間(x(n-M+1)〜x(n),Mは２以上の整数)の二乗平均パワーをp(n)として、例えば次式で計算される。

T_Vは所定の音量値である。この利得制御部９０の動作によりフィルタ部１１と合わせてより音声が聞き取り易くなる。音声のパワーが小さいところを大きくするのみなので、標準的な音量時と同等のエコー消去性能が得られ、エコーが返り易くなるというような欠点は発生しない。なお、図９に破線で示すように送話音声フラグf_sと受話音声フラグｆ_ｒを、更に利得制御部９０に入力し、送話状態の時に利得制御部９０を動作させないようにしても良い。

以上説明したようにこの発明の反響消去装置は、受話音声と雑音の周波数特性の違いに着目し、受話音声のうち大きな成分を維持もしくは影響がない範囲で減衰させて小さな成分に分配することで、エコーの返り易い周波数を大きく変えずに全周波数でのＳＮ比を向上させることができる。フィルタ部が、雑音レベルとスピーカ音声レベルとの比が閾値以下の周波数に関しては受話信号を強調し、閾値以上の周波数に関しては受話信号を抑圧するので、受話信号の全ての周波数の音量を上げるよりも効率的に、受話信号を聞き取り易くすることができ、ハンズフリー送受話器に利用して好適な反響消去装置とその方法を提供することができる。

なお、この発明の反響消去装置のフィルタ部１１について、時間領域のフィルタである場合と、周波数毎のゲイン量F(ω)を受話信号X(ω)に乗算する場合の２つの例を示して説明を行ったが、どちらの技術思想も同じであり、同一の効果を奏する。上記した実施例はフィルタ部１１を、前者を例で説明したが、何れの実施例もゲイン量F(ω)を乗算して受話信号のパワーを調整する後者の方法に代えても良い。

上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD（Digital Versatile Disc）、DVD-RAM（Random Access Memory）、CD-ROM（Compact Disc Read Only Memory）、CD-R（Recordable）/RW（ReWritable）等を、光磁気記録媒体として、MO（Magneto Optical disc）等を、半導体メモリとしてEEP-ROM（Electronically Erasable and Programmable-Read Only Memory）等を用いることができる。

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims

再生音制御部と反響消去部とから構成される反響消去装置であって、
再生音制御部は、
周波数領域の収音信号から擬似エコー信号を減した誤差信号を入力としてその誤差信号の雑音レベルを推定する雑音レベル推定部と、
受話信号を出力するためのスピーカの予め設定されたスピーカ特性と予め設定された音声の平均スペクトルの積で近似したスピーカ音声レベルを、上記雑音レベルで除したＳＮ値と、上限雑音閾値T_high(ω)と下限雑音閾値T_low(ω)とをそれぞれ比較して、上記ＳＮ値が上記上限雑音閾値T_highより大きいとき受話信号を抑圧し、上記ＳＮ値が上記下限雑音閾値T_lowより小さいとき受話信号を強調するゲイン量F(ω)に基づいた時間領域のフィルタf(n)を出力する受話音声制御量生成部と、
受話端に入力される上記受話信号を上記時間領域のフィルタf(n)で畳み込み演算した信号レベル調整済み受話信号を出力するフィルタ部と、を備え、
反響消去部は、
上記信号レベル調整済み受話信号と、上記受話信号を出力するためのスピーカと上記収音信号を得るためのマイクロホンとの間の推定エコー経路＾H(ω)とから上記擬似エコー信号を生成し、上記信号レベル調整済み受話信号と上記誤差信号とを用いて上記推定エコー経路＾H(ω)を更新する適応フィルタ部と、
上記収音信号から上記擬似エコー信号を減じることで送話端に出力される送話信号となる上記誤差信号を生成する差信号生成部と、を備える
ことを特徴とする反響消去装置。
再生音制御部と反響消去部とから構成される反響消去装置であって、
再生音制御部は、
周波数領域の収音信号から擬似エコー信号を減した誤差信号を入力としてその誤差信号の雑音レベルを推定する雑音レベル推定部と、
受話信号を出力するためのスピーカの予め設定されたスピーカ特性と予め設定された音声の平均スペクトルの積で近似したスピーカ音声レベルを、上記雑音レベルで除したＳＮ値と、上限雑音閾値T_high(ω)と下限雑音閾値T_low(ω)とをそれぞれ比較して、上記ＳＮ値が上記上限雑音閾値T_highより大きいとき受話信号を抑圧し、上記ＳＮ値が上記下限雑音閾値T_lowより小さいとき受話信号を強調するゲイン量F(ω)を出力する受話音声制御量生成部と、
受話端に入力される上記受話信号に、上記ゲイン量F(ω)を乗じた信号レベル調整済み受話信号を出力するフィルタ部と、を備え、
反響消去部は、
上記信号レベル調整済み受話信号と、上記受話信号を出力するためのスピーカと上記収音信号を得るためのマイクロホンとの間の推定エコー経路＾H(ω)とから上記擬似エコー信号を生成し、上記信号レベル調整済み受話信号と上記誤差信号とを用いて上記推定エコー経路＾H(ω)を更新する適応フィルタ部と、
上記収音信号から上記擬似エコー信号を減じることで送話端に出力される送話信号となる上記誤差信号を生成する差信号生成部と、を備える
ことを特徴とする反響消去装置。
請求項１又は２に記載の反響消去装置において、
上記上限雑音閾値T_high(ω)と上記下限雑音閾値T_low(ω)は、
T_high(ω)/M_high(ω)の第２上限雑音閾値と、T_low(ω)/M_low(ω)の第２下限雑音閾値と、をそれぞれ有し、M_low(ω)>1，M_high(ω)<1で且つM_low(ω)・H(ω)<1であり、H(ω)は予め定めたエコー経路であり、
上記ＳＮ値が上記第２上限雑音閾値よりも大きい場合にはゲイン量F(ω)をM_high(ω)とし、
上記ＳＮ値が上記第２下限雑音閾値よりも小さい場合にはゲイン量M_low(ω)とするものであることを特徴とする反響消去装置。
請求項１乃至３の何れかに記載した反響消去装置において、
更に、
上記信号レベル調整済み受話信号と、上記誤差信号とを入力としてその両信号の音響結合量を推定する音響結合量推定部と、
上記音響結合量と上記ゲイン量Ｆ(ω)とによって調整された値に基づいて、上記誤差信号から送話信号を生成するノイズ・エコー抑圧部と、
を具備することを特徴とする反響消去装置。
請求項３に記載した反響消去装置において、
上記予め定めたエコー経路H(ω)の代わりに、上記推定エコー経路^H(ω)を用いることを特徴とする反響消去装置。
請求項１乃至５の何れかに記載した反響消去装置において、
上記受話音声制御量生成部は、上記予め設定された音声の平均スペクトルの代わりに、上記信号レベル調整済み受話信号の音声スペクトルを加算平均したものを用いるものであることを特徴とする反響消去装置。
請求項１又は請求項３乃至６の何れかに記載した反響消去装置において、
上記ゲイン量F（ω）から時間領域のフィルタf(n)を次式に基づいて計算することを特徴とする反響消去装置。
請求項１又は請求項３乃至６の何れかに記載した反響消去装置において、
上記受話音声制御量生成部には、複数のＦＩＲフィルタがゲイン量F(ω)に対応付けられて記憶されており、上記受話音声制御量生成部は、上記ゲイン量F(ω)を入力としてそのゲイン量F(ω)に対応するＦＩＲフィルタを出力するものであることを特徴とする反響消去装置。
請求項１又は請求項３乃至６の何れかに記載した反響消去装置において、
更に、
上記受話信号と上記送話信号を入力として送話音声の有無と受話音声の有無を表す送話音声フラグと受話音声フラグを、受話音声制御部に出力する送受話検出部を備え、
上記受話音声制御部は、上記送話音声フラグと上記受話音声フラグとを入力として、送話音声なしで且つ受話音声ありの場合にのみ上記時間領域のフィルタf(n)を出力するものであることを特徴とする反響消去装置。
請求項２乃至６の何れかに記載した反響消去装置において、
更に、
上記受話信号と上記送話信号を入力として送話音声の有無と受話音声の有無を表す送話音声フラグと受話音声フラグを、受話音声制御部に出力する送受話検出部を備え、
上記受話音声制御部は、上記送話音声フラグと上記受話音声フラグとを入力として、送話音声なしで且つ受話音声ありの場合にのみ上記ゲイン量F(ω)を出力するものであることを特徴とする反響消去装置。
請求項９又は１０に記載した反響消去装置において、
更に、
上記送話端に損失量を挿入した送話信号を出力する送話損失挿入部とを備え、
上記送受話検出部は、上記ゲイン量F(ω)を入力として、上記ゲイン量F(ω)を重み付け平均した値に基づいて上記送話損失挿入部に挿入する損失量を算出することを特徴とする反響消去装置。
再生音制御過程と反響消去過程とを有する反響消去方法であって、
再生音制御過程は、
周波数領域の収音信号から擬似エコー信号を減した誤差信号を入力としてその誤差信号の雑音レベルを推定する雑音レベル推定ステップと、
受話信号を出力するためのスピーカの予め設定されたスピーカ特性と予め設定された音声の平均スペクトルの積で近似したスピーカ音声レベルを、上記雑音レベルで除したＳＮ値と、上限雑音閾値T_high(ω)と下限雑音閾値T_low(ω)とをそれぞれ比較して、上記ＳＮ値が上記上限雑音閾値T_highより大きいとき受話信号を抑圧し、上記ＳＮ値が上記下限雑音閾値T_lowより小さいとき受話信号を強調するゲイン量F(ω)に基づいた時間領域のフィルタf(n)を出力する受話音声制御量生成ステップと、
受話端に入力される上記受話信号を上記時間領域のフィルタf(n)で畳み込み演算した信号レベル調整済み受話信号を出力するフィルタステップと、を含み、
反響消去過程は、
上記信号レベル調整済み受話信号と、上記受話信号を出力するためのスピーカと上記収音信号を得るためのマイクロホンとの間の推定エコー経路＾H(ω)とから上記擬似エコー信号を生成し、上記信号レベル調整済み受話信号と上記誤差信号とを用いて上記推定エコー経路＾H(ω)を更新する適応フィルタステップと、
上記収音信号から上記擬似エコー信号を減じることで送話端に出力される送話信号となる上記誤差信号を生成する差信号生成ステップと、を含む
ことを特徴とする反響消去方法。
再生音制御過程と反響消去過程とを有する反響消去方法であって、
再生音制御過程は、
周波数領域の収音信号から擬似エコー信号を減した誤差信号を入力としてその誤差信号の雑音レベルを推定する雑音レベル推定ステップと、
受話信号を出力するためのスピーカの予め設定されたスピーカ特性と予め設定された音声の平均スペクトルの積で近似したスピーカ音声レベルを、上記雑音レベルで除したＳＮ値と、上限雑音閾値T_high(ω)と下限雑音閾値T_low(ω)とをそれぞれ比較して、上記ＳＮ値が上記上限雑音閾値T_highより大きいとき受話信号を抑圧し、上記ＳＮ値が上記下限雑音閾値T_lowより小さいとき受話信号を強調するゲイン量F(ω)を出力する受話音声制御量生成ステップと、
受話端に入力される上記受話信号に、上記ゲイン量F(ω)を乗じた信号レベル調整済み受話信号を出力するフィルタステップと、を含み、
反響消去過程は、
上記信号レベル調整済み受話信号と、上記受話信号を出力するためのスピーカと上記収音信号を得るためのマイクロホンとの間の推定エコー経路＾H(ω)とから上記擬似エコー信号を生成し、上記信号レベル調整済み受話信号と上記誤差信号とを用いて上記推定エコー経路＾H(ω)を更新する適応フィルタステップと、
上記収音信号から上記擬似エコー信号を減じることで送話端に出力される送話信号となる上記誤差信号を生成する差信号生成ステップと、を含む
ことを特徴とする反響消去方法。
請求項１２又は１３に記載の反響消去方法において、
上記上限雑音閾値T_high(ω)と上記下限雑音閾値T_low(ω)は、
T_high(ω)/M_high(ω)の第２上限雑音閾値と、T_low(ω)/M_low(ω)の第２下限雑音閾値と、をそれぞれ有し、M_low(ω)>1，M_high(ω)<1で且つM_low(ω)・H(ω)<1であり、H(ω)は予め定めたエコー経路であり、
上記ＳＮ値が上記第２上限雑音閾値よりも大きい場合にはゲイン量F(ω)をM_high(ω)とし、
上記ＳＮ値が上記第２下限雑音閾値よりも小さい場合にはゲイン量M_low(ω)とするものであることを特徴とする反響消去方法。
請求項１４に記載した反響消去方法において、
上記予め定めたエコー経路H(ω)の代わりに、上記推定エコー経路^H(ω)を用いることを特徴とする反響消去方法。
請求項１２乃至１５の何れかに記載した反響消去方法において、
上記受話音声制御量生成ステップは、上記予め設定された音声の平均スペクトルの代わりに、上記信号レベル調整済み受話信号の音声スペクトルを加算平均したものを用いるステップであることを特徴とする反響消去方法。
請求項１乃至１１の何れかに記載した反響消去装置としてコンピュータを機能させるためのプログラム。