JP2014121033A - エコー消去方法とその装置とプログラムとその記録媒体 - Google Patents
エコー消去方法とその装置とプログラムとその記録媒体 Download PDFInfo
- Publication number
- JP2014121033A JP2014121033A JP2012276449A JP2012276449A JP2014121033A JP 2014121033 A JP2014121033 A JP 2014121033A JP 2012276449 A JP2012276449 A JP 2012276449A JP 2012276449 A JP2012276449 A JP 2012276449A JP 2014121033 A JP2014121033 A JP 2014121033A
- Authority
- JP
- Japan
- Prior art keywords
- estimated
- signal
- echo
- estimation
- received signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【課題】遅延時間の推定が完了しない間でも安定したエコー消去とハウリング防止が行えるエコー消去方法を提供する。
【解決手段】この発明のエコー消去方法は、遅延推定過程と、遅延過程と、適応フィルタ過程と、を備える。遅延推定過程は、受話端に入力される受話信号とマイクロホンで収音された収音信号との間の遅延時間を推定して遅延時間量を出力すると共に、遅延時間の推定前であるか推定済みであるかを表す推定前/推定済信号を出力する。遅延過程は、遅延推定過程が上記遅延時間を推定する前では受話信号を、遅延推定過程が遅延時間量を出力した後では当該遅延時間分の時間、上記受話信号を遅延させた信号を遅延後受話信号として出力する。適応フィルタ過程は、推定前/推定済信号を入力として、当該推定前/推定済信号が推定前の状態を表す時は、適応フィルタの適応動作を停止させる。
【選択図】図2
【解決手段】この発明のエコー消去方法は、遅延推定過程と、遅延過程と、適応フィルタ過程と、を備える。遅延推定過程は、受話端に入力される受話信号とマイクロホンで収音された収音信号との間の遅延時間を推定して遅延時間量を出力すると共に、遅延時間の推定前であるか推定済みであるかを表す推定前/推定済信号を出力する。遅延過程は、遅延推定過程が上記遅延時間を推定する前では受話信号を、遅延推定過程が遅延時間量を出力した後では当該遅延時間分の時間、上記受話信号を遅延させた信号を遅延後受話信号として出力する。適応フィルタ過程は、推定前/推定済信号を入力として、当該推定前/推定済信号が推定前の状態を表す時は、適応フィルタの適応動作を停止させる。
【選択図】図2
Description
本発明は、遅延推定を用いたエコー消去方法とその装置とプログラムとその記録媒体に関する。
エコー消去装置は、受話信号をスピーカから音響信号として出力し、マイクロホンで収音した送話信号に回り込んでくるエコー信号成分を推定し、送話信号からエコー信号成分を消去するものである。ディジタルテレビやスマートフォンなどの機器をスピーカ・マイクロホンとして用いた場合、音声を途切れないようにする目的で受話信号と送話信号のそれぞれにバッファ(遅延)が挿入される場合がある。例えば、ディジタルテレビの映像のコーデックで発生する映像と音声のずれを調整するリップシンク機能で用いられるバッファ等が知られている。
この遅延挿入によりエコー消去が出来なくなるのを防止するため、遅延推定を用いたエコー消去方法が従来から考えられている。この方法は、スピーカから発せられた音声がマイクロホンで収音されるまでのエコー経路の遅延時間を推定し、その遅延時間をエコー消去処理に与えることで、長い遅延が有ってもエコーの消去を可能にするものである。
図16に、特許文献1に開示された遅延推定を用いたエコー消去装置800の機能構成を示し、その動作を簡単に説明する。エコー消去装置800は、遅延推定部810、遅延器820、音響結合量推定部830、エコー抑圧部840、を具備する。遅延5と6は、例えばバッファ等によって挿入される遅延である。
受話端1には遠端話者が発話した音声が受話信号として入力され、その受話信号はスピーカ2によって音響信号に変換される。スピーカ2から発せられた受話信号とエコー経路に基づくエコーと近端話者の発話した音声とは、マイクロホン3で収音されて収音信号に変換される。
遅延推定部810は、受話端1に入力される受話信号と、マイクロホン3で収音した収音信号との相関を求めて遅延時間を推定し、推定した遅延時間を遅延器820に設定する。遅延器820は、受話信号を、設定された遅延時間分遅延させて音響結合量推定部830に出力する。
音響結合量推定部830は、遅延させた受話信号と、送話信号のパワー比から音響結合量を求める。エコー抑圧部840は、遅延させた受話信号のパワーに音響結合量を乗じて推定エコーパワーを求め、その推定エコーパワーと収音信号のパワーからエコー抑圧ゲインを計算し、収音信号にエコー抑圧ゲインを乗じてエコーを抑圧する。エコーが抑圧された収音信号は送話信号として送話端4を介して、例えばネットワークを通じて遠端話者に伝達される。このエコー消去方法によれば、遅延時間が大きい場合でもエコーを抑圧することができる。
また、エコー消去装置800の構成に、適応フィルタ部910、送話検出部920、受話検出部930、音声スイッチ制御部940、受話側音声スイッチ950、送話側音声スイッチ960、の機能構成部を加えたエコー消去装置900(図17)も、同様の効果を奏することで知られている。
しかし、従来のエコー消去装置800,900では、受話信号と送話信号の相関から遅延時間を推定するため、遅延時間の推定に数秒から数十秒間の受話信号の入力が必要である。そのため、遅延時間が推定できるまでの間は効果的にエコーを消去することができない課題がある。例えば、遅延推定前にエコーを増大させてしまうことがある。特に、音響結合量が大きい場合にはハウリング(発振)を起こし、通話ができなくなるおそれがある。
本発明は、この課題に鑑みてなされたものであり、遅延時間の推定が完了しない間でも安定したエコー消去とハウリング防止が行えるエコー消去方法とその装置とプログラムとその記録媒体を提供することを目的とする。
本発明のエコー消去方法は、遅延推定過程と、遅延過程と、適応フィルタ過程と、を備える。遅延推定過程は、受話端に入力される受話信号とマイクロホンで収音された収音信号との間の遅延時間を推定して遅延時間量を出力すると共に、遅延時間の推定前であるか推定済みであるかを表す推定前/推定済信号を出力する。遅延過程は、遅延推定過程が上記遅延時間を推定する前では受話信号を、遅延推定過程が遅延時間量を出力した後では当該遅延時間分の時間、上記受話信号を遅延させた信号を遅延後受話信号として出力する。適応フィルタ過程は、推定前/推定済信号を入力として、当該推定前/推定済信号が推定前の状態を表す時は、適応フィルタの適応動作を停止させる。
本発明のエコー消去方法によれば、遅延推定前の状態では適応フィルタの適応動作を停止させるので、遅延によって収音信号が遅れて適応フィルタに入力されるまでの収音信号の振幅が小さい時間帯での適応フィルタの誤った適応を防止することができる。その結果、遅延推定前に適応フィルタが誤った学習を行いエコーを増大させてしまうことを防止することができる。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
図1に、この発明のエコー消去装置100の機能構成例を示す。その動作フローを図2に示す。エコー消去装置100は、遅延推定部10と、遅延部20と、適応フィルタ部30と、を具備する。エコー消去装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。なお、図1においては、例えばリップシンク機能のために挿入される遅延(図16の5と6)の表記は省略している。
遅延推定部10は、受話端1に入力される受話信号とマイクロホン3で収音された収音信号との間の遅延時間を推定すると共に、遅延時間の推定前であるか推定済みであるかを表す推定前/推定済信号を出力する(ステップS10)。遅延時間は、受話信号と収音信号のそれぞれの特徴量の相互相関係数を求め、その最大値から推定することができる。この方法は従来技術であり、例えば特許文献1に記載されている。
遅延部20は、遅延推定部10が遅延時間を推定する前では上記受話信号を、遅延推定部10が遅延時間を推定した後では当該遅延時間分の時間、上記受話信号を遅延させた信号を遅延後受話信号として出力する(ステップS20)。
適応フィルタ部30は、遅延推定部10が出力する推定前/推定済信号を入力として、当該推定前/推定済信号が推定前の状態を表す時は、適応フィルタの適応動作を停止させる(ステップS30b)。推定前/推定済信号が推定済の状態の場合は、適応動作を開始させる(ステップS30c)。遅延推定過程(ステップS10)〜適応フィルタ過程(ステップS30)の処理は、エコー消去装置100を構成する例えばコンピュータのCPUの動作が停止されるまで繰り返される(ステップS100のNo)。
この実施例の適応フィルタ部30は、遅延推定が行われる前までは、適応フィルタの適応動作を停止させるので、適応フィルタ部30が誤った適応をしてしまうことを防止することができ、誤った学習によるエコーの増大を防止することができる。
図3に、適応フィルタ部30のより具体的な機能構成例を示して更にその動作を説明する。適応フィルタ部30は、フィルタ係数更新手段31と、フィルタ手段32と、減算手段33と、適応ON/OFF設定手段34と、を備える。
フィルタ係数更新手段31は、遅延後受話信号と収音信号を入力として収音信号に重畳するエコー成分を、遅延後受話信号から生成するフィルタ係数を更新する。フィルタ手段32は、フィルタ係数更新手段31で更新されたフィルタ係数で遅延後受話信号をフィルタリングして擬似エコー信号を生成する。減算手段33は、収音信号から擬似エコー信号を減算してエコー成分を除去した適応フィルタ後収音信号を送話信号として送話端4に出力する。
適応ON/OFF設定手段34は、遅延推定部10が出力する推定前/推定済信号と、遅延部20が出力する遅延後受話信号と、を入力として推定前/推定済信号が推定済を表した状態で且つ遅延後受話信号の振幅が所定値以上ある場合に、フィルタ係数更新手段31の動作を許可する。
推定前/推定済信号が推定前を表す状態では、フィルタ係数更新手段31の更新動作は禁止される。一般的なエコー消去装置で用いられる適応フィルタ部のフィルタ長は、演算量や収束速度の制約から、100ms程度である。受話信号から収音信号までの遅延がこのフィルタ長よりも長い場合、遅延を推定する前ではフィルタで遅延を実現できないためエコー消去が全くできない状態となる。この状態でフィルタを学習すると、エコーが消去できないばかりでなく、収音信号に含まれる近端話者音声や雑音の影響により、適応フィルタが誤った適応をしてしまいエコーを増大させてしまう。
適応フィルタ部30は、遅延を推定する前の状態では適応フィルタの適応動作を禁止するので適応フィルタの誤った適応によるエコーの増大を防止することができる。
図4に、この発明のエコー消去装置200の機能構成例を示す。その動作フローを図5に示す。エコー消去装置200は、エコー消去装置100に対して、動作パラメータ変更部40と、音響結合量推定部50と、エコー抑圧部840と、を更に備える点で異なる。エコー抑圧部840は、従来技術で説明したエコー消去装置800に含まれるものと同じものである。
動作パラメータ変更部40は、遅延推定部10が出力する推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を出力する(ステップS40)。音響結合量推定部50は、動作パラメータ変更部40が出力する平滑化係数と、遅延部20が出力する遅延後受話信号と、適応フィルタ部30が出力する適応フィルタ後収音信号とを入力として、当該平滑化係数で上記遅延後受話信号を平滑化した遅延後受話信号パワーと、適応フィルタ後収音信号を平滑化した収音信号パワーとを求めて音響結合量を推定する(ステップS50)。
エコー抑圧部840は、適応フィルタ部30が出力する遅延後受話信号パワーに音響結合量推定部50で推定した音響結合量を乗じて推定エコーパワーを求め、適応フィルタ後収音信号に含まれる残留エコーを抑圧する(ステップS840)。
エコー消去装置200によれば、音響結合量推定部50に与える平滑化係数を、遅延推定前か推定済みかに応じて変更する。遅延推定が行われる前までは、動作パラメータ変更部40において平滑化係数をより長時間の平滑化となるように設定する。例えば、想定される遅延時間量がX秒であった場合には、X秒よりも長い時間の平滑化となるように平滑化係数を設定する。これにより、信号の遅延の影響を少なくし安定した音響結合量の推定を実現することができる。遅延推定後は、平滑化係数を短時間の平滑化となるように変更し、より正確な音響結合量の推定を行えるようにする。
図6に、音響結合量推定部50のより具体的な機能構成例を示して更にその動作を説明する。音響結合量推定部50は、受話信号パワー計算手段51と、収音信号パワー計算手段52と、除算手段53と、推定ON/OFF設定手段54と、ディップホールド手段55と、を備える。
受話信号パワー計算手段51は、遅延部20が出力する遅延後受話信号x(t)を時間平均して遅延後受話信号パワーR(t)を求める。この計算は、例えば式(1)を用いて行われる。
ここでtは、フレームを表すインデックスである。フレームとは、受話信号と収音信号を離散値で扱う場合に処理する単位のことであり、例えば離散値化するサンプリング周波数を16kHzとした時にその離散値を256個集めた時間(例えば16ms)及びその間の信号(データ)のことである。aは平滑化係数であり、0<a<1の値を設定する。aが1に近いほど、より緩やかなパワー変化となる。
この平滑化係数aは、遅延推定前と推定後で変更され、遅延推定前がa′遅延推定後がaでありその大きさはa′>aの関係である。つまり、遅延推定前の遅延後受話信号パワーR(t)のパワー変化は緩やかなものとされる。
受話信号パワー計算手段51は、ピークホールド処理を行うようにしても良い。その場合、遅延後受話信号パワーR(t)の増加時と減少時で異なる平滑化係数を設定する。遅延後受話信号パワーR(t)の増加時R(t−1)>(x(t))2の平滑化係数をb、減少時R(t−1)<(x(t))2の平滑化係数をcとした時にb≫cとなるように設定することで、ピークホールドの効果が得られる。
受話信号パワー計算手段51にピークホールドの効果を持たせた場合でも、平滑化係数のb,cを、遅延推定前がb′,c′、遅延推定後がb,cでありその大きさをb′>b,c′>cの関係にすることで、遅延推定前の遅延後受話信号パワーR(t)のパワー変化を緩やかなものにすることができる。
収音信号パワー計算手段52は、適応フィルタ部30が出力する適応フィルタ後収音信号に対して受話信号パワー計算手段51と同様の処理を行い、収音信号パワーS(t)を求める。
除算手段53は、遅延後受話信号パワーR(t)と収音信号パワーS(t)の比から、推定音響結合量の瞬時値AC′(t)を求める(式(3))。
ディップホールド手段55は、推定音響結合量の瞬時値AC′(t)の最小値を保持してより正確な推定音響結合量AC(t)を求める。最小値を保持する処理を行うのは、ダブルトーク時において収音信号に近端話者の音声が混合しているので、推定音響結合量の瞬時値AC′(t)が真の値よりも大きな値となってしまうことを防止するためである。ディップホールド手段55は、例えば式(4)により実現される。
ここで、dは推定音響結合量増加時の平滑化係数、eは推定音響結合量減少時の平滑化係数である。それぞれ0<d,e<1の値を予め設定する。d≫eとなるように設定すれば、推定音響結合量増加時に音響結合量ACの変化を非常に緩やかな上昇とすることができ、ディップホールドの効果が得られる。
遅延推定前において、遅延後受話信号と適応フィルタ後収音信号との間の遅延が大きい時に音響結合量を推定すると、除算手段53において時間がずれた信号間でパワー比を求めてしまうので、除算手段53の出力は大きく変動して不安定になる。また、ディップホールド手段55は、除算手段53の出力の最小値を保持するので、音響結合量が実際よりも小さく推定されてしまう。
この実施例では、これを防止する目的で、遅延推定が行われる前までは、動作パラメータ変更部40において受話信号パワー計算手段51と収音信号パワー計算手段52に与える平滑化係数を、より長時間の平滑化となるように設定する。例えば、想定される遅延時間量がX秒であった場合には、X秒よりも長い時間の平滑化となるように平滑化係数を設定する。これにより、信号の遅延の影響を少なくし、受話信号(遅延後受話信号)と収音信号(送話信号)間に遅延があっても安定した音響結合量の推定を実現することができる。遅延推定後は、平滑化係数を短時間の平滑化となるように変更することで、より正確な音響結合量が推定できるようにする。この結果、エコー抑圧部840において適応フィルタ後収音信号に含まれる残留エコーを安定的に抑圧することができる。
このように、エコー消去装置200によれば、遅延推定前に音響結合量を小さく推定してしまうことを防止し、エコー消去装置の動作を安定化することができる。また、遅延推定後は、遅延推定前よりも正確な音響結合量の推定を行うことができる。
図7に、この発明のエコー消去装置300の機能構成例を示す。その動作フローを図8に示す。エコー消去装置300は、エコー消去装置100(図1)に対して、更に、動作パラメータ変更部340と、音響結合量推定部50と、送話検出部60と、音声スイッチ制御部940と、受話検出部930と、受話側音声スイッチ950と、送話側音声スイッチ960と、を備える点で異なる。音響結合量推定部50は、エコー消去装置200(図4)と同じものである。また、音声スイッチ制御部940と受話検出部930と受話側音声スイッチ950と送話側音声スイッチ960とは、従来技術で説明したエコー消去装置900(図17)と同じものである。
動作パラメータ変更部340は、遅延推定部10が出力する推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を、音響結合量推定部50と送話検出部60とに出力する(ステップS340)。音響結合量推定部50と送話検出部60とに出力する平滑化係数は、同じでものであっても良いし、それぞれ異なるものであっても良い。
音響結合量推定部50は、動作パラメータ変更部340の出力する平滑化係数と遅延部20が出力する遅延後受話信号と適応フィルタ部30が出力する適応フィルタ後収音信号とを入力として、当該平滑化係数で上記遅延後受話信号を平滑化した遅延後受話信号パワーと上記適応フィルタ後収音信号を平滑化した収音信号パワーとを求めて音響結合量を推定する(ステップS50)。
送話検出部60は、動作パラメータ変更部340が出力する平滑化係数と、遅延部20が出力する遅延後受話信号と、音響結合量推定部50が出力する音響結合量と、適応フィルタ部30が出力する適応フィルタ後収音信号とを入力として、推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数で上記遅延後受話信号を平滑化して遅延後受話信号パワーを求め、遅延後受話信号のパワーに音響結合量を乗じて推定エコーパワーを求める。そして、適応フィルタ後収音信号を平滑化して収音信号パワーと推定ノイズパワーを求め、推定エコーパワー及び収音信号パワー及び推定ノイズパワーの大小から送話状態を検出し、送話状態であることを表す送話状態信号を出力する(ステップS60)。
受話検出部930は、受話端1に入力される受話信号の振幅が所定の値以上の時に、受話状態であることを表す受話検出信号を音声スイッチ制御部940に出力する(ステップS930)。
音声スイッチ制御部940は、送話検出部60が出力する送話状態信号と受話検出部930が出力する受話状態信号とに応じて、受話端1と遅延部20との間に挿入される受話端音声スイッチ950と、送話端4に送話信号を出力する送話端音声スイッチ960の両方のゲイン量を制御する(ステップS940)。送話側音声スイッチ960は、音声スイッチ制御部940から与えられるゲイン量で適応フィルタ後収音信号を増幅して送話信号として送話端4に出力する(ステップS960)。受話側音声スイッチ950は、受話端1に入力される受話信号を音声スイッチ制御部940から与えられるゲイン量で増幅して遅延部20等に出力する(ステップS950)。
エコー消去装置300によれば、遅延後受話信号と適応フィルタ後収音信号との間の遅延時間量が大きい場合でも、遅延後受話信号を遅延(平滑化)させるので適応フィルタ後収音信号に含まれる残留エコーを近端話者の音声として誤検出してしまうことを防止できる。
図9に、送話検出部60のより具体的な機能構成例を示してその動作を説明する。送話検出部60は、受話信号パワー計算手段61と、収音信号パワー計算手段62と、乗算手段63と、ノイズパワー推定手段64と、閾値設定手段65と、パワー比較手段66と、を備える。
受話信号パワー計算手段61は、動作パラメータ変更部340が出力する平滑化係数を用いて、遅延部20が出力する遅延後受話信号を平滑化してパワーを求め遅延後受話信号パワーとして出力する。平滑化の方法は、式(1)又は式(2)で示した方法で行なう。
収音信号パワー計算手段62は、適応フィルタ後収音信号の短時間平均パワーである収音信号パワーを計算する。この収音信号パワーの計算は、予め設定した固定の平滑化係数を用いて、式(1)と同様にして行う。
乗算手段63は、受話信号パワー計算手段61が出力する遅延後受話信号パワーに音響結合量推定部50が出力する音響結合量を乗じて推定エコーパワーEを求める。推定エコーパワーEは閾値設定手段65に出力される。
ノイズパワー推定手段64は、収音信号パワー計算手段62が出力する収音信号パワーをディップホールドして推定ノイズパワーNを求める。推定ノイズパワーNは閾値設定手段65に出力される。
閾値設定手段65は、推定エコーパワーEと推定ノイズパワーNから、送話検出の閾値を設定する。閾値は、推定エコーパワーEに1以上の定数α、推定ノイズパワーNに1以上の定数β、をそれぞれ乗じた値の大きい方の値を閾値として選択してパワー比較手段66に出力する。
パワー比較手段66は、収音信号パワー計算手段62が出力する収音信号パワーと閾値を比較し、収音信号パワーが閾値を越える場合に送話状態を表す送話検出信号を出力する。
音声スイッチ制御部940は、パワー比較手段66が出力する送話検出信号に応じて、受話端1と遅延部20との間に挿入される受話端音声スイッチ950と、送話端4に送話信号を出力する送話端音声スイッチ960と、にゲイン量を出力する。送話検出信号が出力されている状態では送話端音声スイッチ960のゲイン量を大きく設定し、受話端音声スイッチ950のゲイン量を小さく設定する。
送話検出部60を構成する受話信号パワー計算手段61の平滑化係数は、遅延推定前の状態においてはより長期間の平滑化となるように設定される。例えば、想定される遅延量がX秒であった場合には、そのX秒よりも長い時間の平滑化となるように平滑化係数a′(a′>a)が設定される。これにより、送話信号に含まれるエコーを近端話者の音声として誤検出してしまうことを防止する。
ただし、動作パラメータ変更部340が送話検出部60に与える平滑化係数を、長時間の平滑化用とすると送話検出の遅れにつながるので、遅延推定後の平滑化係数は短時間の平滑化用の平滑化係数aとすることで、送話検出の遅れを防止する。
上記したように、この発明は、遅延推定前において受話信号を平滑化する平滑化係数を大きく設定することで、意図的に受話信号を遅延(平均化)させ、受話信号に対して遅れて生ずるエコー成分とのバランスを取る考えである。この考えは、エコー抑圧部840に適応することも可能である。
図10に、上記したエコー消去装置200のエコー抑圧部840にこの発明の考えを適用したエコー消去装置400の機能構成例を示す。エコー消去装置400は、エコー消去装置100(図1)に対して、更に、動作パラメータ変更部440と、音響結合量推定部50と、エコー抑圧部70と、を備える。音響結合量推定部50は、エコー消去装置200と同じものである。
動作パラメータ変更部440は、音響結合量推定部50とエコー抑圧部70とに、遅延推定前と推定後とで異なる平滑化係数を出力する点で、エコー消去装置200の動作パラメータ変更部40と異なる。また、エコー抑圧部70がその平滑化係数を用いてエコーを抑圧する点で、エコー消去装置200のエコー抑圧部840と異なる。なお、エコー抑圧部70に与えられる平滑化係数は、音響結合量推定部40に与えられるものと同じものでも良いし、異なるものでも良い。
エコー抑圧部70は、動作パラメータ変更部440が出力する平滑化係数を入力として、当該平滑化係数で遅延部20が出力する遅延後受話信号を平滑化した信号から求めた遅延後受話信号のパワーに音響結合量推定部50で推定した音響結合量を乗じて推定エコーパワーを求めて適応フィルタ部30が出力する適応フィルタ後収音信号に残存するエコー成分を抑圧する。
図11に、エコー抑圧部70のより具体的な機能構成例を示してその動作を説明する。エコー抑圧部70は、周波数領域変換手段71と、受話信号パワー計算手段72と、乗算手段73と、周波数領域変換手段74と、送話信号パワー計算手段75と、エコー抑圧ゲイン計算手段76と、第2乗算手段77と、時間領域変換手段78と、を備える。
周波数領域変換手段71は、遅延部20が出力する遅延後受話信号を、周波数領域の信号に変換した周波数領域遅延後受話信号として出力する。受話信号パワー計算手段72は、周波数領域遅延後受話信号を、動作パラメータ変更部440から与えられる平滑化係数で平滑化して周波数毎の遅延後受話信号パワーとして出力する。乗算手段73は、周波数領域の遅延後受話信号パワーに音響結合量推定部50で推定した音響結合量を乗じて推定エコーパワーを求める。
周波数領域変換手段74は、適応フィルタ部30が出力する適応フィルタ後収音信号を、周波数領域の信号に変換した周波数領域適応フィルタ後収音信号として出力する。収音信号パワー計算手段75は、周波数領域適応フィルタ後収音信号の周波数毎の短時間平均パワーを、収音信号パワーとして計算する。エコー抑圧ゲイン計算手段76は、推定エコーパワーと適応フィルタ後収音信号パワーとからエコー抑圧ゲインを求める。第2乗算手段77は、周波数領域適応フィルタ後収音信号に周波数毎のエコー抑圧ゲインを乗じてエコーを抑圧した送話信号を出力する。送話信号は、時間領域変換手段78で時間領域の信号に変換されて送話端4から出力される。
受話信号パワー計算手段72に与える平滑化係数を、遅延推定前では大きな値に設定する。例えば、想定される遅延時間量がX秒であった場合には、X秒よりも長い時間の平滑化となるように平滑化係数を設定する。これにより、受話信号よりも遅れて生ずるエコー成分も適切に抑圧することが可能になる。
ただし、受話信号パワー計算手段72に与える平滑化係数を、長時間の平滑化とすることは受話信号がある状態から近端話者の発話に切り替わった際に、近端話者音声の話頭をエコーとして抑圧してしまうことになる。これを防止するために、遅延推定後の平滑化係数は短時間の係数として、近端話者音声の話頭の抑圧を防止する。
図12に、上記したエコー消去装置300の音声スイッチ制御部940にこの発明の考えを適用して、音声スイッチ制御部80としたエコー消去装置500の機能構成例を示す。音声スイッチ制御部940は、送話状態を表す送話検出信号に応じて、受話側音声スイッチ950と送話側音声スイッチ960のゲイン量を制御するものである。この送話検出信号が、この発明の送話検出信号でない場合、つまり、従来技術で説明した送話検出部920が出力する送話検出信号であると、送話検出においてエコーを近端話者の音声と誤認識してしまうことが考えられる。送話検出を誤検出すると、送話側のゲイン量が1.0に、受話側のゲイン量が1.0以下に、それぞれ設定されることになる。このような状態になるとエコーが抑圧されずに送話端4に出力されてしまう。
この送話状態の誤検出を防止する目的でこの発明のエコー消去装置500は、エコー消去装置300の動作パラメータ変更部340に代えて動作パラメータ変更部540と、音声スイッチ制御部940に代えて音声スイッチ制御部80と、を備える。なお、エコー消去装置500の送話検出部は、従来技術で説明したエコー消去装置900の送話検出部920として説明する。
動作パラメータ変更部540は、推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を出力すると共に、当該推定前/推定済信号に応じて送話状態から受話状態への状態遷移条件と受話状態から送話状態への状態遷移条件をそれぞれ変更して出力する。音声スイッチ制御部80は、状態遷移条件と送話検出部920の出力する送話状態信号とを入力として、当該状態遷移条件に応じて受話側音声スイッチ950と送話側音声スイッチ960の両方のゲインを制御する。
図13に、音声スイッチ制御部80のより具体的な機能構成例を示してその動作を説明する。音声スイッチ制御部80は、ゲイン決定手段81と、状態遷移手段82と、ゲイン割り当て手段83と、を備える。
ゲイン決定手段81は、音響結合量推定部50で推定した音響結合量を入力として、当該音響結合量からハウリングを起こさないゲイン量を算出する。状態遷移手段82は、受話検出部930が出力する受話検出信号と、送話検出部920が出力する送話状態信号と、動作パラメータ変更部540が出力する状態遷移条件と、を入力として送話状態と受話状態のどちらか一つの状態を決定する。ゲイン割り当て手段83は、状態遷移手段82が出力する状態と、ゲイン決定手段81が出力するゲイン量を入力として、受話側音声スイッチ950と送話側音声スイッチ960のゲイン量を決定する。
図14に、状態遷移手段82が決定する状態の状態遷移を示す。状態遷移手段82が扱う状態は、送話状態130と受話状態131の2状態である。送話状態130から受話状態131への遷移条件は、送話状態信号なしで且つ受話状態信号ありである。受話状態131から送話状態130への遷移条件は、送話状態信号ありで且つ受話状態信号ありの状態がM回継続すること、若しくは送話状態信号ありで且つ受話状態信号なしの状態がN回継続することである。
動作パラメータ変更部540は、回数の条件Nのパラメータを遅延推定前と後で変更する。遅延推定前では、Nに、想定される遅延後受話信号と適応フィルタ後収音信号との間の遅延の最大値程度の回数を設定し、遅延推定後には1に近い少ない回数を設定する。つまり、推定前をN′、推定後をNとした時に、N′>Nの関係にしておくことで遅延推定前の状態では簡単に送話状態に遷移することを防止する。N′回の回数は、遅延時間量を例えばフレームの時間で割った回数である。例えば、遅延時間量を100s、1フレームを16msと仮定するとN′回は7回程度の回数である。遅延推定後は近端話者発話開始時の状態遷移を素早くし、近端話者音声の話頭が抑圧されてしまうことなくゲイン制御を行うことができる。
このようにエコー消去装置500によれば、遅延推定前であってもハウリングを効果的に抑圧することができる。また、遅延推定後は、近端話者音声の話頭の抑圧がない状態で効果的にハウリングを抑圧することができる。
なお、エコー消去装置500の説明は、従来技術の送話検出部920を用いた例で説明を行ったが、送話検出部920はこの発明の送話検出部60としても良い。同様に、上記した各実施例の機能構成を全て用いてエコー消去装置600を構成しても良い。図15に、エコー消去装置600の機能構成例を示す。エコー消去装置600は、上記した実施例の全ての機能構成を含むので、各実施例よりも更に安定したエコー消去とハウリング防止を実現することができる。
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
Claims (12)
- 受話端に入力される受話信号とマイクロホンで収音された収音信号との間の遅延時間を推定して遅延時間量を出力すると共に、上記遅延時間の推定前であるか推定済みであるかを表す推定前/推定済信号を出力する遅延推定過程と、
上記遅延推定過程で上記遅延時間を推定する前では上記受話信号を、上記遅延推定過程で上記遅延時間量を出力した後では当該遅延時間量分の時間、上記受話信号を遅延させた信号を、遅延後受話信号として出力する遅延過程と、
上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前の状態を表す時は、適応フィルタの適応動作を停止させる適応フィルタ過程と、
を備えるエコー消去方法。 - 請求項1に記載したエコー消去方法において、
更に、
上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を出力する動作パラメータ変更過程と、
上記平滑化係数と上記遅延後受話信号と上記適応フィルタ部が出力する適応フィルタ後収音信号とを入力として、当該平滑化係数で上記遅延後受話信号を平滑化した遅延後受話信号パワーと上記適応フィルタ後収音信号を平滑化した収音信号パワーとを求めて音響結合量を推定する音響結合量推定過程と、
上記遅延後受話信号パワーに上記音響結合量を乗じて推定エコーパワーを求め上記適応フィルタ後収音信号に含まれる残留エコーを抑圧するエコー抑圧過程と、
を備えることを特徴とするエコー消去方法。 - 請求項1に記載したエコー消去方法において、
更に、
上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を、音響結合量推定過程と送話検出過程とに出力する動作パラメータ変更過程と、
上記平滑化係数と上記遅延後受話信号と上記適応フィルタ部が出力する適応フィルタ後収音信号とを入力として、当該平滑化係数で上記遅延後受話信号を平滑化した遅延後受話信号パワーと上記適応フィルタ後収音信号を平滑化した収音信号パワーとを求めて音響結合量を推定する音響結合量推定過程と、
上記動作パラメータ変更過程が出力する平滑化係数と、上記遅延後受話信号と、上記音響結合量推定過程が出力する音響結合量と、上記適応フィルタ過程が出力する適応フィルタ後収音信号とを入力として、上記推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数で上記遅延後受話信号を平滑化して遅延後受話信号パワーを求め、遅延後受話信号のパワーに音響結合量を乗じて推定エコーパワーを求め、適応フィルタ後収音信号を平滑化して収音信号パワーと推定ノイズパワーを求め、推定エコーパワー及び収音信号パワー及び推定ノイズパワーの大小から送話状態を検出し、送話状態であることを表す送話状態信号を出力する送話検出過程と、
上記送話状態に応じて、受話端に接続される受話端音声スイッチと、送話端に接続される送話端音声スイッチの両方のゲイン量を制御する音声スイッチ制御過程と、
を備えることを特徴とするエコー消去方法。 - 請求項1に記載したエコー消去方法において、
更に、
上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を、音響結合量推定過程と送話検出過程とに出力する動作パラメータ変更過程と、
上記平滑化係数と上記遅延後受話信号と上記適応フィルタ過程が出力する適応フィルタ後収音信号とを入力として、当該平滑化係数で上記遅延後受話信号を平滑化した遅延後受話信号パワーと上記適応フィルタ後収音信号を平滑化した収音信号パワーとを求めて音響結合量を推定する音響結合量推定過程と、
上記動作パラメータ変更過程が出力する平滑化係数を入力として、当該平滑化係数で上記遅延後受話信号を平滑化した信号から求めた遅延後受話信号のパワーに上記音響結合量を乗じて推定エコーパワーを求め上記適応フィルタ部が出力する送話信号のエコーを抑圧するエコー抑圧過程を、
備えることを特徴とするエコー消去方法。 - 請求項3に記載したエコー消去方法において、
上記動作パラメータ変更過程は、上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を出力すると共に、当該推定前/推定済信号に応じて送話状態から受話状態への状態遷移条件と受話状態から送話状態への状態遷移条件をそれぞれ変更して出力する過程であり、
上記音声スイッチ制御過程は、上記状態遷移条件と上記送話状態信号とを入力として、当該状態遷移条件に応じて上記受話端音声スイッチと上記送話端音声スイッチの両者のゲイン量を制御する過程である、
ことを特徴とするエコー消去方法。 - 受話端に入力される受話信号とマイクロホンで収音された収音信号との間の遅延時間を推定して遅延時間量を出力すると共に、上記遅延時間の推定前であるか推定済みであるかを表す推定前/推定済信号を出力する遅延推定部と、
上記遅延推定部が上記遅延時間を推定する前では上記受話信号を、上記遅延推定部が上記遅延時間量を出力した後では当該遅延時間量分の時間、上記受話信号を遅延させた信号を、遅延後受話信号として出力する遅延部と、
上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前の状態を表す時は、適応フィルタの適応動作を停止させる適応フィルタ部と、
を具備するエコー消去装置。 - 請求項6に記載したエコー消去装置において、
更に、
上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を出力する動作パラメータ変更部と、
上記平滑化係数と上記遅延後受話信号と上記適応フィルタ部が出力する適応フィルタ後収音信号とを入力として、当該平滑化係数で上記遅延後受話信号を平滑化した遅延後受話信号パワーと上記適応フィルタ後収音信号を平滑化した収音信号パワーとを求めて音響結合量を推定する音響結合量推定部と、
上記遅延後受話信号パワーに上記音響結合量を乗じて推定エコーパワーを求め上記適応フィルタ後収音信号に含まれる残留エコーを抑圧するエコー抑圧部と、
を備えることを特徴とするエコー消去装置。 - 請求項6に記載したエコー消去装置において、
更に、
上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を、音響結合量推定部と送話検出部とに出力する動作パラメータ変更部と、
上記平滑化係数と上記遅延後受話信号と上記適応フィルタ部が出力する適応フィルタ後収音信号とを入力として、当該平滑化係数で上記遅延後受話信号を平滑化した遅延後受話信号パワーと上記適応フィルタ後収音信号を平滑化した収音信号パワーとを求めて音響結合量を推定する音響結合量推定部と、
上記動作パラメータ変更部が出力する平滑化係数と、上記遅延後受話信号と、上記音響結合量推定部が出力する音響結合量と、上記適応フィルタ部が出力する適応フィルタ後収音信号とを入力として、上記推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数で上記遅延後受話信号を平滑化して遅延後受話信号パワーを求め、遅延後受話信号のパワーに音響結合量を乗じて推定エコーパワーを求め、適応フィルタ後収音信号を平滑化して収音信号パワーと推定ノイズパワーを求め、推定エコーパワー及び収音信号パワー及び推定ノイズパワーの大小から送話状態を検出し、送話状態であることを表す送話状態信号を出力する送話検出部と、
上記送話状態に応じて、受話端と上記遅延部との間に挿入される受話端音声スイッチと、送話端に送話信号を出力する送話端音声スイッチとの両者のゲインを制御する音声スイッチ制御部と、
を備えることを特徴とするエコー消去装置。 - 請求項6に記載したエコー消去装置において、
更に、
上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を、音響結合量推定部と送話検出部とに出力する動作パラメータ変更部と、
上記平滑化係数と上記遅延後受話信号と上記適応フィルタ部が出力する適応フィルタ後収音信号とを入力として、当該平滑化係数で上記遅延後受話信号を平滑化した遅延後受話信号パワーと上記適応フィルタ後収音信号を平滑化した収音信号パワーとを求めて音響結合量を推定する音響結合量推定部と、
上記動作パラメータ変更部が出力する平滑化係数を入力として、当該平滑化係数で上記遅延後受話信号を平滑化した信号から求めた遅延後受話信号のパワーに上記音響結合量を乗じて推定エコーパワーを求め上記適応フィルタ部が出力する送話信号のエコーを抑圧するエコー抑圧部を、
備えることを特徴とするエコー消去装置。 - 請求項8に記載したエコー消去装置において、
上記動作パラメータ変更部は、上記推定前/推定済信号を入力として、当該推定前/推定済信号が推定前か推定済かに応じて異なる平滑化係数を出力すると共に、当該推定前/推定済信号に応じて送話状態から受話状態への状態遷移条件と受話状態から送話状態への状態遷移条件をそれぞれ変更して出力するものであり、
上記音声スイッチ制御部は、上記状態遷移条件と上記送話状態信号とを入力として、当該状態遷移条件に応じて上記受話端音声スイッチと上記送話端音声スイッチの両者のゲイン量を制御するものである、
ことを特徴とするエコー消去装置。 - 請求項6乃至10の何れかに記載したエコー消去装置としてコンピュータを機能させるためのプログラム。
- 請求項11に記載した何れかのプログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012276449A JP5562405B2 (ja) | 2012-12-19 | 2012-12-19 | エコー消去方法とその装置とプログラムとその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012276449A JP5562405B2 (ja) | 2012-12-19 | 2012-12-19 | エコー消去方法とその装置とプログラムとその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014121033A true JP2014121033A (ja) | 2014-06-30 |
JP5562405B2 JP5562405B2 (ja) | 2014-07-30 |
Family
ID=51175481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012276449A Active JP5562405B2 (ja) | 2012-12-19 | 2012-12-19 | エコー消去方法とその装置とプログラムとその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5562405B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018225181A1 (ja) * | 2017-06-07 | 2018-12-13 | 株式会社 Trigence Semiconductor | スピーカ装置およびスピーカユニット |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010118793A (ja) * | 2008-11-11 | 2010-05-27 | Oki Electric Ind Co Ltd | 伝搬遅延時間推定器、プログラム及び方法、並びにエコーキャンセラ |
JP2013225747A (ja) * | 2012-04-20 | 2013-10-31 | Panasonic Corp | 通話装置 |
-
2012
- 2012-12-19 JP JP2012276449A patent/JP5562405B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010118793A (ja) * | 2008-11-11 | 2010-05-27 | Oki Electric Ind Co Ltd | 伝搬遅延時間推定器、プログラム及び方法、並びにエコーキャンセラ |
JP2013225747A (ja) * | 2012-04-20 | 2013-10-31 | Panasonic Corp | 通話装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018225181A1 (ja) * | 2017-06-07 | 2018-12-13 | 株式会社 Trigence Semiconductor | スピーカ装置およびスピーカユニット |
Also Published As
Publication number | Publication date |
---|---|
JP5562405B2 (ja) | 2014-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2546717C2 (ru) | Многоканальное акустическое эхоподавление | |
US8315380B2 (en) | Echo suppression method and apparatus thereof | |
US10244121B2 (en) | Automatic tuning of a gain controller | |
JP5036874B2 (ja) | エコー消去装置 | |
CN110225214B (zh) | 对信号进行衰减的方法、衰减单元、系统和介质 | |
KR101975251B1 (ko) | 오디오 신호 처리 시스템 및 이의 에코 신호 제거 방법 | |
JP4689269B2 (ja) | 静的スペクトルパワー依存型音響強調システム | |
US20100226492A1 (en) | Echo canceller canceling an echo according to timings of producing and detecting an identified frequency component signal | |
US9154874B2 (en) | Howling detection device, howling suppressing device and method of detecting howling | |
JP6011880B2 (ja) | ハウリング抑圧装置、補聴器、ハウリング抑圧方法、及び集積回路 | |
US10068585B2 (en) | Echo canceller device | |
JP5430990B2 (ja) | 信号処理方法、装置及びプログラム | |
US9277059B2 (en) | Echo removal | |
US20170310360A1 (en) | Echo removal device, echo removal method, and non-transitory storage medium | |
RU2725017C1 (ru) | Устройство и способ для обработки аудиосигнала | |
WO2001054296A1 (fr) | Dispositif de communication de sons et processeur d'echo | |
WO2013054459A1 (ja) | ハウリング抑圧装置、補聴器、ハウリング抑圧方法、及び集積回路 | |
JP2009513054A (ja) | 音響エコーキャンセラ | |
JP5562405B2 (ja) | エコー消去方法とその装置とプログラムとその記録媒体 | |
JP2008005094A (ja) | エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体 | |
JP4542538B2 (ja) | ダブルトーク状態判定方法、その方法を用いた反響消去装置、そのプログラム及びその記録媒体 | |
JP2017191992A (ja) | エコー抑圧装置、その方法、プログラム、及び記録媒体 | |
JP5963077B2 (ja) | 通話装置 | |
JP5346350B2 (ja) | 反響消去装置とその方法とプログラム | |
JP2006270709A (ja) | エコー除去装置、電子会議装置、エコー除去方法、およびエコー除去プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140603 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5562405 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |