JP6648436B2 - エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法 - Google Patents

エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法 Download PDF

Info

Publication number
JP6648436B2
JP6648436B2 JP2015149935A JP2015149935A JP6648436B2 JP 6648436 B2 JP6648436 B2 JP 6648436B2 JP 2015149935 A JP2015149935 A JP 2015149935A JP 2015149935 A JP2015149935 A JP 2015149935A JP 6648436 B2 JP6648436 B2 JP 6648436B2
Authority
JP
Japan
Prior art keywords
delay amount
signal
frame delay
estimated
estimated echo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015149935A
Other languages
English (en)
Other versions
JP2017034355A (ja
Inventor
尚也 川畑
尚也 川畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2015149935A priority Critical patent/JP6648436B2/ja
Publication of JP2017034355A publication Critical patent/JP2017034355A/ja
Application granted granted Critical
Publication of JP6648436B2 publication Critical patent/JP6648436B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

本発明は、エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法に関し、例えば、テレビ会議システムや電話会議システム等において用いられるエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法に適用し得るものである。
例えば、テレビ会議システムや電話会議システム等の拡声通話システムでは、スピーカから放音された音(ここで、音は音響や音声等を含む。)がマイクに回り込んで送話側に戻る音響エコー信号が発生する。音響エコー信号は、通話の著しい妨げとなるため、音響エコー信号の抑圧方法に関して、これまでも多くの研究、開発が行なわれている。
音響エコー信号を抑圧する1つの手法として、エコー抑圧装置(エコーサプレッサー)を使用する手法がある。エコー抑圧装置とは、遠端信号と近端入力信号とから推定エコーパス特性、推定エコー信号、エコーサプレスゲインを求めて、近端入力信号とエコーサプレスゲインを乗算することで音響エコー信号を抑圧する手法である。このエコー抑圧装置を使用して音響エコー信号を抑圧する手法が非特許文献1によって提案されている。
非特許文献1に開示されるエコー抑圧装置は、過去のフレームの遠端信号と近端入力信号とに基づいて推定エコーパス特性を求める。そして、求めた推定エコーパス特性と遠端信号とを乗算した信号を推定エコー信号とし、エコー抑圧装置は、近端入力信号と推定エコー信号とに基づいてエコーサプレスゲインを求め、エコーサプレスゲインを近端入力信号と乗算して音響エコー信号を抑圧する。
C.Faller and C.Turnery,"ESTIMATION THE DELAY AND COLORATION EFFECT OF THE ACOUSTIC ECHO PATH FOR LOW COMPLEXITY ECHO SUPPRESSION",Proc.Intl.Works.on Acoust.Echo and Noise Control(IWAENC)2005,pp.53−56,Oct.2005
しかしながら、非特許文献1に記載のエコー抑圧装置では、ソフトフォンやスマートフォンなどの入出力部にバッファがある機器で使用すると、動作を開始してから推定エコーパス特性の学習が進むまで音響エコー信号を抑圧できない。さらに、ソフトフォンやスマートフォンはエコーサプレス処理以外にも様々なアプリケーションやプログラムが動作しており、負荷が大きくなるとバッファに音データを保存する処理や入力バッファから音データを出力する処理が停止するため、遅延量が大きくなり、且つ遅延量の変動が大きくなる。非特許文献1のエコーサプレス装置では、遅延量を考慮せずに、推定エコー信号を算出するとき過去のフレームの平均を用いて推定エコーパス特性を算出しているので、エコー抑圧装置が動作を開始した直後の音響エコー信号を抑圧できない。また、遅延量を考慮していないため、音響エコー信号が抑圧できない区間が長くなり、ハウリングが発生する可能性も考えられる。
そのため、エコー抑圧装置の動作を開始した直後でも、音響エコー信号を抑圧できるエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法が望まれる。
第1の本発明は、近端入力信号と、遠端信号とに基づく音響エコー信号を抑圧するエコー抑圧装置において、(1)上記遠端信号の振幅スペクトルと推定エコーパス特性を用いて推定エコー信号の振幅スペクトルを算出する推定エコー信号計算手段と、(2)上記推定エコー信号計算手段で算出した推定エコー信号の振幅スペクトルを過去複数フレーム保持する推定エコー信号保持手段と、(3)上記推定エコー信号保持手段に保持されている過去複数フレームの上記推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとからフレーム遅延量を推定するフレーム遅延量推定手段と、(4)上記フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、収束判定結果と該収束判定結果が収束していないと判定したときは固定フレーム遅延量を上記フレーム遅延量として出力し、収束していると判定したときは上記フレーム遅延量推定手段で推定した上記フレーム遅延量を出力するフレーム遅延量収束判定手段と、(5)上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量を用いて、上記フレーム遅延量だけ遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを算出するエコーサプレスゲイン算出手段と、(6)上記エコーサプレスゲイン算出手段で算出した上記エコーサプレスゲインと、上記近端入力信号の振幅スペクトルとから上記推定エコー信号を抑圧するエコー抑圧手段と、(7)保持している推定エコーパス特性を上記推定エコー信号計算手段に出力し、上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量の上記収束判定結果から、上記フレーム遅延量が収束していないと判定すると、上記固定フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する一方、収束していれば、シングルトークと判定されたフレームについて、推定された上記フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する推定エコーパス特性更新手段とを有することを特徴とする。
第2の本発明のエコー抑圧プログラムは、近端入力信号と、遠端信号とに基づく音響エコー信号を抑圧するエコー抑圧装置に搭載されるコンピュータを、(1)上記遠端信号の振幅スペクトルと推定エコーパス特性を用いて推定エコー信号の振幅スペクトルを算出する推定エコー信号計算手段と、(2)上記推定エコー信号計算手段で算出した推定エコー信号の振幅スペクトルを過去複数フレーム保持する推定エコー信号保持手段と、(3)上記推定エコー信号保持手段に保持されている過去複数フレームの上記推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとからフレーム遅延量を推定するフレーム遅延量推定手段と、(4)上記フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、収束判定結果と該収束判定結果が収束していないと判定したときは固定フレーム遅延量を上記フレーム遅延量として出力し、収束していると判定したときは上記フレーム遅延量推定手段で推定した上記フレーム遅延量を出力するフレーム遅延量収束判定手段と、(5)上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量を用いて、上記フレーム遅延量だけ遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを算出するエコーサプレスゲイン算出手段と、(6)上記エコーサプレスゲイン算出手段で算出した上記エコーサプレスゲインと、上記近端入力信号の振幅スペクトルとから上記推定エコー信号を抑圧するエコー抑圧手段と、(7)保持している推定エコーパス特性を上記推定エコー信号計算手段に出力し、上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量の上記収束判定結果から、上記フレーム遅延量が収束していないと判定すると、上記固定フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する一方、収束していれば、シングルトークと判定されたフレームについて、推定された上記フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する推定エコーパス特性更新手段として機能させることを特徴とする。
第3の本発明は、近端入力信号と、遠端信号とに基づく音響エコー信号を抑圧するエコー抑圧方法において、推定エコー信号計算手段、推定エコー信号保持手段、フレーム遅延量推定手段、フレーム遅延量収束判定手段、エコーサプレスゲイン算出手段、推定エコーパス特性更新手段、及びエコー抑圧手段を有し、(1)上記推定エコー信号計算手段は、上記遠端信号の振幅スペクトルと推定エコーパス特性を用いて推定エコー信号の振幅スペクトルを算出し、(2)上記推定エコー信号保持手段は、上記推定エコー信号計算手段で算出した推定エコー信号の振幅スペクトルを過去複数フレーム保持し、(3)上記フレーム遅延量推定手段は、上記推定エコー信号保持手段に保持されている過去複数フレームの上記推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとからフレーム遅延量を推定し、(4)上記フレーム遅延量収束判定手段は、上記フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、収束判定結果と該収束判定結果が収束していないと判定したときは固定フレーム遅延量を上記フレーム遅延量として出力し、収束していると判定したときは上記フレーム遅延量推定手段で推定した上記フレーム遅延量を出力し、(5)上記エコーサプレスゲイン算出手段は、上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量を用いて、上記フレーム遅延量だけ遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを算出し、(6)上記エコー抑圧手段は、上記エコーサプレスゲイン算出手段で算出した上記エコーサプレスゲインと、上記近端入力信号の振幅スペクトルとから上記推定エコー信号を抑圧し、(7)上記推定エコーパス特性更新手段は、保持している推定エコーパス特性を上記推定エコー信号計算手段に出力し、上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量の上記収束判定結果から、上記フレーム遅延量が収束していないと判定すると、上記固定フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する一方、収束していれば、シングルトークと判定されたフレームについて、推定された上記フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持することを特徴とする。
本発明によれば、エコー抑圧装置の動作を開始した直後でも、音響エコー信号を抑圧できる。
第1の実施形態に係るエコー抑圧装置の構成を示すブロック図である。 第1の実施形態に係るフレーム遅延量収束判定部の処理を示す処理フロー図である。 第1の実施形態に係る推定エコーパス特性算出部の処理を示す処理フロー図である。 第2の実施形態に係る推定エコーパス特性算出部の処理を示す処理フロー図である。
(A)第1の実施形態
以下では、本発明のエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法の第1の実施形態を、図面を参照しながら詳細に説明する。
第1の実施形態は、例えば、テレビ会議システムや電話会議システム等の拡声通話システムの音声送受信装置のエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法に本発明を適用する場合を例示する。
(A−1)第1の実施形態の構成
図1は、本発明の実施形態に係るエコー抑圧装置100の構成を示すブロック図である。
本発明の第1の実施形態に係るエコー抑圧装置100は、上述した本発明のエコー抑圧装置を実装したものであり、遠端信号が近端側の空間を伝達し、音響エコー信号として近端側のマイクに回り込んで入力されたときでも、近端入力信号に対してエコー抑圧処理を行い、音響エコー信号を適切に抑圧するものである。
第1の実施形態に係るエコー抑圧装置100は、例えば、専用ボードとして構築されるようにしても良いし、DSP(デジタルシグナルプロセッサ)へのエコー抑圧プログラムの書き込みによって実現されたものであっても良く、CPUと、CPUが実行するソフトウェア(エコー抑圧プログラム)によって実現されたものであっても良いが、機能的には、図1で表すことができる。
図1において、第1の実施形態に係るエコー抑圧装置100は、遠端信号入力端子101、出力バッファ102、DA変換器103、スピーカ104、マイク105、AD変換器106、入力バッファ107、遠端信号周波数領域変換部108、遠端信号振幅スペクトル計算部109、推定エコーパス特性更新部110、推定エコー信号計算部111、推定エコー信号保持部112、近端入力信号周波数領域変換部113、近端入力信号振幅スペクトル計算部114、フレーム遅延量推定部115、フレーム遅延量収束判定部116、推定エコー信号遅延部117、エコーサプレスゲイン計算部118、エコーサプレス部119、近端出力信号時間領域変換部120、近端信号出力端子121、遠端信号保持部122、近端出力信号振幅スペクトル計算部123、シングルトーク判定部124を有する。
遠端信号入力端子101は、例えば、インターネットプロトコル(IP)網等のネットワークや、携帯電話等の無線ネットワークの電波等に接続されており、接続されている回線を介して遠端側(相手側)の遠端信号が入力される。
遠端信号入力端子101に入力された遠端信号は、出力バッファ102において一時保持され、DA変換器103の処理準備ができ次第、DA変換器103に遠端信号を出力し、DA変換器103において、デジタル音信号からアナログ音信号に変換され、スピーカ104を通して近端側に出力される。
出力バッファ102は、エコー抑圧装置100の処理待ち用のバッファである。
一方、近端側の話者が発した音声等の音信号や、環境音、音響エコー信号(例えば、スピーカ104から出力されたアナログ音信号が近端側の空間を伝達して回り込んだ信号)等が重畳したアナログ音信号は、マイク105において受音され、AD変換器106においてデジタル音信号に変換され、入力バッファ107において一時保持され、エコー抑圧装置100の準備ができ次第、デジタル音信号を近端入力信号としてエコー抑圧装置100に入力される。
入力バッファ107は、エコー抑圧装置100の処理待ち用のバッファである。
遠端信号周波数領域変換部108は、例えば、高速フーリエ変換(FFT)等により、遠端信号を時間領域の信号から周波数領域の信号に変換し、遠端信号の周波数スペクトルを出力する。
遠端信号振幅スペクトル計算部109は、遠端信号の周波数スペクトルに基づいて、遠端信号の振幅スペクトルを算出し、算出した遠端信号の振幅スペクトルを出力する。
推定エコーパス特性更新部110は、前フレームに推定したエコーパス特性を保持しており、保持している推定エコーパス特性に出力する。
さらに、推定エコーパス特性更新部110は、シングルトーク判定部124でシングルトークと判定されると、推定したフレーム遅延量だけ遅延させた遠端信号の振幅スペクトルと近端入力信号の振幅スペクトルに基づいて、現フレームの推定エコーパス特性を算出し、算出した現フレームの推定エコーパス特性と推定エコーパス特性更新部110に保持している推定エコーパス特性に基づき、推定エコーパス特性を更新し、更新した推定エコーパス特性を推定エコーパス特性更新部110に保存する。
推定エコー信号計算部111は、遠端信号の振幅スペクトルと推定エコーパス特性とを乗じて推定エコー信号の振幅スペクトルを算出し、算出した推定エコー信号の振幅スペクトルを出力する。
推定エコー信号保持部112は、推定エコー信号の振幅スペクトルを所定時間保持し、フレーム遅延量推定部115でフレーム遅延量を推定するために過去の推定エコー信号を複数フレーム出力する。さらに、推定エコー信号保持部112は、後述するフレーム遅延量収束判定部116から出力されたフレーム遅延量だけ遅延させた推定エコー信号を出力する。
近端入力信号周波数領域変換部113は、例えば、高速フーリエ変換等により、近端入力信号を時間領域の信号から周波数領域の信号に変換し、近端入力信号の周波数スペクトルを出力する。
近端入力信号振幅スペクトル計算部114は、近端入力信号の周波数スペクトルに基づいて、近端入力信号の振幅スペクトルを算出し、算出した近端入力信号の振幅スペクトルを出力する。
フレーム遅延量推定部115は、過去の複数フレームの推定エコー信号の振幅スペクトルと、過去の複数フレームの近端入力信号の振幅スペクトルでフレーム遅延量を推定し、推定したフレーム遅延量を出力する。
フレーム遅延量収束判定部116は、推定したフレーム遅延量が収束しているか判定し、推定したフレーム遅延量が収束していなければ、フレーム遅延量に固定値を代入して出力する。推定エコーパス特性更新部110は、フレーム推定したフレーム遅延量が収束していれば、フレーム遅延量推定部115で推定したフレーム遅延量を出力する。さらに、フレーム遅延量収束判定部116は、収束判定結果を推定エコーパス特性更新部110に出力する。
推定エコー信号遅延部117は、フレーム遅延量を用いて推定エコー信号保持部112から当該フレーム遅延量だけ遅延させたフレームの推定エコー信号の振幅スペクトルを読み出し、遅延推定エコー信号の振幅スペクトルとして出力する。
エコーサプレスゲイン計算部118は、近端入力信号の振幅スペクトルと遅延推定エコー信号の振幅スペクトルとを用いて、近端入力信号に重畳されている音響エコー信号を抑圧するエコーサプレスゲインを算出し、算出したエコーサプレスゲインを出力する。
エコーサプレス部119は、エコーサプレスゲインと近端入力信号の周波数スペクトルを乗じることにより、近端入力信号に重畳されている音響エコー信号が抑圧した周波数スペクトルを求め、近端出力信号の周波数スペクトルとして出力する。
近端出力信号時間領域変換部120は、近端出力信号の周波数スペクトルを、例えば、逆高速フーリエ変換(InverseFFT)等により、時間領域のデジタル音信号に変換し、近端出力信号として出力する。
遠端信号保持部122は、遠端信号の振幅スペクトルを推定エコー信号保持部112と同じ所定時間保持する。そして、遠端信号保持部122は、推定したフレーム遅延量だけ遅延させた遠端信号の振幅スペクトルを出力する。
近端出力信号振幅スペクトル計算部123は、近端出力信号の周波数スペクトルに基づいて、近端出力信号の振幅スペクトルを算出し、算出した近端出力信号の振幅スペクトルを出力する。
近端出力信号振幅スペクトル計算部123は、近端出力信号の周波数スペクトルに基づいて、近端出力信号の振幅スペクトルを算出し、算出した近端出力信号の振幅スペクトルを出力する。
シングルトーク判定部124は、近端入力信号の振幅スペクトルと近端出力信号の振幅スペクトル等を用いてシングルトークかシングルトーク以外かの判定を行い、シングルトーク判定結果を出力する。
(A−2)第1の実施形態の動作
次に、第1の実施形態に係るエコー抑圧装置100におけるエコー抑圧処理の動作を詳細に説明する。
(A−2−1)エコー抑圧処理
まず、エコー抑圧装置100の動作が開始すると、例えば、インターネットプロトコル(IP)網等のネットワークや、携帯電話等の無線ネットワークの電波等に接続されており接続されている回線を介して、遠端側の遠端信号が遠端信号入力端子101に入力される。
遠端信号入力端子101に入力された遠端信号は、出力バッファ102において一時保持され、DA変換器103の処理準備ができ次第、DA変換器103に遠端信号が出力される。DA変換器103において、遠端信号は、デジタル音信号からアナログ音信号に変換され、スピーカ104を通して近端側に出力される。
一方、近端側の話者が発した音声等の音信号や、環境音、音響エコー信号(例えば、スピーカ104から出力されたアナログ音信号が近端側の空間を伝達して回り込んだ信号)等が重畳したアナログ音信号は、マイク105において受音され、AD変換器106においてデジタル音信号に変換される。デジタル音信号は、入力バッファ107において一時保持され、エコー抑圧装置100の準備ができ次第、デジタル音信号を近端入力信号としてエコー抑圧装置100に入力される。
遠端信号周波数領域変換部108では、例えば、高速フーリエ変換(FFT)等により、遠端信号を時間領域の信号から周波数領域の信号に変換し、変換された遠端信号の周波数スペクトルROUT(i,ω)を遠端信号振幅スペクトル計算部109に出力する。
遠端信号振幅スペクトル計算部109では、周波数スペクトルROUT(i,ω)を用いて、(1)式に従い、遠端信号の振幅スペクトル|ROUT(i,ω)|が求められる。
Figure 0006648436
ここで、iはフレーム、ωは周波数ビン、ROUT_real(i,ω)とROUT_image(i,ω)は、フレームiにおける周波数ビンωの遠端信号の周波数スペクトルの実数部と虚数部を示しており、遠端信号の周波数スペクトルROUT(i,ω)は、(2)式で表すことができる。
Figure 0006648436
(2)式のjは虚数を表している。そして、遠端信号振幅スペクトル計算部109により求められた遠端信号の振幅スペクトル|ROUT(i,ω)|は、推定エコー信号計算部111、遠端信号保持部122に出力する。
推定エコーパス特性更新部110は、保持している前フレームに推定したエコーパス特性|H(i−1,ω)|を推定エコー信号計算部111に出力する。
推定エコー信号計算部111では、前フレームに推定したエコーパス特性|H(i−1,ω)|と、遠端信号の振幅スペクトル|ROUT(i,ω)|とを用いて、(3)式により、推定エコー信号の振幅スペクトル|ECHO(i,ω)|が求められる。
Figure 0006648436
(3)式は遠端信号の振幅スペクトル|ROUT(i,ω)|に、前フレームに推定したエコーパス特性|H(i−1,ω)|の対応する周波数ビンを乗じて、当該周波数ビンの推定エコー信号の振幅スペクトル|ECHO(i,ω)|を求めるという式である。そして、推定エコー信号計算部111により求められた推定エコー信号の振幅スペクトル|ECHO(i,ω)|を推定エコー信号保持部112に出力する。
推定エコー信号保持部112では、推定エコー信号計算部111から出力された推定エコー信号の振幅スペクトル|ECHO(i,ω)|が推定エコー信号の振幅スペクトルバッファECHO_Buffer(n,ω)に書き込まれ、推定エコー信号の振幅スペクトル|ECHO(i,ω)|が過去複数フレーム保持される。
Figure 0006648436
(4)式のnは推定エコー信号保持部112の推定エコー信号の振幅スペクトルバッファの書込み位置であり、推定エコー信号の振幅スペクトル|ECHO(i,ω)|が書込まれるとインクリメントされ、nが推定エコー信号の振幅スペクトルバッファの大きさと同じになると、nに0が代入され上書き保持される。書込みが完了すればフレーム遅延量推定部115に推定エコー信号保持部112が保持している過去の推定エコー信号の振幅スペクトルを複数フレーム出力する。
一方、近端入力信号周波数領域変換部113では、例えば、高速フーリエ変換(FFT)等により、近端入力信号を時間領域の信号から周波数領域の信号に変換する。変換された近端入力信号の周波数スペクトルSIN(i,ω)は、近端入力信号振幅スペクトル計算部114及びエコーサプレス部119に出力される。
近端入力信号振幅スペクトル計算部114は、近端入力信号の周波数スペクトルSIN(i,ω)を用いて、(5)式に従い、近端入力信号の振幅スペクトル|SIN(i,ω)|を求める。
Figure 0006648436
ここで、SIN_real(i,ω)とSIN_image(i,ω)は、フレームiにおける周波数ビンωの近端入力信号の周波数スペクトルの実数部と虚数部を示しており、近端入力信号の周波数スペクトルSIN(i,ω)は、式(6)で表すことができる。
Figure 0006648436
(6)式のjは虚数を表している。そして、近端入力信号振幅スペクトル計算部114により求められた近端入力信号の振幅スペクトル|SIN(i,ω)|は、フレーム遅延量推定部115、エコーサプレスゲイン計算部118、シングルトーク判定部124、及び推定エコーパス特性更新部110に出力される。
フレーム遅延量推定部115は、推定エコー信号保持部112から出力される過去の推定エコー信号の振幅スペクトルの複数フレームECHO_Buffer(n−k)(0≦k≦N)と近端入力信号の振幅スペクトル|SIN(i,ω)|からフレーム遅延量を推定する。フレーム遅延量の推定方法は、例えば、推定エコー信号保持部112から出力される過去の推定エコー信号の振幅スペクトルの複数フレームECHO_Buffer(n−k)と近端入力信号の振幅スペクトル|SIN(i,ω)|の誤差がフレーム毎に(7)式に従い求める。
Figure 0006648436
(7)式のFsはサンプリング周波数である。そして、フレーム遅延量推定部115は、(8)式に従い、フレーム誤差Error(i,k)が最小になるフレーム遅延量delay(i)を求める。
Figure 0006648436
(8)式のargmin(x(k))という関数は、x(k)が最小になる引数を出力する関数であり、フレーム誤差Error(i,k)が最小になるフレーム遅延量を出力し、delay(i)に代入するという式である。
なお、フレーム遅延量の推定の手法は、種々の方法を広く適用することができ、例えば、推定エコー信号の振幅スペクトルの複数フレームECHO_Buffer(n−k)と近端入力信号の振幅スペクトル|SIN(i,ω)|のフレーム毎の相関を算出し、最も相関が高いフレームを求め、その最も相関が高いフレームをフレーム遅延量delay(i)とするとしても良い。フレーム遅延量推定部115は、推定したフレーム遅延量delay(i)を推定出力する。
フレーム遅延量収束判定部116は、フレーム遅延量推定部115で推定したフレーム遅延量delay(i)が収束しているか判定し、推定したフレーム遅延量が収束していなければ、フレーム遅延量delay(i)に固定値を代入して出力する。推定したフレーム遅延量が収束していれば、推定したフレーム遅延量delay(i)を推定エコーパス特性更新部110、推定エコー信号遅延部117及び、遠端信号保持部122に出力する。さらに、フレーム遅延量収束判定部116は、収束判定結果を推定エコーパス特性更新部110に出力する。
推定エコー信号遅延部117では、フレーム遅延量delay(i)を用いて、推定エコー信号保持部112に保持されている過去の推定エコー信号の振幅スペクトルを当該フレーム遅延量だけ遅延させたフレームを読出し、遅延した推定エコー信号とする。この遅延した推定エコー信号は(9)式で表すことができる。
Figure 0006648436
推定エコー信号遅延部117は、遅延した推定エコー信号の振幅スペクトル|ECHO_DELAY(i、ω)|をエコーサプレスゲイン計算部118に出力する。
エコーサプレスゲイン計算部118では、近端入力信号の振幅スペクトル|SIN(i,ω)|と遅延した推定エコー信号の振幅スペクトル|ECHO_DELAY(i、ω)|とを取得して、(10)式に従い、エコーサプレスゲインG(i,ω)を求める。
Figure 0006648436
(10)式は、周波数ビン毎に近端入力信号の振幅スペクトル|SIN(i,ω)|から推定エコー信号の振幅スペクトル|ECHO_DELAY(i,ω)|を差し引いた振幅スペクトルを、近端入力信号の振幅スペクトル|SIN(i,ω)|で除することで、エコーサプレスゲインG(i,ω)を求めるという式である。エコーサプレスゲイン計算部118により求められたエコーサプレスゲインG(i,ω)は、エコーサプレス部119に出力する。
エコーサプレス部119では、近端入力信号のスペクトルSIN(i,ω)とエコーサプレスゲインG(i,ω)とを用いて、(11)式、(12)式に従い、近端入力信号のスペクトルSIN(i,ω)に重畳されている音響エコー信号を抑圧する。
Figure 0006648436
Figure 0006648436
ここで、SOUT_real(i,ω)とSOUT_image(i,ω)は、フレームiにおける周波数ビンωの近端出力信号の周波数スペクトルの実数部と虚数部を示しており、近端出力信号の周波数スペクトルSOUT(i,ω)は(13)式で表すことができる。
Figure 0006648436
(13)式のjは虚数を表している。(11)式と(12)式は、周波数スペクトルの実数部、虚数部にエコーサプレスゲインG(i,ω)を周波数ビン毎に乗じて、音響エコー信号を抑圧した近端出力信号の周波数スペクトルを求める。そして、エコーサプレス部119により求められた音響エコー信号が抑圧された近端出力信号の周波数スペクトルSOUT(i,ω)を近端出力信号時間領域変換部120、及び近端出力信号振幅スペクトル計算部に出力する。
近端出力信号時間領域変換部120では、近端出力信号のスペクトルSOUT(i,ω)が、例えば、逆高速フーリエ変換(InverseFFT)等により、時間領域のデジタル音信号に変換され、変換された近端出力信号を近端信号出力端子121に出力する。
近端信号出力端子121は、例えば、インターネットプロトコル(IP)網等のネットワークや、携帯電話等の無線ネットワークの電波等に接続されており、近端出力信号を接続されている回線を介して通話相手である遠端側に出力する。
遠端信号保持部122は、遠端信号振幅スペクトル計算部109から出力された遠端信号の振幅スペクトル|ROUT(i,ω)|を、推定エコー信号保持部112と同じ書込みフレームに書込む。
Figure 0006648436
そして、遠端信号保持部122は、(15)式に従い、フレーム遅延量delay(i)だけ遅延させた遠端信号の振幅スペクトル|ROUT_DELAY(i,ω)|を推定エコーパス特性更新部110に出力する。
Figure 0006648436
近端出力信号振幅スペクトル計算部123では、近端出力信号の周波数スペクトルSOUT(i,ω)を用いて、(16)式に従い、近端出力信号の振幅スペクトル|SOUT(i,ω)|が求められる。
Figure 0006648436
そして、近端出力信号振幅スペクトル計算部123により求められた近端入力信号の振幅スペクトル|SOUT(i,ω)|は、シングルトーク判定部124に出力される。
シングルトーク判定部124では、近端入力信号がシングルトークかシングルトーク以外かを、近端入力信号の振幅スペクトルと近端出力信号の振幅スペクトルとを用いて判定する。シングルトークかシングルトーク以外かを判定する手法は、例えば、(17)式に従い、シングルトークかシングルトーク以外かを判定する手法がある。
Figure 0006648436
(17)式のFsはサンプリング周波数、TH1は閾値である。つまり、(17)式の条件が真のときはシングルトークと判定し、偽のときはシングルトーク以外として判定する。閾値TH1は、(17)式の場合、シングルトーク時は(17)式の左辺が小さい値になるので、小さい固定値(例えばTH1=0.3)やフレームで変化する変数などにしても良い。なお、シングルトークかシングルトーク以外かの判定の手段は、種々の方法を広く適用することができ、例えば、遠端信号の振幅スペクトルと推定したフレーム遅延量だけ遅延させた近端信号の振幅スペクトルとの相闘を求め、その相関値が高いときはシングルトークとする方法で判定しても良い。シングルトーク判定部124は、シングルトーク判定結果を推定エコーパス特性更新部110に出力する。
推定エコーパス特性更新部110では、フレーム遅延量収束判定部116でフレーム遅延量が収束していないと判定されている間は、エコーパス特性は固定値を次のフレームで推定エコー信号計算部111に出力する。それと同時に、推定エコーパス特性更新部110は、シングルトーク判定部124でシングルトークと判定されたフレームについて、現フレームの推定エコーパス特性を遠端信号保持部122からの遅延させた遠端信号の振幅スペクトルと、近端出力信号振幅スペクトル計算部123からの近端出力信号の振幅スペクトルを用いて求め、推定エコーパス特性更新部110に保持されている1フレーム前に保持した推定エコーパス特性を読み出し、エコーパス特性を更新する。
一方、推定エコーパス特性更新部110は、フレーム遅延量収束判定部116でフレーム遅延量が収束していると判定されると、シングルトーク判定部124でシングルトークと判定されたフレームについて、現フレームの推定エコーパス特性を、遠端信号保持部122からの遅延させた遠端信号の振幅スペクトルと、近端出力信号振幅スペクトル計算部123からの近端出力信号の振幅スペクトルを用いて求め、推定エコーパス特性更新部110に保持されている1フレーム前に保持した推定エコーパス特性を読み出し、エコーパス特性を更新する。
(A−2−2)フレーム遅延量収束判定部の処理
次に、第1の実施形態に係るエコー抑圧装置100におけるフレーム遅延量収束判定部116の処理を、図面を参照しながら詳細に説明する。
図2は、第1の実施形態に係るエコー抑圧装置100のフレーム遅延量収束判定部116の処理フローを示す処理フロー図である。
図2において、フレーム遅延量収束判定部116は、フレーム遅延量収束判定201、フレーム遅延量固定値出力202、及びフレーム遅延量推定値出力203を行う。
フレーム遅延量収束判定201は、推定したフレーム遅延量が収束したか収束していないかを判定し、収束判定結果を出力する。
フレーム遅延量固定値出力202は、フレーム遅延量収束判定201でフレーム遅延量が収束していないと判定されれば動作し、フレーム遅延量の固定値を出力する。
フレーム遅延量推定値出力203は、フレーム遅延量収束判定201でフレーム遅延量が収束していると判定されれば動作し、推定したフレーム遅延量を出力する。
(A−2−3)フレーム遅延量収束判定部の詳細処理
次に、第1の実施形態に係るエコー抑圧装置100におけるフレーム遅延量収束判定部116の処理の動作を詳細に説明する。
フレーム遅延量収束判定201では、推定したフレーム遅延量が収束しているか収束していないかを判定する。収束判定方法は、例えば、(18)に従い、フレーム遅延量の時定数フィルタで平滑化した値delay_TC(i)を求める。
Figure 0006648436
aは時定数フィルタの係数であり、0より大きく、1より小さい値であって、エコーパス特性の更新を遅くしたい場合は1に近い値が望ましく(例えば、a=0.99等の値)、更新を早くしたい場合は0に近い値が望ましい(例えば、a=0.01等の値)。
そして、フレーム遅延量収束判定201は、その平滑化した値delay_TC(i)と推定したフレーム遅延量delay(i)の差が閾値以下になるときを(19)式に従いカウントする。
Figure 0006648436
(19)式のTH2は閾値である。TH2はde1ay_TC(i)とdelay(i)との差が小さいか判定できれば良く、値が小さい固定値(例えば、TH2=0やTH2=1など)とする。delay_TC(i)とdelay(i)の差が閾値TH2より小さいときはcountをインクリメントする。
フレーム遅延量収束判定201は、(19)式のcountが規定回数(例えば、count=100)より小さいときは、フレーム遅延量が収束していないと判定し、countが規定回数より大きくなったときフレーム遅延量が収束したと判定する。なお、フレーム遅延量の収束判定結果は推定エコーパス特性更新部110でも使用する。
フレーム遅延量固定値出力202では、フレーム遅延量収束判定201でフレーム遅延量が収束していないと判定されると動作し、フレーム遅延量de1ay(i)に固定値を代入して出力する。フレーム遅延量の固定値は、例えば、エコー抑圧装置のスピーカとマイクの距離から算出されるフレーム遅延量としても良い。なお、固定値の決定手段は、種々の方法を広く適用することができ、例えば、エコー抑圧装置のフレーム遅延量の最小値としても良い。
フレーム遅延量推定値出力203では、フレーム遅延量収束判定201でフレーム遅延量が収束していると判定されると動作し、フレーム遅延量収束判定201で推定したフレーム遅延量delay(i)を出力する。
(A−2−4)推定エコーパス特性更新部の処理
次に、第1の実施形態に係るエコー抑圧装置100における推定エコーパス特性更新部の処理を、図面を参照しながら詳細に説明する。
図3は、本発明の第1の実施形態に係るエコー抑圧装置100の推定エコーパス特性更新部110の処理フローを示す処理フロー図である。
図3において、本発明のエコー抑圧装置100の推定エコーパス特性更新部110は、フレーム遅延量収束判定確認301、フレーム遅延量未収束時の推定エコーパス特性更新302、シングルトーク判定確認303、及びフレーム遅延量収束時の推定エコーパス特性更新304を行う。
フレーム遅延量収束判定確認301は、フレーム遅延量収束判定部116の判定結果を用いてフレーム遅延量が収束したか収束していないかを確認する。
フレーム遅延量未収束時の推定エコーパス特性更新302は、フレーム遅延量収束判定確認301でフレーム遅延量が収束していないときに動作し、固定値のフレーム遅延量を用いてエコーパス特性を算出する。
シングルトーク判定確認303は、フレーム遅延量収束判定確認301でフレーム遅延量が収束したときにシングルトーク判定部124の結果を用いてシングルトークかシングルトーク以外かを確認する。
フレーム遅延量収束時の推定エコーパス特性更新304は、フレーム遅延量収束判定確認301でフレーム遅延量が収束しており、シングルトーク判定確認303で現フレームがシングルトークのときに動作し、推定エコーパス特性の更新を行う。
(A−2−5)推定エコーパス特性更新部の詳細処理
次に、第1の実施形態に係るエコー抑圧装置100における推定エコーパス特性更新部110の処理の動作を詳細に説明する。
フレーム遅延量収束判定確認301は、フレーム遅延量収束判定部116の判定結果を用いてフレーム遅延量が収束したか収束していないかを確認し、フレーム遅延量が収束していないときは、推定エコーパス特性を更新し、固定値のフレーム遅延量を用いてエコーパス特性の算出を行う。フレーム遅延量が収束しているときはシングルトーク判定確認を行う。
フレーム遅延量未収束時の推定エコーパス特性更新302は、フレーム遅延量収束判定確認301でフレーム遅延量が収束していないとき動作し、固定値のフレーム遅延量を用いて推定エコーパス特性|H(i,ω)|を算出し保持する。フレーム遅延量未収束時の推定エコーパス特性更新302は、固定値分遅延させた遠端信号の振幅スペクトル|ROUT_DELAY(i,ω)|と近端出力信号の振幅スペクトル|SIN(i,ω)|を用いて、現フレームの推定エコーパス特性|H(i,ω)|を(20)式に従い求める。
Figure 0006648436
そして、フレーム遅延量未収束時の推定エコーパス特性更新302は、現フレームの推定エコーパス特性|H(i,ω)|が求まれば、推定エコーパス特性更新部110に保持されている1フレーム前に保持した推定エコーパス特性|H(i−1,ω)|を読み出し、|H(i−1,ω)|と、|H(i,ω)|を用いて、推定エコーパス特性を(21)式に従って更新する。
Figure 0006648436
bは時定数フィルタの係数であり、0より大きく、1より小さい値であって、エコーパス特性の更新を遅くしたい場合は1に近い値が望ましく(例えば、b=0.99等の値)、更新を早くしたい場合は0に近い値が望ましい(例えば、b=0.01等の値)。フレーム遅延量未収束時の推定エコーパス特性更新302は、更新した推定エコーパス特性を推定エコーパス特性更新部110に保持させる。
シングルトーク判定確認303は、フレーム遅延量が収束しているときに動作し、シングルトーク判定部124の結果を用いて、現フレームがシングルトークかシングルトークでないかを確認する。シングルトーク判定確認303は、現フレームがシングルトークであれば、推定エコーパス特性の更新を行い、現フレームがシングルトークではなければ、推定エコーパス特性の更新は行わない。
フレーム遅延量収束時の推定エコーパス特性更新304は、フレーム遅延量収束判定確認301でフレーム遅延量が収束し、且つ、シングルトーク判定確認303で現フレームがシングルトークのとき、遅延させた遠端信号の振幅スペクトル|ROUT_DELAY(i,ω)|と近端出力信号の振幅スペクトル|SIN(i,ω)|を用いて、先述の(20)式に従い、現フレームの推定エコーパス特性|H(i,ω)|を求める。
そして、フレーム遅延量収束時の推定エコーパス特性更新304は、現フレームの推定エコーパス特性|H(i,ω)|が求まれば、推定エコーパス特性更新部110に保持されている1フレーム前に保持した推定エコーパス特性|H(i−1,ω)|を読み出し、|H(i−1,ω)|と、|H(i,ω)|を用いて、(22)式に従い、推定エコーパス特性を更新する。
Figure 0006648436
cは時定数フィルタの係数であり、0より大きく、1より小さい値であって、エコーパス特性の更新を遅くしたい場合は1に近い値が望ましく(例えば、c=0.99等の値)、更新を早くしたい場合は0に近い値が望ましい(例えば、c=0.01等の値)。フレーム遅延量収束時の推定エコーパス特性更新304は、更新した推定エコーパス特性を推定エコーパス特性更新部110に保持させる。
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、エコー抑圧装置が動作を開始した直後でも、フレーム遅延量の固定値と固定推定エコーパス特性を使用して音響エコー信号を抑圧することができ、フレーム遅延量が収束すれば、推定したフレーム遅延量と推定エコーパス特性を使用して音響エコー信号を抑圧することができる。つまり、第1の実施形態のエコー抑圧装置は、動作を開始した直後から継続してエコー抑圧性能を維持することができる。
(B)本発明の第2の実施形態
次に、本発明の第2の実施形態のエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法を、図面を参照しながら詳細に説明する。
(B−1)第2の実施形態の構成
第2の実施形態のエコー抑圧装置100は、推定エコーパス特性更新部110の代わりに推定エコーパス特性更新部200を構成要素とする点が第1の実施形態のエコー抑圧装置100と異なる。それ以外の構成要素は第1の実施形態に係る図1のエコー抑圧装置100の構成要素と同一又は対応するものである。
(B−2)第2の実施形態の動作
(B−2−1)推定エコーパス特性更新部の処理
図4は、第2の実施形態に係るエコー抑圧装置100の推定エコーパス特性更新部200の処理フローを示す処理フロー図である。
図4において、第2の実施形態に係る推定エコーパス特性更新部200は、第1の実施形態で説明した、推定エコーパス特性更新部110に加えて、フレーム遅延量未収束時の推定エコーパス特性更新302の変わりに平滑化エコーパス特性更新401を行う。
なお、図4において、第1の実施形態に係るエコー抑圧装置100の構成要素と同一又は対応するものについては同一の符号を付している。また、第1の実施形態と同一又は対応する構成要素の詳細な説明は重複するため、ここでは省略する。
平滑化エコーパス特性更新401は、フレーム遅延量収束判定確認301でフレーム遅延量が収束していないとき、固定値分遅延させた遠端信号の振幅スペクトルと近端出力信号の振幅スペクトルを平滑化し、平滑化し遅延させた遠端信号の振幅スペクトルと平滑化した近端出力信号の振幅スペクトルを用いて平滑化推定エコーパス特性を算出する。
(B−2−2)推定エコーパス特性更新部の詳細処理
次に、第2の実施形態に係るエコー抑圧装置100における推定エコーパス特性更新部200の処理の動作を詳細に説明する。ここでは、第2の実施形態に係るエコー抑圧装置100の、平滑化エコーパス特性更新401における処理動作を詳細に説明する。
平滑化エコーパス特性更新401では、フレーム遅延量収束判定確認301でフレーム遅延量が収束していないとき動作し、平滑化推定エコーパス特性|H_TC(i,ω)|を算出する。平滑化推定エコーパス特性は、遅延させた遠端信号の振幅スペクトル|ROUT_DELAY(i,ω)|と近端出力信号の振幅スペクトル|SIN(i,ω)|とから、(23)式、(24)式に従って、周波数ビン毎に平滑化した遅延遠端信号の振幅スペクトル|ROUT_DELAY_TC(i,ω)|と周波数ビン毎平滑化した近端出力信号の振幅スペクトル|SIN_TC(i,ω)|を求める。
Figure 0006648436
Figure 0006648436
dは時定数フィルタの係数であり、0より大きく、1より小さい値であって、エコーパス特性の更新を遅くしたい場合は1に近い値が望ましく(例えば、d=0.99等の値)、更新を早くしたい場合は0に近い値が望ましい(例えば、d=0.01等の値)。そして、平滑化エコーパス特性更新401は、周波数ビン毎に平滑化した遅延遠端信号の振幅スペクトル|ROUT_DELAY_TC(i,ω)|と周波数ビン毎に平滑化した近端出力信号の振幅スペクトル|SIN_TC(i,ω)|を使用して(25)、(26)式に従って平滑化推定エコーパス特性を求め、平滑化推定エコー信号を保持する。
Figure 0006648436
Figure 0006648436
(B−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、エコー抑圧装置が動作を開始した直後でも、フレーム遅延量の固定値と平滑化推定エコーパス特性を使用して音響エコー信号を抑圧することができ、フレーム遅延量が収束すれば、推定したフレーム遅延量と推定エコーパス特性を使用して音響エコー信号を抑圧することができる。つまり、第2の実施形態のエコー抑圧装置は、動作を開始した直後から継続してエコー抑圧性能を維持することができる。
(C)他の実施形態
上述した各実施形態においても、種々の変形実施形態を説明したが、本発明は以下の変形実施形態についても適用することができる。
上述した各実施形態で説明したエコー抑圧装置は、例えば、テレビ会議システムや電話会議システム等に用いられる音声通信装置を含む装置に搭載されるようにしても良い。また、携帯電話機やスマートフォン等の携帯端末に本発明のエコー抑圧装置は搭載されるようにしても良い。
100…エコー抑圧装置、101…遠端信号入力端子、102…出力バッファ、103…DA変換器、104…スピーカ、105…マイク、106…AD変換器、107…入力バッファ、108…遠端信号周波数領域変換算部、109…遠端信号振幅スペクトル計算部、110…推定エコーパス特性更新部、111…推定エコー信号計算部、112…推定エコー信号保持部、113…近端入力信号周波数領域変換部、114…近端入力信号振幅スペクトル計算部、115…フレーム遅延量推定部、116…フレーム遅延量収束判定部、117…推定エコー信号遅延部、118…エコーサプレスゲイン計算部、119…エコーサプレス部、120‥近端出力信号時間領域変換部、121…近端信号出力端子、122…遠端信号保持部、123…近端出力信号振幅スペクトル計算部、124…シングルトーク判定部、201…フレーム遅延量収束判定、202…フレーム遅延量固定値出力、203…フレーム遅延量推定値出力、301…フレーム遅延量収束判定確認、302…フレーム遅延量未収束時の推定エコーパス特性更新、303…シングルトーク判定確認、304…フレーム遅延量収束時のエコーパス特性更新、401…平滑化エコーパス特性更新。

Claims (4)

  1. 近端入力信号と、遠端信号とに基づく音響エコー信号を抑圧するエコー抑圧装置において、
    上記遠端信号の振幅スペクトルと推定エコーパス特性を用いて推定エコー信号の振幅スペクトルを算出する推定エコー信号計算手段と、
    上記推定エコー信号計算手段で算出した推定エコー信号の振幅スペクトルを過去複数フレーム保持する推定エコー信号保持手段と、
    上記推定エコー信号保持手段に保持されている過去複数フレームの上記推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとからフレーム遅延量を推定するフレーム遅延量推定手段と、
    上記フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、収束判定結果と該収束判定結果が収束していないと判定したときは固定フレーム遅延量を上記フレーム遅延量として出力し、収束していると判定したときは上記フレーム遅延量推定手段で推定した上記フレーム遅延量を出力するフレーム遅延量収束判定手段と、
    上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量を用いて、上記フレーム遅延量だけ遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを算出するエコーサプレスゲイン算出手段と、
    上記エコーサプレスゲイン算出手段で算出した上記エコーサプレスゲインと、上記近端入力信号の振幅スペクトルとから上記推定エコー信号を抑圧するエコー抑圧手段と、
    保持している推定エコーパス特性を上記推定エコー信号計算手段に出力し、上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量の上記収束判定結果から、上記フレーム遅延量が収束していないと判定すると、上記固定フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する一方、収束していれば、シングルトークと判定されたフレームについて、推定された上記フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する推定エコーパス特性更新手段と
    を有することを特徴とするエコー抑圧装置。
  2. 上記推定エコーパス特性更新手段は、上記フレーム遅延量が収束していないと判定すると、上記固定フレーム遅延量の値だけ遅延させた上記遠端信号の振幅スペクトルと、上記エコー抑圧手段により上記近端入力信号の上記推定エコー信号が抑圧された近端出力信号の振幅スペクトルとを平滑化し、平滑化した上記遠端信号の振幅スペクトルと、上記近端出力信号の振幅スペクトルとを用いて、現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持することを特徴とする請求項に記載のエコー抑圧装置。
  3. 近端入力信号と、遠端信号とに基づく音響エコー信号を抑圧するエコー抑圧装置に搭載されるコンピュータを、
    上記遠端信号の振幅スペクトルと推定エコーパス特性を用いて推定エコー信号の振幅スペクトルを算出する推定エコー信号計算手段と、
    上記推定エコー信号計算手段で算出した推定エコー信号の振幅スペクトルを過去複数フレーム保持する推定エコー信号保持手段と、
    上記推定エコー信号保持手段に保持されている過去複数フレームの上記推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとからフレーム遅延量を推定するフレーム遅延量推定手段と、
    上記フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、収束判定結果と該収束判定結果が収束していないと判定したときは固定フレーム遅延量を上記フレーム遅延量として出力し、収束していると判定したときは上記フレーム遅延量推定手段で推定した上記フレーム遅延量を出力するフレーム遅延量収束判定手段と、
    上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量を用いて、上記フレーム遅延量だけ遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを算出するエコーサプレスゲイン算出手段と、
    上記エコーサプレスゲイン算出手段で算出した上記エコーサプレスゲインと、上記近端入力信号の振幅スペクトルとから上記推定エコー信号を抑圧するエコー抑圧手段と、
    保持している推定エコーパス特性を上記推定エコー信号計算手段に出力し、上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量の上記収束判定結果から、上記フレーム遅延量が収束していないと判定すると、上記固定フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する一方、収束していれば、シングルトークと判定されたフレームについて、推定された上記フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する推定エコーパス特性更新手段と
    して機能させることを特徴とするエコー抑圧プログラム。
  4. 近端入力信号と、遠端信号とに基づく音響エコー信号を抑圧するエコー抑圧方法において、
    推定エコー信号計算手段、推定エコー信号保持手段、フレーム遅延量推定手段、フレーム遅延量収束判定手段、エコーサプレスゲイン算出手段、推定エコーパス特性更新手段、及びエコー抑圧手段を有し、
    上記推定エコー信号計算手段は、上記遠端信号の振幅スペクトルと推定エコーパス特性を用いて推定エコー信号の振幅スペクトルを算出し、
    上記推定エコー信号保持手段は、上記推定エコー信号計算手段で算出した推定エコー信号の振幅スペクトルを過去複数フレーム保持し、
    上記フレーム遅延量推定手段は、上記推定エコー信号保持手段に保持されている過去複数フレームの上記推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとからフレーム遅延量を推定し、
    上記フレーム遅延量収束判定手段は、上記フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、収束判定結果と該収束判定結果が収束していないと判定したときは固定フレーム遅延量を上記フレーム遅延量として出力し、収束していると判定したときは上記フレーム遅延量推定手段で推定した上記フレーム遅延量を出力し、
    上記エコーサプレスゲイン算出手段は、上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量を用いて、上記フレーム遅延量だけ遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを算出し、
    上記エコー抑圧手段は、上記エコーサプレスゲイン算出手段で算出した上記エコーサプレスゲインと、上記近端入力信号の振幅スペクトルとから上記推定エコー信号を抑圧し
    上記推定エコーパス特性更新手段は、保持している推定エコーパス特性を上記推定エコー信号計算手段に出力し、上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量の上記収束判定結果から、上記フレーム遅延量が収束していないと判定すると、上記固定フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する一方、収束していれば、シングルトークと判定されたフレームについて、推定された上記フレーム遅延量の値だけ遅延させた遠端信号の振幅スペクトルと上記近端入力信号の振幅スペクトルとを用いて現フレームの推定エコーパス特性を算出し、上記保持している推定エコーパス特性と算出した現フレームの推定エコーパス特性とから推定エコーパス特性を更新して保持する
    ことを特徴とするエコー抑圧方法。
JP2015149935A 2015-07-29 2015-07-29 エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法 Active JP6648436B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015149935A JP6648436B2 (ja) 2015-07-29 2015-07-29 エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015149935A JP6648436B2 (ja) 2015-07-29 2015-07-29 エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法

Publications (2)

Publication Number Publication Date
JP2017034355A JP2017034355A (ja) 2017-02-09
JP6648436B2 true JP6648436B2 (ja) 2020-02-14

Family

ID=57988966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015149935A Active JP6648436B2 (ja) 2015-07-29 2015-07-29 エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法

Country Status (1)

Country Link
JP (1) JP6648436B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111556210B (zh) * 2020-04-23 2021-10-22 深圳市未艾智能有限公司 通话语音处理方法与装置、终端设备和存储介质

Also Published As

Publication number Publication date
JP2017034355A (ja) 2017-02-09

Similar Documents

Publication Publication Date Title
US9591123B2 (en) Echo cancellation
US9697845B2 (en) Non-linear echo path detection
JP6295722B2 (ja) エコー抑圧装置、プログラム及び方法
JP6160403B2 (ja) エコー抑圧装置及びエコー抑圧プログラム
US20190349471A1 (en) Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters
CN109727607B (zh) 时延估计方法、装置及电子设备
KR102190833B1 (ko) 에코 억제
JP4155774B2 (ja) エコー抑制システム及び方法
US8804981B2 (en) Processing audio signals
JP6648436B2 (ja) エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法
JP6432384B2 (ja) エコー抑圧装置、エコー抑圧プログラム及びエコー抑圧方法
JP6369189B2 (ja) エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末
JP6369192B2 (ja) エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末
KR20220157475A (ko) 반향 잔류 억제
JP6398470B2 (ja) ステレオエコー抑圧装置、エコー抑圧装置、ステレオエコー抑圧方法及びステレオエコー抑圧プログラム
JP6221258B2 (ja) 信号処理装置、方法及びプログラム
JP6180689B1 (ja) エコーキャンセラ装置、エコー消去方法、及びエコー消去プログラム
JP6314608B2 (ja) エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法
JP6555057B2 (ja) 音源分離エコー抑圧装置、音源分離エコー抑圧プログラム、及び音源分離エコー抑圧方法
JPWO2013032001A1 (ja) 音声処理装置、その制御方法および制御プログラム
JP2013005106A (ja) 場内拡声装置、場内拡声方法、及びそのプログラム
Fukui et al. Hands-free audio conferencing unit with low-complexity dereverberation
JP6164015B2 (ja) エコー抑圧装置、及びエコー抑圧プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190528

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191230

R150 Certificate of patent or registration of utility model

Ref document number: 6648436

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150