JP2017034355A - Echo suppression device, echo suppression program, and echo suppression method - Google Patents
Echo suppression device, echo suppression program, and echo suppression method Download PDFInfo
- Publication number
- JP2017034355A JP2017034355A JP2015149935A JP2015149935A JP2017034355A JP 2017034355 A JP2017034355 A JP 2017034355A JP 2015149935 A JP2015149935 A JP 2015149935A JP 2015149935 A JP2015149935 A JP 2015149935A JP 2017034355 A JP2017034355 A JP 2017034355A
- Authority
- JP
- Japan
- Prior art keywords
- delay amount
- frame delay
- signal
- echo
- estimated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法に関し、例えば、テレビ会議システムや電話会議システム等において用いられるエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法に適用し得るものである。 The present invention relates to an echo suppression device, an echo suppression program, and an echo suppression method, and can be applied to, for example, an echo suppression device, an echo suppression program, and an echo suppression method used in a video conference system, a telephone conference system, and the like. .
例えば、テレビ会議システムや電話会議システム等の拡声通話システムでは、スピーカから放音された音(ここで、音は音響や音声等を含む。)がマイクに回り込んで送話側に戻る音響エコー信号が発生する。音響エコー信号は、通話の著しい妨げとなるため、音響エコー信号の抑圧方法に関して、これまでも多くの研究、開発が行なわれている。 For example, in a loudspeaker system such as a video conference system or a telephone conference system, an acoustic echo that is emitted from a speaker (where sound includes sound, voice, etc.) wraps around a microphone and returns to the transmitting side. A signal is generated. Since the acoustic echo signal significantly hinders a call, much research and development have been conducted on the acoustic echo signal suppression method.
音響エコー信号を抑圧する1つの手法として、エコー抑圧装置(エコーサプレッサー)を使用する手法がある。エコー抑圧装置とは、遠端信号と近端入力信号とから推定エコーパス特性、推定エコー信号、エコーサプレスゲインを求めて、近端入力信号とエコーサプレスゲインを乗算することで音響エコー信号を抑圧する手法である。このエコー抑圧装置を使用して音響エコー信号を抑圧する手法が非特許文献1によって提案されている。 One technique for suppressing the acoustic echo signal is to use an echo suppressor (echo suppressor). The echo suppressor obtains the estimated echo path characteristics, estimated echo signal, and echo suppress gain from the far end signal and the near end input signal, and suppresses the acoustic echo signal by multiplying the near end input signal and the echo suppress gain. It is a technique. Non-Patent Document 1 proposes a technique for suppressing an acoustic echo signal using this echo suppressor.
非特許文献1に開示されるエコー抑圧装置は、過去のフレームの遠端信号と近端入力信号とに基づいて推定エコーパス特性を求める。そして、求めた推定エコーパス特性と遠端信号とを乗算した信号を推定エコー信号とし、エコー抑圧装置は、近端入力信号と推定エコー信号とに基づいてエコーサプレスゲインを求め、エコーサプレスゲインを近端入力信号と乗算して音響エコー信号を抑圧する。 The echo suppressor disclosed in Non-Patent Document 1 obtains an estimated echo path characteristic based on a far-end signal and a near-end input signal of a past frame. Then, the signal obtained by multiplying the obtained estimated echo path characteristic and the far-end signal is used as an estimated echo signal, and the echo suppressor obtains an echo suppression gain based on the near-end input signal and the estimated echo signal, Multiply with the end input signal to suppress the acoustic echo signal.
しかしながら、非特許文献1に記載のエコー抑圧装置では、ソフトフォンやスマートフォンなどの入出力部にバッファがある機器で使用すると、動作を開始してから推定エコーパス特性の学習が進むまで音響エコー信号を抑圧できない。さらに、ソフトフォンやスマートフォンはエコーサプレス処理以外にも様々なアプリケーションやプログラムが動作しており、負荷が大きくなるとバッファに音データを保存する処理や入力バッファから音データを出力する処理が停止するため、遅延量が大きくなり、且つ遅延量の変動が大きくなる。非特許文献1のエコーサプレス装置では、遅延量を考慮せずに、推定エコー信号を算出するとき過去のフレームの平均を用いて推定エコーパス特性を算出しているので、エコー抑圧装置が動作を開始した直後の音響エコー信号を抑圧できない。また、遅延量を考慮していないため、音響エコー信号が抑圧できない区間が長くなり、ハウリングが発生する可能性も考えられる。 However, in the echo suppression device described in Non-Patent Document 1, when used in a device having a buffer in an input / output unit such as a softphone or a smartphone, an acoustic echo signal is output until the learning of the estimated echo path characteristics proceeds after the operation starts. I cannot suppress it. In addition to the echo suppression process, various applications and programs are running on softphones and smartphones. If the load increases, the process of saving sound data in the buffer and the process of outputting sound data from the input buffer will stop. The delay amount increases, and the variation in the delay amount increases. In the echo suppression device of Non-Patent Document 1, since the estimated echo path characteristic is calculated using the average of past frames when calculating the estimated echo signal without considering the delay amount, the echo suppression device starts operating. The acoustic echo signal immediately after being applied cannot be suppressed. Further, since the delay amount is not taken into consideration, there is a possibility that a section in which the acoustic echo signal cannot be suppressed becomes long and howling occurs.
そのため、エコー抑圧装置の動作を開始した直後でも、音響エコー信号を抑圧できるエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法が望まれる。 Therefore, an echo suppression device, an echo suppression program, and an echo suppression method that can suppress an acoustic echo signal immediately after the operation of the echo suppression device is started are desired.
第1の本発明は、近端入力信号と、遠端信号とに基づく音響エコー信号を抑圧するエコー抑圧装置において、(1)過去複数フレームの推定エコー信号の振幅スペクトルと、近端入力信号の振幅スペクトルとからフレーム遅延量を推定するフレーム遅延量推定手段と、(2)フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、その判定した判定結果に基づき、上記フレーム遅延量を出力するフレーム遅延量収束判定手段と、(3)上記フレーム遅延量収束判定手段での上記判定結果に応じて、上記フレーム遅延量の固定値を用いて推定エコーパス特性を更新し保持する推定エコーパス特性更新手段と、(4)上記フレーム遅延量を用いて遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを計算し、上記近端入力信号の振幅スペクトルから上記推定エコー信号を抑圧するエコー抑圧手段とを有することを特徴とする。 According to a first aspect of the present invention, there is provided an echo suppressor that suppresses an acoustic echo signal based on a near-end input signal and a far-end signal, and (1) an amplitude spectrum of an estimated echo signal of a plurality of past frames, A frame delay amount estimating means for estimating a frame delay amount from the amplitude spectrum; and (2) determining whether or not the frame delay amount estimated by the frame delay amount estimating means has converged, and based on the determined determination result, A frame delay amount convergence determining means for outputting the frame delay amount; and (3) updating an estimated echo path characteristic using a fixed value of the frame delay amount in accordance with the determination result in the frame delay amount convergence determining means. An estimated echo path characteristic updating means to be held; (4) an amplitude spectrum of the estimated echo signal delayed by using the frame delay amount; and an amplitude of the near-end input signal. An echo suppression gain calculated in the spectrum, and having a echo suppression means for suppressing the estimated echo signal from the amplitude spectrum of the near-end input signal.
第2の本発明のエコー抑圧プログラムは、近端入力信号と、遠端信号とに基づく音響エコー信号を抑圧するエコー抑圧装置に搭載されるコンピュータを、(1)過去複数フレームの推定エコー信号の振幅スペクトルと、近端入力信号の振幅スペクトルとからフレーム遅延量を推定するフレーム遅延量推定手段と、(2)フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、その判定した判定結果に基づき、上記フレーム遅延量を出力するフレーム遅延量収束判定手段と、(3)上記フレーム遅延量収束判定手段での上記判定結果に応じて、上記フレーム遅延量の固定値を用いて推定エコーパス特性を更新し保持する推定エコーパス特性更新手段と、(4)上記フレーム遅延量を用いて遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを計算し、上記近端入力信号の振幅スペクトルから上記推定エコー信号を抑圧するエコー抑圧手段として機能させることを特徴とする。 The echo suppression program of the second aspect of the present invention provides a computer mounted on an echo suppression apparatus that suppresses an acoustic echo signal based on a near-end input signal and a far-end signal, and (1) an estimated echo signal of a plurality of past frames. A frame delay amount estimating means for estimating a frame delay amount from the amplitude spectrum and the amplitude spectrum of the near-end input signal; and (2) determining whether or not the frame delay amount estimated by the frame delay amount estimating means has converged. A frame delay amount convergence determining means for outputting the frame delay amount based on the determined determination result; and (3) a fixed value of the frame delay amount according to the determination result in the frame delay amount convergence determining means. And (4) an estimated echo signal delayed by using the frame delay amount. The amplitude spectrum, the echo suppression gain in the amplitude spectrum of the near-end input signal is calculated, characterized in that to function as an echo suppression means for suppressing the estimated echo signal from the amplitude spectrum of the near-end input signal.
第3の本発明は、近端入力信号と、遠端信号とに基づく音響エコー信号を抑圧するエコー抑圧方法において、フレーム遅延量推定手段、フレーム遅延量収束判定手段、推定エコーパス特性更新手段、及びエコー抑圧手段を有し、(1)上記フレーム遅延量推定手段は、過去複数フレームの推定エコー信号の振幅スペクトルと、近端入力信号の振幅スペクトルとからフレーム遅延量を推定し、(2)上記フレーム遅延量収束判定手段は、フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、その判定した判定結果に基づき、上記フレーム遅延量を出力し、(3)上記推定エコーパス特性更新手段は、上記フレーム遅延量収束判定手段での上記判定結果に応じて、上記フレーム遅延量の固定値を用いて推定エコーパス特性を更新し保持し、(4)上記エコー抑圧手段は、上記フレーム遅延量を用いて遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを計算し、上記近端入力信号の振幅スペクトルから上記推定エコー信号を抑圧することを特徴とする。 According to a third aspect of the present invention, there is provided an echo suppression method for suppressing an acoustic echo signal based on a near-end input signal and a far-end signal, a frame delay amount estimating unit, a frame delay amount convergence determining unit, an estimated echo path characteristic updating unit, and Echo suppression means, (1) the frame delay amount estimation means estimates the frame delay amount from the amplitude spectrum of the estimated echo signal of the past plural frames and the amplitude spectrum of the near-end input signal, and (2) the above The frame delay amount convergence determination means determines whether or not the frame delay amount estimated by the frame delay amount estimation means has converged, and outputs the frame delay amount based on the determined determination result, (3) The estimated echo path characteristic updating unit uses the fixed value of the frame delay amount according to the determination result of the frame delay amount convergence determining unit. (4) The echo suppression means calculates an echo suppression gain using the amplitude spectrum of the estimated echo signal delayed using the frame delay amount and the amplitude spectrum of the near-end input signal. The estimated echo signal is suppressed from the amplitude spectrum of the near-end input signal.
本発明によれば、エコー抑圧装置の動作を開始した直後でも、音響エコー信号を抑圧できる。 According to the present invention, an acoustic echo signal can be suppressed even immediately after the operation of the echo suppression device is started.
(A)第1の実施形態
以下では、本発明のエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法の第1の実施形態を、図面を参照しながら詳細に説明する。
(A) First Embodiment Hereinafter, a first embodiment of an echo suppression device, an echo suppression program, and an echo suppression method of the present invention will be described in detail with reference to the drawings.
第1の実施形態は、例えば、テレビ会議システムや電話会議システム等の拡声通話システムの音声送受信装置のエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法に本発明を適用する場合を例示する。 The first embodiment exemplifies a case where the present invention is applied to, for example, an echo suppression device, an echo suppression program, and an echo suppression method of an audio transmission / reception device of a loudspeaker communication system such as a video conference system or a telephone conference system.
(A−1)第1の実施形態の構成
図1は、本発明の実施形態に係るエコー抑圧装置100の構成を示すブロック図である。
(A-1) Configuration of First Embodiment FIG. 1 is a block diagram showing a configuration of an echo suppression apparatus 100 according to an embodiment of the present invention.
本発明の第1の実施形態に係るエコー抑圧装置100は、上述した本発明のエコー抑圧装置を実装したものであり、遠端信号が近端側の空間を伝達し、音響エコー信号として近端側のマイクに回り込んで入力されたときでも、近端入力信号に対してエコー抑圧処理を行い、音響エコー信号を適切に抑圧するものである。 The echo suppressor 100 according to the first embodiment of the present invention is implemented with the above-described echo suppressor of the present invention, and the far-end signal transmits the near-end side space and is used as an acoustic echo signal. Even when the signal is input around the side microphone, echo suppression processing is performed on the near-end input signal to appropriately suppress the acoustic echo signal.
第1の実施形態に係るエコー抑圧装置100は、例えば、専用ボードとして構築されるようにしても良いし、DSP(デジタルシグナルプロセッサ)へのエコー抑圧プログラムの書き込みによって実現されたものであっても良く、CPUと、CPUが実行するソフトウェア(エコー抑圧プログラム)によって実現されたものであっても良いが、機能的には、図1で表すことができる。 The echo suppression apparatus 100 according to the first embodiment may be configured as a dedicated board, for example, or may be realized by writing an echo suppression program to a DSP (digital signal processor). Although it may be realized by a CPU and software (echo suppression program) executed by the CPU, it can be functionally represented in FIG.
図1において、第1の実施形態に係るエコー抑圧装置100は、遠端信号入力端子101、出力バッファ102、DA変換器103、スピーカ104、マイク105、AD変換器106、入力バッファ107、遠端信号周波数領域変換部108、遠端信号振幅スペクトル計算部109、推定エコーパス特性更新部110、推定エコー信号計算部111、推定エコー信号保持部112、近端入力信号周波数領域変換部113、近端入力信号振幅スペクトル計算部114、フレーム遅延量推定部115、フレーム遅延量収束判定部116、推定エコー信号遅延部117、エコーサプレスゲイン計算部118、エコーサプレス部119、近端出力信号時間領域変換部120、近端信号出力端子121、遠端信号保持部122、近端出力信号振幅スペクトル計算部123、シングルトーク判定部124を有する。
In FIG. 1, an echo suppression apparatus 100 according to the first embodiment includes a far-end signal input terminal 101, an
遠端信号入力端子101は、例えば、インターネットプロトコル(IP)網等のネットワークや、携帯電話等の無線ネットワークの電波等に接続されており、接続されている回線を介して遠端側(相手側)の遠端信号が入力される。 The far-end signal input terminal 101 is connected to, for example, a network such as an Internet protocol (IP) network or a radio wave of a wireless network such as a mobile phone. ) Is input.
遠端信号入力端子101に入力された遠端信号は、出力バッファ102において一時保持され、DA変換器103の処理準備ができ次第、DA変換器103に遠端信号を出力し、DA変換器103において、デジタル音信号からアナログ音信号に変換され、スピーカ104を通して近端側に出力される。
The far-end signal input to the far-end signal input terminal 101 is temporarily held in the
出力バッファ102は、エコー抑圧装置100の処理待ち用のバッファである。
The
一方、近端側の話者が発した音声等の音信号や、環境音、音響エコー信号(例えば、スピーカ104から出力されたアナログ音信号が近端側の空間を伝達して回り込んだ信号)等が重畳したアナログ音信号は、マイク105において受音され、AD変換器106においてデジタル音信号に変換され、入力バッファ107において一時保持され、エコー抑圧装置100の準備ができ次第、デジタル音信号を近端入力信号としてエコー抑圧装置100に入力される。
On the other hand, a sound signal such as a voice uttered by a speaker on the near end side, an environmental sound, an acoustic echo signal (for example, an analog sound signal output from the
入力バッファ107は、エコー抑圧装置100の処理待ち用のバッファである。
The
遠端信号周波数領域変換部108は、例えば、高速フーリエ変換(FFT)等により、遠端信号を時間領域の信号から周波数領域の信号に変換し、遠端信号の周波数スペクトルを出力する。
The far-end signal frequency
遠端信号振幅スペクトル計算部109は、遠端信号の周波数スペクトルに基づいて、遠端信号の振幅スペクトルを算出し、算出した遠端信号の振幅スペクトルを出力する。
The far-end signal amplitude
推定エコーパス特性更新部110は、前フレームに推定したエコーパス特性を保持しており、保持している推定エコーパス特性に出力する。 The estimated echo path characteristic updating unit 110 holds the estimated echo path characteristic in the previous frame, and outputs it to the held estimated echo path characteristic.
さらに、推定エコーパス特性更新部110は、シングルトーク判定部124でシングルトークと判定されると、推定したフレーム遅延量だけ遅延させた遠端信号の振幅スペクトルと近端入力信号の振幅スペクトルに基づいて、現フレームの推定エコーパス特性を算出し、算出した現フレームの推定エコーパス特性と推定エコーパス特性更新部110に保持している推定エコーパス特性に基づき、推定エコーパス特性を更新し、更新した推定エコーパス特性を推定エコーパス特性更新部110に保存する。 Further, when the single-talk determining unit 124 determines that single-talk is determined, the estimated echo path characteristic updating unit 110 is based on the amplitude spectrum of the far-end signal and the amplitude spectrum of the near-end input signal delayed by the estimated frame delay amount. The estimated echo path characteristic of the current frame is calculated, the estimated echo path characteristic is updated based on the calculated estimated echo path characteristic of the current frame and the estimated echo path characteristic held in the estimated echo path characteristic update unit 110, and the updated estimated echo path characteristic is The estimated echo path characteristic update unit 110 stores the result.
推定エコー信号計算部111は、遠端信号の振幅スペクトルと推定エコーパス特性とを乗じて推定エコー信号の振幅スペクトルを算出し、算出した推定エコー信号の振幅スペクトルを出力する。 The estimated echo signal calculation unit 111 calculates the amplitude spectrum of the estimated echo signal by multiplying the amplitude spectrum of the far-end signal and the estimated echo path characteristic, and outputs the calculated amplitude spectrum of the estimated echo signal.
推定エコー信号保持部112は、推定エコー信号の振幅スペクトルを所定時間保持し、フレーム遅延量推定部115でフレーム遅延量を推定するために過去の推定エコー信号を複数フレーム出力する。さらに、推定エコー信号保持部112は、後述するフレーム遅延量収束判定部116から出力されたフレーム遅延量だけ遅延させた推定エコー信号を出力する。
The estimated echo
近端入力信号周波数領域変換部113は、例えば、高速フーリエ変換等により、近端入力信号を時間領域の信号から周波数領域の信号に変換し、近端入力信号の周波数スペクトルを出力する。 The near-end input signal frequency domain conversion unit 113 converts the near-end input signal from a time-domain signal to a frequency-domain signal by, for example, fast Fourier transform, and outputs a frequency spectrum of the near-end input signal.
近端入力信号振幅スペクトル計算部114は、近端入力信号の周波数スペクトルに基づいて、近端入力信号の振幅スペクトルを算出し、算出した近端入力信号の振幅スペクトルを出力する。
The near-end input signal amplitude
フレーム遅延量推定部115は、過去の複数フレームの推定エコー信号の振幅スペクトルと、過去の複数フレームの近端入力信号の振幅スペクトルでフレーム遅延量を推定し、推定したフレーム遅延量を出力する。
The frame delay
フレーム遅延量収束判定部116は、推定したフレーム遅延量が収束しているか判定し、推定したフレーム遅延量が収束していなければ、フレーム遅延量に固定値を代入して出力する。推定エコーパス特性更新部110は、フレーム推定したフレーム遅延量が収束していれば、フレーム遅延量推定部115で推定したフレーム遅延量を出力する。さらに、フレーム遅延量収束判定部116は、収束判定結果を推定エコーパス特性更新部110に出力する。
The frame delay amount convergence determination unit 116 determines whether or not the estimated frame delay amount has converged. If the estimated frame delay amount has not converged, a fixed value is substituted for the frame delay amount and output. The estimated echo path characteristic update unit 110 outputs the frame delay amount estimated by the frame delay
推定エコー信号遅延部117は、フレーム遅延量を用いて推定エコー信号保持部112から当該フレーム遅延量だけ遅延させたフレームの推定エコー信号の振幅スペクトルを読み出し、遅延推定エコー信号の振幅スペクトルとして出力する。
The estimated echo
エコーサプレスゲイン計算部118は、近端入力信号の振幅スペクトルと遅延推定エコー信号の振幅スペクトルとを用いて、近端入力信号に重畳されている音響エコー信号を抑圧するエコーサプレスゲインを算出し、算出したエコーサプレスゲインを出力する。
The echo suppression
エコーサプレス部119は、エコーサプレスゲインと近端入力信号の周波数スペクトルを乗じることにより、近端入力信号に重畳されている音響エコー信号が抑圧した周波数スペクトルを求め、近端出力信号の周波数スペクトルとして出力する。
The
近端出力信号時間領域変換部120は、近端出力信号の周波数スペクトルを、例えば、逆高速フーリエ変換(InverseFFT)等により、時間領域のデジタル音信号に変換し、近端出力信号として出力する。
The near-end output signal time
遠端信号保持部122は、遠端信号の振幅スペクトルを推定エコー信号保持部112と同じ所定時間保持する。そして、遠端信号保持部122は、推定したフレーム遅延量だけ遅延させた遠端信号の振幅スペクトルを出力する。
The far end
近端出力信号振幅スペクトル計算部123は、近端出力信号の周波数スペクトルに基づいて、近端出力信号の振幅スペクトルを算出し、算出した近端出力信号の振幅スペクトルを出力する。
The near-end output signal amplitude
近端出力信号振幅スペクトル計算部123は、近端出力信号の周波数スペクトルに基づいて、近端出力信号の振幅スペクトルを算出し、算出した近端出力信号の振幅スペクトルを出力する。
The near-end output signal amplitude
シングルトーク判定部124は、近端入力信号の振幅スペクトルと近端出力信号の振幅スペクトル等を用いてシングルトークかシングルトーク以外かの判定を行い、シングルトーク判定結果を出力する。 The single talk determination unit 124 determines whether single talk or other than single talk using the amplitude spectrum of the near-end input signal and the amplitude spectrum of the near-end output signal, and outputs a single talk determination result.
(A−2)第1の実施形態の動作
次に、第1の実施形態に係るエコー抑圧装置100におけるエコー抑圧処理の動作を詳細に説明する。
(A-2) Operation of the First Embodiment Next, the operation of echo suppression processing in the echo suppression device 100 according to the first embodiment will be described in detail.
(A−2−1)エコー抑圧処理
まず、エコー抑圧装置100の動作が開始すると、例えば、インターネットプロトコル(IP)網等のネットワークや、携帯電話等の無線ネットワークの電波等に接続されており接続されている回線を介して、遠端側の遠端信号が遠端信号入力端子101に入力される。
(A-2-1) Echo Suppression Processing First, when the operation of the echo suppression device 100 is started, it is connected to, for example, a radio wave of a network such as the Internet Protocol (IP) network or a wireless network such as a mobile phone. The far-end signal on the far-end side is input to the far-end signal input terminal 101 through the connected line.
遠端信号入力端子101に入力された遠端信号は、出力バッファ102において一時保持され、DA変換器103の処理準備ができ次第、DA変換器103に遠端信号が出力される。DA変換器103において、遠端信号は、デジタル音信号からアナログ音信号に変換され、スピーカ104を通して近端側に出力される。
The far-end signal input to the far-end signal input terminal 101 is temporarily held in the
一方、近端側の話者が発した音声等の音信号や、環境音、音響エコー信号(例えば、スピーカ104から出力されたアナログ音信号が近端側の空間を伝達して回り込んだ信号)等が重畳したアナログ音信号は、マイク105において受音され、AD変換器106においてデジタル音信号に変換される。デジタル音信号は、入力バッファ107において一時保持され、エコー抑圧装置100の準備ができ次第、デジタル音信号を近端入力信号としてエコー抑圧装置100に入力される。
On the other hand, a sound signal such as a voice uttered by a speaker on the near end side, an environmental sound, an acoustic echo signal (for example, an analog sound signal output from the
遠端信号周波数領域変換部108では、例えば、高速フーリエ変換(FFT)等により、遠端信号を時間領域の信号から周波数領域の信号に変換し、変換された遠端信号の周波数スペクトルROUT(i,ω)を遠端信号振幅スペクトル計算部109に出力する。
The far-end signal frequency
遠端信号振幅スペクトル計算部109では、周波数スペクトルROUT(i,ω)を用いて、(1)式に従い、遠端信号の振幅スペクトル|ROUT(i,ω)|が求められる。
The far-end signal amplitude
推定エコーパス特性更新部110は、保持している前フレームに推定したエコーパス特性|H(i−1,ω)|を推定エコー信号計算部111に出力する。 The estimated echo path characteristic update unit 110 outputs the stored echo path characteristic | H (i−1, ω) | estimated for the previous frame to the estimated echo signal calculation unit 111.
推定エコー信号計算部111では、前フレームに推定したエコーパス特性|H(i−1,ω)|と、遠端信号の振幅スペクトル|ROUT(i,ω)|とを用いて、(3)式により、推定エコー信号の振幅スペクトル|ECHO(i,ω)|が求められる。 The estimated echo signal calculation unit 111 uses the echo path characteristic | H (i−1, ω) | estimated for the previous frame and the amplitude spectrum | ROUT (i, ω) | Thus, the amplitude spectrum | ECHO (i, ω) | of the estimated echo signal is obtained.
推定エコー信号保持部112では、推定エコー信号計算部111から出力された推定エコー信号の振幅スペクトル|ECHO(i,ω)|が推定エコー信号の振幅スペクトルバッファECHO_Buffer(n,ω)に書き込まれ、推定エコー信号の振幅スペクトル|ECHO(i,ω)|が過去複数フレーム保持される。
The estimated echo
一方、近端入力信号周波数領域変換部113では、例えば、高速フーリエ変換(FFT)等により、近端入力信号を時間領域の信号から周波数領域の信号に変換する。変換された近端入力信号の周波数スペクトルSIN(i,ω)は、近端入力信号振幅スペクトル計算部114及びエコーサプレス部119に出力される。
On the other hand, the near-end input signal frequency domain conversion unit 113 converts the near-end input signal from a time-domain signal to a frequency-domain signal by, for example, fast Fourier transform (FFT). The converted frequency spectrum SIN (i, ω) of the near-end input signal is output to the near-end input signal amplitude
近端入力信号振幅スペクトル計算部114は、近端入力信号の周波数スペクトルSIN(i,ω)を用いて、(5)式に従い、近端入力信号の振幅スペクトル|SIN(i,ω)|を求める。
The near-end input signal amplitude
フレーム遅延量推定部115は、推定エコー信号保持部112から出力される過去の推定エコー信号の振幅スペクトルの複数フレームECHO_Buffer(n−k)(0≦k≦N)と近端入力信号の振幅スペクトル|SIN(i,ω)|からフレーム遅延量を推定する。フレーム遅延量の推定方法は、例えば、推定エコー信号保持部112から出力される過去の推定エコー信号の振幅スペクトルの複数フレームECHO_Buffer(n−k)と近端入力信号の振幅スペクトル|SIN(i,ω)|の誤差がフレーム毎に(7)式に従い求める。
The frame delay
なお、フレーム遅延量の推定の手法は、種々の方法を広く適用することができ、例えば、推定エコー信号の振幅スペクトルの複数フレームECHO_Buffer(n−k)と近端入力信号の振幅スペクトル|SIN(i,ω)|のフレーム毎の相関を算出し、最も相関が高いフレームを求め、その最も相関が高いフレームをフレーム遅延量delay(i)とするとしても良い。フレーム遅延量推定部115は、推定したフレーム遅延量delay(i)を推定出力する。
Note that various methods can be widely applied to the method of estimating the frame delay amount. For example, a plurality of frames ECHO_Buffer (n−k) of the amplitude spectrum of the estimated echo signal and the amplitude spectrum | SIN ( i, ω) | may be calculated for each frame, a frame having the highest correlation may be obtained, and the frame having the highest correlation may be used as the frame delay amount delay (i). The frame delay
フレーム遅延量収束判定部116は、フレーム遅延量推定部115で推定したフレーム遅延量delay(i)が収束しているか判定し、推定したフレーム遅延量が収束していなければ、フレーム遅延量delay(i)に固定値を代入して出力する。推定したフレーム遅延量が収束していれば、推定したフレーム遅延量delay(i)を推定エコーパス特性更新部110、推定エコー信号遅延部117及び、遠端信号保持部122に出力する。さらに、フレーム遅延量収束判定部116は、収束判定結果を推定エコーパス特性更新部110に出力する。
The frame delay amount convergence determination unit 116 determines whether or not the frame delay amount delay (i) estimated by the frame delay
推定エコー信号遅延部117では、フレーム遅延量delay(i)を用いて、推定エコー信号保持部112に保持されている過去の推定エコー信号の振幅スペクトルを当該フレーム遅延量だけ遅延させたフレームを読出し、遅延した推定エコー信号とする。この遅延した推定エコー信号は(9)式で表すことができる。
The estimated echo
エコーサプレスゲイン計算部118では、近端入力信号の振幅スペクトル|SIN(i,ω)|と遅延した推定エコー信号の振幅スペクトル|ECHO_DELAY(i、ω)|とを取得して、(10)式に従い、エコーサプレスゲインG(i,ω)を求める。
The echo suppression
エコーサプレス部119では、近端入力信号のスペクトルSIN(i,ω)とエコーサプレスゲインG(i,ω)とを用いて、(11)式、(12)式に従い、近端入力信号のスペクトルSIN(i,ω)に重畳されている音響エコー信号を抑圧する。
The echo suppress
近端出力信号時間領域変換部120では、近端出力信号のスペクトルSOUT(i,ω)が、例えば、逆高速フーリエ変換(InverseFFT)等により、時間領域のデジタル音信号に変換され、変換された近端出力信号を近端信号出力端子121に出力する。
In the near-end output signal time
近端信号出力端子121は、例えば、インターネットプロトコル(IP)網等のネットワークや、携帯電話等の無線ネットワークの電波等に接続されており、近端出力信号を接続されている回線を介して通話相手である遠端側に出力する。
The near-end
遠端信号保持部122は、遠端信号振幅スペクトル計算部109から出力された遠端信号の振幅スペクトル|ROUT(i,ω)|を、推定エコー信号保持部112と同じ書込みフレームに書込む。
The far-end
シングルトーク判定部124では、近端入力信号がシングルトークかシングルトーク以外かを、近端入力信号の振幅スペクトルと近端出力信号の振幅スペクトルとを用いて判定する。シングルトークかシングルトーク以外かを判定する手法は、例えば、(17)式に従い、シングルトークかシングルトーク以外かを判定する手法がある。 The single talk determination unit 124 determines whether the near-end input signal is a single talk or other than a single talk using the amplitude spectrum of the near-end input signal and the amplitude spectrum of the near-end output signal. As a method for determining whether it is single talk or other than single talk, for example, there is a method for determining whether it is single talk or other than single talk according to the equation (17).
推定エコーパス特性更新部110では、フレーム遅延量収束判定部116でフレーム遅延量が収束していないと判定されている間は、エコーパス特性は固定値を次のフレームで推定エコー信号計算部111に出力する。それと同時に、推定エコーパス特性更新部110は、シングルトーク判定部124でシングルトークと判定されたフレームについて、現フレームの推定エコーパス特性を遠端信号保持部122からの遅延させた遠端信号の振幅スペクトルと、近端出力信号振幅スペクトル計算部123からの近端出力信号の振幅スペクトルを用いて求め、推定エコーパス特性更新部110に保持されている1フレーム前に保持した推定エコーパス特性を読み出し、エコーパス特性を更新する。
The estimated echo path characteristic update unit 110 outputs a fixed value of the echo path characteristic to the estimated echo signal calculation unit 111 in the next frame while the frame delay amount convergence determination unit 116 determines that the frame delay amount has not converged. To do. At the same time, the estimated echo path characteristic update unit 110 for the frame determined as single talk by the single talk determination unit 124, the amplitude spectrum of the far end signal obtained by delaying the estimated echo path characteristic of the current frame from the far end
一方、推定エコーパス特性更新部110は、フレーム遅延量収束判定部116でフレーム遅延量が収束していると判定されると、シングルトーク判定部124でシングルトークと判定されたフレームについて、現フレームの推定エコーパス特性を、遠端信号保持部122からの遅延させた遠端信号の振幅スペクトルと、近端出力信号振幅スペクトル計算部123からの近端出力信号の振幅スペクトルを用いて求め、推定エコーパス特性更新部110に保持されている1フレーム前に保持した推定エコーパス特性を読み出し、エコーパス特性を更新する。
On the other hand, if the frame delay amount convergence determination unit 116 determines that the frame delay amount has converged, the estimated echo path characteristic update unit 110 determines the current frame of the frame determined as single talk by the single talk determination unit 124. An estimated echo path characteristic is obtained using the delayed far-end signal amplitude spectrum from the far-end
(A−2−2)フレーム遅延量収束判定部の処理
次に、第1の実施形態に係るエコー抑圧装置100におけるフレーム遅延量収束判定部116の処理を、図面を参照しながら詳細に説明する。
(A-2-2) Processing of Frame Delay Amount Convergence Determination Unit Next, the processing of the frame delay amount convergence determination unit 116 in the echo suppression apparatus 100 according to the first embodiment will be described in detail with reference to the drawings. .
図2は、第1の実施形態に係るエコー抑圧装置100のフレーム遅延量収束判定部116の処理フローを示す処理フロー図である。 FIG. 2 is a process flow diagram illustrating a process flow of the frame delay amount convergence determination unit 116 of the echo suppressor 100 according to the first embodiment.
図2において、フレーム遅延量収束判定部116は、フレーム遅延量収束判定201、フレーム遅延量固定値出力202、及びフレーム遅延量推定値出力203を行う。
In FIG. 2, the frame delay amount convergence determination unit 116 performs a frame delay
フレーム遅延量収束判定201は、推定したフレーム遅延量が収束したか収束していないかを判定し、収束判定結果を出力する。
The frame delay
フレーム遅延量固定値出力202は、フレーム遅延量収束判定201でフレーム遅延量が収束していないと判定されれば動作し、フレーム遅延量の固定値を出力する。
The frame delay amount fixed
フレーム遅延量推定値出力203は、フレーム遅延量収束判定201でフレーム遅延量が収束していると判定されれば動作し、推定したフレーム遅延量を出力する。
The frame delay amount estimated
(A−2−3)フレーム遅延量収束判定部の詳細処理
次に、第1の実施形態に係るエコー抑圧装置100におけるフレーム遅延量収束判定部116の処理の動作を詳細に説明する。
(A-2-3) Detailed Processing of Frame Delay Amount Convergence Determination Unit Next, the processing operation of the frame delay amount convergence determination unit 116 in the echo suppressor 100 according to the first embodiment will be described in detail.
フレーム遅延量収束判定201では、推定したフレーム遅延量が収束しているか収束していないかを判定する。収束判定方法は、例えば、(18)に従い、フレーム遅延量の時定数フィルタで平滑化した値delay_TC(i)を求める。
In frame delay
そして、フレーム遅延量収束判定201は、その平滑化した値delay_TC(i)と推定したフレーム遅延量delay(i)の差が閾値以下になるときを(19)式に従いカウントする。
Then, the frame delay
フレーム遅延量収束判定201は、(19)式のcountが規定回数(例えば、count=100)より小さいときは、フレーム遅延量が収束していないと判定し、countが規定回数より大きくなったときフレーム遅延量が収束したと判定する。なお、フレーム遅延量の収束判定結果は推定エコーパス特性更新部110でも使用する。
The frame delay
フレーム遅延量固定値出力202では、フレーム遅延量収束判定201でフレーム遅延量が収束していないと判定されると動作し、フレーム遅延量de1ay(i)に固定値を代入して出力する。フレーム遅延量の固定値は、例えば、エコー抑圧装置のスピーカとマイクの距離から算出されるフレーム遅延量としても良い。なお、固定値の決定手段は、種々の方法を広く適用することができ、例えば、エコー抑圧装置のフレーム遅延量の最小値としても良い。
The frame delay amount fixed
フレーム遅延量推定値出力203では、フレーム遅延量収束判定201でフレーム遅延量が収束していると判定されると動作し、フレーム遅延量収束判定201で推定したフレーム遅延量delay(i)を出力する。
The frame delay amount estimated
(A−2−4)推定エコーパス特性更新部の処理
次に、第1の実施形態に係るエコー抑圧装置100における推定エコーパス特性更新部の処理を、図面を参照しながら詳細に説明する。
(A-2-4) Process of Estimated Echo Path Characteristic Update Unit Next, the process of the estimated echo path characteristic update unit in the echo suppressor 100 according to the first embodiment will be described in detail with reference to the drawings.
図3は、本発明の第1の実施形態に係るエコー抑圧装置100の推定エコーパス特性更新部110の処理フローを示す処理フロー図である。 FIG. 3 is a process flow diagram showing a process flow of the estimated echo path characteristic update unit 110 of the echo suppressor 100 according to the first embodiment of the present invention.
図3において、本発明のエコー抑圧装置100の推定エコーパス特性更新部110は、フレーム遅延量収束判定確認301、フレーム遅延量未収束時の推定エコーパス特性更新302、シングルトーク判定確認303、及びフレーム遅延量収束時の推定エコーパス特性更新304を行う。
3, the estimated echo path characteristic update unit 110 of the echo suppressor 100 of the present invention includes a frame delay amount
フレーム遅延量収束判定確認301は、フレーム遅延量収束判定部116の判定結果を用いてフレーム遅延量が収束したか収束していないかを確認する。 The frame delay amount convergence determination check 301 uses the determination result of the frame delay amount convergence determination unit 116 to check whether the frame delay amount has converged or has not converged.
フレーム遅延量未収束時の推定エコーパス特性更新302は、フレーム遅延量収束判定確認301でフレーム遅延量が収束していないときに動作し、固定値のフレーム遅延量を用いてエコーパス特性を算出する。
The estimated echo path
シングルトーク判定確認303は、フレーム遅延量収束判定確認301でフレーム遅延量が収束したときにシングルトーク判定部124の結果を用いてシングルトークかシングルトーク以外かを確認する。
The single
フレーム遅延量収束時の推定エコーパス特性更新304は、フレーム遅延量収束判定確認301でフレーム遅延量が収束しており、シングルトーク判定確認303で現フレームがシングルトークのときに動作し、推定エコーパス特性の更新を行う。
The estimated echo path
(A−2−5)推定エコーパス特性更新部の詳細処理
次に、第1の実施形態に係るエコー抑圧装置100における推定エコーパス特性更新部110の処理の動作を詳細に説明する。
(A-2-5) Detailed Process of Estimated Echo Path Characteristic Update Unit Next, the operation of the process of the estimated echo path characteristic update unit 110 in the echo suppressor 100 according to the first embodiment will be described in detail.
フレーム遅延量収束判定確認301は、フレーム遅延量収束判定部116の判定結果を用いてフレーム遅延量が収束したか収束していないかを確認し、フレーム遅延量が収束していないときは、推定エコーパス特性を更新し、固定値のフレーム遅延量を用いてエコーパス特性の算出を行う。フレーム遅延量が収束しているときはシングルトーク判定確認を行う。
The frame delay amount
フレーム遅延量未収束時の推定エコーパス特性更新302は、フレーム遅延量収束判定確認301でフレーム遅延量が収束していないとき動作し、固定値のフレーム遅延量を用いて推定エコーパス特性|H(i,ω)|を算出し保持する。フレーム遅延量未収束時の推定エコーパス特性更新302は、固定値分遅延させた遠端信号の振幅スペクトル|ROUT_DELAY(i,ω)|と近端出力信号の振幅スペクトル|SIN(i,ω)|を用いて、現フレームの推定エコーパス特性|H1(i,ω)|を(20)式に従い求める。
The estimated echo path
シングルトーク判定確認303は、フレーム遅延量が収束しているときに動作し、シングルトーク判定部124の結果を用いて、現フレームがシングルトークかシングルトークでないかを確認する。シングルトーク判定確認303は、現フレームがシングルトークであれば、推定エコーパス特性の更新を行い、現フレームがシングルトークではなければ、推定エコーパス特性の更新は行わない。
The single
フレーム遅延量収束時の推定エコーパス特性更新304は、フレーム遅延量収束判定確認301でフレーム遅延量が収束し、且つ、シングルトーク判定確認303で現フレームがシングルトークのとき、遅延させた遠端信号の振幅スペクトル|ROUT_DELAY(i,ω)|と近端出力信号の振幅スペクトル|SIN(i,ω)|を用いて、先述の(20)式に従い、現フレームの推定エコーパス特性|H1(i,ω)|を求める。
The estimated echo path
そして、フレーム遅延量収束時の推定エコーパス特性更新304は、現フレームの推定エコーパス特性|H1(i,ω)|が求まれば、推定エコーパス特性更新部110に保持されている1フレーム前に保持した推定エコーパス特性|H(i−1,ω)|を読み出し、|H(i−1,ω)|と、|H1(i,ω)|を用いて、(22)式に従い、推定エコーパス特性を更新する。
The estimated echo path
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、エコー抑圧装置が動作を開始した直後でも、フレーム遅延量の固定値と固定推定エコーパス特性を使用して音響エコー信号を抑圧することができ、フレーム遅延量が収束すれば、推定したフレーム遅延量と推定エコーパス特性を使用して音響エコー信号を抑圧することができる。つまり、第1の実施形態のエコー抑圧装置は、動作を開始した直後から継続してエコー抑圧性能を維持することができる。
(A-3) Effects of the First Embodiment As described above, according to the first embodiment, the fixed value of the frame delay amount and the fixed estimated echo path characteristic are used even immediately after the echo suppressor starts operating. Thus, the acoustic echo signal can be suppressed, and if the frame delay amount converges, the acoustic echo signal can be suppressed using the estimated frame delay amount and the estimated echo path characteristic. That is, the echo suppression device of the first embodiment can maintain the echo suppression performance continuously immediately after the operation is started.
(B)本発明の第2の実施形態
次に、本発明の第2の実施形態のエコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法を、図面を参照しながら詳細に説明する。
(B) Second Embodiment of the Present Invention Next, an echo suppression device, an echo suppression program, and an echo suppression method according to a second embodiment of the present invention will be described in detail with reference to the drawings.
(B−1)第2の実施形態の構成
第2の実施形態のエコー抑圧装置100は、推定エコーパス特性更新部110の代わりに推定エコーパス特性更新部200を構成要素とする点が第1の実施形態のエコー抑圧装置100と異なる。それ以外の構成要素は第1の実施形態に係る図1のエコー抑圧装置100の構成要素と同一又は対応するものである。
(B-1) Configuration of Second Embodiment The echo suppression apparatus 100 according to the second embodiment is characterized in that the estimated echo path characteristic update unit 200 is a constituent element instead of the estimated echo path characteristic update unit 110 in the first embodiment. This is different from the echo suppressor 100 of the form. The other components are the same as or correspond to the components of the echo suppression apparatus 100 of FIG. 1 according to the first embodiment.
(B−2)第2の実施形態の動作
(B−2−1)推定エコーパス特性更新部の処理
図4は、第2の実施形態に係るエコー抑圧装置100の推定エコーパス特性更新部200の処理フローを示す処理フロー図である。
(B-2) Operation of Second Embodiment (B-2-1) Process of Estimated Echo Path Characteristic Updating Unit FIG. 4 is a process of the estimated echo path characteristic updating unit 200 of the echo suppressor 100 according to the second embodiment. It is a processing flowchart which shows a flow.
図4において、第2の実施形態に係る推定エコーパス特性更新部200は、第1の実施形態で説明した、推定エコーパス特性更新部110に加えて、フレーム遅延量未収束時の推定エコーパス特性更新302の変わりに平滑化エコーパス特性更新401を行う。
In FIG. 4, the estimated echo path characteristic update unit 200 according to the second embodiment includes an estimated echo path
なお、図4において、第1の実施形態に係るエコー抑圧装置100の構成要素と同一又は対応するものについては同一の符号を付している。また、第1の実施形態と同一又は対応する構成要素の詳細な説明は重複するため、ここでは省略する。 In FIG. 4, the same or corresponding components as those of the echo suppression apparatus 100 according to the first embodiment are denoted by the same reference numerals. Detailed descriptions of the same or corresponding components as those in the first embodiment are duplicated, and are omitted here.
平滑化エコーパス特性更新401は、フレーム遅延量収束判定確認301でフレーム遅延量が収束していないとき、固定値分遅延させた遠端信号の振幅スペクトルと近端出力信号の振幅スペクトルを平滑化し、平滑化し遅延させた遠端信号の振幅スペクトルと平滑化した近端出力信号の振幅スペクトルを用いて平滑化推定エコーパス特性を算出する。
The smoothing echo path
(B−2−2)推定エコーパス特性更新部の詳細処理
次に、第2の実施形態に係るエコー抑圧装置100における推定エコーパス特性更新部200の処理の動作を詳細に説明する。ここでは、第2の実施形態に係るエコー抑圧装置100の、平滑化エコーパス特性更新401における処理動作を詳細に説明する。
(B-2-2) Detailed Process of Estimated Echo Path Characteristic Update Unit Next, the operation of the process of the estimated echo path characteristic update unit 200 in the echo suppressor 100 according to the second embodiment will be described in detail. Here, the processing operation in the smoothed echo path
平滑化エコーパス特性更新401では、フレーム遅延量収束判定確認301でフレーム遅延量が収束していないとき動作し、平滑化推定エコーパス特性|H_TC(i,ω)|を算出する。平滑化推定エコーパス特性は、遅延させた遠端信号の振幅スペクトル|ROUT_DELAY(i,ω)|と近端出力信号の振幅スペクトル|SIN(i,ω)|とから、(23)式、(24)式に従って、周波数ビン毎に平滑化した遅延遠端信号の振幅スペクトル|ROUT_DELAY_TC(i,ω)|と周波数ビン毎平滑化した近端出力信号の振幅スペクトル|SIN_TC(i,ω)|を求める。
The smoothed echo path
(B−3)第2の実施形態の効果
以上のように、第2の実施形態によれば、エコー抑圧装置が動作を開始した直後でも、フレーム遅延量の固定値と平滑化推定エコーパス特性を使用して音響エコー信号を抑圧することができ、フレーム遅延量が収束すれば、推定したフレーム遅延量と推定エコーパス特性を使用して音響エコー信号を抑圧することができる。つまり、第2の実施形態のエコー抑圧装置は、動作を開始した直後から継続してエコー抑圧性能を維持することができる。
(B-3) Effect of Second Embodiment As described above, according to the second embodiment, the fixed value of the frame delay amount and the smoothed estimated echo path characteristic can be obtained even immediately after the echo suppressor starts operating. The acoustic echo signal can be suppressed by use, and if the frame delay amount converges, the acoustic echo signal can be suppressed by using the estimated frame delay amount and the estimated echo path characteristic. That is, the echo suppression device of the second embodiment can maintain the echo suppression performance continuously immediately after the operation is started.
(C)他の実施形態
上述した各実施形態においても、種々の変形実施形態を説明したが、本発明は以下の変形実施形態についても適用することができる。
(C) Other Embodiments In the above-described embodiments, various modified embodiments have been described, but the present invention can also be applied to the following modified embodiments.
上述した各実施形態で説明したエコー抑圧装置は、例えば、テレビ会議システムや電話会議システム等に用いられる音声通信装置を含む装置に搭載されるようにしても良い。また、携帯電話機やスマートフォン等の携帯端末に本発明のエコー抑圧装置は搭載されるようにしても良い。 The echo suppression device described in each of the above-described embodiments may be mounted on a device including a voice communication device used in a video conference system, a telephone conference system, or the like. Further, the echo suppression device of the present invention may be mounted on a mobile terminal such as a mobile phone or a smartphone.
100…エコー抑圧装置、101…遠端信号入力端子、102…出力バッファ、103…DA変換器、104…スピーカ、105…マイク、106…AD変換器、107…入力バッファ、108…遠端信号周波数領域変換算部、109…遠端信号振幅スペクトル計算部、110…推定エコーパス特性更新部、111…推定エコー信号計算部、112…推定エコー信号保持部、113…近端入力信号周波数領域変換部、114…近端入力信号振幅スペクトル計算部、115…フレーム遅延量推定部、116…フレーム遅延量収束判定部、117…推定エコー信号遅延部、118…エコーサプレスゲイン計算部、119…エコーサプレス部、120‥近端出力信号時間領域変換部、121…近端信号出力端子、122…遠端信号保持部、123…近端出力信号振幅スペクトル計算部、124…シングルトーク判定部、201…フレーム遅延量収束判定、202…フレーム遅延量固定値出力、203…フレーム遅延量推定値出力、301…フレーム遅延量収束判定確認、302…フレーム遅延量未収束時の推定エコーパス特性更新、303…シングルトーク判定確認、304…フレーム遅延量収束時のエコーパス特性更新、401…平滑化エコーパス特性更新。
DESCRIPTION OF SYMBOLS 100 ... Echo suppression apparatus, 101 ... Far end signal input terminal, 102 ... Output buffer, 103 ... DA converter, 104 ... Speaker, 105 ... Microphone, 106 ... AD converter, 107 ... Input buffer, 108 ... Far end signal frequency Area
Claims (5)
過去複数フレームの推定エコー信号の振幅スペクトルと、近端入力信号の振幅スペクトルとからフレーム遅延量を推定するフレーム遅延量推定手段と、
フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、その判定した判定結果に基づき、上記フレーム遅延量を出力するフレーム遅延量収束判定手段と、
上記フレーム遅延量収束判定手段での上記判定結果に応じて、上記フレーム遅延量の固定値を用いて推定エコーパス特性を更新し保持する推定エコーパス特性更新手段と、
上記フレーム遅延量を用いて遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを計算し、上記近端入力信号の振幅スペクトルから上記推定エコー信号を抑圧するエコー抑圧手段と
を有することを特徴とするエコー抑圧装置。 In an echo suppression device that suppresses an acoustic echo signal based on a near-end input signal and a far-end signal,
A frame delay amount estimating means for estimating a frame delay amount from the amplitude spectrum of the estimated echo signal of the past plural frames and the amplitude spectrum of the near-end input signal;
Determining whether the frame delay amount estimated by the frame delay amount estimation means has converged, and based on the determined determination result, a frame delay amount convergence determination means for outputting the frame delay amount;
In accordance with the determination result in the frame delay amount convergence determination means, estimated echo path characteristic update means for updating and holding the estimated echo path characteristic using a fixed value of the frame delay amount;
The echo suppression gain is calculated from the amplitude spectrum of the estimated echo signal delayed using the frame delay amount and the amplitude spectrum of the near-end input signal, and the estimated echo signal is suppressed from the amplitude spectrum of the near-end input signal. And an echo suppression means.
上記フレーム遅延量収束判定手段で、上記フレーム遅延量が収束していないと判定すると、上記フレーム遅延量の固定値を用いて推定エコーパス特性を更新し保持するフレーム遅延量未収束時の推定エコーパス特性更新部と、
上記フレーム遅延量収束判定手段で、上記フレーム遅延量が収束していると判定すると、さらに、シングルトーク判定を行い、シングルトーク判定でシングルトークと判定されれば、上記フレーム遅延量収束判定手段から出力された上記フレーム遅延量を用いて推定エコーパス特性を更新し保持するフレーム遅延量収束時の推定エコーパス特性更新部と
を有することを特徴とする請求項1に記載のエコー抑圧装置。 The estimated echo path characteristic update means includes:
If the frame delay amount convergence determining means determines that the frame delay amount has not converged, the estimated echo path characteristic when the frame delay amount has not converged is updated and held using the fixed value of the frame delay amount. Update section,
When the frame delay amount convergence determining means determines that the frame delay amount has converged, it further performs single talk determination. If it is determined as single talk by the single talk determination, the frame delay amount convergence determining means The echo suppression apparatus according to claim 1, further comprising: an estimated echo path characteristic updating unit at the time of frame delay amount convergence that updates and holds the estimated echo path characteristic using the output frame delay amount.
過去複数フレームの推定エコー信号の振幅スペクトルと、近端入力信号の振幅スペクトルとからフレーム遅延量を推定するフレーム遅延量推定手段と、
フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、その判定した判定結果に基づき、上記フレーム遅延量を出力するフレーム遅延量収束判定手段と、
上記フレーム遅延量収束判定手段での上記判定結果に応じて、上記フレーム遅延量の固定値を用いて推定エコーパス特性を更新し保持する推定エコーパス特性更新手段と、
上記フレーム遅延量を用いて遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを計算し、上記近端入力信号の振幅スペクトルから上記推定エコー信号を抑圧するエコー抑圧手段と
して機能させることを特徴とするエコー抑圧プログラム。 A computer mounted in an echo suppression device that suppresses an acoustic echo signal based on the near-end input signal and the far-end signal,
A frame delay amount estimating means for estimating a frame delay amount from the amplitude spectrum of the estimated echo signal of the past plural frames and the amplitude spectrum of the near-end input signal;
Determining whether the frame delay amount estimated by the frame delay amount estimation means has converged, and based on the determined determination result, a frame delay amount convergence determination means for outputting the frame delay amount;
In accordance with the determination result in the frame delay amount convergence determination means, estimated echo path characteristic update means for updating and holding the estimated echo path characteristic using a fixed value of the frame delay amount;
The echo suppression gain is calculated from the amplitude spectrum of the estimated echo signal delayed using the frame delay amount and the amplitude spectrum of the near-end input signal, and the estimated echo signal is suppressed from the amplitude spectrum of the near-end input signal. An echo suppression program that functions as an echo suppression means.
フレーム遅延量推定手段、フレーム遅延量収束判定手段、推定エコーパス特性更新手段、及びエコー抑圧手段を有し、
上記フレーム遅延量推定手段は、過去複数フレームの推定エコー信号の振幅スペクトルと、近端入力信号の振幅スペクトルとからフレーム遅延量を推定し、
上記フレーム遅延量収束判定手段は、フレーム遅延量推定手段で推定したフレーム遅延量が、収束しているか否か判定し、その判定した判定結果に基づき、上記フレーム遅延量を出力し、
上記推定エコーパス特性更新手段は、上記フレーム遅延量収束判定手段での上記判定結果に応じて、上記フレーム遅延量の固定値を用いて推定エコーパス特性を更新し保持し、
上記エコー抑圧手段は、上記フレーム遅延量を用いて遅延させた推定エコー信号の振幅スペクトルと、上記近端入力信号の振幅スペクトルとでエコーサプレスゲインを計算し、上記近端入力信号の振幅スペクトルから上記推定エコー信号を抑圧する
ことを特徴とするエコー抑圧方法。 In an echo suppression method for suppressing an acoustic echo signal based on a near-end input signal and a far-end signal,
A frame delay amount estimation unit, a frame delay amount convergence determination unit, an estimated echo path characteristic update unit, and an echo suppression unit,
The frame delay amount estimating means estimates the frame delay amount from the amplitude spectrum of the estimated echo signal of the past plural frames and the amplitude spectrum of the near-end input signal,
The frame delay amount convergence determination means determines whether or not the frame delay amount estimated by the frame delay amount estimation means has converged, and outputs the frame delay amount based on the determined determination result,
The estimated echo path characteristic update unit updates and holds the estimated echo path characteristic using a fixed value of the frame delay amount according to the determination result in the frame delay amount convergence determination unit,
The echo suppression means calculates an echo suppression gain from the amplitude spectrum of the estimated echo signal delayed using the frame delay amount and the amplitude spectrum of the near-end input signal, and calculates the echo suppression gain from the amplitude spectrum of the near-end input signal. An echo suppression method comprising suppressing the estimated echo signal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015149935A JP6648436B2 (en) | 2015-07-29 | 2015-07-29 | Echo suppression device, echo suppression program, and echo suppression method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015149935A JP6648436B2 (en) | 2015-07-29 | 2015-07-29 | Echo suppression device, echo suppression program, and echo suppression method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017034355A true JP2017034355A (en) | 2017-02-09 |
JP6648436B2 JP6648436B2 (en) | 2020-02-14 |
Family
ID=57988966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015149935A Active JP6648436B2 (en) | 2015-07-29 | 2015-07-29 | Echo suppression device, echo suppression program, and echo suppression method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6648436B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111556210A (en) * | 2020-04-23 | 2020-08-18 | 深圳市未艾智能有限公司 | Call voice processing method and device, terminal equipment and storage medium |
-
2015
- 2015-07-29 JP JP2015149935A patent/JP6648436B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111556210A (en) * | 2020-04-23 | 2020-08-18 | 深圳市未艾智能有限公司 | Call voice processing method and device, terminal equipment and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP6648436B2 (en) | 2020-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9591123B2 (en) | Echo cancellation | |
JP6160403B2 (en) | Echo suppression device and echo suppression program | |
JP5671147B2 (en) | Echo suppression including modeling of late reverberation components | |
US10880427B2 (en) | Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters | |
JP6295722B2 (en) | Echo suppression device, program and method | |
KR20170142001A (en) | Electric device, acoustic echo cancelling method of thereof and non-transitory computer readable recording medium | |
JP4957810B2 (en) | Sound processing apparatus, sound processing method, and sound processing program | |
JPWO2010035308A1 (en) | Echo canceller | |
KR102190833B1 (en) | Echo suppression | |
JP2011166484A (en) | Multi-channel echo cancellation method, multi-channel echo canceler, multi-channel echo cancellation program and recording medium therefor | |
US8804981B2 (en) | Processing audio signals | |
JP4413205B2 (en) | Echo suppression method, apparatus, echo suppression program, recording medium | |
JP6648436B2 (en) | Echo suppression device, echo suppression program, and echo suppression method | |
JP6432384B2 (en) | Echo suppression device, echo suppression program, and echo suppression method | |
JP6369189B2 (en) | Echo suppression device, echo suppression program, echo suppression method, and communication terminal | |
JP6369192B2 (en) | Echo suppression device, echo suppression program, echo suppression method, and communication terminal | |
KR20220157475A (en) | Echo Residual Suppression | |
JP6398470B2 (en) | Stereo echo suppression device, echo suppression device, stereo echo suppression method, and stereo echo suppression program | |
JP6314608B2 (en) | Echo suppression device, echo suppression program, and echo suppression method | |
JP2013005106A (en) | In-house sound amplification system, in-house sound amplification method, and program therefor | |
JPWO2013032001A1 (en) | Speech processing apparatus, control method thereof, and control program | |
JP6555057B2 (en) | Sound source separation echo suppression apparatus, sound source separation echo suppression program, and sound source separation echo suppression method | |
Fukui et al. | Hands-free audio conferencing unit with low-complexity dereverberation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190528 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191230 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6648436 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |