JP2012227566A - Echo cancellation device, and method and program therefor - Google Patents
Echo cancellation device, and method and program therefor Download PDFInfo
- Publication number
- JP2012227566A JP2012227566A JP2011090442A JP2011090442A JP2012227566A JP 2012227566 A JP2012227566 A JP 2012227566A JP 2011090442 A JP2011090442 A JP 2011090442A JP 2011090442 A JP2011090442 A JP 2011090442A JP 2012227566 A JP2012227566 A JP 2012227566A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- echo
- frequency domain
- residual echo
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
Description
本発明は、M(但し、Mは1以上の整数)個のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込む音響エコー(以下、単に「エコー」という)を消去する技術、特にテレビ会議システム等の拡声通話系におけるエコーを消去する技術に関する。 In the present invention, M (where M is an integer of 1 or more) speakers and one or more microphones are arranged in a common sound field, and when a received signal is reproduced from the speakers, the microphones are connected to the microphones via an echo path. The present invention relates to a technique for canceling an acoustic echo that wraps around (hereinafter simply referred to as “echo”), and more particularly to a technique for canceling an echo in a voice call system such as a video conference system.
スピーカで受話信号が再生され、その音声がマイクロホンで収音されてエコーが生じる。そのまま送信されると通話の障害や不快感等の問題が生じる。さらに、スピーカやマイクロホンの音量が大きい場合にはハウリングが生じ、通話が不可能になる。特に拡声通話系では、このような問題が顕著となる。 The received signal is reproduced by the speaker, and the sound is picked up by the microphone to generate an echo. If it is transmitted as it is, problems such as trouble of telephone conversation and discomfort arise. Further, howling occurs when the volume of the speaker or microphone is high, making it impossible to make a call. In particular, such a problem becomes conspicuous in the voice call system.
この問題を解決するために、従来技術として、適応フィルタを用いてエコーを消去するエコー消去装置がある。非特許文献1が従来技術の多チャネルエコー消去方法として知られている。図1を用いて従来の多チャネルエコー消去装置80を説明する。
In order to solve this problem, there is an echo canceller that cancels echoes using an adaptive filter as a prior art. Non-Patent
スピーカ21,…,2Mとマイクロホン31,…,3Nが共通の音場に配置され、スピーカ21,…,2Mからそれぞれ受話信号x1(k),…,xM(k)を再生した場合に、多チャネルエコー消去装置80内のエコー消去部8nは、マイクロホン3nにM本のエコー経路hmn(k)を介して回り込む再生音を消去する。但し、Mは1以上の整数であり、Nは1以上の整数であり、m=1,…,Mであり、n=1,…,Nである。多チャネルエコー消去装置80は、受話端子11,…,1Mと、送話端子41,…,4Nと、マイクロホン31,…,3Nとが接続されており、受話信号x1(k),…,xM(k)及び収音信号y1(k),…,yN(k)が入力され、送話信号u1(k),…,uN(k)をそれぞれ送話端子41,…,4Nに出力する。多チャネルエコー消去装置80は、N個のエコー消去部81,…,8Nを含み、エコー消去部8nは、エコー予測部81と、減算部82と、エコー経路推定部83とを有する。図1において、yn(k)をy(k)とし、un(k)をu(k)とし、h1n(k),…,hMn(k)をそれぞれh1(k),…,hM(k)として表す。他のマイクロホンからの収音信号についても同様の処理を行うことができ、図1のエコー消去部8nの構成を並列に並べるだけでよいため、以下では図1を用いて説明する。
エコー消去部8nは、エコー予測部81において、受話信号x1(k),…,xM(k)を適応フィルタでフィルタリングし、予測エコー信号y’(k)を生成する。減算部82において、収音信号y(k)と予測エコー信号y’(k)との差分(以下「誤差信号」という)u(k)を求め、これを送話信号として出力する。また、エコー経路推定部83において、誤差信号u(k)と受話信号x1(k),…,xM(k)とからエコー経路を逐次推定し、この推定結果(適応フィルタのフィルタ係数h’(k))をエコー予測部81にコピーする。エコー経路推定が精度よく行われた状態では、収音信号y(k)に含まれるエコー成分と予測エコー信号y’(k)がほぼ等しくなり、誤差信号u(k)中にエコーは殆ど含まれなくなる。
In the
しかし実際に多チャネルエコー消去装置が使用される状況では、いつも十分にエコー消去できるとは限らず、残留エコーが生じて通話品質が劣化しうる。それは、人の動き等によりエコー経路は絶えず変動しているからであり、適応フィルタによるエコー経路推定が瞬時には完了しないためである。またダブルトーク状態でエコー経路の推定が若干乱れうるからである。 However, in a situation where a multi-channel echo canceller is actually used, it is not always possible to sufficiently cancel the echo, and a residual echo may occur, resulting in a deterioration in the speech quality. This is because the echo path is constantly fluctuating due to human movement and the like, and the echo path estimation by the adaptive filter is not completed instantaneously. This is because the estimation of the echo path can be slightly disturbed in the double talk state.
さらに受話信号が多チャネルの場合には、受話信号間の相関が高いために、エコーが消去されている状態であっても推定されたエコー経路と真のエコー経路は必ずしも一致しない場合がある。そのため、話者が交代して受話信号間の相互相関が変化すると突然残留エコーが大きくなりうる(非特許文献1参照)。 Further, when the received signal is multi-channel, since the correlation between the received signals is high, the estimated echo path may not always match the true echo path even if the echo is canceled. Therefore, when the speaker changes and the cross-correlation between the received signals changes, the residual echo can suddenly increase (see Non-Patent Document 1).
快適な拡声通話を実現するには、適応フィルタによるエコー経路推定及び消去が十分でない状態において、受話信号のチャネル数や会話状態によらず、迅速に残留エコーを低減する必要がある。チャネル数や会話状態によらず残留エコーを低減させるために、受話信号から残留エコーへの伝達特性を高速に推定し、誤差信号から残留エコーを差し引く方法として非特許文献2が知られている。この方法において、伝達特性の推定では、周波数毎に受話信号と誤差信号の相関を利用することで、推定が高速化され、残留エコー以外の信号による推定揺らぎが抑えられる。伝達特性と残留エコーに関して振幅と位相を推定するため、チャネル数によらず適用可能である。また引き算により残留エコーの消去をはかるため、ダブルトーク時でも送話音質の歪みを小さくできる。
In order to realize a comfortable loud voice call, it is necessary to quickly reduce the residual echo regardless of the number of channels of the received signal and the conversation state in a state where the echo path estimation and cancellation by the adaptive filter is not sufficient. Non-Patent
非特許文献2では、残留エコーが精度良く求められている必要がある。しかしながら、残留エコーを限られた時間長(短時間区間)の受話信号と誤差信号とから推定するため、時間長を十分長くとる場合と比較すると推定のばらつきが大きくなり、残留エコーを大きめに推定してしまう。送話の品質を高くするには、上記のような状況でも残留エコーの推定精度を高める必要がある。なお、上述の問題は、限られた時間長の受話信号と誤差信号とから伝達特性を推定し、残留エコーを推定する場合には、受話信号が多チャネルの場合に限らず、1チャネルの場合であっても同様に生じうる。
In
本発明の目的は、従来よりも残留エコーの推定精度が高いエコー消去技術を提供することである。 An object of the present invention is to provide an echo cancellation technique with higher residual echo estimation accuracy than before.
上記の課題を解決するために、本発明の第一の態様に係るエコー消去装置によれば、Mは1以上の整数であり、M個のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込むエコーを消去する。受話信号とマイクロホンで収音した第一収音信号から得られる信号(以下「収音信号」という)とを短時間区間毎に周波数領域の信号に変換する周波数領域変換部と、m=1,…,Mとし、周波数領域の受話信号と収音信号とを用いて、第mチャネルの受話信号のパワースペクトルと、第mチャネルの受話信号と収音信号とのクロススペクトルとを求める入出力相関係数算出部と、パワースペクトルとクロススペクトルとを用いて、周波数領域の受話信号と収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定部と、周波数領域の受話信号と入出力伝達特性の推定値とから、周波数領域の収音信号に含まれる残留エコー成分を予測する残留エコー予測部と、周波数領域の収音信号を用いて、残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正部と、周波数領域の収音信号と補正後残留エコー成分との差分を送話信号として求める減算部と、周波数領域の送話信号を時間領域の信号に変換する時間領域変換部と、を含む。 In order to solve the above-described problem, according to the echo canceller according to the first aspect of the present invention, M is an integer of 1 or more, and M speakers and one or more microphones have a common sound field. When the received signal is reproduced from the speaker, the echo that goes around the microphone via the echo path is eliminated. A frequency domain conversion unit that converts a received signal and a signal obtained from a first sound collection signal collected by a microphone (hereinafter referred to as “sound collection signal”) into a frequency domain signal for each short period; ..., M, and an input / output phase for obtaining a power spectrum of the m-th channel received signal and a cross spectrum of the m-th channel received signal and the collected sound signal using the received signal and the collected sound signal in the frequency domain. An input / output transfer characteristic estimation unit that estimates an estimated value of input / output transfer characteristics of a received signal and a sound pickup signal in a frequency domain for each frequency by using a relation number calculation unit, a power spectrum and a cross spectrum, and a frequency domain The residual echo component is estimated by using the residual echo prediction unit that predicts the residual echo component contained in the frequency domain sound pickup signal and the frequency domain sound pickup signal from the received signal and the estimated input / output transfer characteristics. Shi A residual echo correction unit for obtaining a corrected residual echo component, a subtraction unit for obtaining a difference between a frequency-domain sound pickup signal and a corrected residual echo component as a transmission signal, and a frequency-domain transmission signal as a time-domain signal A time domain conversion unit for conversion.
上記の課題を解決するために、本発明の第二の態様に係るエコー消去装置によれば、Mは1以上の整数であり、M個のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込むエコーを消去する。受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、マイクロホンで収音した第一収音信号と予測エコー信号との差分を第二収音信号として求め、この第二収音信号と受話信号とに基づき適応フィルタのフィルタ係数を更新するエコー消去部と、第二収音信号を短時間区間毎に周波数領域の信号に変換する周波数領域変換部と、予測エコー信号を短時間区間毎に周波数領域の信号に変換する第二周波数領域変換部と、周波数領域の第二収音信号と予測エコー信号とを用いて、予測エコー信号のパワースペクトルと、予測エコー信号と第二収音信号とのクロススペクトルとを求める入出力相関係数算出部と、パワースペクトルとクロススペクトルとを用いて、周波数領域の予測エコー信号と第二収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定部と、周波数領域の予測エコー信号と入出力伝達特性の推定値とから、周波数領域の第二収音信号に含まれる残留エコー成分を予測する残留エコー予測部と、周波数領域の第二収音信号を用いて、残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正部と、周波数領域の第二収音信号と補正後残留エコー成分との差分を送話信号として求める減算部と、周波数領域の送話信号を時間領域の信号に変換する時間領域変換部と、を含む。 In order to solve the above-mentioned problem, according to the echo canceller according to the second aspect of the present invention, M is an integer of 1 or more, and M speakers and one or more microphones have a common sound field. When the received signal is reproduced from the speaker, the echo that goes around the microphone via the echo path is eliminated. The received signal is filtered by an adaptive filter, a predicted echo signal is generated, and the difference between the first collected sound signal and the predicted echo signal collected by the microphone is obtained as a second collected signal. An echo cancellation unit that updates the filter coefficient of the adaptive filter based on the signal, a frequency domain conversion unit that converts the second collected signal into a frequency domain signal for each short time interval, and a predicted echo signal for each short time interval Using a second frequency domain conversion unit that converts to a frequency domain signal, a second sound collection signal and a prediction echo signal in the frequency domain, a power spectrum of the prediction echo signal, a prediction echo signal, and a second sound collection signal Input / output transfer characteristics between the predicted echo signal in the frequency domain and the second collected sound signal using the input / output correlation coefficient calculation unit for obtaining the cross spectrum of the power spectrum and the power spectrum and the cross spectrum Predict the residual echo component contained in the second collected sound signal in the frequency domain from the input / output transfer characteristic estimation unit that estimates the estimated value for each frequency, the predicted echo signal in the frequency domain, and the estimated value of the input / output transfer characteristic. The residual echo prediction unit, the residual echo correction unit that corrects the residual echo component by using the second collected sound signal in the frequency domain to obtain the corrected residual echo component, the second collected signal in the frequency domain and the corrected residual A subtractor that obtains a difference from the echo component as a transmission signal, and a time domain conversion unit that converts the frequency domain transmission signal into a time domain signal.
上記の課題を解決するために、本発明の第三の態様に係るエコー消去装置によれば、Mは1以上の整数であり、M個のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込むエコーを消去する。受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、マイクロホンで収音した第一収音信号と予測エコー信号との差分を第二収音信号として求めるエコー消去部と、受話信号と第二収音信号とを短時間区間毎に周波数領域の信号に変換する周波数領域変換部と、m=1,…,Mとし、周波数領域の受話信号と第二収音信号とを用いて、第mチャネルの受話信号のパワースペクトルと、第mチャネルの受話信号と第二収音信号とのクロススペクトルとを求める入出力相関係数算出部と、パワースペクトルとクロススペクトルとを用いて、周波数領域の受話信号と第二収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定部と、周波数領域の受話信号と入出力伝達特性の推定値とから、周波数領域の第二収音信号に含まれる残留エコー成分を予測する残留エコー予測部と、周波数領域の第二収音信号を用いて、残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正部と、周波数領域の第二収音信号と補正後残留エコー成分とを用いて、周波数領域の第二収音信号に対する補正後残留エコー成分の比率である残留エコーパワー比率を求める残留エコーパワー比率計算部と、を含み、エコー消去部において、残留エコーパワー比率と受話信号と第二収音信号とに基づき適応フィルタのフィルタ係数を更新する。 In order to solve the above-mentioned problem, according to the echo canceller according to the third aspect of the present invention, M is an integer of 1 or more, and M speakers and one or more microphones have a common sound field. When the received signal is reproduced from the speaker, the echo that goes around the microphone via the echo path is eliminated. The received signal is filtered with an adaptive filter, a predicted echo signal is generated, and an echo canceller that obtains a difference between the first collected signal collected by the microphone and the predicted echo signal as the second collected signal, and the received signal and the first received signal A frequency domain conversion unit that converts the two sound pickup signals into a frequency domain signal for each short time interval, and m = 1,..., M, and using the frequency domain received signal and the second sound pickup signal, An input / output correlation coefficient calculation unit for obtaining a power spectrum of an m-channel received signal and a cross spectrum of the m-th channel received signal and the second collected sound signal, and a frequency spectrum using the power spectrum and the cross spectrum. An input / output transfer characteristic estimation unit for estimating the input / output transfer characteristic between the received signal and the second collected sound signal for each frequency, and the frequency domain received signal and the input / output transfer characteristic estimate from the frequency domain. of A residual echo prediction unit that predicts a residual echo component included in the two collected sound signals, and a residual echo correction unit that corrects the residual echo component to obtain a corrected residual echo component using the second collected sound signal in the frequency domain; A residual echo power ratio calculation unit that obtains a residual echo power ratio that is a ratio of a corrected residual echo component to a second collected sound signal in the frequency domain using the second collected sound signal in the frequency domain and the corrected residual echo component The echo canceling unit updates the filter coefficient of the adaptive filter based on the residual echo power ratio, the received signal, and the second collected sound signal.
上記の課題を解決するために、本発明の第四の態様に係るエコー消去方法によれば、Mは1以上の整数であり、M個のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込むエコーを消去する。受話信号とマイクロホンで収音した第一収音信号から得られる信号(以下「収音信号」という)とを短時間区間毎に周波数領域の信号に変換する周波数領域変換ステップと、m=1,…,Mとし、周波数領域の受話信号と収音信号とを用いて、第mチャネルの受話信号のパワースペクトルと、第mチャネルの受話信号と収音信号とのクロススペクトルとを求める入出力相関係数算出ステップと、パワースペクトルとクロススペクトルとを用いて、周波数領域の受話信号と収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定ステップと、周波数領域の受話信号と入出力伝達特性の推定値とから、周波数領域の収音信号に含まれる残留エコー成分を予測する残留エコー予測ステップと、周波数領域の収音信号を用いて、残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正ステップと、周波数領域の収音信号と補正後残留エコー成分との差分を送話信号として求める減算ステップと、周波数領域の送話信号を時間領域の信号に変換する時間領域変換ステップと、を含む。 In order to solve the above problem, according to the echo canceling method according to the fourth aspect of the present invention, M is an integer of 1 or more, and M speakers and one or more microphones have a common sound field. When the received signal is reproduced from the speaker, the echo that goes around the microphone via the echo path is eliminated. A frequency domain conversion step for converting a received signal and a signal obtained from a first sound collection signal collected by a microphone (hereinafter referred to as “sound collection signal”) into a frequency domain signal for each short time interval; m = 1, ..., M, and an input / output phase for obtaining a power spectrum of the m-th channel received signal and a cross spectrum of the m-th channel received signal and the collected sound signal using the received signal and the collected sound signal in the frequency domain. An input / output transfer characteristic estimation step for estimating an input / output transfer characteristic estimated value for the frequency domain received signal and sound pickup signal for each frequency using the relation number calculation step, the power spectrum and the cross spectrum; and the frequency domain A residual echo prediction step for predicting a residual echo component included in the frequency domain sound pickup signal from the received signal and the estimated input / output transfer characteristics, and using the frequency domain sound pickup signal A residual echo correction step for correcting the residual echo component to obtain a corrected residual echo component, a subtraction step for obtaining a difference between the collected sound signal in the frequency domain and the corrected residual echo component as a transmission signal, and transmission in the frequency domain Transforming the signal into a time domain signal.
上記の課題を解決するために、本発明の第五の態様に係るエコー消去方法によれば、Mは1以上の整数であり、M個のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込むエコーを消去する。受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、マイクロホンで収音した第一収音信号と予測エコー信号との差分を第二収音信号として求め、この第二収音信号と受話信号とに基づき適応フィルタのフィルタ係数を更新するエコー消去ステップと、第二収音信号を短時間区間毎に周波数領域の信号に変換する周波数領域変換ステップと、予測エコー信号を短時間区間毎に周波数領域の信号に変換する第二周波数領域変換ステップと、周波数領域の第二収音信号と予測エコー信号とを用いて、予測エコー信号のパワースペクトルと、予測エコー信号と第二収音信号とのクロススペクトルとを求める入出力相関係数算出ステップと、パワースペクトルとクロススペクトルとを用いて、周波数領域の予測エコー信号と第二収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定ステップと、周波数領域の予測エコー信号と入出力伝達特性の推定値とから、周波数領域の第二収音信号に含まれる残留エコー成分を予測する残留エコー予測ステップと、周波数領域の第二収音信号を用いて、残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正ステップと、周波数領域の第二収音信号と補正後残留エコー成分との差分を送話信号として求める減算ステップと、周波数領域の送話信号を時間領域の信号に変換する時間領域変換ステップと、を含む。 In order to solve the above problem, according to the echo cancellation method according to the fifth aspect of the present invention, M is an integer of 1 or more, and M speakers and one or more microphones have a common sound field. When the received signal is reproduced from the speaker, the echo that goes around the microphone via the echo path is eliminated. The received signal is filtered by an adaptive filter, a predicted echo signal is generated, and the difference between the first collected sound signal and the predicted echo signal collected by the microphone is obtained as a second collected signal. An echo cancellation step for updating the filter coefficient of the adaptive filter based on the signal, a frequency domain conversion step for converting the second collected signal into a frequency domain signal for each short time interval, and a predicted echo signal for each short time interval. Using a second frequency domain conversion step for converting to a frequency domain signal, a second collected sound signal and a predicted echo signal in the frequency domain, a power spectrum of the predicted echo signal, a predicted echo signal and a second collected sound signal, Using the input / output correlation coefficient calculation step to obtain the cross spectrum of the power spectrum and the power spectrum and the cross spectrum, The input / output transfer characteristic estimation step for estimating the input / output transfer characteristic with the signal for each frequency, the predicted echo signal in the frequency domain, and the estimated input / output transfer characteristic are converted into the second collected sound signal in the frequency domain. A residual echo prediction step for predicting the residual echo component included, a residual echo correction step for correcting the residual echo component to obtain a corrected residual echo component using the second collected sound signal in the frequency domain, A subtracting step for obtaining a difference between the two sound pickup signals and the corrected residual echo component as a transmission signal; and a time domain conversion step for converting the frequency domain transmission signal into a time domain signal.
上記の課題を解決するために、本発明の第六の態様に係るエコー消去方法によれば、Mは1以上の整数であり、M個のスピーカと1個以上のマイクロホンが共通の音場に配置され、スピーカから受話信号を再生した際に、エコー経路を介してマイクロホンに回り込むエコーを消去する。受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、マイクロホンで収音した第一収音信号と予測エコー信号との差分を第二収音信号として求めるエコー消去ステップと、受話信号と第二収音信号とを短時間区間毎に周波数領域の信号に変換する周波数領域変換ステップと、m=1,…,Mとし、周波数領域の受話信号と第二収音信号とを用いて、第mチャネルの受話信号のパワースペクトルと、第mチャネルの受話信号と第二収音信号とのクロススペクトルとを求める入出力相関係数算出ステップと、パワースペクトルとクロススペクトルとを用いて、周波数領域の受話信号と第二収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定ステップと、周波数領域の受話信号と入出力伝達特性の推定値とから、周波数領域の第二収音信号に含まれる残留エコー成分を予測する残留エコー予測ステップと、周波数領域の第二収音信号を用いて、残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正ステップと、周波数領域の第二収音信号と補正後残留エコー成分とを用いて、周波数領域の第二収音信号に対する補正後残留エコー成分の比率である残留エコーパワー比率を求める残留エコーパワー比率計算ステップと、残留エコーパワー比率と受話信号と第二収音信号とに基づき適応フィルタのフィルタ係数を更新する適応フィルタ更新ステップと、を含む。 In order to solve the above-described problem, according to the echo cancellation method according to the sixth aspect of the present invention, M is an integer of 1 or more, and M speakers and one or more microphones have a common sound field. When the received signal is reproduced from the speaker, the echo that goes around the microphone via the echo path is eliminated. The received signal is filtered by an adaptive filter to generate a predicted echo signal, and an echo cancellation step for obtaining a difference between the first collected signal collected by the microphone and the predicted echo signal as a second collected signal; A frequency domain conversion step for converting the two sound pickup signals into a frequency domain signal for each short time interval, and m = 1,..., M, and using the frequency domain received signal and the second sound pickup signal, An input / output correlation coefficient calculating step for obtaining a power spectrum of an m-channel received signal and a cross spectrum between the m-th channel received signal and the second collected sound signal, and using the power spectrum and the cross spectrum, Input / output transfer characteristic estimation step for estimating the input / output transfer characteristics of the received signal and the second collected sound signal for each frequency, and estimation of the frequency domain received signal and input / output transfer characteristics. The residual echo prediction step for predicting the residual echo component included in the second collected sound signal in the frequency domain from the value, and the corrected residual echo by correcting the residual echo component using the second collected sound signal in the frequency domain The residual echo power ratio, which is the ratio of the corrected residual echo component to the second collected sound signal in the frequency domain, using the residual echo correction step for obtaining the component, the second collected sound signal in the frequency domain and the corrected residual echo component A residual echo power ratio calculation step for obtaining the adaptive echo filter, and an adaptive filter update step for updating a filter coefficient of the adaptive filter based on the residual echo power ratio, the received signal, and the second collected sound signal.
本発明に係るエコー消去技術では、推定値の信頼区間を考慮して、推定した残留エコーを補正し、残留エコーの推定精度を高めることができるという効果を奏する。 In the echo cancellation technique according to the present invention, the estimated residual echo is corrected in consideration of the confidence interval of the estimated value, and the residual echo estimation accuracy can be improved.
以下、本発明の実施形態について、説明する。 Hereinafter, embodiments of the present invention will be described.
<第一実施形態>
<エコー消去装置100>
図2及び図3を用いて第一実施形態に係るエコー消去装置100を説明する。M個のスピーカ21,…,2MとN個のマイクロホン31,…,3Nが共通の音場に配置され、スピーカ21,…,2Mからそれぞれ受話信号x1(k),…,xM(k)を再生した場合に、エコー消去装置100は、にM×N本のエコー経路hmn(k)を介してマイクロホンに回り込む再生音(エコー)を消去する。より詳しく説明すると、エコー消去装置100内の残留エコー消去部16nは、マイクロホン3nにM本のエコー経路hmn(k)を介して回り込む再生音(エコー)を消去する。エコー消去装置100は、受話側の全Mチャネルの受話端子11,…,1Mと、送話側の全Nチャネルの送話端子41,…,4Nと、マイクロホン31,…,3Nとが接続されており、受話信号x1(k),…,xM(k)及び収音信号y1(k),…,yN(k)が入力され、送話信号u1(k),…,uN(k)をそれぞれ送話端子41,…,4Nに出力する。
<First embodiment>
<
The
エコー消去装置100は、N個の残留エコー消去部161,…,16Nを含む。
The
<残留エコー消去部16n>
残留エコー消去部16nは、受話側の全Mチャネルの受話端子11,…,1Mと、送話側の1チャネルの送話端子4nと、マイクロホン3nとが接続されており、Mチャネルの受話信号x1(k),…,xM(k)及び1チャネルの収音信号yn(k)が入力され、1チャネルの送話信号un(k)を送話端子4nに出力する。なお、各図において、yn(k)をy(k)とし、un(k)をu(k)とし、h1n(k),…,hMn(k)をそれぞれh1(k),…,hM(k)として表す。また、各図において、第nチャネルの処理部についてのみ説明する。他のマイクロホンからの収音信号についても同様の処理を行うことができ、第nチャネルの処理部の構成を並列に並べるだけでよいため、説明を省略する。
<Residual echo canceller 16n >
The residual
残留エコー消去部16nは、M個の周波数領域変換部1611,…,161Mと、周波数領域変換部162と、入出力相関係数算出部163と、入出力伝達特性推定部164と、残留エコー予測部165と、残留エコー補正部166と、減算部167と、時間領域変換部168とを含む。
The residual
<周波数領域変換部1611,…,161Mと周波数領域変換部162>
周波数領域変換部1611,…,161Mは、それぞれ受話信号x1(k),…,xM(k)を入力とし、これを短時間区間毎に周波数領域の受話信号X1(f,j),…,XM(f,j)に変換し、出力する(s161)。同様に、周波数領域変換部162は、マイクロホン3nで収音した第一収音信号y(k)を入力とし、短時間区間毎に周波数領域の信号Y(f,j)に変換し出力する(s162)。
<
The frequency domain transform
各信号を1フレーム=2Lサンプルとし、L/Dサンプル毎にブロック化し、L/Dサンプルずつずらして、フレームを作成する場合について説明する。但し、Lは1以上の整数であり、DはLを割り切ることができる整数であり、jはフレーム番号を表し、時刻k=jL/Dである。fは周波数番号を表し、例えば、fはサンプリング周波数fsの半分をL等分した離散点(周波数ビン)に対応し、f=0,1,…,L−1であり、f=0は周波数0に対応し、f=1は周波数(1/L)fs/2に対応し、…、f=L−1は((L−1)/L)fs/2に対応する。
A case will be described in which each signal is set to 1 frame = 2 L samples, the L / D samples are blocked, and the L / D samples are shifted to create a frame. However, L is an integer greater than or equal to 1, D is an integer which can divide L, j represents a frame number, and is time k = jL / D. f represents a frequency number. For example, f corresponds to a discrete point (frequency bin) obtained by equally dividing half of the sampling frequency f s by L, f = 0, 1,..., L−1, and f = 0 is Corresponding to
周波数領域への変換は例えば、FFT(Fast Fourier transform)やDFT(discrete Fourier transform)により行い、計算を簡略化・高速化するために、Lを2のべき乗にとることが好ましい。例えば、L=64〜1024、D=2〜8等とする。フレーム長(1フレームに含まれるサンプル数)を10ms〜20msに対応するように設定すればよい。 The conversion to the frequency domain is performed by, for example, FFT (Fast Fourier transform) or DFT (discrete Fourier transform), and it is preferable to set L to a power of 2 in order to simplify and speed up the calculation. For example, L = 64 to 1024, D = 2 to 8, and the like. The frame length (number of samples included in one frame) may be set so as to correspond to 10 ms to 20 ms.
<入出力相関係数算出部163>
入出力相関係数算出部163は、周波数領域の受話信号X1(f,j),…,XM(f,j)と第一収音信号Y(f,j)とを入力とし、これらの値を用いて、第mチャネルの受話信号Xm(f,j)のパワースペクトルPmm(f,j)と、第mチャネルの受話信号Xm(f,j)と第m’(但し、m’=1,…,Mであり、m≠m’である)チャネルの受話信号Xm’(f,j)とのクロススペクトルPm’m(f,j)と、第m’チャネルの受話信号Xm’(f,j)と第一収音信号Y(f,j)とのクロススペクトルQm’(f,j)とを求め、出力する(s163)。
<Input / output correlation
The input / output correlation
なお、各クロススペクトル及びパワースペクトルは、時刻k=jL/Dにおける値である。パワースペクトルPmm(f,j)は入力信号(第mチャネルの受話信号Xm(f,j))の自己相関係数を表し、クロススペクトルPm’m(f,j)は入力信号(第mチャネルの受話信号Xm(f,j)と第m’チャネルの受話信号Xm’(f,j))間の相関係数を表す。上述のパワースペクトルPmm(f,j)とクロススペクトルPm’m(f,j)からなる行列を入力信号の相関係数P(f,j)として、以下のように表す。 Each cross spectrum and power spectrum are values at time k = jL / D. The power spectrum P mm (f, j) represents the autocorrelation coefficient of the input signal (the m-th channel received signal X m (f, j)), and the cross spectrum P m′m (f, j) represents the input signal ( This represents a correlation coefficient between the m-th channel received signal X m (f, j) and the m′-th channel received signal X m ′ (f, j)). The matrix composed of the power spectrum P mm (f, j) and the cross spectrum P m′m (f, j) described above is represented as the correlation coefficient P (f, j) of the input signal as follows.
一方、クロススペクトルQm’(f,j)は、入力信号(第m’チャネルの受話信号Xm’(f,j))と出力信号(第一収音信号Y(f,j))との間の相関係数を表し、入出力間の相関係数Q(f,j)を On the other hand, the cross spectrum Q m ′ (f, j) includes an input signal (received signal X m ′ (f, j) of the m′-th channel) and an output signal (first sound pickup signal Y (f, j)). The correlation coefficient between the input and output Q (f, j)
と表す。図4を用いて入出力相関係数算出部163を説明する。例えば、入出力相関係数算出部163はパワースペクトル算出部163aと、受話信号間クロススペクトル算出部163bと、入出力信号間クロススペクトル算出部163cを有する。
It expresses. The input / output correlation
パワースペクトル算出部163aは、周波数領域の第mチャネルの受話信号Xm(f,j)を用いて、パワースペクトルPmm(f,j)を算出する。
The power
受話信号間クロススペクトル算出部163bは、周波数領域のM個の受話信号X1(f,j),…,XM(f,j)を用いて、第mチャネルの受話信号Xm(f,j)と第m’チャネルの受話信号Xm’(f,j))間のクロススペクトルPm’m(f,j)を算出する。
The inter-received signal cross
入出力信号間クロススペクトル算出部163cは、X1(f,j),…,XM(f,j)と第一収音信号Y(f,j)とを用いて、X1(f,j),…,XM(f,j)と第一収音信号Y(f,j)間のクロススペクトルQm’(f,j)を算出する。
The cross
例えば、Pmm(f,j),Pm’m(f,j),Qm’(f,j)は、時刻k=jL/Dにおける第mチャネルの受話信号Xm(f,j)と第一収音信号Y(f,j)からそれぞれ以下の式(3)、(4)、(5)により算出する。 For example, P mm (f, j), P m′m (f, j), and Q m ′ (f, j) are the received signal X m (f, j) of the m-th channel at time k = jL / D. And the first collected sound signal Y (f, j) by the following equations (3), (4) and (5), respectively.
X*はXの複素共役を、E[ ]は平均をとることを意味する。平均処理の一例としては、 X * means a complex conjugate of X, and E [] means an average. As an example of the averaging process,
のように、1フレーム前の処理結果と0〜1の値をとる平滑化定数βを用いる方法や過去の数フレームに時定数を乗じて求める方法等が考えられる。Pmm(f,j)及びQm’(f,j)についても同様の方法により求めることができる。 As described above, there are a method using a processing result of one frame before and a smoothing constant β that takes a value of 0 to 1, a method of obtaining by multiplying a past several frames by a time constant, and the like. P mm (f, j) and Q m ′ (f, j) can also be obtained by the same method.
<入出力伝達特性推定部164>
入出力伝達特性推定部164は、パワースペクトルPmm(f,j)とクロススペクトルPm’m(f,j)、Qm’(f,j)とを入力とし、これらの値を用いて、周波数領域のM個の受話信号X1(f,j),…,XM(f,j)と第一収音信号Y(f,j)との入出力伝達特性の推定値G(f,j)=[G1(f,j),…,GM(f,j)]Tを周波数毎に推定し、出力する(s164)。
<Input / output transfer
The input / output transfer
例えば、入出力伝達特性推定部164は、入出力伝達特性の推定値G(f,j)を以下の式(7)により推定する。
For example, the input / output transfer
なお上記パワースペクトルとクロススペクトルからなる行列について、逆行列計算を安定化するために、対角成分に微小定数δを加えて、 For the matrix composed of the power spectrum and cross spectrum, in order to stabilize the inverse matrix calculation, a small constant δ is added to the diagonal component,
としてもよい。 It is good.
<残留エコー予測部165>
残留エコー予測部165は、周波数領域のM個の受話信号X1(f,j),…,XM(f,j)と入出力伝達特性の推定値G(f,j)とを入力とし、これらの値から、周波数領域の第一収音信号Y(f,j)に含まれる残留エコー成分Y^(f,j)を予測し、出力する(s165)。
<Residual
The residual
例えば、残留エコー成分Y^(f,j)を、 For example, the residual echo component Y ^ (f, j)
として予測する。 To predict.
<残留エコー補正部166>
残留エコー補正部166は、周波数領域の第一収音信号Y(f,j)と残留エコー成分Y^(f,j)とを入力とし、これを用いて、残留エコー成分Y^(f,j)を補正して補正後残留エコー成分Y2^(f,j)を求め、出力する(s166)。例えば、残留エコー成分Y^(f,j)にその信頼区間の期待値からの比率に基づく値を乗じることにより、残留エコー成分を補正して補正後残留エコー成分Y2^(f,j)を求める。補正後残留エコー成分Y2^(f,j)は例えば、以下の式により、求めることができる。
<Residual
The residual
但し、式(9)中のZ^(f,j)は、 However, Z ^ (f, j) in equation (9) is
で定義される送話信号の予測値である。また、式(9)において、Tは各スペクトルの推定の自由度の数であり、入出力相関係数算出部163において、パワースペクトルPmm(f,j)及びクロススペクトルPm’m(f,j)、Qm’(f,j)を算出するときのフレーム数が、これに該当する。T−2M>0になるように、利用に先立ち、または、受話信号のチャネル数Mを設定後に、適切な値が設定される。F2M,T−2M,αは、自由度n1=2M、n2=T−2MのF分布の100α百分比点である。F分布は統計学で用いられる連続確率分布である。統計的仮説検定の一手法である分散分析において、観測データにおける変動を誤差変動と各要因の変動に分解し、各要因の効果・有意性を判定する際に使用される。
Is a predicted value of the transmission signal defined by. In Equation (9), T is the number of degrees of freedom of estimation of each spectrum, and the input / output correlation
以下の参考文献1によれば、M=1のとき、入出力伝達特性推定部164における伝達特性の推定値G(f,j)の信頼区間は、期待値からの比率で
According to
の幅を持つ。残留エコー予測部165において予測される残留エコー成分Y^(f,j)(推定値)の信頼区間も同じ幅を持つ。
[参考文献1]J. S. ベンダット、A. G. ピアソル、「ランダムデータの統計的処理」、培風館、1976年
With a width of The confidence interval of the residual echo component Y ^ (f, j) (estimated value) predicted by the residual
[Reference 1] JS Vendat, AG Pearsol, “Statistical Processing of Random Data”, Baifukan, 1976
前述の入出力伝達特性推定部164では、短時間区間毎に周波数の信号に変換された受話信号Xm(f,j)と第一収音信号Y(f,j)から算出した短時間スペクトル(パワースペクトルPmm(f,j)、クロススペクトルPm’m(f,j)、Qm’(f,j))に基づいて、入出力伝達特性の推定値G(f,j)を推定し、これを用いて残留エコー成分Y^(f,j)を推定する。
In the input / output transfer
短時間スペクトルに基づき残留エコー成分を推定すると、本来よりも送話と残留エコー成分の相関性を高めに推定し、残留エコー成分を大きめに推定する傾向がある。このことに基づき、上記の補正は残留エコー成分(推定値)の信頼区間の下端の値を残留エコー成分の補正値としている。よって、この例では、残留エコー成分Y^(f,j)(推定値)の信頼区間の期待値からの比率に基づく値とは When the residual echo component is estimated based on the short-time spectrum, the correlation between the transmission and the residual echo component is estimated to be higher than the original, and the residual echo component tends to be estimated larger. Based on this, the above correction uses the value of the lower end of the confidence interval of the residual echo component (estimated value) as the correction value of the residual echo component. Therefore, in this example, the value based on the ratio of the residual echo component Y ^ (f, j) (estimated value) from the expected value of the confidence interval is
を意味する。 Means.
なお、図示しない記憶部にF2M,T−2M,αの値を予め記憶しておく。また、式(9)中の値(−2M/(T−2M))・F2M,T−2M,αをM及びT設定後に、計算しておき、図示しない記憶部に記憶しておいてもよい。このような構成により、式(9)の計算時間を短縮できる。 Note that the values of F 2M, T-2M, and α are stored in advance in a storage unit (not shown). Further, values (−2M / (T−2M)) · F 2M, T−2M, α in the equation (9) are calculated after M and T are set and stored in a storage unit (not shown). Also good. With such a configuration, the calculation time of Equation (9) can be shortened.
<減算部167>
減算部167は、周波数領域の第一収音信号Y(f,j)と補正後残留エコー成分Y2^(f,j)を入力とし、この差分を送話信号V(f,j)として求め、出力する(s167)。例えば、以下の式(12)により、送話信号をV(f,j)を求める。
<
The subtracting
<時間領域変換部168>
時間領域変換部168は、周波数領域の送話信号V(f,j)を入力とし、この信号を時間領域の信号v(k)に変換し、これをエコー消去装置100の出力値として出力する(s168)。なお、時間領域変換部168では、周波数領域変換部161m及び162において用いた周波数領域変換方法に対応する時間領域変換方法を用いればよい。
<Time
The time
<効果>
このような構成によって、残留エコー成分(推定値)の信頼区間を考慮して、予測した残留エコーを補正し、残留エコーの推定精度を高めることができる。
<Effect>
With such a configuration, it is possible to correct the predicted residual echo in consideration of the confidence interval of the residual echo component (estimated value), and to improve the estimation accuracy of the residual echo.
<変形例>
第一実施形態では、主にM>1のときについて説明しているが、M=1であってもよい。この場合、入出力相関係数算出部163では、第mチャネルの受話信号Xm(f,j)と第m’チャネルの受話信号Xm’(f,j)とのクロススペクトルPm’m(f,j)を求める必要はなくなる。入出力伝達特性推定部164では、パワースペクトルP11(f,j)とクロススペクトルQ1(f,j)とを用いて、周波数領域の受話信号X1(f,j)と第一収音信号Y(f,j)との入出力伝達特性の推定値G(f,j)を周波数毎に推定し、出力する。
<Modification>
In the first embodiment, the case where M> 1 is mainly described. However, M = 1 may be used. In this case, the input-output correlation
<第二実施形態>
第一実施形態と異なる部分についてのみ説明する。
<Second embodiment>
Only parts different from the first embodiment will be described.
<エコー消去装置200>
図5及び図6を用いて第二実施形態に係るエコー消去装置200を説明する。エコー消去装置200は、N個のエコー消去部281,…,28NとN個の残留エコー消去部261,…,26Nを含み、残留エコー消去部26nの前段にエコー消去部28nを設ける。
<
An
<エコー消去部28n>
エコー消去部28nには、受話端子11,…,1Mと、残留エコー消去部26nと、マイクロホン3nとが接続されており、受話信号x1(k),…,xM(k)及び第一収音信号yn(k)が入力され、1チャネルの第二収音信号un(k)を残留エコー消去部26nに出力する。なお、第一収音信号からエコー成分を消去した誤差信号を便宜的に第二収音信号と呼ぶ。
<Echo canceling
The
エコー消去部28nは、受話信号x1(k),…,xM(k)を適応フィルタでフィルタリングし、予測エコー信号y’(k)を生成し、さらに、マイクロホン3nで収音した第一収音信号y(k)と予測エコー信号y’(k)との差分を第二収音信号u(k)として求め、第二収音信号u(k)と受話信号x1(k),…,xM(k)とに基づき、適応フィルタのフィルタ係数h’(k)を更新する(s28)。
The
以下、図7及び図8を用いて、詳細を説明する。エコー消去部28nは、エコー予測部281と減算部282とエコー経路推定部283とを有する。
Details will be described below with reference to FIGS. The
エコー消去部28nの処理内容を説明するために、まず、受話信号と第一収音信号との関係を説明する。スピーカ21,…,2Mからマイクロホン3nまでのエコー経路のインパルス応答をh1,…,hM(k)とし、その長さをL1とすると、受話信号x1(k),…,xM(k)と第一収音信号y(k)の間には次の関係がある。
To illustrate the processing of the
第mチャネルのインパルス応答hmと受話信号xmを
hm=[hm(0)…hm(L1-1)]T (22)
xm=[xm(0)…xm(L1-1)]T (23)
として、ベクトル化すると、受話信号x1(k),…,xM(k)と第一収音信号y(k)の関係は次のように記述される。
The impulse response h m and the reception signal x m of the m channels
h m = [h m (0)… h m (L 1 -1)] T (22)
x m = [x m (0)… x m (L 1 -1)] T (23)
As a vector, the relationship between the received signal x 1 (k),..., X M (k) and the first collected sound signal y (k) is described as follows.
y(k)=h1 Tx1(k)+…+hM TxM(k) (24)
但し、Tは転置を表す。
y (k) = h 1 T x 1 (k) +… + h M T x M (k) (24)
However, T represents transposition.
<エコー予測部281>
エコー予測部281は、適応フィルタによる予測エコー経路に受話信号x1(k),…,xM(k)を入力して予測エコー信号y’(k)を生成し、出力する(s281)。エコー予測部281は適応フィルタによって構成され、受話状態における減算部282の誤差信号が最小となるように後述するエコー経路推定部283で適応フィルタの特性が制御される。
<
The
例えば、第mチャネルの適応フィルタのフィルタ係数を
h'm=[h'm(0)…h'm(LE-1)]T (25)
とし、予測エコー信号
y'(k)=h'1 Tx1(k)+…+h'M TxM(k) (26)
を生成する。但し、LEは適応フィルタのタップ長を表す。エコー予測部281は、生成した予測エコー信号y’(k)を減算部282に出力する。なお、例えば、適応フィルタのタップ長は100〜300ms程度に設定されることが多い。
For example, the filter coefficient of the adaptive filter of the mth channel is
h ' m = [h' m (0)… h ' m (L E -1)] T (25)
And the predicted echo signal
y '(k) = h' 1 T x 1 (k) +… + h ' M T x M (k) (26)
Is generated. However, L E represents a tap length of the adaptive filter. The
<減算部282>
減算部282は、第一収音信号y(k)と予測エコー信号y’(k)を入力とし、第一収音信号y(k)から予測エコー信号y’(k)を差し引き、第二収音信号u(k)を求める(s282)。
<
The
u(k)=y(k)-y'(k) (27)
求めた第二収音信号u(k)をエコー経路推定部283と残留エコー消去部26n内の周波数領域変換部262に出力する。
u (k) = y (k) -y '(k) (27)
The obtained second collected sound signal u (k) is output to the echo
<エコー経路推定部283>
エコー経路推定部283は、第二収音信号u(k)と受話信号x1(k),…,xM(k)を入力とし、これらを用いて、適応フィルタのフィルタ係数h’(k)を更新し、出力する(s283)。適応フィルタの係数修正法としてNormalized Least Mean Squareアルゴリズム(NLMSアルゴリズム)を用いた場合を、以下の式(28)により、フィルタ係数を更新する。
<Echo
The
h'm(k+1)=h'm(k)+μu(k)xm(k) (28)
但し、μはステップサイズであり、
h ' m (k + 1) = h' m (k) + μu (k) x m (k) (28)
Where μ is the step size,
により決定される。なお、μ0は入力信号のパワーに基づいて制御され、安定した推定を行うために、予め0〜1の値に設定されるパラメータである。エコー経路推定部283は、更新したフィルタ係数h’(k+1)をコピーして、エコー予測部281に出力する。なお、フィルタ係数の更新方法は上述の方法に限定されるものではなく、他の更新方法を用いてもよい。
Determined by. Note that μ 0 is a parameter that is controlled based on the power of the input signal and is preset to a value of 0 to 1 in order to perform stable estimation. The echo
<残留エコー消去部26n>
第一実施形態の残留エコー消去部16nにおいて第一収音信号yn(k)を用いて行っていた処理を、残留エコー消去部26nにおいて上述の第二収音信号un(k)を用いて行う。例えば、周波数領域変換部262において、第二収音信号u(k)を周波数領域の信号U(f,j)に変換し、この信号を用いて入出力相関係数算出部263と残留エコー補正部266と減算部267において各処理を行う。また、残留エコー予測部265で行われる処理は、第一実施形態と同様であるが、予測する残留エコー成分U^(f,j)は、第一収音信号yn(k)に含まれる残留エコー成分ではなく、第二収音信号un(k)に含まれる残留エコー成分である。つまり、残留エコー消去部26nは、第一収音信号yn(k)に含まれる残留エコー成分ではなく、第二収音信号un(k)に含まれる残留エコー成分を消去する。
<
The processing performed using the first collected sound signal y n (k) in the residual
<効果>
このような構成により、第一実施形態と同様の効果を得ることができる。エコー経路に大きな変動がない場合には、前段のエコー消去部28nにおいて、精度の高いエコー経路の推定が可能となるため、送話品質が向上する。また、エコー経路が大きく変動した場合には、エコー消去部28nにおいて行われるエコー経路の推定が安定するまで、後段の残留エコー消去部26nにおいて、残留エコー成分を消去することができる。よって、適応フィルタのみを用いてエコー消去を行う装置(例えば、図1の多チャネルエコー消去装置80)に比べ、エコー経路安定時及び変動時を通じて、高い送話品質を維持することができる。
<Effect>
With such a configuration, the same effect as that of the first embodiment can be obtained. When there is no large fluctuation in the echo path, the
<第三実施形態>
第二実施形態と異なる部分についてのみ説明する。
<Third embodiment>
Only parts different from the second embodiment will be described.
<エコー消去装置300>
図9及び図10を用いて第三実施形態に係るエコー消去装置300を説明する。エコー消去装置300は、N個のエコー消去部381,…,38NとN個の残留エコー消去部361,…,36Nを含み、残留エコー消去部36nの前段にエコー消去部38nを設ける。
<
An
<エコー消去部38n>
エコー消去部38nの処理内容はエコー消去部28nと同様である。但し、エコー予測部281で求めた予測エコー信号y’(k)を、減算部282だけではなく、残留エコー消去部36n内の第二周波数領域変換部369にも出力する点が異なる(図7及び図9参照、但し図7中、予測エコー信号y’(k)の出力を破線で示す)。
<Echo canceling
The processing content of the
<残留エコー消去部36n>
残留エコー消去部36nは、M個の周波数領域変換部1611,…,161Mと、周波数領域変換部262と、入出力相関係数算出部363と、入出力伝達特性推定部364と、残留エコー予測部365と、残留エコー補正部266と、減算部267と、時間領域変換部168と、第二周波数領域変換部369とを含む。
<
The residual
<第二周波数領域変換部369>
第二周波数領域変換部369は、予測エコー信号y’(k)を入力とし、これを短時間区間毎に周波数領域の予測エコー信号に変換し、入出力相関係数算出部363と残留エコー予測部365とに出力する(s369)。なお、周波数領域の予測エコー信号を便宜上X0(f,j)と表す。変換方法は、周波数領域変換部161m及び262と同様の方法を用いる。
<Second frequency
The second frequency
<入出力相関係数算出部363>
入出力相関係数算出部363は、周波数領域の受話信号X1(f,j),…,XM(f,j)と予測エコー信号X0(f,j)と第二収音信号U(f,j)とを入力とし、これらの値を用いて、第mチャネルの受話信号Xm(f,j)のパワースペクトルPmm(f,j)と、予測エコー信号X0(f,j)のパワースペクトルP00(f,j)と、第mチャネルの受話信号Xm(f,j)と第m’チャネルの受話信号Xm’(f,j)とのクロススペクトルPm’m(f,j)と、第mチャネルの受話信号Xm(f,j)と予測エコー信号X0(f,j)とのクロススペクトルP0m(f,j)と、第m’チャネルの受話信号Xm’(f,j)と第二収音信号U(f,j)とのクロススペクトルQm’(f,j)と、予測エコー信号X0(f,j)と第二収音信号U(f,j)とのクロススペクトルQ0(f,j)とを求め、出力する(s363)。
<Input / output correlation
The input / output correlation
なお、パワースペクトルP00(f,j)とクロススペクトルP0m(f,j)とクロススペクトルQ0(f,j)を以下の式により求める。 The power spectrum P 00 (f, j), the cross spectrum P 0m (f, j), and the cross spectrum Q 0 (f, j) are obtained by the following equations.
なお、平均処理の方法は第一実施形態で用いた方法と同様の方法を用いればよい。 The average processing method may be the same method as that used in the first embodiment.
第三実施形態において、p=0,1,…,M、q’=0,1,…,M、q≠q’とし、パワースペクトルP00(f,j)とクロススペクトルPm’m(f,j)を In the third embodiment, p = 0, 1,..., M, q ′ = 0, 1,..., M, q ≠ q ′, and power spectrum P 00 (f, j) and cross spectrum P m′m ( f, j)
として表す。クロススペクトルP0m(f,j)とクロススペクトルPm’m(f,j)を Represent as Cross spectrum P 0m (f, j) and cross spectrum P m′m (f, j)
として表す。クロススペクトルQ0(f,j)とクロススペクトルQm’(f,j)を、 Represent as Cross spectrum Q 0 (f, j) and cross spectrum Q m ′ (f, j)
として表す。上述のパワースペクトルP00(f,j)、Pmm(f,j)とクロススペクトル、P0m(f,j)、Pm’m(f,j)からなる行列を入力信号の相関係数P(f,j)として、以下のように表す。 Represent as A matrix composed of the power spectra P 00 (f, j), P mm (f, j) and the cross spectrum, P 0m (f, j), P m′m (f, j) is used as a correlation coefficient of the input signal. P (f, j) is expressed as follows.
一方、クロススペクトルQm’(f,j)、Q0(f,j)からなる入出力間の相関係数Q(f,j)を On the other hand, the correlation coefficient Q (f, j) between the input and output composed of the cross spectrums Q m ′ (f, j) and Q 0 (f, j) is
として表す。 Represent as
<入出力伝達特性推定部364>
入出力伝達特性推定部364は、パワースペクトルPmm(f,j)、P00(f,j)とクロススペクトルPm’m(f,j)、P0m(f,j)、Q0(f,j)、Qm’(f,j)とを入力とし、これらの値を用いて、周波数領域のM個の受話信号X1(f,j),…,XM(f,j)、予測エコー信号X0(f,j)と第二収音信号U(f,j)との入出力伝達特性の推定値G(f,j)=[G0(f,j),G1(f,j),…,GM(f,j)]Tを周波数毎に推定し、出力する(s364)。
<Input / output transfer
The input / output transfer
例えば、入出力伝達特性推定部364は、入出力伝達特性の推定値G(f,j)を以下の式(39)により推定する。
For example, the input / output transfer
<残留エコー予測部365>
残留エコー予測部365は、周波数領域のM個の受話信号X1(f,j),…,XM(f,j)と予測エコー信号X0(f,j)、入出力伝達特性の推定値G(f,j)とを入力とし、これらの値から、周波数領域の第二収音信号U(f,j)に含まれる残留エコー成分U^(f,j)を予測し、出力する(s365)。
<Residual
The residual
例えば、残留エコー成分U^(f,j)を、 For example, the residual echo component U ^ (f, j)
として予測する。 To predict.
<効果>
このような構成とすることで第二実施形態と同様の効果を得ることができる。残留エコー消去部36nにおいて、その処理遅延量は周波数領域変換部161m、162、第二周波数領域変換部369で設定されるL/Dにより決定される。予測性能を向上させるために、フレーム長を長くすると、その遅延量が大きくなる。一方、処理遅延を短くするためにフレーム長を(エコー予測部281で用いる)適応フィルタのタップ長LEより短くすると、残響成分のうちフレーム長よりも遅れて到達する残留エコー成分に対応できなくなる。そのために残留エコー消去性能が低下する。例えばフレーム長を10msにとった場合、通常の会議室の残響時間は300ms以上なので、エコー経路インパルス応答の10msより後ろの部分(つまり、10ms〜300ms以上)に含まれる残留エコー成分に対応できないために、残留エコー消去性能は大幅に劣化する。
<Effect>
By adopting such a configuration, the same effect as in the second embodiment can be obtained. In the
そこで、適応フィルタが生成する予測エコー信号y’(k)には、フレーム長を超える残響成分を含むことに着目した。残留エコー予測部605において、予測エコー信号y’(k)を用いて、残留エコーを推定することで、遅延量を増大させることなく、残留エコー消去性能を向上させることができる。これにより、残響が長い部屋でも残留エコー消去性能を確保することができる。 Therefore, attention is paid to the fact that the predicted echo signal y ′ (k) generated by the adaptive filter includes a reverberation component exceeding the frame length. In the residual echo prediction unit 605, the residual echo cancellation performance can be improved without increasing the delay amount by estimating the residual echo using the predicted echo signal y '(k). Thereby, the residual echo cancellation performance can be ensured even in a room with long reverberation.
<第四実施形態>
第三実施形態と異なる部分についてのみ説明する。
<Fourth embodiment>
Only parts different from the third embodiment will be described.
<エコー消去装置400>
図11及び図12を用いて第四実施形態に係るエコー消去装置400を説明する。エコー消去装置400は、N個のエコー消去部381,…,38NとN個の残留エコー消去部461,…,46Nを含む。
<
An
<残留エコー消去部46n>
残留エコー消去部46nは、周波数領域変換部262と、入出力相関係数算出部463と、入出力伝達特性推定部464と、残留エコー予測部465と、残留エコー補正部266と、減算部267と、時間領域変換部168と、第二周波数領域変換部369とを含む。よって、残留エコー消去部46nは、M個の周波数領域変換部1611,…,161Mを含まない点が残留エコー消去部36nと異なる。
<
The residual
<入出力相関係数算出部463>
入出力相関係数算出部463は、周波数領域の予測エコー信号X0(f,j)と第二収音信号U(f,j)とを入力とし、これらの値を用いて、予測エコー信号X0(f,j)のパワースペクトルP(f,j)と、予測エコー信号X0(f,j)と第二収音信号U(f,j)とのクロススペクトルQ(f,j)とを求め、出力する(s463)。
<Input / output correlation
The input / output correlation
例えば、P(f,j),Q(f,j)は、時刻k=jL/Dにおける予測エコー信号X0(f,j)と第二収音信号U(f,j)から For example, P (f, j) and Q (f, j) are obtained from the predicted echo signal X 0 (f, j) and the second collected sound signal U (f, j) at time k = jL / D.
により算出する。 Calculated by
<入出力伝達特性推定部464>
入出力伝達特性推定部464は、パワースペクトルP(f,j)とクロススペクトルQ(f,j)とを入力とし、これらの値を用いて、予測エコー信号X0(f,j)と第二収音信号U(f,j)との入出力伝達特性の推定値G(f,j)を周波数毎に推定し、出力する(s464)。
<Input / output transfer
The input / output transfer
例えば、入出力伝達特性推定部464は、入出力伝達特性の推定値G(f,j)を
P-1(f,j)Q(f,j)=G(f,j) (43)
により推定する。
For example, the input / output transfer
P -1 (f, j) Q (f, j) = G (f, j) (43)
Estimated by
<残留エコー予測部465>
残留エコー予測部465は、周波数領域の予測エコー信号X0(f,j)と入出力伝達特性の推定値G(f,j)とを入力とし、これらの値から、周波数領域の第二収音信号U(f,j)に含まれる残留エコー成分U^(f,j)を予測し、出力する(s465)。
<Residual
The residual
例えば、残留エコー成分U^(f,j)を、 For example, the residual echo component U ^ (f, j)
として予測する。 To predict.
<効果>
このような構成とすることで第三実施形態と同様の効果を得ることができる。但し、残留エコーの予測時に受話信号を用いないため、その推定精度は、若干低くなる。第三実施形態の残留エコー消去部36nの演算量の大半は、相関係数の算出と伝達特性の算出が占めている。入出力相関係数の算出(s163、s263、s363)はチャネル数の2乗に比例し、入出力伝達特性の算出(s164、s364)は逆行列演算を含むためにチャネル数の3乗に比例する。このため上述の第一乃至第三実施形態では、チャネル数が増加すると演算量が急激に増大してしまう。
<Effect>
By adopting such a configuration, the same effect as that of the third embodiment can be obtained. However, since the received signal is not used when the residual echo is predicted, the estimation accuracy is slightly lowered. Most of the computation of the residual
そこで、本実施形態では、チャネル数が増大したときの演算量増大を抑えるために、上述のように構成を簡素化する。本実施形態では残留エコー消去部46nへの入力がMチャネルから1チャネルに減少しているため、チャネル数が増大しても残留エコー消去部46nの演算量は増大しない。
Therefore, in the present embodiment, the configuration is simplified as described above in order to suppress an increase in the amount of computation when the number of channels increases. In the present embodiment, since the input to the residual
<第五実施形態>
第二実施形態と異なる部分についてのみ説明する。第五実施形態では第二実施形態の方法で適応フィルタの出力信号(第二収音信号)に占める残留エコー成分のパワー比率を高精度で推定し、この比率に基づき適応フィルタを更新する方法を示す。
<Fifth embodiment>
Only parts different from the second embodiment will be described. In the fifth embodiment, a method of estimating the power ratio of the residual echo component in the output signal (second sound collection signal) of the adaptive filter with high accuracy by the method of the second embodiment and updating the adaptive filter based on this ratio. Show.
<エコー消去装置500>
図13及び図14を用いて第五実施形態に係るエコー消去装置500を説明する。エコー消去装置500は、N個のエコー消去部581,…,58NとN個の残留エコー消去部561,…,56Nを含み、残留エコー消去部56nの前段にエコー消去部58nを設ける。
<
An
<エコー消去部58n>
図15及び図16を用いてエコー消去部58nについて説明する。エコー消去部58nは、周波数領域変換部584とエコー予測部581と減算部282とエコー経路推定部583とを有する。例えば、エコー消去部58nにおいて、参考文献2記載の方法を用いて、エコー成分を消去する(s58)。
[参考文献2]特許第3756828号公報
<
The
[Reference Document 2] Japanese Patent No. 3756828
<周波数領域変換部584>
周波数領域変換部584は、受話信号x1(k),…,xM(k)をそれぞれ周波数領域の信号X’1(j),…,X’M(j)に変換し、出力する(s584)。例えば、以下の式(51)により、周波数領域の受話信号X’m(j)を求める。
<
Frequency
X'm(j)=diag(FFT([xm(k-2L+1),…,xm(k)])) (51)
各信号を1フレーム=2Lサンプルとし、L/Dサンプル毎にブロック化し、L/Dサンプルずつずらして、フレームを作成する場合、時刻kとフレーム番号jにはk=jL/Dの関係があり、DはLを割り切ることができる整数である。FFT(A)はベクトルAをFFT変換(高速フーリエ変換)する関数であり、diag(A)はベクトルAを、その要素を対角成分とする行列に変換する関数である。つまり、X’m(j)の対角成分をX’m(f’,j)(但し、f’は周波数番号を表し、f’=0,1,…,2L−1)とすると、X’m(j)は以下のような値となる。
X ' m (j) = diag (FFT ([x m (k-2L + 1),…, x m (k)])) (51)
When each signal is set to 2 L samples per frame, and each L / D sample is blocked and shifted by L / D samples to create a frame, there is a relationship of k = j L / D between time k and frame number j. , D is an integer that can divide L. FFT (A) is a function that performs an FFT transform (fast Fourier transform) on vector A, and diag (A) is a function that transforms vector A into a matrix whose elements are diagonal components. That, X 'm the diagonal elements of (j) X' m (f ', j) ( where, f' represents a frequency number, f '= 0,1, ..., 2L-1) When to, X ' m (j) has the following value.
<エコー予測部581>
エコー予測部581は、周波数領域の受話信号X’1(j),…,X’M(j)を入力とし、それぞれのエコー経路hm(k)に対応する周波数領域での適応フィルタでフィルタリングし、時間領域の信号に変換し、M個のチャネルに対応する予測エコー信号ベクトルy1’(k),…,yM’(k)を合算して予測エコー信号ベクトルy’(k)を生成する(s581)。例えば、以下の式により、予測エコー信号ベクトルy’(k)を生成する。
<
The
ym(k)=[0L IL ]IFFT(X'm(j)Hm'(j)) (52)
y'(k)=ΣM m=1ym(k) (53)
但し、Hm’(j)は要素数2Lの複素数ベクトルであり、時間領域に変換して前半L個を取り出すと、適応フィルタのインパルス応答になる。0LはL×Lの零行列を、ILはL×Lの単位行列を表す。IFFT(A)はベクトルAをIFFT変換(逆高速フーリエ変換)する関数である。
y m (k) = [0 L I L ] IFFT (X ' m (j) H m ' (j)) (52)
y '(k) = Σ M m = 1 y m (k) (53)
However, H m ′ (j) is a complex vector of 2L elements, and when it is converted to the time domain and the first half L is taken out, it becomes the impulse response of the adaptive filter. 0 L represents an L × L zero matrix, and IL represents an L × L unit matrix. IFFT (A) is a function that performs an IFFT transform (inverse fast Fourier transform) on the vector A.
<減算部582>
減算部582の処理内容は、第二実施形態の減算部282と同様である。但し、第二収音信号u(k)を、エコー消去装置500の出力値(送話信号)として、出力する点が、第二実施形態とは異なる。
<Subtraction unit 582>
The processing content of the subtraction unit 582 is the same as that of the
<エコー経路推定部583>
エコー消去部58nは、残留エコーパワー比率γ2(f’,j)と周波数領域の受話信号X’1(j),…,X’M(j)と第二収音信号u(k)とを入力とし、これらの値に基づき周波数領域の適応フィルタのフィルタ係数H’(j)を更新し、コピーし、エコー予測部581に出力する(s583)。なお、エコー経路の推定(s583)は、残留エコーパワー比率γ2(f’,j)の算出後に行う(図14参照)。残留エコーパワー比率γ2(f’,j)の詳細は後述する。例えば、参考文献2記載の方法を用いて、フィルタ係数H’(j)を更新する。以下、概要を説明する。
<Echo
The
第二収音信号u(k)と周波数領域の受話信号X’1(j),…,X’M(j)とを用いて Using the second collected sound signal u (k) and the received signal X ′ 1 (j),..., X ′ M (j) in the frequency domain
を求める。 Ask for.
さらに、周波数領域の受話信号X’(j)の対角成分X’1(f’,j),…,X’M(f’,j)を用いて、 Further, using diagonal components X ′ 1 (f ′, j),..., X ′ M (f ′, j) of the received signal X ′ (j) in the frequency domain,
を求める。但し、βは短時間平均をとるための平滑化定数であり、0より大きく1より小さい実数に設定される。 Ask for. However, β is a smoothing constant for taking an average for a short time, and is set to a real number larger than 0 and smaller than 1.
さらに、残留エコーパワー比率γ2(f’,j)を用いて、行列 Further, using the residual echo power ratio γ 2 (f ′, j), the matrix
を求める。 Ask for.
最後に、上述の処理によって得られたM(j)、P(j)、M個のdH^m(j)を用いて、以下の式によりフィルタ係数H’(j)を更新する。 Finally, the filter coefficient H ′ (j) is updated by the following equation using M (j), P (j), and M dH ^ m (j) obtained by the above-described processing.
但し、μ0は固定値であり、0より大きく1より小さい実数に設定される。なお式(57)の代わりに However, μ 0 is a fixed value and is set to a real number larger than 0 and smaller than 1. Instead of formula (57)
を用いることも可能である。 It is also possible to use.
<残留エコー消去部56n>
図13及び図14を用いて残留エコー消去部56nについて説明する。残留エコー消去部56nは、M個の周波数領域変換部1611,…,161Mと、周波数領域変換部262と、入出力相関係数算出部263と、入出力伝達特性推定部164と、残留エコー予測部265と、残留エコー補正部266と、残留エコーパワー比率計算部569とを含む。
<Residual echo canceling unit 56 n >
Residual echo cancellation unit 56 n will be described with reference to FIGS. 13 and 14. The residual echo canceling unit 56 n includes M frequency
周波数領域変換部262の出力値である周波数領域の第二収音信号U(f,j)及び残留エコー補正部266の出力値である補正後残留エコー成分U2^(f,j)は、減算部ではなく、残留エコーパワー比率計算部569に出力される。
The second collected sound signal U (f, j) in the frequency domain, which is the output value of the frequency
<残留エコーパワー比率計算部569>
残留エコーパワー比率計算部569は、周波数領域の第二収音信号U(f,j)と補正後残留エコー成分U2^(f,j)とを入力とし、これらの値を用いて、周波数領域の第二収音信号U(f,j)に対する補正後残留エコー成分U2^(f,j)の比率である残留エコーパワー比率γ2(f’,j)を求める(s569)。例えば、以下の式(63)または式(64)によって、残留エコーパワー比率γ2(f’,j)(但し、f’<L、f=f’)を求め、
<Residual echo power
The residual echo power
さらにγ2(2L−f’,j)=γ2(f’,j)(但し、L≦2L−f’<2L)を求め、γ2(f’,j)(f’=0,1,…,2L−1)をエコー消去部58nに出力する。
Further, γ 2 (2L−f ′, j) = γ 2 (f ′, j) (where
但し、残留エコーパワー比率計算部569において、残留エコーパワー比率γ2(f’,j)を対角成分とする行列
However, in the residual echo power
を求め、エコー消去部58nに出力する構成としてもよい。
May be obtained and output to the
<効果>
このような構成によって、推定値の信頼区間を考慮して、予測した残留エコーを補正し、残留エコーの推定精度を高めることができる。推定精度の高い残留エコーを用いて、周波数領域の第二収音信号U(f,j)に対する補正後残留エコー成分U2^(f,j)の比率である残留エコーパワー比率γ2(f’,j)を求め、残留エコーパワー比率γ2(f’,j)に基づき、適応フィルタのフィルタ係数の更新式のステップサイズを制御するため、より高精度のエコー成分推定が可能となり、高い送話品質を実現できる。
<Effect>
With such a configuration, the estimated residual echo can be corrected in consideration of the confidence interval of the estimated value, and the estimation accuracy of the residual echo can be increased. A residual echo power ratio γ 2 (f), which is a ratio of the corrected residual echo component U 2 ^ (f, j) to the second collected sound signal U (f, j) in the frequency domain, using a residual echo with high estimation accuracy. ', J) is obtained, and the step size of the update equation of the filter coefficient of the adaptive filter is controlled based on the residual echo power ratio γ 2 (f', j). The transmission quality can be realized.
<第五実施形態の第一変形例>
第五実施形態と異なる部分についてのみ説明する。
<First Modification of Fifth Embodiment>
Only the parts different from the fifth embodiment will be described.
<エコー消去装置600>
図17及び図18を用いて第五実施形態の第一変形例に係るエコー消去装置600を説明する。エコー消去装置600は、N個のエコー消去部581,…,58NとN個の残留エコー消去部661,…,66Nを含み、残留エコー消去部66nの前段にエコー消去部58nを設ける。
<
An
N個のエコー消去部58nの処理内容は第五実施形態と同様である。但し、その出力値u(k)は、残留エコー消去部66n内の周波数領域変換部262のみに出力し、エコー消去装置600の出力値(送話信号)とはしない点が異なる。
The processing contents of the N echo canceling
<残留エコー消去部66n>
残留エコー消去部66nは、M個の周波数領域変換部1611,…,161Mと、周波数領域変換部262と、入出力相関係数算出部263と、入出力伝達特性推定部164と、残留エコー予測部265と、残留エコー補正部266と、残留エコーパワー比率計算部569と、減算部267と、時間領域変換部168とを含む。つまり、第二実施形態の残留エコー消去部26nに残留エコーパワー比率計算部569を加えた構成である。減算部267と、時間領域変換部168を含む点が、残留エコー消去部56nとは異なる。
<
The residual
周波数領域変換部262の出力値U(f,j)及び残留エコー補正部266の出力値U2^(f,j)は、残留エコーパワー比率計算部だけではなく、減算部267にも出力される。減算部267及び時間領域変換部168の処理内容は、第二実施形態で説明したものと同様である(s267、s168)。エコー消去装置600は、時間領域変換部168の出力値v(k)を送話信号として出力する。
Output value of the frequency domain transform section 262 U (f, j) and the
<効果>
このような構成とすることで第二実施形態と同様の効果に加え、第五実施形態と同様の効果も得ることができる。
<Effect>
By adopting such a configuration, in addition to the same effect as that of the second embodiment, the same effect as that of the fifth embodiment can be obtained.
<第五実施形態の第二変形例>
第五実施形態の第一変形例と異なる部分についてのみ説明する。
<Second Modification of Fifth Embodiment>
Only parts different from the first modification of the fifth embodiment will be described.
<エコー消去装置700>
図19及び図20を用いて第五実施形態の第二変形例に係るエコー消去装置700を説明する。エコー消去装置700は、N個のエコー消去部581,…,58NとN個の残留エコー消去部761,…,76Nを含み、残留エコー消去部76nの前段にエコー消去部58nを設ける。
<
An
<残留エコー消去部76n>
残留エコー消去部76nは、M個の周波数領域変換部1611,…,161Mと、周波数領域変換部262と、入出力相関係数算出部363と、入出力伝達特性推定部364と、残留エコー予測部365と、残留エコー補正部266と、残留エコーパワー比率計算部569とを、減算部267と、時間領域変換部168と、第二周波数領域変換部369とを含む。つまり、第三実施形態の残留エコー消去部36nに残留エコーパワー比率計算部569を加えた構成である。
<Residual echo canceller 76 n >
The residual echo canceling unit 76 n includes M frequency
各部の処理は、第三実施形態及び第五実施形態で説明した内容と同様である。 The process of each part is the same as that described in the third embodiment and the fifth embodiment.
<効果>
このような構成とすることで第三実施形態と同様の効果に加え、第五実施形態と同様の効果も得ることができる。
<Effect>
By adopting such a configuration, in addition to the same effects as in the third embodiment, the same effects as in the fifth embodiment can be obtained.
<プログラム及び記録媒体>
上述したエコー消去装置は、コンピュータにより機能させることもできる。この場合はコンピュータに、目的とする装置(各種実施形態及びその変形例で図に示した機能構成をもつ装置)として機能させるためのプログラム、またはその処理手順(各実施例で示したもの)の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。
<Program and recording medium>
The echo canceling apparatus described above can also be operated by a computer. In this case, a program for causing a computer to function as a target device (device having the functional configuration shown in the drawings in various embodiments and modifications thereof), or a processing procedure thereof (shown in each example) A program for causing a computer to execute each process may be downloaded from a recording medium such as a CD-ROM, a magnetic disk, or a semiconductor storage device or via a communication line into the computer to execute the program.
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<Other variations>
The present invention is not limited to the above-described embodiments and modifications. For example, the various processes described above are not only executed in time series according to the description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. In addition, it can change suitably in the range which does not deviate from the meaning of this invention.
例えば、第五実施形態の第二変形例において、第五実施形態と同じように、残留エコー消去部76nが減算部267と、時間領域変換部168とを含まない構成とし、エコー消去部58nの出力をエコー消去装置700の出力値(送話信号)としてもよい。
For example, in the second modification of the fifth embodiment, as in the fifth embodiment, the residual echo canceller 76 n does not include the
なお、請求項における収音信号とは、マイクロホンで収音した第一収音信号から得られる信号であり、マイクロホンで収音した第一収音信号自体や、第一収音信号と予測エコー信号との差分として求められる第二収音信号を含む概念である。さらに、第一または第二収音信号に対し多チャネルの受話信号の相互相関が変化するような工夫を施された信号(例えば、ノイズが負荷された信号、半波整流、遅延変動、レベル変動等の処理を施された信号)であってもよいし、第一収音信号に対し上述の工夫が施された信号と予測エコー信号との差分として求められる第二収音信号であってもよい。 The sound collection signal in the claims is a signal obtained from the first sound collection signal collected by the microphone, and the first sound collection signal itself collected by the microphone, or the first sound collection signal and the predicted echo signal. This is a concept including a second collected sound signal obtained as a difference from the above. Furthermore, a signal that has been devised so that the cross-correlation of the multi-channel received signal changes with respect to the first or second collected sound signal (for example, a signal loaded with noise, half-wave rectification, delay variation, level variation Or a second sound pickup signal obtained as a difference between the signal obtained by performing the above-described contrivance on the first sound pickup signal and the predicted echo signal. Good.
Claims (13)
前記受話信号と前記マイクロホンで収音した第一収音信号から得られる信号(以下「収音信号」という)とを短時間区間毎に周波数領域の信号に変換する周波数領域変換部と、
m=1,…,Mとし、周波数領域の前記受話信号と前記収音信号とを用いて、第mチャネルの前記受話信号のパワースペクトルと、第mチャネルの前記受話信号と前記収音信号とのクロススペクトルとを求める入出力相関係数算出部と、
前記パワースペクトルと前記クロススペクトルとを用いて、周波数領域の前記受話信号と前記収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定部と、
周波数領域の前記受話信号と前記入出力伝達特性の前記推定値とから、周波数領域の前記収音信号に含まれる残留エコー成分を予測する残留エコー予測部と、
周波数領域の前記収音信号を用いて、前記残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正部と、
周波数領域の前記収音信号と前記補正後残留エコー成分との差分を送話信号として求める減算部と、
周波数領域の前記送話信号を時間領域の信号に変換する時間領域変換部と、
を含む、エコー消去装置。 M is an integer of 1 or more, and M speakers and one or more microphones are arranged in a common sound field, and when an incoming signal is reproduced from the speakers, an echo that wraps around the microphone via an echo path is generated. An echo canceller for erasing,
A frequency domain converter that converts the received signal and a signal obtained from the first collected sound signal collected by the microphone (hereinafter referred to as “sound collected signal”) into a frequency domain signal for each short period;
m = 1,..., M, and using the received signal and the collected sound signal in the frequency domain, the power spectrum of the received signal in the m-th channel, the received signal and the collected sound signal in the m-th channel, An input / output correlation coefficient calculation unit for obtaining a cross spectrum of
Using the power spectrum and the cross spectrum, an input / output transfer characteristic estimation unit that estimates an estimated value of the input / output transfer characteristics of the received signal and the collected sound signal in the frequency domain for each frequency;
A residual echo prediction unit that predicts a residual echo component included in the collected sound signal in the frequency domain from the received signal in the frequency domain and the estimated value of the input / output transfer characteristic;
Using the collected sound signal in the frequency domain, correcting the residual echo component to obtain a corrected residual echo component; and
A subtraction unit for obtaining a difference between the sound pickup signal in the frequency domain and the corrected residual echo component as a transmission signal;
A time domain conversion unit for converting the transmission signal in the frequency domain into a signal in the time domain;
Including an echo canceller.
前記残留エコー補正部において、前記残留エコー成分にその信頼区間の期待値からの比率に基づく値を乗じることにより、前記残留エコー成分を補正して補正後残留エコー成分を求める、
エコー消去装置。 The echo canceller according to claim 1,
In the residual echo correction unit, the residual echo component is corrected by multiplying the residual echo component by a value based on a ratio from an expected value of the confidence interval to obtain a corrected residual echo component.
Echo canceler.
各スペクトルの推定の自由度の数をTとし、自由度n1=2M、n2=T−2MのF分布の100α百分比点をF2M,T−2M,αとし、周波数領域の前記収音信号をY(f,j)とし、前記残留エコー成分をY^(f,j)とし、前記残留エコー補正部において、前記補正後残留エコー成分Y2^(f,j)を
として求める、
エコー消去装置。 The echo canceller according to claim 1 or 2, wherein
The number of degrees of freedom of estimation of each spectrum is T, and the 100α percentage point of the F distribution with degrees of freedom n 1 = 2M and n 2 = T-2M is F 2M, T-2M, α, and the sound collection in the frequency domain The signal is Y (f, j), the residual echo component is Y ^ (f, j), and the residual echo component Y 2 ^ (f, j) is changed in the residual echo correction unit.
Asking,
Echo canceler.
前記受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、前記マイクロホンで収音した前記第一収音信号と前記予測エコー信号との差分を第二収音信号として求め、この第二収音信号と前記受話信号とに基づき適応フィルタのフィルタ係数を更新するエコー消去部と、をさらに含み、
前記周波数領域変換部と前記入出力相関係数算出部と前記残留エコー補正部と前記減算部において、前記収音信号として前記第二収音信号を用いる、
エコー消去装置。 The echo canceller according to any one of claims 1 to 3,
The received signal is filtered by an adaptive filter to generate a predicted echo signal, and a difference between the first collected sound signal collected by the microphone and the predicted echo signal is obtained as a second collected sound signal. An echo canceler that updates a filter coefficient of the adaptive filter based on the sound signal and the received signal, and
In the frequency domain conversion unit, the input / output correlation coefficient calculation unit, the residual echo correction unit, and the subtraction unit, the second sound collection signal is used as the sound collection signal.
Echo canceler.
前記予測エコー信号を短時間区間毎に周波数領域の信号に変換する第二周波数領域変換部と、をさらに含み、
q’≠qとし、q=0,1,…,Mとし、q’=0,1,…,Mとし、周波数領域の前記予測エコー信号をX0(f,j)とし、周波数領域の第mチャネルの前記受話信号をXm(f,j)とし、周波数領域の前記第二収音信号をU(f,j)とし、前記予測エコー信号のパワースペクトルをP00(f,j)とし、第mチャネルの前記受話信号のパワースペクトルをPmm(f,j)とし、前記予測エコー信号と第mチャネルの前記受話信号との間のクロススペクトルをP0m(f,j)とし、m’=1,…,Mとし、m≠m’とし、第m’チャネルの前記受話信号と第mチャネルの前記受話信号の間のクロススペクトルをPm’m(f,j)とし、前記予測エコー信号と前記第二収音信号との間のクロススペクトルをQ0(f,j)とし、第m’チャネルの前記受話信号と前記第二収音信号との間のクロススペクトルをQm’(f,j)とし、A*をAの複素共役とし、E[A]をAの平均をとる関数とし、
前記入出力相関係数算出部において、前記パワースペクトルP00と前記パワースペクトルPmmを
として求め、前記クロススペクトルP0m(f,j)と前記クロススペクトルPm’m(f,j)を
として求め、前記クロススペクトルQ0(f,j)と前記クロススペクトルQm’(f,j)を、
として求め、
前記入出力伝達特性推定部において、前記入出力伝達特性の前記推定値G(f,j)を、
として推定し、
前記残留エコー予測部において、前記残留エコー成分を、
として予測する、
エコー消去装置。 The echo canceller according to claim 4,
A second frequency domain transform unit that transforms the predicted echo signal into a frequency domain signal for each short time interval; and
q ′ ≠ q, q = 0, 1,..., M, q ′ = 0, 1,..., M, and the predicted echo signal in the frequency domain is X 0 (f, j). The received signal of the m channel is X m (f, j), the second sound pickup signal in the frequency domain is U (f, j), and the power spectrum of the predicted echo signal is P 00 (f, j). , The power spectrum of the received signal of the m-th channel is P mm (f, j), the cross spectrum between the predicted echo signal and the received signal of the m-th channel is P 0m (f, j), and m '= 1, ..., M, m ≠ m', the cross spectrum between the received signal of the m'th channel and the received signal of the mth channel is P m'm (f, j), and the prediction the cross spectrum between the echo signal and the second voice collecting signal Q 0 (f, j) and , 'Cross spectra between said received signal of the channel the second voice collecting signal Q m' m-th and (f, j), the A * is the complex conjugate of A, the average E and [A] of A And a function that takes
In the input / output correlation coefficient calculation unit, the power spectrum P 00 and the power spectrum P mm are
The cross spectrum P 0m (f, j) and the cross spectrum P m′m (f, j) are obtained as
The cross spectrum Q 0 (f, j) and the cross spectrum Q m ′ (f, j)
As sought
In the input / output transfer characteristic estimation unit, the estimated value G (f, j) of the input / output transfer characteristic is
Estimated as
In the residual echo prediction unit, the residual echo component is
Predict as
Echo canceler.
前記受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、前記マイクロホンで収音した第一収音信号と前記予測エコー信号との差分を第二収音信号として求め、この第二収音信号と前記受話信号とに基づき適応フィルタのフィルタ係数を更新するエコー消去部と、
前記第二収音信号を短時間区間毎に周波数領域の信号に変換する周波数領域変換部と、
前記予測エコー信号を短時間区間毎に周波数領域の信号に変換する第二周波数領域変換部と、
周波数領域の前記第二収音信号と前記予測エコー信号とを用いて、前記予測エコー信号のパワースペクトルと、前記予測エコー信号と前記第二収音信号とのクロススペクトルとを求める入出力相関係数算出部と、
前記パワースペクトルと前記クロススペクトルとを用いて、周波数領域の前記予測エコー信号と前記第二収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定部と、
周波数領域の前記予測エコー信号と前記入出力伝達特性の前記推定値とから、周波数領域の前記第二収音信号に含まれる残留エコー成分を予測する残留エコー予測部と、
周波数領域の前記第二収音信号を用いて、前記残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正部と、
周波数領域の前記第二収音信号と前記補正後残留エコー成分との差分を送話信号として求める減算部と、
周波数領域の前記送話信号を時間領域の信号に変換する時間領域変換部と、
を含む、エコー消去装置。 M is an integer of 1 or more, and M speakers and one or more microphones are arranged in a common sound field, and when an incoming signal is reproduced from the speakers, an echo that wraps around the microphone via an echo path is generated. An echo canceller for erasing,
The received signal is filtered by an adaptive filter, a predicted echo signal is generated, and a difference between the first collected signal collected by the microphone and the predicted echo signal is obtained as a second collected signal, and this second collected sound is obtained. An echo canceler that updates a filter coefficient of an adaptive filter based on a signal and the received signal;
A frequency domain converter that converts the second collected sound signal into a frequency domain signal for each short time interval;
A second frequency domain transform unit that transforms the predicted echo signal into a frequency domain signal for each short time interval;
Input / output phase relationship for obtaining a power spectrum of the predicted echo signal and a cross spectrum between the predicted echo signal and the second collected sound signal using the second collected signal in the frequency domain and the predicted echo signal A number calculator,
Using the power spectrum and the cross spectrum, an input / output transfer characteristic estimation unit that estimates an estimated value of the input / output transfer characteristic of the predicted echo signal in the frequency domain and the second sound collection signal for each frequency;
A residual echo prediction unit that predicts a residual echo component included in the second collected sound signal in the frequency domain from the predicted echo signal in the frequency domain and the estimated value of the input / output transfer characteristic;
Using the second collected signal in the frequency domain, correcting the residual echo component to obtain a corrected residual echo component;
A subtraction unit for obtaining a difference between the second collected sound signal in the frequency domain and the corrected residual echo component as a transmission signal;
A time domain conversion unit for converting the transmission signal in the frequency domain into a signal in the time domain;
Including an echo canceller.
前記受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、前記マイクロホンで収音した第一収音信号と前記予測エコー信号との差分を第二収音信号として求めるエコー消去部と、
前記受話信号と前記第二収音信号とを短時間区間毎に周波数領域の信号に変換する周波数領域変換部と、
m=1,…,Mとし、周波数領域の前記受話信号と前記第二収音信号とを用いて、第mチャネルの前記受話信号のパワースペクトルと、第mチャネルの前記受話信号と前記第二収音信号とのクロススペクトルとを求める入出力相関係数算出部と、
前記パワースペクトルと前記クロススペクトルとを用いて、周波数領域の前記受話信号と前記第二収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定部と、
周波数領域の前記受話信号と前記入出力伝達特性の前記推定値とから、周波数領域の前記第二収音信号に含まれる残留エコー成分を予測する残留エコー予測部と、
周波数領域の前記第二収音信号を用いて、前記残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正部と、
周波数領域の前記第二収音信号と補正後残留エコー成分とを用いて、周波数領域の前記第二収音信号に対する前記補正後残留エコー成分の比率である残留エコーパワー比率を求める残留エコーパワー比率計算部と、を含み、
前記エコー消去部において、前記残留エコーパワー比率と前記受話信号と前記第二収音信号とに基づき適応フィルタのフィルタ係数を更新する、
エコー消去装置。 M is an integer of 1 or more, and M speakers and one or more microphones are arranged in a common sound field, and when an incoming signal is reproduced from the speakers, an echo that wraps around the microphone via an echo path is generated. An echo canceller for erasing,
An echo canceler that filters the received signal with an adaptive filter to generate a predicted echo signal, and obtains a difference between the first collected signal collected by the microphone and the predicted echo signal as a second collected signal;
A frequency domain converter that converts the received signal and the second collected sound signal into a frequency domain signal for each short period;
m = 1,..., M, and using the received signal in the frequency domain and the second collected sound signal, the power spectrum of the received signal in the m-th channel, the received signal in the m-th channel, and the second An input / output correlation coefficient calculation unit for obtaining a cross spectrum with the collected sound signal;
Using the power spectrum and the cross spectrum, an input / output transfer characteristic estimation unit that estimates an estimated value of the input / output transfer characteristic of the received signal in the frequency domain and the second sound collection signal for each frequency;
A residual echo prediction unit that predicts a residual echo component included in the second collected sound signal in the frequency domain from the received signal in the frequency domain and the estimated value of the input / output transfer characteristic;
Using the second collected signal in the frequency domain, correcting the residual echo component to obtain a corrected residual echo component;
A residual echo power ratio for obtaining a residual echo power ratio, which is a ratio of the corrected residual echo component to the second collected sound signal in the frequency domain, using the second collected sound signal and the corrected residual echo component in the frequency domain Including a calculation unit,
In the echo canceller, the filter coefficient of the adaptive filter is updated based on the residual echo power ratio, the received signal, and the second collected sound signal.
Echo canceler.
周波数領域の前記第二収音信号と前記補正後残留エコー成分との差分を送話信号として求める減算部と、
周波数領域の前記送話信号を時間領域の信号に変換する時間領域変換部と、をさらに含む
エコー消去装置。 The echo canceller according to claim 7, comprising:
A subtraction unit for obtaining a difference between the second collected sound signal in the frequency domain and the corrected residual echo component as a transmission signal;
An echo canceling apparatus, further comprising: a time domain conversion unit that converts the transmission signal in the frequency domain into a signal in the time domain.
前記予測エコー信号を短時間区間毎に周波数領域の信号に変換する第二周波数領域変換部と、をさらに含み、
q’≠qとし、q=0,1,…,Mとし、q’=0,1,…,Mとし、周波数領域の前記予測エコー信号をX0(f,j)とし、周波数領域の第mチャネルの前記受話信号をXm(f,j)とし、周波数領域の前記第二収音信号をU(f,j)とし、前記予測エコー信号のパワースペクトルをP00(f,j)とし、第mチャネルの前記受話信号のパワースペクトルをPmm(f,j)とし、前記予測エコー信号と第mチャネルの前記受話信号との間のクロススペクトルをP0m(f,j)とし、m’=1,…,Mとし、m≠m’とし、第m’チャネルの前記受話信号と第mチャネルの前記受話信号の間のクロススペクトルをPm’m(f,j)とし、前記予測エコー信号と前記第二収音信号との間のクロススペクトルをQ0(f,j)とし、第m’チャネルの前記受話信号と前記第二収音信号との間のクロススペクトルをQm’(f,j)とし、A*をAの複素共役とし、E[A]をAの平均をとる関数とし、
前記入出力相関係数算出部において、前記パワースペクトルP00と前記パワースペクトルPmmを
として求め、前記クロススペクトルP0m(f,j)と前記クロススペクトルPm’m(f,j)を
として求め、前記クロススペクトルQ0(f,j)と前記クロススペクトルQm’(f,j)を、
として求め、
前記入出力伝達特性推定部において、前記入出力伝達特性の前記推定値G(f,j)を、
として推定し、
前記残留エコー予測部において、前記残留エコー成分を、
として予測する、
エコー消去装置。 The echo canceller according to claim 7 or 8,
A second frequency domain transform unit that transforms the predicted echo signal into a frequency domain signal for each short time interval; and
q ′ ≠ q, q = 0, 1,..., M, q ′ = 0, 1,..., M, and the predicted echo signal in the frequency domain is X 0 (f, j). The received signal of the m channel is X m (f, j), the second sound pickup signal in the frequency domain is U (f, j), and the power spectrum of the predicted echo signal is P 00 (f, j). , The power spectrum of the received signal of the m-th channel is P mm (f, j), the cross spectrum between the predicted echo signal and the received signal of the m-th channel is P 0m (f, j), and m '= 1, ..., M, m ≠ m', the cross spectrum between the received signal of the m'th channel and the received signal of the mth channel is P m'm (f, j), and the prediction the cross spectrum between the echo signal and the second voice collecting signal Q 0 (f, j) and , 'Cross spectra between said received signal of the channel the second voice collecting signal Q m' m-th and (f, j), the A * is the complex conjugate of A, the average E and [A] of A And a function that takes
In the input / output correlation coefficient calculation unit, the power spectrum P 00 and the power spectrum P mm are
The cross spectrum P 0m (f, j) and the cross spectrum P m′m (f, j) are obtained as
The cross spectrum Q 0 (f, j) and the cross spectrum Q m ′ (f, j)
As sought
In the input / output transfer characteristic estimation unit, the estimated value G (f, j) of the input / output transfer characteristic is
Estimated as
In the residual echo prediction unit, the residual echo component is
Predict as
Echo canceler.
前記受話信号と前記マイクロホンで収音した第一収音信号から得られる信号(以下「収音信号」という)とを短時間区間毎に周波数領域の信号に変換する周波数領域変換ステップと、
m=1,…,Mとし、周波数領域の前記受話信号と前記収音信号とを用いて、第mチャネルの前記受話信号のパワースペクトルと、第mチャネルの前記受話信号と前記収音信号とのクロススペクトルとを求める入出力相関係数算出ステップと、
前記パワースペクトルと前記クロススペクトルとを用いて、周波数領域の前記受話信号と前記収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定ステップと、
周波数領域の前記受話信号と前記入出力伝達特性の前記推定値とから、周波数領域の前記収音信号に含まれる残留エコー成分を予測する残留エコー予測ステップと、
周波数領域の前記収音信号を用いて、前記残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正ステップと、
周波数領域の前記収音信号と前記補正後残留エコー成分との差分を送話信号として求める減算ステップと、
周波数領域の前記送話信号を時間領域の信号に変換する時間領域変換ステップと、
を含む、エコー消去方法。 M is an integer of 1 or more, and M speakers and one or more microphones are arranged in a common sound field, and when an incoming signal is reproduced from the speakers, an echo that wraps around the microphone via an echo path is generated. An echo cancellation method for erasing,
A frequency domain conversion step of converting the received signal and a signal obtained from the first sound collection signal collected by the microphone (hereinafter referred to as “sound collection signal”) into a frequency domain signal for each short period;
m = 1,..., M, and using the received signal and the collected sound signal in the frequency domain, the power spectrum of the received signal in the m-th channel, the received signal and the collected sound signal in the m-th channel, An input / output correlation coefficient calculation step for obtaining a cross spectrum of
Using the power spectrum and the cross spectrum, an input / output transfer characteristic estimation step for estimating an input / output transfer characteristic estimated value of the received signal and the collected sound signal in the frequency domain for each frequency;
A residual echo prediction step for predicting a residual echo component included in the collected sound signal in the frequency domain from the received signal in the frequency domain and the estimated value of the input / output transfer characteristic;
A residual echo correction step for correcting the residual echo component to obtain a corrected residual echo component using the collected sound signal in the frequency domain;
A subtraction step for obtaining a difference between the sound pickup signal in the frequency domain and the corrected residual echo component as a transmission signal;
A time domain transforming step for transforming the transmission signal in the frequency domain into a signal in the time domain;
Including an echo cancellation method.
前記受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、前記マイクロホンで収音した第一収音信号と前記予測エコー信号との差分を第二収音信号として求め、この第二収音信号と前記受話信号とに基づき適応フィルタのフィルタ係数を更新するエコー消去ステップと、
前記第二収音信号を短時間区間毎に周波数領域の信号に変換する周波数領域変換ステップと、
前記予測エコー信号を短時間区間毎に周波数領域の信号に変換する第二周波数領域変換ステップと、
周波数領域の前記第二収音信号と前記予測エコー信号とを用いて、前記予測エコー信号のパワースペクトルと、前記予測エコー信号と前記第二収音信号とのクロススペクトルとを求める入出力相関係数算出ステップと、
前記パワースペクトルと前記クロススペクトルとを用いて、周波数領域の前記予測エコー信号と前記第二収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定ステップと、
周波数領域の前記予測エコー信号と前記入出力伝達特性の前記推定値とから、周波数領域の前記第二収音信号に含まれる残留エコー成分を予測する残留エコー予測ステップと、
周波数領域の前記第二収音信号を用いて、前記残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正ステップと、
周波数領域の前記第二収音信号と前記補正後残留エコー成分との差分を送話信号として求める減算ステップと、
周波数領域の前記送話信号を時間領域の信号に変換する時間領域変換ステップと、
を含む、エコー消去方法。 M is an integer of 1 or more, and M speakers and one or more microphones are arranged in a common sound field, and when an incoming signal is reproduced from the speakers, an echo that wraps around the microphone via an echo path is generated. An echo cancellation method for erasing,
The received signal is filtered by an adaptive filter, a predicted echo signal is generated, and a difference between the first collected signal collected by the microphone and the predicted echo signal is obtained as a second collected signal, and this second collected sound is obtained. An echo cancellation step of updating a filter coefficient of an adaptive filter based on a signal and the received signal;
A frequency domain conversion step of converting the second collected sound signal into a frequency domain signal for each short time interval;
A second frequency domain transforming step for transforming the predicted echo signal into a frequency domain signal for each short time interval;
Input / output phase relationship for obtaining a power spectrum of the predicted echo signal and a cross spectrum between the predicted echo signal and the second collected sound signal using the second collected signal in the frequency domain and the predicted echo signal A number calculation step;
Using the power spectrum and the cross spectrum, an input / output transfer characteristic estimation step for estimating an estimated value of the input / output transfer characteristic of the predicted echo signal in the frequency domain and the second sound pickup signal for each frequency;
A residual echo prediction step for predicting a residual echo component included in the second collected sound signal in the frequency domain from the predicted echo signal in the frequency domain and the estimated value of the input / output transfer characteristic;
A residual echo correction step for correcting the residual echo component to obtain a residual echo component after correction using the second collected sound signal in the frequency domain;
A subtraction step for obtaining a difference between the second collected sound signal in the frequency domain and the corrected residual echo component as a transmission signal;
A time domain transforming step for transforming the transmission signal in the frequency domain into a signal in the time domain;
Including an echo cancellation method.
前記受話信号を適応フィルタでフィルタリングし、予測エコー信号を生成し、前記マイクロホンで収音した第一収音信号と前記予測エコー信号との差分を第二収音信号として求めるエコー消去ステップと、
前記受話信号と前記第二収音信号とを短時間区間毎に周波数領域の信号に変換する周波数領域変換ステップと、
m=1,…,Mとし、周波数領域の前記受話信号と前記第二収音信号とを用いて、第mチャネルの前記受話信号のパワースペクトルと、第mチャネルの前記受話信号と前記第二収音信号とのクロススペクトルとを求める入出力相関係数算出ステップと、
前記パワースペクトルと前記クロススペクトルとを用いて、周波数領域の前記受話信号と前記第二収音信号との入出力伝達特性の推定値を周波数毎に推定する入出力伝達特性推定ステップと、
周波数領域の前記受話信号と前記入出力伝達特性の前記推定値とから、周波数領域の前記第二収音信号に含まれる残留エコー成分を予測する残留エコー予測ステップと、
周波数領域の前記第二収音信号を用いて、前記残留エコー成分を補正して補正後残留エコー成分を求める残留エコー補正ステップと、
周波数領域の前記第二収音信号と補正後残留エコー成分とを用いて、周波数領域の前記第二収音信号に対する前記補正後残留エコー成分の比率である残留エコーパワー比率を求める残留エコーパワー比率計算ステップと、
前記残留エコーパワー比率と前記受話信号と前記第二収音信号とに基づき適応フィルタのフィルタ係数を更新する適応フィルタ更新ステップと、を含む、
エコー消去方法。 M is an integer of 1 or more, and M speakers and one or more microphones are arranged in a common sound field, and when an incoming signal is reproduced from the speakers, an echo that wraps around the microphone via an echo path is generated. An echo cancellation method for erasing,
Echo cancellation step of filtering the received signal with an adaptive filter, generating a predicted echo signal, and obtaining a difference between the first collected sound signal collected by the microphone and the predicted echo signal as a second collected signal;
A frequency domain conversion step of converting the received signal and the second sound pickup signal into a frequency domain signal for each short period;
m = 1,..., M, and using the received signal in the frequency domain and the second collected sound signal, the power spectrum of the received signal in the m-th channel, the received signal in the m-th channel, and the second An input / output correlation coefficient calculating step for obtaining a cross spectrum with the collected sound signal;
Using the power spectrum and the cross spectrum, an input / output transfer characteristic estimation step for estimating an input / output transfer characteristic estimated value of the received signal in the frequency domain and the second collected sound signal for each frequency;
A residual echo prediction step for predicting a residual echo component included in the second collected sound signal in the frequency domain from the received signal in the frequency domain and the estimated value of the input / output transfer characteristic;
A residual echo correction step for correcting the residual echo component to obtain a residual echo component after correction using the second collected sound signal in the frequency domain;
A residual echo power ratio for obtaining a residual echo power ratio, which is a ratio of the corrected residual echo component to the second collected sound signal in the frequency domain, using the second collected sound signal and the corrected residual echo component in the frequency domain A calculation step;
An adaptive filter update step of updating a filter coefficient of an adaptive filter based on the residual echo power ratio, the received signal, and the second collected sound signal,
Echo cancellation method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011090442A JP5662232B2 (en) | 2011-04-14 | 2011-04-14 | Echo canceling apparatus, method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011090442A JP5662232B2 (en) | 2011-04-14 | 2011-04-14 | Echo canceling apparatus, method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012227566A true JP2012227566A (en) | 2012-11-15 |
JP5662232B2 JP5662232B2 (en) | 2015-01-28 |
Family
ID=47277321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011090442A Expired - Fee Related JP5662232B2 (en) | 2011-04-14 | 2011-04-14 | Echo canceling apparatus, method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5662232B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015130606A (en) * | 2014-01-08 | 2015-07-16 | 富士通株式会社 | Voice communication apparatus and acoustic correction program |
CN104891127A (en) * | 2014-03-04 | 2015-09-09 | 株式会社村田制作所 | Conveying apparatus |
JP2015201787A (en) * | 2014-04-09 | 2015-11-12 | 日本電信電話株式会社 | Echo cancellation device, method thereof and program |
JP2016189548A (en) * | 2015-03-30 | 2016-11-04 | 日本電信電話株式会社 | Echo canceller, method and program thereof |
JP2022531330A (en) * | 2019-05-01 | 2022-07-06 | ボーズ・コーポレーション | Signal component estimation using coherence |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6075783B2 (en) * | 2013-12-09 | 2017-02-08 | 日本電信電話株式会社 | Echo canceling apparatus, echo canceling method and program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010035308A1 (en) * | 2008-09-24 | 2010-04-01 | 三菱電機株式会社 | Echo cancelling device |
JP2011166484A (en) * | 2010-02-10 | 2011-08-25 | Nippon Telegr & Teleph Corp <Ntt> | Multi-channel echo cancellation method, multi-channel echo canceler, multi-channel echo cancellation program and recording medium therefor |
JP2012039441A (en) * | 2010-08-09 | 2012-02-23 | Nippon Telegr & Teleph Corp <Ntt> | Multi-channel echo erasure method, multi-channel echo erasure device, and program of the same |
-
2011
- 2011-04-14 JP JP2011090442A patent/JP5662232B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010035308A1 (en) * | 2008-09-24 | 2010-04-01 | 三菱電機株式会社 | Echo cancelling device |
JP2011166484A (en) * | 2010-02-10 | 2011-08-25 | Nippon Telegr & Teleph Corp <Ntt> | Multi-channel echo cancellation method, multi-channel echo canceler, multi-channel echo cancellation program and recording medium therefor |
JP2012039441A (en) * | 2010-08-09 | 2012-02-23 | Nippon Telegr & Teleph Corp <Ntt> | Multi-channel echo erasure method, multi-channel echo erasure device, and program of the same |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015130606A (en) * | 2014-01-08 | 2015-07-16 | 富士通株式会社 | Voice communication apparatus and acoustic correction program |
CN104891127A (en) * | 2014-03-04 | 2015-09-09 | 株式会社村田制作所 | Conveying apparatus |
JP2015201787A (en) * | 2014-04-09 | 2015-11-12 | 日本電信電話株式会社 | Echo cancellation device, method thereof and program |
JP2016189548A (en) * | 2015-03-30 | 2016-11-04 | 日本電信電話株式会社 | Echo canceller, method and program thereof |
JP2022531330A (en) * | 2019-05-01 | 2022-07-06 | ボーズ・コーポレーション | Signal component estimation using coherence |
JP7393438B2 (en) | 2019-05-01 | 2023-12-06 | ボーズ・コーポレーション | Signal component estimation using coherence |
Also Published As
Publication number | Publication date |
---|---|
JP5662232B2 (en) | 2015-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5391103B2 (en) | Multi-channel echo canceling method, multi-channel echo canceling apparatus, multi-channel echo canceling program and recording medium therefor | |
US8594320B2 (en) | Hybrid echo and noise suppression method and device in a multi-channel audio signal | |
JP5347794B2 (en) | Echo suppression method and apparatus | |
US9008327B2 (en) | Acoustic multi-channel cancellation | |
JP4957810B2 (en) | Sound processing apparatus, sound processing method, and sound processing program | |
US7742592B2 (en) | Method and device for removing echo in an audio signal | |
JP5501527B2 (en) | Echo canceller and echo detector | |
JP5662232B2 (en) | Echo canceling apparatus, method and program | |
JP5469564B2 (en) | Multi-channel echo cancellation method, multi-channel echo cancellation apparatus and program thereof | |
JP2004349806A (en) | Multichannel acoustic echo canceling method, apparatus thereof, program thereof, and recording medium thereof | |
US20170195496A1 (en) | Echo canceller device and echo cancel method | |
JP3787088B2 (en) | Acoustic echo cancellation method, apparatus, and acoustic echo cancellation program | |
JP3756839B2 (en) | Reverberation reduction method, Reverberation reduction device, Reverberation reduction program | |
JP3756828B2 (en) | Reverberation elimination method, apparatus for implementing this method, program, and recording medium therefor | |
JP6143702B2 (en) | Echo canceling apparatus, method and program | |
JP4413205B2 (en) | Echo suppression method, apparatus, echo suppression program, recording medium | |
US20050008143A1 (en) | Echo canceller having spectral echo tail estimator | |
JP4700673B2 (en) | Echo cancellation method, apparatus, program, and recording medium | |
JP5937451B2 (en) | Echo canceling apparatus, echo canceling method and program | |
KR100545832B1 (en) | Sound echo canceller robust to interference signals | |
CN112863532A (en) | Echo suppressing device, echo suppressing method, and storage medium | |
JP6356087B2 (en) | Echo canceling apparatus, method and program | |
JP2004349796A (en) | Sound echo canceling method, apparatus thereof, program and recording medium thereof | |
JP4504782B2 (en) | Echo cancellation method, apparatus for implementing this method, program, and recording medium therefor | |
JPH08331020A (en) | Echo canceller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130718 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140415 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5662232 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |