JP4448423B2 - Echo suppression method, apparatus for implementing this method, program, and recording medium therefor - Google Patents
Echo suppression method, apparatus for implementing this method, program, and recording medium therefor Download PDFInfo
- Publication number
- JP4448423B2 JP4448423B2 JP2004309638A JP2004309638A JP4448423B2 JP 4448423 B2 JP4448423 B2 JP 4448423B2 JP 2004309638 A JP2004309638 A JP 2004309638A JP 2004309638 A JP2004309638 A JP 2004309638A JP 4448423 B2 JP4448423 B2 JP 4448423B2
- Authority
- JP
- Japan
- Prior art keywords
- echo
- signal
- short
- time spectrum
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
この発明は、例えば多チャネル音響再生系を有する通信会議システムに適用され、ハウリングの原因及び聴覚上の障害となる音響エコーを抑圧する多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体に関するものである。
BACKGROUND OF THE
近年のディジタルネットワークの大容量化により、複数の人が容易に参加でき、より自然な通話環境を提供できる多チャネル拡声型の通信会議システムが検討されている。このシステムでは、受話音声がスピーカから再生されマイクロホンに収音されて音響エコーが生じ、そのまま送信されると通話の障害や不快感などの問題が生じる。スピーカ再生信号の信号パワーよりも音響エコー信号の信号パワーが大きい場合には、音響エコーはハウリングを引き起こして通話を不可能にしてしまう。この多チャネル通信会議システムにおける音響エコーを抑圧する方法として、特開2003−309493号公報(特許文献1)がある。 With the recent increase in capacity of digital networks, a multi-channel loudspeaker type teleconferencing system that allows a plurality of people to easily participate and provide a more natural calling environment has been studied. In this system, the received voice is reproduced from the speaker and picked up by the microphone to generate an acoustic echo. If the received voice is transmitted as it is, problems such as a call failure and discomfort arise. When the signal power of the acoustic echo signal is larger than the signal power of the speaker reproduction signal, the acoustic echo causes howling and makes a call impossible. As a method of suppressing acoustic echo in this multi-channel communication conference system, there is JP-A-2003-309493 (Patent Document 1).
M(≧2)チャネルの再生系と2チャネルの収音系とで構成される通信会議システムは、図1に示すような構成により音響エコーの抑圧を行う。すなわち各受話端子1m(m=1,…,M)からの受話信号は、再生信号として各スピーカ2m(m=1,…,M)に送られ、音響信号として再生され、各M個の音響エコー経路を経て各マイクロホン3n(n=1,…,N)に回り込む。マイクロホン3nからの収音信号は、収音信号ごとにMチャネルエコー抑圧部6n(n=1,…,N)によりエコー成分が抑圧され、送信信号として送話端子5n(n=1,…,N)から送信される。
A communication conference system including an M (≧ 2) channel reproduction system and a two-channel sound collection system performs acoustic echo suppression with the configuration shown in FIG. That is, the reception signal from each reception terminal 1 m (m = 1,..., M) is sent as a reproduction signal to each speaker 2 m (m = 1,..., M) and reproduced as an acoustic signal. each microphone 3 n through the acoustic echo path (n = 1, ..., n ) around to. The collected sound signal from the
上記Mチャネルエコー抑圧部6の内部構成を図2に示す。Mチャネルエコー抑圧部6は、スピーカ2mからのMチャネルの再生信号とマイクロホンからの1チャネルの収音信号から、周波数成分ごとに収音信号に占めるエコー成分の比率を推定し、周波数成分ごとに音響エコー相当分だけ収音信号の振幅を減衰させることで音響エコーを抑圧する。なお、収音系がNチャネルの場合には、図1に示すようにMチャネルエコー抑圧部6をN個並列に並べることになる。
エコー抑圧部6では、TF変換部61m(m=1,…,M)にて時間領域の再生信号x1(k),…,xM(k)(ただし、kは時間を示す変数。)を、フレーム長2Lサンプルで、Lサンプルごとにフレーム化し、周波数領域に変換してスペクトルX1(j,f),…,XM(j,f)(ただし、jはフレームの時刻を示す変数)を求める。TF変換部62では、時間領域の収音信号y(k)を周波数領域に変換してスペクトルY(j,f)を求める。Lサンプルごとの信号のサンプル時刻kとフレーム時刻jの関係を図11に示す。
The internal configuration of the M
In the
図2中のエコー成分比率推定部63で、上記再生信号のスペクトルX1(j,f),…,XM(j,f)と上記収音信号のスペクトルY(j,f)から収音成分に占めるエコー成分の比率γ2(j,f)が求められ、減衰比算出部64で減衰率を求める。乗算部65では周波数成分ごとに収音信号の振幅をエコー相当分だけ減衰させる。FT変換部66では、周波数領域での処理結果を時間領域に変換し、エコーが抑圧された送信信号を得る。なお、上記減衰率は、エコー成分比率γ2(f)から複数の方法により求めることができ、具体的には特開平11−331046号公報(特許文献2)に詳しく示されている。
The echo component
次に図2中のエコー成分比率推定部63の詳細な構成を図3に示す。相関除去部631では、多チャネル再生信号のスペクトルX1(j,f),…,XM(j,f)から互いに相関のない多チャネルのスペクトルX1(j,f),X2(1)(j,f),…,XM(M−1)(j,f)を求める。相関除去部632では、収音信号のスペクトルY(j,f)から第1〜第m−1チャネル再生信号の相関成分を除去したスペクトルY(m―1)(j,f)(m=2,…,M)を求める。コヒーレンス算出部633では、コヒーレンス算出部6331で第1チャネルの再生信号X1(j,f)と収音信号Y(j,f)のコヒーレンスγ1y 2(j,f)を、コヒーレンス算出部633m(m=2,…,M)で第mチャネルの再生信号Xm(m−1)(j,f)とY(m−1)(j,f)(m=2,…,M)のコヒーレンスγmy(m−1) 2(j,f)を求める。エコー成分比率算出部634では、次式によりエコー成分比率γ2(j,f)を求める。
上記従来法では、収音信号は一定のフレーム長でフレーム化され、FFTにより周波数領域に変換され、エコー抑圧処理を経て送信される。この方法では、送話音声信号はフレーム長分バッファリングされ、処理されてから送信されるので、ハードウェアの処理能力には関係なく、フレーム長によって決まるアルゴリズム上の遅延(処理遅延)が存在する。この遅延が大きい場合には通話系として非常に離しづらくなってしまうため、フレーム長を短くして処理遅延を抑える必要がある。
しかし、スピーカから再生されてマイクロホンに収音されるまでにフレーム長以上遅延するエコー成分は、非エコー成分として扱われることが問題となる。したがって、フレーム長を残響時間(通常の部屋で300ms程度)よりも大幅に短く設定した場合、エコー成分比率が小さめに設定されたり、エコー成分の推定値が揺らいだりするために、エコー成分比率の推定性能が劣化し、エコー成分抑圧性能が劣化してしまう。
In the above-described conventional method, the collected sound signal is framed with a fixed frame length, converted into the frequency domain by FFT, and transmitted through echo suppression processing. In this method, the transmission voice signal is buffered for the frame length, processed, and then transmitted. Therefore, there is an algorithmic delay (processing delay) determined by the frame length regardless of the processing capability of the hardware. . When this delay is large, it is very difficult to separate as a call system, so it is necessary to reduce the processing delay by shortening the frame length.
However, there is a problem that an echo component that is delayed from the frame length by the time it is reproduced from the speaker and collected by the microphone is treated as a non-echo component. Therefore, when the frame length is set to be significantly shorter than the reverberation time (about 300 ms in a normal room), the echo component ratio is set smaller, or the estimated value of the echo component fluctuates. The estimation performance is degraded, and the echo component suppression performance is degraded.
この発明では、収音信号の短時間スペクトルY(j,f)に含まれるエコー成分の比率を、現時点の多チャネル再生信号フレームから求めた短時間スペクトルX1(j,f),…,XM(j,f)だけでなく、過去の再生信号フレームから求めた短時間スペクトルも一緒に使用して推定する方法を提案する。
この発明では更に、多チャネル再生信号の現時点のフレームと過去のフレームとを、現時点のフレームの第1チャネル再生信号からなる主成分および主成分との相関が除去されたその他のフレームからなる副成分に分け、主成分のエコーが収音信号に占める割合を求め、副成分のエコーが主成分との相関を除去した収音信号に占める割合を求め、これら2つの割合から収音信号に占める多チャネル再生信号のエコー成分比率を推定する方法を提案する。
In the present invention, the ratio of echo components included in the short-time spectrum Y (j, f) of the collected sound signal is determined from the short-time spectrum X 1 (j, f),. A method is proposed for estimation using not only M (j, f) but also a short-time spectrum obtained from a past reproduction signal frame.
In the present invention, the current frame and the past frame of the multi-channel reproduction signal are further divided into the main component consisting of the first channel reproduction signal of the current frame and the sub-component consisting of other frames from which the correlation with the main component has been removed. The ratio of the main component echo to the collected sound signal is obtained, and the ratio of the sub component echo to the collected sound signal from which the correlation with the main component is removed is obtained. A method for estimating the echo component ratio of the channel reproduction signal is proposed.
この方法により、過去の信号フレームをエコー成分比率の推定に取り込むことができ、フレーム長が残響時間よりも大幅に短く設定された場合でもエコー成分比率の推定性能劣化を回避し、エコー抑圧性能の劣化を防ぐことができる。 With this method, past signal frames can be taken into the estimation of the echo component ratio, and even when the frame length is set to be much shorter than the reverberation time, the estimation performance of the echo component ratio is avoided and the echo suppression performance is improved. Deterioration can be prevented.
以下にこの発明の実施形態を図面を参照しながら説明するが、各図中の対応する部分は同一参照番号を付けて重複説明を省略する。
[第1実施形態]
この発明をM(≧2)チャネル再生系とN(≧1)チャネル収音系からなる場合について説明する。収音系のNチャネルに対しては、M入力1出力の送信音声パワー推定部をN個並列に並べることで、Nチャネルの収音系に対応する。この発明では、図3に内部構成を示している図2のエコー抑圧部6中のエコー成分比率推定部63を、図5に内部構造を示すエコー成分比率推定部68に置き換える。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described below with reference to the drawings. Corresponding portions in the respective drawings are given the same reference numerals, and redundant description is omitted.
[First Embodiment]
The present invention will be described in the case of an M (≧ 2) channel reproduction system and an N (≧ 1) channel sound collection system. For the N channel of the sound collection system, N transmission audio power estimators with M inputs and one output are arranged in parallel to correspond to the N channel sound collection system. In the present invention, the echo component
以下では、フレーム長を2Lサンプル、シフト長をLサンプル、フレーム時刻をjとする。フレーム時刻jの信号フレームは、サンプル時刻k=jL−2L+1〜jLの信号サンプルからなる。このときの信号のサンプル時刻kとフレーム時刻jの関係は図11のようになる。また、過去の再生信号フレームから求めたスペクトルとして、1フレーム前の短時間スペクトルX1(j−1,f),…,XM(j−1,f)を使用する例を説明する。
図2のTF変換部61m(m=1,…,M)において、各チャネルの時間領域の再生信号xm(k)をLサンプル毎に長さ2Lの信号ベクトルにフレーム化し、FFTを使って短時間スペクトルに変換する。
この処理では、各信号をハニング窓等でウインドウ処理してから周波数変換してもよい。
In the following, it is assumed that the frame length is 2L samples, the shift length is L samples, and the frame time is j. The signal frame at frame time j is composed of signal samples at sample times k = jL−2L + 1 to jL. The relationship between the signal sampling time k and the frame time j at this time is as shown in FIG. An example in which the short-time spectrum X 1 (j−1, f),..., X M (j−1, f) one frame before is used as the spectrum obtained from the past reproduction signal frame will be described.
In the TF converter 61 m (m = 1,..., M) in FIG. 2, the reproduction signal x m (k) in the time domain of each channel is framed into a signal vector having a length of 2 L for each L sample, and FFT is used. For a short time.
In this processing, each signal may be subjected to frequency conversion after being windowed by a Hanning window or the like.
また、TF変換部62において、収音信号y(k)を周波数領域に変換し、短時間スペクトルをえる。
図5に内部構造が示されているエコー成分比率推定部68において以下のステップF1〜7により、周波数領域の多チャネル再生信号Xm(j,f)と周波数領域の収音信号Y(j,f)から、周波数成分ごとに収音信号に含まれるエコー成分の比率を求める。図6にエコー成分比率を推定するためのフローを示す。
Further, the
In the echo component
ステップF1
現時点のフレームから求めた多チャネル再生信号の短時間スペクトルX1(j,f),…,XM(j,f)を図5の相関除去部681内の蓄積部681a1に保存する。
ステップF2
相関除去部681b1では、例えば次式の方法で多チャネル再生信号の短時間スペクトルX2(j,f),…,XM(j,f)からX1(j,f)との相関成分を除去して、スペクトルX2(1)(j,f),…,XM(1)(j,f)を得、多チャネル再生信号スペクトルの副成分の一部とする。
ここで、ε[]は、平均をとることを意味し、平均処理の一例としては、
The short-time spectrum X 1 (j, f),..., X M (j, f) of the multi-channel reproduction signal obtained from the current frame is stored in the accumulation unit 681a1 in the correlation removal unit 681 in FIG.
Step F2
The decorrelation unit 681B1, for example, short-
Here, ε [] means taking an average, and as an example of the averaging process,
ステップF3
相関除去部681b2において、蓄積部681a2に蓄積された1フレーム前の多チャネル再生信号のスペクトルX1(j−1,f),…,XM(j−1,f)から、X1(j,f)との相関を次のように除去したスペクトルX1(1)(j−1,f),…,XM(1)(j−1,f)を求め、多チャネル再生信号スペクトルの副成分の一部とする。
なお、nフレーム前の短時間スペクトルX1(j−n,f),…,XM(j−n,f)をエコー成分比率推定に使用する場合にも、同様の計算により得られた結果を多チャネル再生信号スペクトルの副成分の一部とすればよい。
Step F3
In decorrelation unit 681B2, the
Incidentally, n frames before short-time spectrum X 1 (j-n, f ), ..., X M (j-n, f) in the case of using the echo component ratio estimation results obtained by the similar calculation May be a part of the sub-component of the multi-channel reproduction signal spectrum.
ステップF4
相関除去部682では、現時点のフレームの収音信号の短時間スペクトルY(j,f)からX1(j,f)との相関成分を除去したスペクトルY(1)(j,f)を求める。
The correlation removal unit 682 obtains a spectrum Y (1) (j, f) obtained by removing the correlation component with X 1 (j, f) from the short-time spectrum Y (j, f) of the sound collection signal of the current frame. .
ステップF5
コヒーレンス算出部6831では、多チャネル再生信号スペクトルの主成分である現時点のフレームの第1チャネル再生信号の短時間スペクトルX1(j,f)と現時点の収音信号のスペクトルY(j,f)から、次のコヒーレンスを求める。
In the
ステップF6
副成分エコー比率算出部6832では、まず相関除去された収音信号スペクトルY(1)(j,f)に含まれるエコー成分Y^(1)(j,f)を求める。エコー成分Y^(1)(j,f)は、多チャネル再生信号短時間スペクトルの副成分X2(1)(j,f),…,XM(1)(j,f),X1(1)(j−1,f),…,XM(1)(j−1,f)の線形和
|Y(1)(j,f)−Y^(1)(j,f)|2
が最小となるスペクトルである。この誤差を最小にするスペクトルは、
The sub-component echo
Is the spectrum with the minimum. The spectrum that minimizes this error is
ステップF7
エコー成分比率算出部684において、ステップF5、F6で求めた各比率から、収音信号スペクトルY(j,f)に占めるエコー成分の比率を求める。
In the echo component
FT変換部66では、周波数領域におけるエコー抑圧処理結果Z(j,f)を次式のように時間領域のフレーム信号に変換する。
現時点のフレームの処理が終了すると、最後に現時点の蓄積部681a1に蓄積された再生信号情報は過去の蓄積部681a2に転送され、蓄積される。
なお、蓄積部681a内で現時点の蓄積部681a1と過去の蓄積部681a2とを特に区別し、上記のように一連の処理の最後に現時点の蓄積部681a1に蓄積された再生信号情報を過去の蓄積部681a2に転送するのではなく、1つの蓄積部681aに蓄積された情報の中で最新情報を現時点の情報として処理する方法もある。また、図7に示すように処理に利用する現時点の再生信号のスペクトルを、蓄積部から取り出すのではなく、入力された再生信号のスペクトルを直接利用する方法もある。
The
When the processing of the current frame is completed, the reproduction signal information stored last in the current storage unit 681a1 is transferred to and stored in the past storage unit 681a2.
In the
[第2実施形態]
この発明は、エコー抑圧方法と適応フィルタによる音響エコー消去方法とを組み合わせたものであり、その構成例を図8に示す。
Mチャネル受話信号は、スピーカ2m(m=1,…,M)で音響信号として再生され、音響エコー経路を経てマイクロホン3に回り込む。同時に音響エコー消去部9の予測エコー生成部91に入力される。減算器92によってマイクロホン3からの収音信号y(k)から予測エコー信号が差し引かれ、その残差信号がエコー経路推定部93にフィードバックされると同時にエコー抑圧部6への入力信号となる。エコー抑圧部6では、第1実施形態と同様にエコー成分を抑圧し、送話端子5から送話信号を送信する。
この構成では、エコー抑圧部6への入力として適応フィルタによるエコー消去後の信号(残差信号)を用いている。そのため受話音声と送話音声が重なるダブルトーク状況においても、収音信号に含まれる受話エコー成分を大幅に低減でき、拡声通話の品質を向上できる。
なお、図8はM(≧2)チャネル再生系と1チャネル収音系からなる場合を説明したが、収音系がN(≧2)チャネルの場合にも同様の構成をN個並列に並べることで対応可能である。
[Second Embodiment]
The present invention is a combination of an echo suppression method and an acoustic echo cancellation method using an adaptive filter, and a configuration example thereof is shown in FIG.
The M channel received signal is reproduced as an acoustic signal by the speaker 2 m (m = 1,..., M), and goes around the
In this configuration, a signal (residual signal) after echo cancellation by an adaptive filter is used as an input to the
Note that FIG. 8 illustrates the case of the M (≧ 2) channel reproduction system and the 1-channel sound collection system, but N similar configurations are arranged in parallel when the sound collection system has N (≧ 2) channels. This is possible.
[第3実施形態]
この発明は、エコー抑圧方法と音声スイッチ方法とを組み合わせたものであり、その構成例を図9に示す。
スピーカ2mからのMチャネルの再生信号とマイクロホンからの1チャネルの収音信号から、エコー抑圧部6n’(n=1,…,N)によりエコーが抑圧された送信信号が得られるとともに、送話判定部に入力される非エコー信号パワーが求められる。なお図9は、収音系がNチャネルの場合に対応しており、Mチャネルエコー抑圧部6n’をN個並列に並べた構成となっている。
[Third Embodiment]
The present invention is a combination of an echo suppression method and a voice switch method, and a configuration example thereof is shown in FIG.
From the reproduction signal of M channel from the
収音信号は、エコー抑圧部6’のTF変換部62で周波数領域に変換され、エコー成分比率推定部68および信号パワー算出部69に入力される。エコー成分比率推定部68は、第1実施形態と同様に周波数成分ごとに収音信号に占めるエコー成分の比率を推定する。推定結果は、エコー抑圧のために減衰比算出部64に入力されると同時に、信号パワー算出部69に入力される。信号パワー算出部69では、上記エコー成分比率推定結果γ2(j,f)とTF変換部62からの出力である収音信号の短時間スペクトルY(j,f)から、非エコー信号パワーPYIを求める。送話判定部4では、上記非エコー信号パワーPYIをあらかじめ設定した閾値Pthと比較して送話の有無を判定し、送話音声があると判断されたときは受話側の可変損失部7m(m=1,…,M)により受話信号のみを減衰させてスピーカへの再生信号とする。送話音声がないと判断されたときは、送話端子4から送信される送話信号のみを可変損失部8n(n=1,…,N)により減衰させる。
The collected sound signal is converted into the frequency domain by the
ここで、上記非エコー信号パワーPYIを求める方法の例としては、次式がある。
[第4実施形態]
この発明は、エコー抑圧方法、音声スイッチ方法、適応フィルタによる音響エコー消去方法を組み合わせたものであり、その構成例を図10に示す。
Mチャネル受話信号は、スピーカ2m(m=1,…,M)で音響信号として再生され、音響エコー経路を経てマイクロホン3n(n=1,…,N)に回り込む。同時に音響エコー消去部9nに入力される。予測エコー生成部91で再生信号xm(k)からエコー成分が予測され、減算器92によって収音信号y(k)から予測エコー信号が差し引かれる。その残差信号がエコー経路推定部93にフィードバックされると同時にエコー抑圧部6’への入力信号となる。なお図10は、収音系がNチャネルの場合に対応しており、Mチャネルエコー抑圧部6n’をN個並列に並べた構成となっている。
[Fourth Embodiment]
The present invention is a combination of an echo suppression method, a voice switch method, and an acoustic echo cancellation method using an adaptive filter, and its configuration example is shown in FIG.
The M channel received signal is reproduced as an acoustic signal by the speaker 2 m (m = 1,..., M), and circulates to the microphone 3 n (n = 1,..., N) through the acoustic echo path. At the same time inputted to the acoustic
エコー抑圧部6’、送話判定部4、受話側の可変損失部7m、送話側の可変損失部8nの構成と処理方法は第3実施形態と同じである。
この構成の送信信号は、エコー消去後の残差信号にエコー抑圧処理し、さらに可変損失部を経た信号となるため拡声通話品質の一層の向上が期待できる。
The configuration and processing method of the
Since the transmission signal having this configuration is subjected to echo suppression processing on the residual signal after echo cancellation and further undergoes a variable loss section, further enhancement of the quality of the voice call can be expected.
Claims (12)
現時点のフレームの第1チャネル再生信号の短時間スペクトルを主成分とし、
現時点のフレームの第2から第Mチャネルまでの再生信号、および、少なくとも1フレーム過去の第1から第Mチャネルまでの再生信号について、各々の短時間スペクトルから、主成分とした短時間スペクトルとの相関を除去して、副成分を構成する複数の短時間スペクトルを求め、
主成分のエコーが収音信号の短時間スペクトルに占める割合を求め、
副成分のエコーが主成分との相関を除去した収音信号の短時間スペクトルに占める割合を求め、
上記2つの割合から収音信号の短時間スペクトルに占めるエコー成分比率を周波数ごとに推定し、
周波数ごとに推定された上記エコー成分比率に基づき、周波数成分ごとに収音信号の振幅をエコー相当分だけ減衰させること、
を特徴とするエコー抑圧方法。 In a method for predicting an echo component from a reproduction signal of a plurality of channels (M channel) and a sound pickup signal of at least one channel and suppressing the echo,
The main component is the short-time spectrum of the first channel playback signal of the current frame,
With respect to the reproduction signal from the second to the M-th channel of the current frame and the reproduction signal from the first to the M-th channel at least one frame past, from each of the short-time spectra, the short-term spectrum as the main component Remove multiple correlations to find multiple short-time spectra that make up subcomponents,
Find the ratio of the main component echo to the short-time spectrum of the collected signal,
Obtain the ratio of the echoes of subcomponents in the short-time spectrum of the collected sound signal from which the correlation with the main component has been removed,
Estimate the ratio of echo components in the short-time spectrum of the collected sound signal for each frequency from the above two ratios,
Based on the echo component ratio estimated for each frequency, the amplitude of the collected signal is attenuated by an amount equivalent to the echo for each frequency component;
An echo suppression method characterized by the above.
収音信号の短時間スペクトルに占めるエコー成分比率γ2(f)を、主成分のエコーが収音信号の短時間スペクトルに占める割合γ1 2(f)と副成分のエコーが主成分との相関を除去した収音信号の短時間スペクトルに占める割合γ2 2(f)から、
を特徴とするエコー抑圧方法。 The method of claim 1 , wherein
The echo component ratio gamma 2 occupying the short-time spectrum of the collected signal (f), the echo of the main component is short Percentage spectrum γ 1 2 (f) and subcomponent of collected signal echo is mainly From the ratio γ 2 2 (f) of the short-time spectrum of the collected sound signal from which the correlation is removed,
An echo suppression method characterized by the above.
主成分との相関が除去された収音信号の短時間スペクトルY(1)(f)に含まれるエコー成分Y^(1)(f)を、|Y(1)(f)−Y^(1)(f)|2を最小とする線形和として求め、
副成分のエコーが主成分との相関を除去した収音信号の短時間スペクトルに占める割合γ2 2(f)を、
を特徴とするエコー消去方法。 The method of claim 2 , wherein
The echo component Y ^ (1) (f) included in the short-time spectrum Y (1) (f) of the collected sound signal from which the correlation with the principal component is removed is represented by | Y (1) (f) -Y ^ ( 1) (f) | Obtain as a linear sum that minimizes 2 ;
The proportion γ 2 2 (f) of the short-time spectrum of the collected sound signal from which the echo of the subcomponent is removed from the correlation with the main component,
An echo canceling method characterized by the above.
エコー抑圧処理結果Z(f)を、収音信号の短時間スペクトルY(f)と収音信号の短時間スペクトルに占めるエコー成分比率γ2(f)から、
を特徴とするエコー抑圧方法。 In the method in any one of Claims 1-3 ,
The echo suppression processing result Z (f) is calculated from the short-time spectrum Y (f) of the collected sound signal and the echo component ratio γ 2 (f) occupying the short-time spectrum of the collected sound signal.
An echo suppression method characterized by the above.
再生信号から予測したエコーの予測値と収音部から得た信号との残差信号を収音信号とすること、
を特徴とするエコー抑圧方法。 In the method in any one of Claims 1-4 ,
A residual signal between the predicted value of the echo predicted from the reproduction signal and the signal obtained from the sound collection unit is used as the sound collection signal;
An echo suppression method characterized by the above.
現時点のフレームの第1チャネル再生信号の短時間スペクトルを主成分とする手段と、
現時点のフレームの第2から第Mチャネルまでの再生信号、および、少なくとも1フレーム過去の第1から第Mチャネルまでの再生信号について、各々の短時間スペクトルから主成分とした短時間スペクトルとの相関を除去して、副成分を構成する複数の短時間スペクトルを求める手段と、
主成分のエコーが収音信号の短時間スペクトルに占める割合を求める手段と、
副成分のエコーが主成分との相関を除去した収音信号の短時間スペクトルに占める割合を求める手段と、
上記2つの割合から収音信号の短時間スペクトルに占めるエコー成分比率を周波数ごとに推定する手段と、
周波数ごとに推定された上記エコー成分比率に基づき、周波数成分ごとに収音信号の振幅をエコー相当分だけ減衰させる手段と、
を備えることを特徴とするエコー抑圧装置。 Means for receiving a reproduction signal of a plurality of channels (M channel) and a sound pickup signal of at least one channel;
Means based on the short-time spectrum of the first channel reproduction signal of the current frame;
Correlation between the reproduction signal from the second to M-th channel of the current frame and the reproduction signal from the first to M-th channel at least one frame past from each short-time spectrum to the short-time spectrum as a main component Means for obtaining a plurality of short-time spectra constituting subcomponents ,
Means for determining the proportion of the principal component echo in the short-time spectrum of the collected signal;
Means for determining the ratio of the echoes of the subcomponents in the short-time spectrum of the collected sound signal from which the correlation with the main component is removed;
Means for estimating, for each frequency, an echo component ratio in the short-time spectrum of the collected sound signal from the two ratios;
Based on the echo component ratio estimated for each frequency, means for attenuating the amplitude of the collected signal for each frequency component by an amount equivalent to the echo,
An echo suppression apparatus comprising:
収音信号の短時間スペクトルに占めるエコー成分比率γ2(f)を推定する手段として、主成分のエコーが収音信号の短時間スペクトルに占める割合γ1 2(f)と副成分のエコーが主成分との相関を除去した収音信号の短時間スペクトルに占める割合γ2 2(f)から、
を備えるエコー抑圧装置。 The apparatus of claim 6 .
As means for estimating the echo component ratio γ 2 (f) in the short-time spectrum of the collected sound signal, the ratio γ 1 2 (f) in which the main component echo occupies the short-time spectrum of the collected signal and the sub-component echo are From the ratio γ 2 2 (f) in the short-time spectrum of the collected sound signal from which the correlation with the main component is removed,
An echo suppressor comprising:
副成分のエコーが主成分との相関を除去した収音信号の短時間スペクトルに占める割合γ2 2(f)を求める手段として、主成分との相関が除去された収音信号の短時間スペクトルY(1)(f)に含まれるエコー成分Y^(1)(f)を、
|Y(1)(f)−Y^(1)(f)|2
を最小とする線形和として求め、副成分のエコーが主成分との相関を除去した収音信号の短時間スペクトルに占める割合γ2 2(f)を、
を備えるエコー抑圧装置。 The apparatus of claim 7 .
The short-time spectrum of the collected sound signal from which the correlation with the main component has been removed as means for obtaining the ratio γ 2 2 (f) of the short-term spectrum of the collected sound signal from which the correlation with the main component has been removed by the echo of the subcomponent Y: (1) echo component contained in the (f) Y ^ (1) (f),
| Y (1) (f) -Y ^ (1) (f) | 2
And the ratio γ 2 2 (f) in the short-time spectrum of the collected sound signal in which the echo of the subcomponent is removed from the correlation with the main component,
An echo suppressor comprising:
エコー抑圧処理結果Z(f)を、収音信号の短時間スペクトルY(f)と収音信号Y(f)と収音信号の短時間スペクトルに占めるエコー成分比率γ2(f)から、
を備えるエコー抑圧装置。 In the apparatus in any one of Claims 6-8 ,
The echo suppression processing result Z (f) is obtained from the short-time spectrum Y (f) of the collected sound signal, the collected sound signal Y (f), and the echo component ratio γ 2 (f) in the short-time spectrum of the collected sound signal.
An echo suppressor comprising:
再生信号から予測したエコーの予測値と収音部から得た信号との残差信号を収音信号とする手段、
を備えるエコー抑圧装置。 In the apparatus in any one of Claims 6-9 ,
Means for making a sound collection signal a residual signal between a predicted value of an echo predicted from a reproduction signal and a signal obtained from the sound collection section;
An echo suppressor comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004309638A JP4448423B2 (en) | 2004-10-25 | 2004-10-25 | Echo suppression method, apparatus for implementing this method, program, and recording medium therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004309638A JP4448423B2 (en) | 2004-10-25 | 2004-10-25 | Echo suppression method, apparatus for implementing this method, program, and recording medium therefor |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006121588A JP2006121588A (en) | 2006-05-11 |
JP4448423B2 true JP4448423B2 (en) | 2010-04-07 |
Family
ID=36539028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004309638A Expired - Fee Related JP4448423B2 (en) | 2004-10-25 | 2004-10-25 | Echo suppression method, apparatus for implementing this method, program, and recording medium therefor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4448423B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4916394B2 (en) * | 2007-07-03 | 2012-04-11 | 富士通株式会社 | Echo suppression device, echo suppression method, and computer program |
JP5391103B2 (en) * | 2010-02-10 | 2014-01-15 | 日本電信電話株式会社 | Multi-channel echo canceling method, multi-channel echo canceling apparatus, multi-channel echo canceling program and recording medium therefor |
JP6143702B2 (en) * | 2014-04-09 | 2017-06-07 | 日本電信電話株式会社 | Echo canceling apparatus, method and program |
CN113362841B (en) * | 2021-06-10 | 2023-05-02 | 北京小米移动软件有限公司 | Audio signal processing method, device and storage medium |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3420705B2 (en) * | 1998-03-16 | 2003-06-30 | 日本電信電話株式会社 | Echo suppression method and apparatus, and computer-readable storage medium storing echo suppression program |
JP3753996B2 (en) * | 2002-03-20 | 2006-03-08 | 日本電信電話株式会社 | Echo suppression device, echo suppression method and program |
JP3756839B2 (en) * | 2002-04-17 | 2006-03-15 | 日本電信電話株式会社 | Reverberation reduction method, Reverberation reduction device, Reverberation reduction program |
JP3881300B2 (en) * | 2002-10-24 | 2007-02-14 | 日本電信電話株式会社 | Voice switch method, voice switch and voice switch program, and recording medium recording the program |
-
2004
- 2004-10-25 JP JP2004309638A patent/JP4448423B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006121588A (en) | 2006-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2546717C2 (en) | Multichannel acoustic echo cancellation | |
US8644496B2 (en) | Echo suppressor, echo suppressing method, and computer readable storage medium | |
US20070036344A1 (en) | Method and system for eliminating noises and echo in voice signals | |
JPH114288A (en) | Echo canceler device | |
JP5391103B2 (en) | Multi-channel echo canceling method, multi-channel echo canceling apparatus, multi-channel echo canceling program and recording medium therefor | |
KR20130040194A (en) | Method and device for suppressing residual echoes | |
JP2004133403A (en) | Sound signal processing apparatus | |
JP3607625B2 (en) | Multi-channel echo suppression method, apparatus thereof, program thereof and recording medium thereof | |
US20170310360A1 (en) | Echo removal device, echo removal method, and non-transitory storage medium | |
JP5662232B2 (en) | Echo canceling apparatus, method and program | |
JP3753996B2 (en) | Echo suppression device, echo suppression method and program | |
JP3756839B2 (en) | Reverberation reduction method, Reverberation reduction device, Reverberation reduction program | |
JP5469564B2 (en) | Multi-channel echo cancellation method, multi-channel echo cancellation apparatus and program thereof | |
JP4448423B2 (en) | Echo suppression method, apparatus for implementing this method, program, and recording medium therefor | |
US8369511B2 (en) | Robust method of echo suppressor | |
JP3756828B2 (en) | Reverberation elimination method, apparatus for implementing this method, program, and recording medium therefor | |
JP4413205B2 (en) | Echo suppression method, apparatus, echo suppression program, recording medium | |
JP4504782B2 (en) | Echo cancellation method, apparatus for implementing this method, program, and recording medium therefor | |
JP3673727B2 (en) | Reverberation elimination method, apparatus thereof, program thereof, and recording medium thereof | |
JP4448424B2 (en) | Voice switch method, apparatus for implementing the method, program, and recording medium therefor | |
JP3881300B2 (en) | Voice switch method, voice switch and voice switch program, and recording medium recording the program | |
JP4594854B2 (en) | Voice switch method, voice switch device, voice switch program, and recording medium recording the program | |
JP5963077B2 (en) | Telephone device | |
JP2002064617A (en) | Echo suppression method and echo suppression equipment | |
CN111968663A (en) | Echo residue judgment method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100112 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100122 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130129 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |