JP2000252884A - Adaptive filter learning system - Google Patents
Adaptive filter learning systemInfo
- Publication number
- JP2000252884A JP2000252884A JP5147099A JP5147099A JP2000252884A JP 2000252884 A JP2000252884 A JP 2000252884A JP 5147099 A JP5147099 A JP 5147099A JP 5147099 A JP5147099 A JP 5147099A JP 2000252884 A JP2000252884 A JP 2000252884A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- learning
- frame
- signal
- adaptive filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Filters That Use Time-Delay Elements (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、例えばディジタル
自動車電話等の音声通信装置において、送話信号に含ま
れるエコー成分を除去するためのエコーキャンセラに係
り、特に各周波数毎に適応フィルタを備えた周波数領域
型のエコーキャンセラに用いられる適応フィルタ学習方
式に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an echo canceller for removing an echo component contained in a transmission signal in a voice communication device such as a digital car telephone, and more particularly to an echo canceller provided for each frequency. The present invention relates to an adaptive filter learning method used for a frequency-domain echo canceller.
【0002】[0002]
【従来の技術】近年、コンピュータや通信の分野では、
ディジタル信号処理(DSP)が注目され、多種類の分
野に応用されている。このディジタル信号処理は、アナ
ログ処理では困難であった特性定数の任意変更や適応処
理等の複雑な処理を容易に実現することができるため、
特に、音声処理や画像処理の分野において汎用的な技術
として用いられている。2. Description of the Related Art In recent years, in the field of computers and communications,
Digital signal processing (DSP) has attracted attention and has been applied to various fields. This digital signal processing can easily realize complicated processing such as arbitrary change of characteristic constants and adaptive processing which were difficult in analog processing.
In particular, it is used as a general-purpose technique in the field of audio processing and image processing.
【0003】例えば、自動車電話等で使用されるハンズ
フリータイプの電話機では、ハンズフリー通話中には、
スピーカからの受話音声がマイクロホンに回り込み、こ
れが相手方に送られて音響エコーが発生することがあ
る。このような受話音声の回り込みによる音響エコーを
打ち消して通話品質を保つために、一般にエコーキャン
セラと呼ばれるエコー消去装置が使用される。For example, in a hands-free type telephone used in a car telephone or the like, during a hands-free call,
In some cases, the voice received from the speaker wraps around the microphone and is sent to the other party to generate an acoustic echo. An echo canceller generally called an echo canceller is used to cancel the acoustic echo caused by the wraparound of the received voice and maintain the communication quality.
【0004】ここで、音声通信において問題とされる、
スピーカからマイクへの帰還信号であるエコーは、受話
信号(スピーカへ供給される音)と送話信号(マイクか
ら入力される音)との相関をつかって打ち消すことが可
能である。具体的には、スピーカとマイクの間の回帰路
を1つのFIRフィルタ(FIR:finite impulse res
ponse,有限インパルス応答)と見なし、このフィルタ
の係数を推定する方式が実用化されている。Here, there is a problem in voice communication.
The echo, which is a feedback signal from the speaker to the microphone, can be canceled by using the correlation between the reception signal (sound supplied to the speaker) and the transmission signal (sound input from the microphone). Specifically, the regression path between the speaker and the microphone is connected to one FIR filter (FIR: finite impulse res
ponse, finite impulse response), and a method of estimating the coefficient of this filter has been put to practical use.
【0005】実用のフィルタ係数推定方式は、時間逐次
型の適応フィルタを用いる(「ディジタル信号処理の基
礎」辻井重男、電子情報通信学会発行)。しかし、この
時間領域型のエコーキャンセラでは、適応フィルタの学
習のための演算量が多いことから、近年、信号をフレー
ム単位で区切り、各フレーム毎に適応フィルタの学習を
行う周波数領域型のエコーキャンセラが検討された
(“Unconstrained Frequency
−Domain Adaptive Filter”,
IEEE trans.Vol.ASSP−30,N
o.5,Oct.1982)。A practical filter coefficient estimating method uses a time-sequential adaptive filter ("Basics of Digital Signal Processing", published by Shigeo Tsujii, IEICE). However, in this time-domain echo canceller, since the amount of computation for learning the adaptive filter is large, in recent years, the frequency-domain echo canceller separates the signal in frame units and learns the adaptive filter for each frame. (“Unconstrained Frequency”
-Domain Adaptive Filter ",
IEEE trans. Vol. ASSP-30, N
o. 5, Oct. 1982).
【0006】この周波数領域型のエコーキャンセラの方
式の概要を述べると、まず、受話信号と送話信号をそれ
ぞれフレームに区切ってFFT(高速フーリエ変換)を
行い、周波数成分毎に個別の複素一次適応フィルタを用
意して1フレームに一度学習させ、各周波数成分毎にエ
コーをキャンセルする。残留成分を逆変換すれば、エコ
ー除去後の信号が得られる。The outline of the frequency-domain echo canceller system is as follows. First, an FFT (Fast Fourier Transform) is performed by dividing a reception signal and a transmission signal into frames, and an individual complex first-order adaptation is performed for each frequency component. A filter is prepared and learned once per frame, and echo is canceled for each frequency component. If the residual component is inversely transformed, a signal after echo removal can be obtained.
【0007】適応フィルタの学習は、送話信号にエコー
以外の信号、即ち送話側の話者の声が混入している間は
行えない。学習ができるかどうかを判定する機能をダブ
ルトーク検出という。ダブルトークの判定は、受話信
号、送話信号、エコー残留成分のパワーを閾値と比較し
て行う。ダブルトーク検出は時間領域型のエコーキャン
セラの場合にはサンプル毎に、周波数領域型のエコーキ
ャンセラの場合にはフレーム毎に行われるのが通常であ
る。Learning of the adaptive filter cannot be performed while a signal other than the echo, that is, the voice of the speaker on the transmitting side is mixed in the transmitting signal. The function of determining whether learning is possible is called double talk detection. The determination of double talk is performed by comparing the power of the received signal, the transmitted signal, and the power of the echo residual component with a threshold. In general, double talk detection is performed for each sample in the case of a time domain type echo canceller, and is performed for each frame in the case of a frequency domain type echo canceller.
【0008】[0008]
【発明が解決しようとする課題】周波数領域型のエコー
キャンセラにおいて、従来は、フレーム単位で学習の可
否を判定していた。しかしながら、周波数領域型で用い
られる適応フィルタは、低域、中域、高域といったよう
に各周波数毎に個別であるため、必ずしも全ての周波数
で学習が可能とは限らない。例えば、受話信号の周波数
成分のパワーが小さい場合に学習を行うと、その周波数
のみエコー打消し量が劣化することもある。このような
ことから、学習の可否は各周波数毎に個別に判定するこ
とが望ましい。Conventionally, in a frequency-domain echo canceller, whether or not learning is possible is determined on a frame-by-frame basis. However, an adaptive filter used in the frequency domain type is individual for each frequency such as a low band, a middle band, and a high band, so that learning is not always possible at all frequencies. For example, if learning is performed when the power of the frequency component of the received signal is small, the echo canceling amount may deteriorate only at that frequency. For this reason, it is desirable to determine whether or not learning is possible for each frequency.
【0009】本発明は上記のような点に鑑みなされたも
ので、各周波数毎に適応フィルタを備えた周波数領域型
のエコーキャンセラにおいて、学習可否の判定を各周波
数毎に独立して行うことで、周波数単位でのエコー打消
し量の劣化を防ぐようにした適応フィルタ学習方式を提
供することを目的とする。The present invention has been made in view of the above points, and in a frequency-domain echo canceller provided with an adaptive filter for each frequency, the determination as to whether or not learning is possible is made independently for each frequency. It is another object of the present invention to provide an adaptive filter learning method for preventing deterioration of an echo canceling amount in frequency units.
【0010】[0010]
【課題を解決するための手段】本発明の適応フィルタ学
習方式は、受話信号をフレーム単位で周波数変換し、各
周波数毎に異なる適応フィルタを用いて上記受話信号か
ら疑似エコー信号を生成し、この疑似エコー信号を周波
数逆変換して送話信号から減算することで上記送話信号
に含まれるエコー成分を除去する周波数領域型のエコー
キャンセラに用いられる適応フィルタ学習方式であっ
て、上記受話信号、上記送話信号、上記疑似エコー信号
と上記送話信号との残留誤差信号に基づいて上記適応フ
ィルタの当該フレームに対する学習処理を行い、その学
習の可否の判定を各周波数毎に独立に行うようにしたも
のである。According to the adaptive filter learning method of the present invention, a received speech signal is frequency-converted in frame units, and a pseudo echo signal is generated from the received speech signal using a different adaptive filter for each frequency. An adaptive filter learning method used in a frequency-domain echo canceller that removes an echo component included in the transmission signal by subjecting the pseudo echo signal to inverse frequency conversion and subtracting from the transmission signal, wherein the reception signal includes: The adaptive filter performs learning processing on the frame based on the residual error signal between the transmission signal and the pseudo echo signal and the transmission signal, and determines whether or not to perform the learning independently for each frequency. It was done.
【0011】この場合、まず、上記受話信号、上記送話
信号、上記残留誤差信号のフレーム全体のパワーに基づ
いて当該フレームが学習に適するか否かを判定し、その
後で当該フレームが学習に適する場合には、さらに各周
波数毎に上記受話信号、上記送話信号、上記残留誤差信
号の周波数成分パワーから当該周波数の学習の可否を判
定することでも良い。In this case, first, it is determined whether or not the frame is suitable for learning based on the power of the entire frame of the reception signal, the transmission signal, and the residual error signal, and then the frame is suitable for learning. In this case, it is also possible to determine whether or not the frequency can be learned from the frequency component power of the received signal, the transmitted signal, and the residual error signal for each frequency.
【0012】また、当該フレームの周波数成分をいくつ
かのグループに分け、上記残留誤差信号の周波数成分の
パワーをグループ毎に平均化した値と、グループ毎に設
定された閾値および上記受信信号の周波数成分のパワー
を用いて上記適応フィルタの当該フレームに対する学習
の可否を判定することでも良い。Further, the frequency component of the frame is divided into several groups, the power of the power of the frequency component of the residual error signal is averaged for each group, a threshold value set for each group, and the frequency of the reception signal are set. Whether the adaptive filter can learn the frame or not may be determined using the power of the component.
【0013】また、学習可と判定された周波数の個数が
一定値より多い場合には当該フレームの全ての周波数に
ついて学習を行い、学習可と判定された周波数の個数が
一定値より少ない場合には当該フレームの全ての周波数
について学習を行わないようにすることでも良い。When the number of frequencies determined to be learnable is larger than a certain value, learning is performed for all the frequencies of the frame, and when the number of frequencies determined to be learnable is smaller than a certain value, the learning is performed. Learning may not be performed for all frequencies of the frame.
【0014】さらに、当該フレームの周波数成分をいく
つかのグループに分け、各グループ内での学習の可否の
判定結果を同一にするようにしても良い。Further, the frequency components of the frame may be divided into several groups, and the determination result of the possibility of learning in each group may be the same.
【0015】このように、各周波数毎に学習の可否を独
立に判定することで、各周波数に応じた最適な学習処理
を行うことができ、周波数単位のエコー打消し量劣化を
防ぐことができる。As described above, by independently determining whether or not learning is possible for each frequency, it is possible to perform optimal learning processing according to each frequency, and to prevent deterioration of the echo cancellation amount in frequency units. .
【0016】また、大多数の周波数で学習可と判定され
た場合には、学習全体としてのスピードを上げるために
フレーム毎に学習し、逆に、学習可と判定された周波数
の数が少ない場合には誤学習の可能性が高いのでフレー
ム毎に学習不可とすることで、各周波数の相関関係を考
慮したフレーム全体としての学習処理を行うことができ
る。When it is determined that learning is possible at most of the frequencies, learning is performed for each frame in order to increase the speed of learning as a whole. Conversely, when the number of frequencies determined to be learning is small, Since the possibility of erroneous learning is high, learning cannot be performed for each frame, so that the learning processing of the entire frame can be performed in consideration of the correlation between the frequencies.
【0017】[0017]
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.
【0018】図1は本発明の一実施形態に係る周波数領
域型のエコーキャンセラの構成を示すブロック図であ
る。FIG. 1 is a block diagram showing the configuration of a frequency-domain echo canceller according to an embodiment of the present invention.
【0019】このエコーキャンセラは、受話信号用のフ
レーム作成部10、フーリエ変換部(FFT)11、適
応フィルタ部(AF)12、逆フーリエ変換部(IFF
T)13、送話信号用のフレーム作成部14、フレーム
合成部15、フーリエ変換部16およびダブルトーク検
出部(DTD)17から構成される。The echo canceller includes a frame generator 10 for a received signal, a Fourier transformer (FFT) 11, an adaptive filter (AF) 12, and an inverse Fourier transformer (IFF).
T) 13, a transmission signal frame creation unit 14, a frame synthesis unit 15, a Fourier transform unit 16, and a double talk detection unit (DTD) 17.
【0020】なお、本発明の特徴部分は、各周波数毎に
設けられる適応フィルタ12(フィルタ係数)の学習の
可否を判定するダブルトーク検出部17であり、その他
のエコーキャンセラの構成部分(10〜16)について
は既存の方式で良いので、詳細な説明は避ける。本実施
形態では、従来方式として挙げた文献のFFT−ECを
例にして説明する。A feature of the present invention is a double talk detecting unit 17 for determining whether or not learning of an adaptive filter 12 (filter coefficient) provided for each frequency is performed, and other components of the echo canceller (10 to 10). For 16), an existing method may be used, and a detailed description will be omitted. In the present embodiment, an example will be described using FFT-EC of a document cited as a conventional method.
【0021】通信相手側の音声信号である受話信号は、
まず、フレーム作成部10において長さ2Nのフレーム
xk(0),…,xk(2N−1)に分割される。kは
フレームの番号、2NはFFTの変換次数であって、受
話信号においてはNサンプルずつオーバーラップさせて
フレームを作成する。The reception signal, which is the voice signal of the communication partner, is
First, the frame creation unit 10 divides the frame into 2N-length frames xk (0),..., Xk (2N-1). k is the frame number, 2N is the transform order of the FFT, and the received signal is overlapped by N samples to create a frame.
【0022】次に、このフレームをフーリエ変換部11
において周波数変換し、受話信号の周波数成分Xk
(0),…,Xk(N−1)を得る。ここで、Xk
(i)は複素数であるが、Xk(0)の実部は直流成
分、虚部は周期2サンプルの高周波成分とする。受話信
号の周波数成分Xk(i)は適応フィルタ部12におい
てフィルタ係数がかけらる。このXk(i)とフィルタ
係数との乗算結果として、疑似エコー成分X′k(i)
が生成される。この疑似エコー成分X′k(i)は逆フ
ーリエ変換部13において逆変換され、疑似エコーx′
k(0),…,x′k(2N−1)が生成される。Next, this frame is converted to a Fourier transform unit 11.
, And frequency component Xk of the received signal.
(0),..., Xk (N-1) are obtained. Where Xk
(I) is a complex number, but the real part of Xk (0) is a DC component, and the imaginary part is a high-frequency component having a period of two samples. The filter component is applied to the frequency component Xk (i) of the received signal in the adaptive filter unit 12. As a result of multiplication of the Xk (i) and the filter coefficient, a pseudo echo component X'k (i)
Is generated. This pseudo echo component X'k (i) is inversely transformed in the inverse Fourier transform unit 13, and the pseudo echo x '
k (0),..., x′k (2N−1) are generated.
【0023】一方、通信者側の音声信号である送話信号
は、フレーム作成部14において長さNのフレームyk
(0),…,yk(N−1)に分割される。そして、フ
レーム合成部15において、前半Nサンプルは0、後半
Nサンプルは送話信号から疑似エコーの後半x′k
(N),…,x′k(2N−1)を引き去った値を入れ
たフレームを作り、これをFFT部16において変換
し、残留誤差の周波数成分Ek(0),…,Ek(N−
1)を得る。On the other hand, a transmission signal, which is a voice signal on the communication side, is sent to a frame forming unit 14 by a frame yk of length N.
, Yk (N-1). Then, in the frame synthesizing unit 15, the first N samples are 0, and the second N samples are the second half x'k of the pseudo echo from the transmission signal.
(N),..., X′k (2N−1), and a frame in which the value is subtracted. The frame is transformed by the FFT unit 16, and the residual error frequency components Ek (0),. −
Obtain 1).
【0024】ここで、Ek(i)は複素数、Ek(0)
の実部は直流成分、虚部は周期2サンプルの高周波成分
とする。Where Ek (i) is a complex number and Ek (0)
Is a DC component, and the imaginary part is a high-frequency component having two cycles.
【0025】最後に、各周波数成分iに対して、残留誤
差の周波数成分Ek(i)と受話信号の周波数成分Xk
(i)を使って適応フィルタ12のi番目のフィルタ係
数を更新する。この場合、フィルタ係数の更新は周波数
iに対して、学習可否のフラグmode(i)が可(=
1)の場合のみ行われる。フィルタ係数の更新アルゴリ
ズムについては、文献等において周知であるため、ここ
ではその説明を省略するものとする。Finally, for each frequency component i, the frequency component Ek (i) of the residual error and the frequency component Xk
The i-th filter coefficient of the adaptive filter 12 is updated using (i). In this case, the update of the filter coefficient is enabled by the flag mode (i) indicating whether or not learning is possible for the frequency i (=
This is performed only in the case of 1). The algorithm for updating the filter coefficients is well known in literatures and the like, and therefore, the description thereof is omitted here.
【0026】フラグmode(i)(i=0,…,N)
はダブルトーク検出部17において決定される。このダ
ブルトーク検出部17は、受話信号から疑似エコーを生
成して送話信号から引き去るエコーキャンセルにおい
て、上述したように、受話信号および送話信号を周波数
変換(FFT)し、各周波数成分毎に異なる適応フィル
タ(フィルタ係数)を用いて疑似エコー成分を生成する
場合に、各周波数の適応フィルタにおける当該フレーム
に対する学習の可否を各周波数毎に独立に決定すること
を特徴とするものである。Flag mode (i) (i = 0,..., N)
Is determined by the double talk detecting unit 17. As described above, the double talk detecting unit 17 performs frequency conversion (FFT) on the received signal and the transmitted signal in the echo cancellation to generate a pseudo echo from the received signal and subtract the pseudo echo from the transmitted signal. When a pseudo echo component is generated using a different adaptive filter (filter coefficient), it is characterized in that whether or not the adaptive filter of each frequency can learn the frame is independently determined for each frequency.
【0027】以下に、このダブルトーク検出部17の処
理動作について説明する。Hereinafter, the processing operation of the double talk detecting unit 17 will be described.
【0028】図2乃至図4はダブルトーク検出部17の
アルゴリズムを示したフローチャートである。FIGS. 2 to 4 are flowcharts showing the algorithm of the double talk detecting unit 17.
【0029】ここでは、便宜上、直流成分(周波数0の
実部)に対するフラグはmode(0)、周期2サンプ
ルの周波数成分(周波数0の虚部)に対するフラグはm
ode(N)を用いることとする。その他の周波数は周
波数No.に対応する。Here, for convenience, the flag for the DC component (real part of frequency 0) is mode (0), and the flag for the frequency component of two samples in the period (imaginary part of frequency 0) is m.
mode (N) is used. Other frequencies are frequency Nos. Corresponding to
【0030】また、図2乃至図4において、各記号の定
義は以下の通りである。In FIGS. 2 to 4, the definition of each symbol is as follows.
【0031】k;フレーム番号 N;送話信号のフレーム長かつFFT次数の1/2(例
えば128) Xk(i);受話信号のフレームkの周波数成分i(複
素数) Ek(i);残留誤差信号のフレームkの周波数成分i
(複素数) なお、i=0,…,N−1、i=0の時に周波数成分の
実部は直流成分、虚部は最高周波数である。 yk(i);送信信号のフレームkのシンプル値(実
数) i=0,…,N−1 pe;残留誤差信号のフレーム全体のパワー px;受話信号のフレーム全体のパワー py;送話信号のフレーム全体のパワー tmp;S/N比 t;フレームの可変閾値 flag;フレームの状態フラグ c;フレームの数 V,a,b;定数(例えばV=1024*N,a=1,
b=1) α,β;定数(例えばα=0.95,β=0.25) L;更新時間(例えば100) Pe(i);受話信号の周波数成分のグループ別平均パ
ワー Px(i);残留誤差信号の周波数成分のグループ別平
均パワー B,BN;周波数のグループ数,各グループに含まれる
周波数の数 例えば、B=4,BN=N/4であり、グループ数が4
で、周波数の数が128の場合には、各グループに含ま
れる周波数の数は128/4=32 Ca;学習可の周波数の数 M1,M0;定数(M1>M0) T(i);周波数グループ別の可変閾値,i=0,…,
B−1 mode(i);周波数グループ別の学習可否フラグ,
i=0,…,N A0,A1,A2,VB;定数(例えばA0=2,A1
=1,A2=1) なお、R( )とI( )はそれぞれ実部と虚部を表
す。K; frame number N; frame length of transmission signal and 1/2 of FFT order (for example, 128) Xk (i); frequency component i of reception signal frame k (complex number) Ek (i); residual error Frequency component i of frame k of the signal
(Complex number) Note that when i = 0,..., N−1, i = 0, the real part of the frequency component is a DC component, and the imaginary part is the highest frequency. yk (i); simple value (real number) of frame k of transmission signal i = 0,..., N-1 pe; power of entire frame of residual error signal px; power of entire frame of reception signal py; Power of the entire frame tmp; S / N ratio t; variable threshold value of the frame flag; status flag of the frame c; number of frames V, a, b; constant (for example, V = 1024 * N, a = 1,
b = 1) α, β; constant (for example, α = 0.95, β = 0.25) L; update time (for example, 100) Pe (i); average power of received signal frequency components by group Px (i) Average power B, BN for each group of frequency components of the residual error signal; number of frequency groups, number of frequencies included in each group For example, B = 4, BN = N / 4, and the number of groups is 4
When the number of frequencies is 128, the number of frequencies included in each group is 128/4 = 32 Ca; the number of learnable frequencies M1, M0; a constant (M1> M0) T (i); Variable threshold value for each group, i = 0,.
B-1 mode (i); learning enable / disable flag for each frequency group,
i = 0,..., N A0, A1, A2, VB; constant (for example, A0 = 2, A1
= 1, A2 = 1) Note that R () and I () represent a real part and an imaginary part, respectively.
【0032】また、図中のsection1はフレーム
に対する学習可否の判定処理、section2は適応
フィルタが異常の場合でのフレーム学習不可処理、se
ction3は周波数別の学習可否の判定結果に基づい
て当該フレームの全周波数に対する学習を可または不可
と決定する処理、section4は周波数のグループ
単位での可変閾値の更新処理、section5は周波
数別の学習可否の判定処理を示している。In the figure, section 1 is a process for determining whether or not learning is possible for a frame, section 2 is a frame learning disabling process when the adaptive filter is abnormal,
section3 is a process of determining whether or not learning is possible for all frequencies of the frame based on the determination result of the learning possibility of each frequency, section4 is a process of updating a variable threshold value for each frequency group, and section5 is a possibility of learning of each frequency. Is shown.
【0033】図2乃至図4のフローチャートに示すよう
に、ダブルトーク検出部17では、まず、ステップS1
で、処理に必要な各パラメータを0クリアし、ステップ
S2〜S16で、フレームに対する学習可否の判定処理
(section1)を以下のように実行する。As shown in the flow charts of FIGS. 2 to 4, the double talk detecting unit 17 first executes step S1.
Then, each parameter required for the processing is cleared to 0, and in steps S2 to S16, a learning possibility determination process (section 1) for the frame is executed as follows.
【0034】すなわち、ステップS2で、残留誤差信号
のフレーム全体のパワーpe、受話信号のフレーム全体
のパワーpx、送話信号のフレーム全体のパワーpyを
所定の計算式に従って計算すると共に、残留誤差信号と
受話信号とのS/N比tmpを次のように計算する。That is, in step S2, the power pe of the entire frame of the residual error signal, the power px of the entire frame of the reception signal, and the power py of the entire frame of the transmission signal are calculated in accordance with a predetermined formula. The S / N ratio tmp between the received signal and the received signal is calculated as follows.
【0035】tmp=log10(pe/px) ここで、学習不可の状態とは、ダブルトークの時と、送
話者が通話している時である。学習可の状態とは、受話
者(相手)が通話している時である。Tmp = log10 (pe / px) Here, the state in which learning is not possible is at the time of double talk and at the time of the talker talking. The state in which learning is possible is when the receiver (the other party) is talking.
【0036】したがって、上記ステップS2において、
残留誤差信号のフレーム全体のパワーpe、受話信号の
フレーム全体のパワーpx、送話信号のフレーム全体の
パワーpy、そして、残留誤差信号と受話信号とのS/
N比tmpを求めた後、次のステップS3にて、受話信
号のフレーム全体のパワーpxと定数Vとを比較するこ
とにより、受話者(相手)が通話状態にあるか否かを判
断する。その結果、受話信号のフレーム全体のパワーp
xの値が定数Vの値以下である場合には(px≦V)、
受話者(相手)が通話状態にないと判断して、ステップ
S4にて当該フレームの学習用flagに「0」をセッ
トしておく。なお、flag=0はフレームの学習不可
を示している。Therefore, in step S2,
The power pe of the entire frame of the residual error signal, the power px of the entire frame of the received signal, the power py of the entire frame of the transmitted signal, and the S / S of the residual error signal and the received signal.
After obtaining the N ratio tmp, in the next step S3, it is determined whether or not the receiver (the other party) is in a talking state by comparing the power px of the entire reception signal frame with the constant V. As a result, the power p of the entire received signal frame
If the value of x is equal to or less than the value of the constant V (px ≦ V),
It is determined that the receiver (the other party) is not in a talking state, and "0" is set in the learning flag of the frame in step S4. Note that flag = 0 indicates that learning of the frame is not possible.
【0037】一方、パワーpxの値が定数Vの値よりも
高い場合(px>V)、つまり、受話者(相手)が通話
状態にあると判断した場合には、次のステップS5にお
いて、送話信号のフレーム全体のパワーpyと定数V/
2とを比較することにより、そのときに送話者が通話状
態にあるか否かを判断する。その結果、送話信号のフレ
ーム全体のパワーpyの値が定数V/2の値よりも高い
場合には(py>V/2)、送話者が通話状態にあると
判断する。なお、このときの定数をV/2としたのは、
エコー減衰量が6dBと想定したのことであり、例えば
減衰量が12dBならば3V/4とする等の変更ができ
る。On the other hand, when the value of the power px is higher than the value of the constant V (px> V), that is, when it is determined that the receiver (the other party) is in a talking state, the transmission is performed in the next step S5. The power py of the whole frame of the speech signal and the constant V /
By comparing this with 2, it is determined whether or not the talker is in a talking state at that time. As a result, if the value of the power py of the entire frame of the transmission signal is higher than the value of the constant V / 2 (py> V / 2), it is determined that the transmitter is in a talking state. Note that the constant at this time was set to V / 2,
This is based on the assumption that the echo attenuation is 6 dB. For example, if the attenuation is 12 dB, it can be changed to 3 V / 4.
【0038】ここで、送話者も通話状態であれば、ダブ
ルトークであり学習不可となるが、その際にステップS
6にて、残留誤差信号と受話信号とのS/N比tmp
と、残留誤差信号と送話信号とのS/N比=log10
(pe/py)とをチェックし、両者がそれぞれ定数b
の値を超えているような場合、つまり、tmp>b&l
og10(pe/py)>bであるような場合には、適
応フィルタ12が正常に動作しておらず、異常状態(誤
動作)にあると判断する。適応フィルタ12が異常状態
にある場合には、エコーをキャンセルできないだけでな
く、逆にエコーを増幅してしまう可能性がある。そこ
で、適応フィルタ12が異常状態にあると判断した場合
には、ステップS7にて当該フレームの学習用flag
に「−1」をセットしておく。なお、flag=−1
は、フィルタ異常により学習不可であることを示してい
る。Here, if the talker is also in a talking state, it is a double talk and learning is not possible.
At 6, the S / N ratio tmp between the residual error signal and the reception signal
And the S / N ratio between the residual error signal and the transmission signal = log10
(Pe / py), and both are constants b
Is exceeded, that is, tmp> b & l
If og10 (pe / py)> b, it is determined that the adaptive filter 12 is not operating normally and is in an abnormal state (malfunction). When the adaptive filter 12 is in an abnormal state, not only the echo cannot be canceled but also the echo may be amplified. Therefore, when it is determined that the adaptive filter 12 is in the abnormal state, the learning flag of the frame is determined in step S7.
Is set to "-1". In addition, flag = -1
Indicates that learning is not possible due to a filter abnormality.
【0039】また、上記ステップS6において、上述し
た残留誤差信号と受話信号とのS/N比tmpと、残留
誤差信号と送話信号とのS/N比=log10(pe/
py)S/N比に問題がなければ、ダブルトーク(送話
側と受話側の両方が同時に通話している状態)であると
判断する。ダブルトークの場合には、ステップS4にて
当該フレームの学習用flagに「0」をセットして、
学習不可であることを示しておく。In step S6, the S / N ratio tmp between the residual error signal and the received signal and the S / N ratio between the residual error signal and the transmitted signal = log10 (pe / pe
py) If there is no problem in the S / N ratio, it is determined that double talk (a state in which both the transmitting side and the receiving side are talking at the same time). In the case of double talk, in step S4, "0" is set to the learning flag of the frame, and
Show that learning is not possible.
【0040】一方、上記ステップS3において、受話信
号のフレーム全体のパワーpxの値が定数Vの値よりも
高く(px>V)、かつ、上記ステップS5において、
送話信号のフレーム全体のパワーpyの値が定数V/2
の値以下である場合には(py≦V/2)、受話者(相
手)のみが通話状態にある判断して、当該フレームの学
習を可とする。On the other hand, in step S3, the value of the power px of the entire frame of the received signal is higher than the value of the constant V (px> V), and in step S5,
The value of the power py of the entire frame of the transmission signal is a constant V / 2
Is smaller than or equal to (py ≦ V / 2), only the receiver (the other party) is determined to be in a talking state, and learning of the frame is enabled.
【0041】その際、上記ステップS2で求めた残留誤
差信号と受話信号とのS/N比tmpをチェックし、そ
のS/N比tmpがフレームの可変閾値tに定数aを加
えた値以上であれば(tmp≧t+a)、ステップS9
にて当該フレームの学習用flagに「2」をセットす
る。また、そのS/N比tmpがフレームの可変閾値t
に定数aを加えた値よりも低ければ(tmp<t+
a)、ステップS10にて当該フレームの学習用fla
gに「1」をセットする。flag=1またはflag
=2は、学習可の状態を示している。なお、flag=
2はフレーム全部の学習は危険だが、一部の周波数だけ
ならば学習可としても良い状態と考えられる。At this time, the S / N ratio tmp between the residual error signal and the received signal obtained in step S2 is checked, and if the S / N ratio tmp is equal to or larger than the value obtained by adding the constant a to the variable threshold value t of the frame. If there is (tmp ≧ t + a), step S9
Sets "2" to the learning flag of the frame. Also, the S / N ratio tmp is equal to the variable threshold value t of the frame.
Is smaller than the value obtained by adding the constant a to (tmp <t +
a) In step S10, the learning fla of the frame
Set “1” to g. flag = 1 or flag
= 2 indicates a state in which learning is possible. In addition, flag =
In the case of 2, the learning of the entire frame is dangerous, but it can be considered that learning is possible if only a part of the frequencies is possible.
【0042】続いて、ステップS11〜S16にて、フ
レームの可変閾値tの更新処理を行う。Subsequently, in steps S11 to S16, a process of updating the variable threshold value t of the frame is performed.
【0043】この可変閾値tの更新処理では、現在設定
されている可変閾値tと上記ステップS2で求めた残留
誤差信号と受話信号とのS/N比tmpの値とを比較す
ることにより、可変閾値tがS/N比tmpより低けれ
ば(tmp<t)、ステップS12で所定の計算式に従
って当該可変閾値tを更新する。また、S/N比tmp
の値が0より低い場合には(tmp<0)、ステップS
14〜S16に示すように、更新時間L経過したとき
に、所定の計算式に従って当該可変閾値tを更新する。In the process of updating the variable threshold value t, the variable threshold value t which is currently set is compared with the value of the S / N ratio tmp of the received error signal and the residual error signal obtained in step S2 to obtain a variable value. If the threshold value t is lower than the S / N ratio tmp (tmp <t), the variable threshold value t is updated in step S12 according to a predetermined calculation formula. Also, the S / N ratio tmp
Is smaller than 0 (tmp <0), step S
As shown in 14 to S16, when the update time L has elapsed, the variable threshold value t is updated according to a predetermined calculation formula.
【0044】このようにして、受話信号のパワーpxと
残留誤差のパワーpe(=周波数成分のパワー総和)、
送話信号のパワーpyからフレームkが学習に適するか
否かを判定すると、次に周波数別の学習可否の判定処理
を行う。Thus, the power px of the received signal and the power pe of the residual error (= power sum of frequency components),
When it is determined whether or not the frame k is suitable for learning from the power py of the transmission signal, a process of determining whether or not learning is possible for each frequency is performed.
【0045】すなわち、まず、ステップS17で、現在
の学習対象となる周波数を示すnの値を0クリアした状
態で、n=1〜B(B;周波数のグループ数)まで順次
インクリメントしながら、ステップS10において、受
話信号の周波数成分のグループ別平均パワーPe(n)
と、残留誤差信号の周波数成分のグループ別平均パワー
Px(n)を求める。That is, first, in step S17, while the value of n indicating the current frequency to be learned is cleared to 0, n is sequentially incremented from 1 to B (B; the number of frequency groups). In S10, the average power Pe (n) of the frequency components of the received signal for each group
And the average power Px (n) for each group of the frequency components of the residual error signal.
【0046】受話信号と留誤差信号の周波数成分のグル
ープ別平均パワーPe(n)、Px(n)が得られる
と、次のステップS20にて上記フレーム単位でのfl
agのチェックを行う。その結果、flagが「1」よ
り低い値である場合(flag<1)、つまり、fla
g=0またはflag=−1である場合には、その周波
数グループnでの学習はできないので、ステップS21
で、周波数別の学習可否フラグmode(n)を「0」
にする。When the average powers Pe (n) and Px (n) of the frequency components of the received signal and the error signal are obtained for each group, fl is set in the frame unit in the next step S20.
Check ag. As a result, when flag is a value lower than “1” (flag <1), that is,
If g = 0 or flag = -1, learning is not possible in the frequency group n, and therefore, step S21 is performed.
Sets the learning enable / disable flag mode (n) for each frequency to "0".
To
【0047】さらに、ステップS22にてflag=−
1であることを確認すると、適応フィルタ12が異常状
態であるとして、ステップS23でフレームの可変閾値
tおよび周波数グループ別の可変閾値T(n)をそれぞ
れ0クリアすると共に、適応フィルタ12の係数を0ク
リアして、適応フィルタ12の異常状態に対処する(s
ection2)。Further, at step S22, flag =-
When it is confirmed that the adaptive filter 12 is in an abnormal state, it is determined that the adaptive filter 12 is in an abnormal state. Clear to 0 to deal with the abnormal state of the adaptive filter 12 (s
section2).
【0048】一方、上記ステップS20において、上記
フレーム単位でのflagが「1」以上である場合(f
lag≧1)、つまり、flag=1またはflag=
2である場合には、次のステップS24〜S36で周波
数別学習可否の判定処理を行う(section5)。
なお、学習の安全を期すならば、flag=1である場
合のみ、section5の処理を行うようにしても良
い。On the other hand, in step S20, when the flag in the frame unit is "1" or more (f
lag ≧ 1), that is, flag = 1 or flag =
If it is 2, a determination process of whether or not learning is possible for each frequency is performed in the next steps S24 to S36 (section 5).
Note that if safety of learning is ensured, the processing of section 5 may be performed only when flag = 1.
【0049】この場合、例えば256次のFFTの演算
を行うと、256個の値が出現するが、そのうちの最初
の値は直流成分で、これは複素数ではなく、1つで単独
な値となる。そこで、本実施形態では、上述したよう
に、便宜上、直流成分と周期2サンプルの周波数成分と
に分け、ステップS24〜S27で直流成分に対する処
理を行い、ステップS28〜S32で通常の周波数成分
に対する処理、そして、ステップS33〜36で周期2
サンプルの周波数成分に対する学習可否の判定処理を行
っている。なお、FFTの場合には、周期2サンプルの
周波数成分についても複素数ではなく、実数になるた
め、ステップS33〜36に示すような処理が必要とな
る。In this case, for example, when a 256-order FFT operation is performed, 256 values appear, the first of which is a DC component, which is not a complex number but a single value. . Therefore, in the present embodiment, as described above, for convenience, the DC component and the frequency component having a period of two samples are divided, the DC component is processed in steps S24 to S27, and the normal frequency component is processed in steps S28 to S32. , And cycle 2 in steps S33 to S36.
The process of determining whether or not learning is possible for the frequency component of the sample is performed. In the case of FFT, since the frequency components of two samples in the period are not complex numbers but real numbers, the processing shown in steps S33 to S36 is required.
【0050】ここで行われる周波数別学習可否の判定処
理は、基本的には上記フレーム単位での学習可否の判定
処理と同様である。The process of determining whether or not learning is possible for each frequency is basically the same as the process of determining whether or not learning is possible on a frame basis.
【0051】すなわち、受話信号の周波数成分のグルー
プ別平均パワーPe(n)と、残留誤差信号の周波数成
分のグループ別平均パワーPx(n)とに基づいてS/
N比tmpの値を所定の計算式に従って求め(ステップ
S24,S28,S33)、そのS/N比tmpが所定
の閾値より高ければ、学習に適さないものと判断して、
周波数別の学習可否フラグmode(n)を「0」にす
る(ステップS26,S30,S35)。That is, based on the average power Pe (n) of the frequency components of the received signal per group and the average power Px (n) of the frequency components of the residual error signal per group.
The value of the N ratio tmp is obtained according to a predetermined formula (steps S24, S28, S33). If the S / N ratio tmp is higher than a predetermined threshold, it is determined that the learning is not suitable, and
The learning enable / disable flag mode (n) for each frequency is set to "0" (steps S26, S30, S35).
【0052】また、上記S/N比tmpが所定の閾値よ
り低ければ、学習に適するものと判断して、周波数別の
学習可否フラグmode(n)を「1」にする(ステッ
プS27,S36)。その際、ステップS31におい
て、周波数別の学習可否フラグmode(n)を「1」
にしたときに、学習可とされた周波数の数Caをカウン
トしておく。If the S / N ratio tmp is lower than a predetermined threshold value, it is determined that the learning is suitable for learning, and the learning enable / disable flag mode (n) for each frequency is set to "1" (steps S27 and S36). . At this time, in step S31, the learning enable / disable flag mode (n) for each frequency is set to "1".
, The number Ca of frequencies at which learning is permitted is counted.
【0053】このようにして、周波数別に学習可否の判
定を行うと、ステップS37〜S39にて、学習可とさ
れた周波数の数Caに基づいて当該フレームの全周波数
に対する学習可否を決定する(section3)。When the determination as to whether or not learning is possible for each frequency is made in this way, it is determined in steps S37 to S39 whether or not learning is possible for all frequencies of the frame based on the number Ca of frequencies for which learning is possible (section 3). ).
【0054】すなわち、ステップS37にて、学習可と
された周波数の数Caと定数M1とを比較する。その結
果、学習可の周波数の数Caが定数M1よりも多ければ
(Ca>M1)、学習全体としてのスピードを上げるた
めに、ステップS38で当該フレームの全周波数に対す
る学習を行うものと決定し、周波数別学習可否mode
(i)=1とする。That is, in step S37, the number Ca of frequencies for which learning is possible is compared with a constant M1. As a result, if the number Ca of learnable frequencies is larger than the constant M1 (Ca> M1), it is determined in step S38 that learning is performed on all frequencies of the frame in order to increase the speed of the entire learning. Mode of learning by frequency mode
(I) = 1.
【0055】一方、学習可とされた周波数の数Caが定
数M1以下である場合には(Ca≦M1)、さらにステ
ップS39にて、学習可の周波数の数Caと定数M0と
を比較することにより、学習可の周波数の数Caが定数
M0よりも少なければ(Ca<M0)、誤学習の可能性
が高いので、ステップS40で当該フレームの全周波数
に対する学習を行わないものと決定し、周波数別学習可
否フラグmode(i)=0とする。On the other hand, if the number Ca of frequencies that can be learned is less than or equal to the constant M1 (Ca ≦ M1), the number Ca of frequencies that can be learned is compared with the constant M0 in step S39. Therefore, if the number Ca of the learnable frequencies is smaller than the constant M0 (Ca <M0), the possibility of erroneous learning is high, so that it is determined in step S40 that learning is not performed for all the frequencies of the frame. It is assumed that another learning availability flag mode (i) = 0.
【0056】ここで、M1>M0の関係にあり、例えば
周波数が128個ある場合には、M1=100、M0=
10といった値に設定され、学習可の周波数が100個
よりも多ければ、当該フレームの全周波数に対する学習
をONにし、逆に学習可の周波数が10個よりも少なけ
れば、当該フレームの全周波数に対する学習をOFFに
する。また、学習可の周波数が100〜10個の間であ
れば、前回の学習結果のままとする。Here, there is a relationship of M1> M0. For example, when there are 128 frequencies, M1 = 100 and M0 =
If the number of learnable frequencies is set to 10 or more and the number of learnable frequencies is more than 100, the learning for all the frequencies of the frame is turned ON. Turn off learning. If the frequency at which learning is possible is between 100 and 10, the previous learning result is left as it is.
【0057】このように、当該フレームに対して、学習
を行うと決定した周波数の個数が一定値より多い場合は
全ての周波数について学習を行い、学習を行うと決定し
た周波数の個数が一定値より少ない場合は全ての周波数
について学習を行わないものとすることで、各周波数の
相関関係を考慮したフレーム全体としての学習処理を行
うことができる。なお、ここでのステップS37〜S3
9の処理(section3)は、特定の周波数に対す
る学習判定結果がその前後の周波数に対する学習判定結
果と異なるような例外的な場合のために設けられたもの
であり、必ずしも必要ではない。As described above, when the number of frequencies determined to be learned for the frame is larger than a certain value, learning is performed for all the frequencies, and the number of frequencies determined to be learned is smaller than the certain value. If the number is small, the learning is not performed for all the frequencies, so that the learning processing of the entire frame in consideration of the correlation between the frequencies can be performed. Steps S37 to S3 here
The process 9 (section 3) is provided for an exceptional case in which the learning determination result for a specific frequency is different from the learning determination results for the preceding and following frequencies, and is not always necessary.
【0058】最後に、周波数グループ別の閾値T(n)
の更新処理を行う。Finally, the threshold value T (n) for each frequency group
Update processing.
【0059】すなわち、ステップS41で、学習対象と
なる周波数を示すnの値を0クリアし、ステップS42
で、受話信号の周波数成分のグループ別平均パワーPe
(n)と、残留誤差信号の周波数成分のグループ別平均
パワーPx(n)とに基づいて、そのS/N比tmpの
値を次のような計算式に従って求める。That is, in step S41, the value of n indicating the frequency to be learned is cleared to 0, and in step S42
, And the average power Pe of the frequency components of the received signal for each group
Based on (n) and the average power Px (n) of the frequency components of the residual error signal for each group, the value of the S / N ratio tmp is obtained according to the following formula.
【0060】 tmp=log10(Pe(n)/Px(n)) そして、上記のようにして求めた受話信号の周波数成分
のグループ別平均パワーPe(n)と、残留誤差信号の
周波数成分のグループ別平均パワーPx(n)とのS/
N比tmpの値が現在設定されている閾値T(n)より
も低く、かつ、残留誤差信号の周波数成分のグループ別
平均パワーPx(n)の値が定数VBよりも高い場合に
は(tmp<T(n)&Px(n)>VB)、ステップ
S44で所定の計算式に従って当該可変閾値(n)を更
新する。Tmp = log10 (Pe (n) / Px (n)) Then, the average power Pe (n) for each group of the frequency components of the received signal obtained as described above, and the group of the frequency components of the residual error signal S / with other average power Px (n)
If the value of the N ratio tmp is lower than the currently set threshold value T (n) and the value of the group-wise average power Px (n) of the frequency component of the residual error signal is higher than the constant VB, (tmp <T (n) & Px (n)> VB), the variable threshold value (n) is updated in step S44 according to a predetermined calculation formula.
【0061】続いて、ステップS45〜S48におい
て、周波数グループ単位での閾値T(n)の更新処理
(section4)を行う。Subsequently, in steps S45 to S48, an update process (section 4) of the threshold value T (n) is performed for each frequency group.
【0062】まず、ステップS45において、上記受話
信号の周波数成分のグループ別平均パワーPe(n)
と、残留誤差信号の周波数成分のグループ別平均パワー
Px(n)とのS/N比tmpと、当該フレームの学習
用flagの状態をチェックする。その結果、S/N比
tmpが0より低く、かつ、flagが「1」である場
合には(tmp<0&flag=1)、ステップS46
〜S48に示すように、更新時間L経過したときに、所
定の計算式に従って当該可変閾値T(n)を更新する。First, in step S45, the average power Pe (n) for each group of the frequency components of the received signal is described.
Then, the S / N ratio tmp of the average power Px (n) of the frequency component of the residual error signal with respect to each group and the state of the learning flag of the frame are checked. As a result, if the S / N ratio tmp is lower than 0 and the flag is “1” (tmp <0 & flag = 1), step S46
As shown in S48 to S48, when the update time L has elapsed, the variable threshold T (n) is updated according to a predetermined calculation formula.
【0063】以後、ステップS49で、処理対象となる
周波数の数nを更新しながら、上記更新処理を所定のグ
ループ数B分繰り返す。そして、ステップS50にて、
n=Bになったことを確認すると、上記ステップS2に
戻り、上記同様の処理を再び行う。Thereafter, in step S49, the updating process is repeated for a predetermined number B of groups while updating the number n of frequencies to be processed. Then, in step S50,
When it is confirmed that n = B, the process returns to step S2, and the same processing as above is performed again.
【0064】以上の処理を簡単に求めると、ダブルトー
ク検出部17では、まず、受話信号のフレーム全体のパ
ワーpxと残留誤差のフレーム全体のパワーpe、送話
信号のフレーム全体のパワーpyに基づいてフレームk
が学習に適するか否かを判定する(ステップS1〜S1
6)。When the above processing is simply obtained, the double talk detecting unit 17 first determines the power px of the entire frame of the received signal, the power pe of the entire frame of the residual error, and the power py of the entire frame of the transmitted signal. Frame k
Is determined to be suitable for learning (steps S1 to S1).
6).
【0065】次に、フレームの周波数成分を複数にグル
ープ分けし、残留誤差信号の周波数成分のパワーをグル
ープ毎に平均化した値を計算しておき(ステップS17
〜S19)、周波数成分nに対し、グループ平均残留誤
差信号のパワーと受話信号のn成分のパワーから周波数
nの学習の可否を判定する(ステップS20〜S3
6)。Next, the frequency components of the frame are divided into a plurality of groups, and the average value of the power of the frequency components of the residual error signal is calculated for each group (step S17).
To S19), for the frequency component n, it is determined whether the learning of the frequency n is possible or not from the power of the group average residual error signal and the power of the n component of the received signal (steps S20 to S3).
6).
【0066】そして、学習可と判定された周波数の数に
応じて、一定値以上なら全周波数の学習を可とし、一定
値より少ない場合には全周波数の学習を不可とする(ス
テップS37〜S40)。最後に可変閾値の更新を行う
(ステップS41〜S50)。Then, according to the number of frequencies determined to be learnable, learning of all frequencies is allowed if the value is equal to or more than a certain value, and learning of all frequencies is disabled if the value is less than the certain value (steps S37 to S40). ). Finally, the variable threshold is updated (steps S41 to S50).
【0067】このように、各周波数毎に学習の可否を独
立に決定し、決定時の参考値の一部にグループ平均を用
いることで、周波数別の学習機会を増やし誤学習を減ら
すことができ、周波数別ダブルト−ク検出の性能を高め
ることができる。As described above, by independently determining whether or not learning is possible for each frequency and using the group average as a part of the reference value at the time of determination, it is possible to increase learning opportunities for each frequency and reduce erroneous learning. In addition, the performance of frequency-dependent double-talk detection can be improved.
【0068】なお、フレームとしての可否判断部分(s
ection1)はなくても良い。その場合は、フレー
ム学習用のflagの値に関わりなく、それ以降の処理
を行うことになる。It should be noted that a portion (s
The option 1) may be omitted. In that case, subsequent processing is performed irrespective of the value of the flag for frame learning.
【0069】また、flag=−1の場合、つまり、フ
ィルタ異常の場合に可変閾値と適応フィルタ係数の0ク
リアを行うが、この処理(section2)は必ずし
も必要ではない。When flag = −1, that is, when the filter is abnormal, the variable threshold value and the adaptive filter coefficient are cleared to 0, but this processing (section 2) is not always necessary.
【0070】また、学習可である周波数の数によりmo
deを変更する処理(section3)も削除しても
良い。最後の受話信号と残留誤差のパワー比の最小値に
よる可変閾値の更新処理(section4)も必ず必
要なものではない。Further, mo is determined by the number of frequencies that can be learned.
The process of changing de (section 3) may also be deleted. The process of updating the variable threshold based on the minimum value of the power ratio between the last received signal and the residual error (section 4) is not always necessary.
【0071】また、上記section5において、t
mpの計算式を全て、 tmp=log10(Pe(n/BN)/Px(n/B
N)) とすることもできる。この場合、同一グループ内の可否
フラグ(mode(n))は同じ値になる。つまり、フ
レームの周波数成分をいくつかのグループに分けた場合
に、各周波数の適応フィルタ学習の可否をグループ内で
は同一であるとする。グループの数によってはこの方が
誤学習しにくい場合がある。In the above section 5, t
mp = log10 (Pe (n / BN) / Px (n / B
N)). In this case, the availability flag (mode (n)) in the same group has the same value. That is, when the frequency components of the frame are divided into several groups, it is assumed that the adaptive filter learning of each frequency is the same in the group. Depending on the number of groups, this may be less likely to cause erroneous learning.
【0072】以上は文献に従いFFT次数が送話フレー
ム長の2倍である場合を説明したが、この他の長さでも
同様に実施できる。例えばFFT次数256、送話フレ
ーム長80サンプル等でもよい。このときは受話フレー
ムのオーバーラップ長が176とすれば同様である。Although the case where the FFT order is twice the length of the transmission frame has been described in accordance with the literature, the present invention can be similarly applied to other lengths. For example, the FFT degree may be 256 and the transmission frame length may be 80 samples. At this time, the same applies if the overlap length of the reception frame is 176.
【0073】[0073]
【発明の効果】以上のように本発明によれば、周波数領
域型のエコーキャンセラにおいて、受話信号、送話信
号、疑似エコー信号と送話信号との残留誤差信号に基づ
いて適応フィルタの当該フレームに対する学習処理を行
う場合に、その学習の可否を各周波数毎に独立に決定
し、また、決定時の参考値の一部にグループ平均を用い
ることで、周波数別の学習機会を増やし誤学習を減らす
ことができ、周波数別ダブルト−ク検出の性能を高め
て、周波数単位でのエコー打消し量の劣化を防ぐことが
できる。As described above, according to the present invention, in a frequency-domain echo canceller, a frame of an adaptive filter is determined based on a received error signal, a transmission signal, a residual error signal between a pseudo echo signal and a transmission signal. In the case of performing the learning process for, the possibility of the learning is determined independently for each frequency, and the group average is used as a part of the reference value at the time of determination, so that the learning opportunity for each frequency is increased and the erroneous learning is performed. Thus, the performance of double-talk detection for each frequency can be improved, and deterioration of the echo cancellation amount in frequency units can be prevented.
【図1】本発明の一実施形態に係る周波数領域型のエコ
ーキャンセラの構成を示すブロック図。FIG. 1 is a block diagram showing a configuration of a frequency-domain echo canceller according to an embodiment of the present invention.
【図2】上記周波数領域型のエコーキャンセラに用いら
れるダブルトーク検出部のアルゴリズムを示したフロー
チャート(その1)。FIG. 2 is a flowchart (part 1) illustrating an algorithm of a double talk detecting unit used in the frequency-domain echo canceller.
【図3】上記周波数領域型のエコーキャンセラに用いら
れるダブルトーク検出部のアルゴリズムを示したフロー
チャート(その2)。FIG. 3 is a flowchart (part 2) illustrating an algorithm of a double talk detecting unit used in the frequency domain echo canceller.
【図4】上記周波数領域型のエコーキャンセラに用いら
れるダブルトーク検出部のアルゴリズムを示したフロー
チャート(その3)。FIG. 4 is a flowchart (part 3) illustrating an algorithm of a double talk detection unit used in the frequency-domain echo canceller.
【符号の説明】 10…フレーム作成部 11…フーリエ変換部(FFT) 12…適応フィルタ(AF) 13…逆フーリエ変換部(IFFT) 14…フレーム作成部 15…フレーム合成部 16…フーリエ変換部(FFT) 17…ダブルトーク検出部(DTD) x…受話信号 y…送話信号 z…残留誤差信号 px…受話信号のフレーム全体のパワー py…送話信号のフレーム全体のパワー pz…残留誤差信号のフレーム全体のパワー[Description of Signs] 10: Frame creation unit 11: Fourier transform unit (FFT) 12: Adaptive filter (AF) 13: Inverse Fourier transform unit (IFFT) 14: Frame creation unit 15: Frame synthesis unit 16: Fourier transform unit ( FFT) 17: Double talk detector (DTD) x: Received signal y: Transmitted signal z: Residual error signal px: Power of the entire frame of the received signal py: Power of the entire frame of the transmitted signal pz: Residual error signal Power of the whole frame
Claims (5)
し、 各周波数毎に異なる適応フィルタを用いて上記受話信号
から疑似エコー信号を生成し、 この疑似エコー信号を周波数逆変換して送話信号から減
算することで上記送話信号に含まれるエコー成分を除去
する周波数領域型のエコーキャンセラに用いられる適応
フィルタ学習方式であって、 上記受話信号、上記送話信号、上記疑似エコー信号と上
記送話信号との残留誤差信号に基づいて上記適応フィル
タの当該フレームに対する学習処理を行い、その学習の
可否の判定を各周波数毎に独立に行う、 ことを特徴とする適応フィルタ学習方式。1. A reception signal is frequency-converted in frame units, a pseudo echo signal is generated from the reception signal by using a different adaptive filter for each frequency, and the pseudo echo signal is frequency-inverted and converted from a transmission signal. An adaptive filter learning method used in a frequency domain echo canceller for removing an echo component included in the transmission signal by subtraction, wherein the reception signal, the transmission signal, the pseudo echo signal, and the transmission A learning process for the frame of the adaptive filter based on a residual error signal with respect to the signal, and determining whether or not the learning is possible is performed independently for each frequency.
誤差信号のフレーム全体のパワーに基づいて当該フレー
ムが学習に適するか否かを判定した後に、 当該フレームが学習に適する場合には、さらに各周波数
毎に上記受話信号、上記送話信号、上記残留誤差信号の
周波数成分パワーから当該周波数の学習の可否を判定す
る、 ことを特徴とする請求項1記載の適応フィルタ学習方
式。2. After determining whether or not the frame is suitable for learning based on the power of the entire frame of the reception signal, the transmission signal, and the residual error signal, if the frame is suitable for learning, 2. The adaptive filter learning method according to claim 1, further comprising determining whether or not the frequency can be learned from the frequency component power of the received signal, the transmitted signal, and the residual error signal for each frequency.
グループに分け、 上記残留誤差信号の周波数成分のパワーをグループ毎に
平均化した値と、グループ毎に設定された閾値および上
記受信信号の周波数成分のパワーを用いて上記適応フィ
ルタの当該フレームに対する学習の可否を判定する、 ことを特徴とする請求項1記載の適応フィルタ学習方
式。3. The frequency component of the frame is divided into several groups, a value obtained by averaging the power of the frequency component of the residual error signal for each group, a threshold value set for each group, and a frequency of the received signal. The adaptive filter learning method according to claim 1, wherein whether the adaptive filter can learn the frame is determined using the power of the component.
値より多い場合には当該フレームの全ての周波数につい
て学習を行い、 学習可と判定された周波数の個数が一定値より少ない場
合には当該フレームの全ての周波数について学習を行わ
ないようにする、 ことを特徴とする請求項1記載の適応フィルタ学習方
式。4. When the number of frequencies determined to be learnable is larger than a certain value, learning is performed for all frequencies of the frame. When the number of frequencies determined to be learnable is smaller than a certain value, The adaptive filter learning method according to claim 1, wherein learning is not performed for all frequencies of the frame.
グループに分け、 各グループ内での学習の可否の判定結果を同一にする、 ことを特徴とする請求項1記載の適応フィルタ学習方
式。5. The adaptive filter learning method according to claim 1, wherein the frequency components of the frame are divided into several groups, and the determination result as to whether or not learning is possible is the same in each group.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5147099A JP2000252884A (en) | 1999-02-26 | 1999-02-26 | Adaptive filter learning system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5147099A JP2000252884A (en) | 1999-02-26 | 1999-02-26 | Adaptive filter learning system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000252884A true JP2000252884A (en) | 2000-09-14 |
Family
ID=12887845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5147099A Pending JP2000252884A (en) | 1999-02-26 | 1999-02-26 | Adaptive filter learning system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000252884A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005318518A (en) * | 2004-03-31 | 2005-11-10 | Yamaha Corp | Double-talk state judging method, echo cancel method, double-talk state judging apparatus, echo cancel apparatus, and program |
JP2006319925A (en) * | 2005-05-16 | 2006-11-24 | Advanced Telecommunication Research Institute International | Adaptive filter |
JP2010135936A (en) * | 2008-12-02 | 2010-06-17 | Hitachi Ltd | Echo canceler, and echo cancellation method |
WO2019106914A1 (en) * | 2017-11-30 | 2019-06-06 | ソニー株式会社 | Signal processing device, signal processing method, and program |
CN114584256A (en) * | 2020-11-30 | 2022-06-03 | 默升科技集团有限公司 | Equalizer training during link speed negotiation |
-
1999
- 1999-02-26 JP JP5147099A patent/JP2000252884A/en active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005318518A (en) * | 2004-03-31 | 2005-11-10 | Yamaha Corp | Double-talk state judging method, echo cancel method, double-talk state judging apparatus, echo cancel apparatus, and program |
JP4591685B2 (en) * | 2004-03-31 | 2010-12-01 | ヤマハ株式会社 | Double talk state determination method, echo cancellation method, double talk state determination device, echo cancellation device, and program |
JP2006319925A (en) * | 2005-05-16 | 2006-11-24 | Advanced Telecommunication Research Institute International | Adaptive filter |
JP4581114B2 (en) * | 2005-05-16 | 2010-11-17 | 株式会社国際電気通信基礎技術研究所 | Adaptive beamformer |
JP2010135936A (en) * | 2008-12-02 | 2010-06-17 | Hitachi Ltd | Echo canceler, and echo cancellation method |
WO2019106914A1 (en) * | 2017-11-30 | 2019-06-06 | ソニー株式会社 | Signal processing device, signal processing method, and program |
US11270718B2 (en) | 2017-11-30 | 2022-03-08 | Sony Corporation | Signal processing apparatus and signal processing method |
CN114584256A (en) * | 2020-11-30 | 2022-06-03 | 默升科技集团有限公司 | Equalizer training during link speed negotiation |
CN114584256B (en) * | 2020-11-30 | 2024-08-23 | 默升科技集团有限公司 | Equalizer training during link speed negotiation |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6597787B1 (en) | Echo cancellation device for cancelling echos in a transceiver unit | |
KR100716377B1 (en) | Digital adaptive filter and acoustic echo canceller using the same | |
US20040264610A1 (en) | Interference cancelling method and system for multisensor antenna | |
US5912966A (en) | Enhanced echo canceller for digital cellular application | |
GB2448201A (en) | Cancelling non-linear echo during full duplex communication in a hands free communication system. | |
JPH1041859A (en) | Acoustic echo canceller | |
KR20050074503A (en) | A method for enhancing the acoustic echo cancellation system using residual echo filter | |
JP4403776B2 (en) | Echo canceller | |
JP2000252884A (en) | Adaptive filter learning system | |
KR100272131B1 (en) | Adaptive reverbation cancelling apparatus | |
JPH09261135A (en) | Acoustic echo erasion device | |
JP2000252891A (en) | Signal processor | |
JP2004349796A (en) | Sound echo canceling method, apparatus thereof, program and recording medium thereof | |
JP3121983B2 (en) | Acoustic echo canceller | |
JP3217614B2 (en) | Acoustic echo canceller | |
JP3121998B2 (en) | Acoustic echo canceller | |
JP3187715B2 (en) | Echo canceller | |
JP2000165300A (en) | Method and system for identifying unknown system using sub band adaptive filter | |
JP3152822B2 (en) | Acoustic echo canceller | |
JPH08288894A (en) | Echo suppression device | |
JPH0946276A (en) | Public-address information communication system | |
JP3152815B2 (en) | Acoustic echo canceller | |
JP3635644B2 (en) | Echo canceller | |
JP3121997B2 (en) | Acoustic echo canceller | |
KR100414911B1 (en) | Method and apparatus for echo canceller during in wireless communication system |