JP2007251917A - Similarity calculation apparatus and method, and echo erasure apparatus and method - Google Patents

Similarity calculation apparatus and method, and echo erasure apparatus and method Download PDF

Info

Publication number
JP2007251917A
JP2007251917A JP2006305023A JP2006305023A JP2007251917A JP 2007251917 A JP2007251917 A JP 2007251917A JP 2006305023 A JP2006305023 A JP 2006305023A JP 2006305023 A JP2006305023 A JP 2006305023A JP 2007251917 A JP2007251917 A JP 2007251917A
Authority
JP
Japan
Prior art keywords
spectrum
similarity
sum
signal
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006305023A
Other languages
Japanese (ja)
Other versions
JP4520970B2 (en
Inventor
Katsuhiro Fukui
勝宏 福井
Suehiro Shimauchi
末廣 島内
Yoichi Haneda
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006305023A priority Critical patent/JP4520970B2/en
Publication of JP2007251917A publication Critical patent/JP2007251917A/en
Application granted granted Critical
Publication of JP4520970B2 publication Critical patent/JP4520970B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide similarity calculation techniques for highly accurately estimating similarity in a short time, and to provide echo erasure techniques utilizing the similarity calculation method. <P>SOLUTION: In the present invention, first of all, a similarity coefficient of a spectrum analyzed for each predetermined sample number (frame) and predetermined frequency interval (frequency value). Within a predetermined range in a frequency base direction and within a predetermined range in a time base direction, the sum of products of two signal spectrums and the sum of squares of amplitudes of respective signal spectrums (power spectrums) are determined. Then, the similarity coefficient is determined from the sum of the squares of the sum of products of the two signal spectrums and the squares (power spectral) of amplitudes of the respective signal spectrums. In the present invention, an output erasing echo by means of a method of gain calculation or adaptive filtering using the similarity coefficient is then obtained. <P>COPYRIGHT: (C)2007,JPO&amp;INPIT

Description

本発明は、2つの信号スペクトルの類似度を計算する類似度計算装置、類似度計算方法に関するものである。また、この類似度計算装置または類似度計算方法を用いた、音響エコーを消去するエコー消去装置、エコー消去方法に関するものである。   The present invention relates to a similarity calculation device and a similarity calculation method for calculating the similarity between two signal spectra. The present invention also relates to an echo erasing device and an echo erasing method for erasing an acoustic echo using the similarity calculating device or the similarity calculating method.

図1に、従来のエコー消去装置の機能構成例を示す。また、図2にエコー消去装置100の処理フローを示す。再生信号x(k)がスピーカ1からマイクロホン2へ回り込むことによって生じるエコーを消去した出力信号e(k)を生成する。従来の短時間スペクトル振幅(STSA : Short-Time Spectral Amplitude)推定に基づくエコー抑圧処理は、人間の聴覚特性が位相に鈍感である性質、及び音声とエコーの統計的な性質などを利用して、周波数領域でエコーの振幅成分を減算する。ここで、kは、所定間隔の離散時間を指す数(サンプル点の番号)である。サンプリングとは、アナログの音声信号をディジタル信号に変換するために、変数のある区間の値を1つの代表する値に置き換えることである。例えばサンプリング周波数16kHz(1秒間に16000回)で行われる。なお、スピーカ1に与える信号、マイクロホン2で収音された信号はアナログ信号である。以下の説明では、ディジタル信号を扱うので、それぞれDA変換器、AD変換器によって変換を行う必要があるが、それは当然のことであり、図示していない。
エコー消去装置100は、再生信号用の周波数分析部101、収音信号用の周波数分析部102、類似度係数計算部103、ゲイン計算部104、積算部6、および周波数合成部105から構成される。
FIG. 1 shows a functional configuration example of a conventional echo canceling apparatus. FIG. 2 shows a processing flow of the echo canceling apparatus 100. An output signal e (k) in which an echo generated when the reproduction signal x (k) goes from the speaker 1 to the microphone 2 is eliminated is generated. The conventional echo suppression processing based on short-time spectral amplitude (STSA) estimation uses the characteristics that human auditory characteristics are insensitive to the phase and the statistical characteristics of speech and echo. The amplitude component of the echo is subtracted in the frequency domain. Here, k is a number (sample point number) indicating discrete time at a predetermined interval. Sampling is replacing a value in a certain section of a variable with one representative value in order to convert an analog audio signal into a digital signal. For example, the sampling frequency is 16 kHz (16000 times per second). The signal given to the speaker 1 and the signal collected by the microphone 2 are analog signals. In the following description, since a digital signal is handled, it is necessary to perform conversion by a DA converter and an AD converter, respectively, but this is naturally not shown.
The echo canceller 100 includes a reproduction signal frequency analysis unit 101, a collected sound signal frequency analysis unit 102, a similarity coefficient calculation unit 103, a gain calculation unit 104, an integration unit 6, and a frequency synthesis unit 105. .

周波数分析部101は、再生信号x(k)を入力とし、再生信号スペクトルXω,lを出力する(ステップS101)。ここで、周波数値ωは所定の周波数間隔で求めたスペクトルの周波数値の番号、フレーム番号lは周波数分析を行ったフレームの番号である。例えば、16kHzでサンプリングした256点の再生信号x(k−255),…,x(k)を1フレームとし、半フレーム(ここでは128点)ずらしながら周波数分析し、再生信号x(k)をフレーム単位で、8kHzまでの周波数帯域をサンプル点数128で表した再生信号スペクトルXω,l(ω=1,…,128)へ変換する。 The frequency analysis unit 101 receives the reproduction signal x (k) as an input and outputs a reproduction signal spectrum Xω, l (step S101). Here, the frequency value ω is the number of the frequency value of the spectrum obtained at a predetermined frequency interval, and the frame number l is the number of the frame subjected to frequency analysis. For example, 256 reproduction signals x (k-255),..., X (k) sampled at 16 kHz are set as one frame, and frequency analysis is performed while shifting half frames (here, 128 points), and the reproduction signal x (k) is obtained. In a frame unit, the frequency band up to 8 kHz is converted into a reproduction signal spectrum X ω, l (ω = 1,..., 128) represented by 128 sample points.

周波数分析部102は、収音信号y(k)を入力とし、収音信号スペクトルYω,lを出力する(ステップS102)。類似度計算部103は、再生信号スペクトルXω,lと収音信号スペクトルYω,lを入力とし、類似度係数rω,lを出力する(ステップS103)。類似度係数の推定はコヒーレンス関数を用いる方法がこれまでに提案されている(非特許文献1)。再生信号スペクトルXω,lと収音信号スペクトルYω,lの類似度係数rω,lは、

Figure 2007251917
と定義される。類似度係数rω,lは、0〜1の間の実数値をとる。ここで、E[]は時間領域での変数の期待値(平均値)を表す。例えば、E[X ω,l・Yω,l]、E[|Xω,l]、E[|Yω,l]はそれぞれ、
Figure 2007251917
により算出することができる。ここで、X ω,lはXω,lの共役複素数、l−1は1フレーム過去の値、αは時定数の重み係数(例えば0.3)を表す。
ゲイン計算部104は、類似度係数rω,lと収音信号スペクトルYω,lを入力とし、ゲイン係数Gω,lを出力する(ステップS104)。ゲイン係数Gω,lは0〜1の実数値をとる。類似度が高いとき(類似度係数rω,lが1に近いとき)には小さい値、類似度が低いとき(類似度係数rω,lが0に近いとき)には大きい値をとる。積算部6は、収音信号スペクトルYω,lにゲイン係数Gω,lを積算し、エコー消去信号スペクトルEω,lを得る(ステップS6)。周波数合成部105は、各周波数成分ωに対応するエコー消去信号スペクトルEω,lから、時間領域の信号e(k)を再合成して出力する(ステップS105)。
C. Beaugeant, V. Turbin, P. Scalart, A.Gilloire, “New optimal fi1tering approaches forhands-free telecommunication terminals,” SignalProcessing, vo1.64, no.1, pp.33-47, Jan. 1998. The frequency analysis unit 102 receives the collected sound signal y (k) as an input, and outputs a collected sound signal spectrum Y ω, l (step S102). The similarity calculation unit 103 receives the reproduction signal spectrum X ω, l and the collected sound signal spectrum Y ω, l and outputs a similarity coefficient r ω, l (step S103). A method using a coherence function has been proposed so far for estimating the similarity coefficient (Non-Patent Document 1). Reproduced signal spectrum X omega, l sound collection signal spectrum Y omega, similarity coefficients l r omega, l is
Figure 2007251917
Is defined. The similarity coefficient rω, l takes a real value between 0 and 1 . Here, E t [] represents the expected value (average value) of the variable in the time domain. For example, E t [X * ω, l · Y ω, l], E t [| X ω, l | 2], E t [| Y ω, l | 2] , respectively,
Figure 2007251917
Can be calculated. Here, X * ω, l is X omega, complex conjugate of l, l-1 represents a 1-frame past values, alpha weighting factor is a time constant (e.g., 0.3).
The gain calculation unit 104 receives the similarity coefficient r ω, l and the collected sound signal spectrum Y ω, l and outputs the gain coefficient G ω, l (step S104). The gain coefficient Gω , l takes a real value from 0 to 1 . When the similarity is high (when the similarity coefficient rω, l is close to 1), the value is small, and when the similarity is low (when the similarity coefficient rω, l is close to 0), the value is large. Integration unit 6, the sound collection signal spectrum Y omega, l in the gain coefficient G omega, integrates the l, echo-canceled signal spectrum E omega, obtain l (step S6). The frequency synthesizer 105 re-synthesizes and outputs the time-domain signal e (k) from the echo cancellation signal spectrum E ω, l corresponding to each frequency component ω (step S105).
C. Beaugeant, V. Turbin, P. Scalart, A. Gilloire, “New optimal fi1tering approaches forhands-free telecommunication terminals,” SignalProcessing, vo1.64, no.1, pp.33-47, Jan. 1998.

従来のコヒーレンスに基づく類似度計算方法は、時間ベクトルの特徴量しか利用していなかった。これは、エコー経路を不変と仮定して、時間ベクトルの長時間の特徴量から類似度を算出するものである。そのため、エコー経路が変動した場合、類似度を精度良く推定できるまで一定の時間がかかっていた。実用上は、頻繁にエコー経路が変動することもあるため、類似度を精度よく計算することができないことがあった。また、類似度の誤推定がミュージカルノイズ発生の原因の一つになっていた。本発明の課題は、短時間で類似度を高精度に推定する類似度計算技術を提供すること、およびミュージカルノイズ発生を抑圧するエコー抑圧技術を提供することである。   The conventional similarity calculation method based on coherence uses only the feature quantity of the time vector. In this method, assuming that the echo path is unchanged, the similarity is calculated from the long-time feature quantity of the time vector. Therefore, when the echo path fluctuates, it takes a certain time until the similarity can be accurately estimated. In practical use, the echo path sometimes fluctuates frequently, so that the degree of similarity cannot be calculated accurately. In addition, erroneous estimation of similarity was one of the causes of musical noise. An object of the present invention is to provide a similarity calculation technique that estimates a similarity with high accuracy in a short time, and to provide an echo suppression technique that suppresses the occurrence of musical noise.

まず、所定のサンプル数(フレーム)、所定の周波数間隔(周波数値)ごとに分析されたスペクトルの類似度係数を求める手段を示す。本発明では、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの積の和と、各信号スペクトルの振幅の二乗の和を求める。そして、上記2つの信号スペクトルの積の和の二乗と各信号スペクトルの振幅の二乗(パワースペクトル)の和から類似度係数を求める。
そして、本発明では、前記の類似度係数を用いて、ゲイン計算や適応フィルタなどの方法によりエコーを消去した出力を得る。
First, a means for obtaining a similarity coefficient of a spectrum analyzed every predetermined number of samples (frame) and every predetermined frequency interval (frequency value) will be described. In the present invention, the sum of the product of two signal spectra and the sum of the square of the amplitude of each signal spectrum are determined within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. Then, a similarity coefficient is obtained from the sum of the square of the sum of the products of the two signal spectra and the sum of the square of the amplitude of each signal spectrum (power spectrum).
In the present invention, using the similarity coefficient, an output in which echo is eliminated by a method such as gain calculation or an adaptive filter is obtained.

本発明では、周波数ベクトルの特徴量も考慮することで、時間ベクトルを短時間にした場合にも類似度計算に利用できる特徴量を補うことができる。したがって、時間ベクトルを短時間にしても類似度計算の精度の低下を防ぐことができる。また、エコー消去技術に適用した場合には、エコー経路が頻繁に変化する場合でも、短時間で追従できる。   In the present invention, by considering the feature quantity of the frequency vector, the feature quantity that can be used for similarity calculation can be supplemented even when the time vector is shortened. Therefore, even if the time vector is shortened, it is possible to prevent a decrease in the accuracy of similarity calculation. Further, when applied to the echo cancellation technique, even if the echo path changes frequently, it can be tracked in a short time.

[第1実施形態]
図3に、第1実施形態のエコー消去装置の機能構成例を示す。また、図4にエコー消去装置200の処理フロー例を示す。エコー消去装置200は、再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203、ゲイン計算部104、積算部6、および周波数合成部105から構成される。類似度計算部103が二次元類似度計算部203に置き換わった以外は、従来技術と同じ構成である。以下に、図1と異なる二次元類似度計算部203について説明する。
[First Embodiment]
FIG. 3 shows a functional configuration example of the echo cancellation apparatus of the first embodiment. FIG. 4 shows an example of the processing flow of the echo canceller 200. The echo cancellation apparatus 200 includes a reproduction signal frequency analysis unit 101, a collected sound signal frequency analysis unit 102, a two-dimensional similarity calculation unit 203, a gain calculation unit 104, an integration unit 6, and a frequency synthesis unit 105. The The configuration is the same as that of the prior art except that the similarity calculation unit 103 is replaced with a two-dimensional similarity calculation unit 203. Below, the two-dimensional similarity calculation part 203 different from FIG. 1 is demonstrated.

二次元類似度計算部203は、クロススペクトルの期待値を計算する第1の計算手段2031、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第2の計算手段2032、収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第3の計算手段2033を備えている。二次元類似度計算部203は、再生信号スペクトルXω,lと収音信号スペクトルYω,lを入力とする。そして、第1の計算手段2031、第2の計算手段2032、第3の計算手段2033が、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[X ω,l・Yω,l]、Et,f[|Xω,l]、Et,f[|Yω,l]を、 The two-dimensional similarity calculation unit 203 includes a first calculation unit 2031 that calculates the expected value of the cross spectrum, a second calculation unit 2032 that calculates the sum of the squares of the amplitudes of the reproduction signal spectrum (power spectrum), and the collected sound signal. Third calculation means 2033 is provided for calculating the sum of the square of the spectrum amplitude (power spectrum). The two-dimensional similarity calculation unit 203 receives the reproduction signal spectrum X ω, l and the sound collection signal spectrum Y ω, l as inputs. Then, the first calculation unit 2031, the second calculation unit 2032, and the third calculation unit 2033 perform the expected value (average value) E t, f [X * ω, l · Y of the two-dimensional vector of time and frequency. ω, l ], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ],

Figure 2007251917
により算出する(ステップS2031、S2032、S2033)。ここで、m、n、M、Nはそれぞれ自然数、ω+mはωからmサンプルシフトした値、l+nはlからnフレームシフトした値である。例えば、Mを5、Nを10とする。このように、時間軸方向だけでなく、周波数方向にも加算することで、サンプル数を増やすことができる。したがって、時間軸方向のサンプル数を少なく(言い換えると、短時間に)することができる。なお、上記のEt,f[X ω,l・Yω,l]、Et,f[|Xω,l]、Et,f[|Yω,l]は、単なる和を求めており、期待値(平均値)を求める式とはなっていない。しかし、後述の類似度係数r’ω,lを求める式で、Et,f[X ω,l・Yω,l]の二乗が分子、Et,f[|Xω,l]とEt,f[|Yω,l]の積が分母となるため、単なる和を求めても、類似度係数r’ω,lの値は同じである。
Figure 2007251917
(Steps S2031, S2032, and S2033). Here, m, n, M, and N are natural numbers, ω + m is a value obtained by shifting m samples from ω, and l + n is a value obtained by shifting n frames from l. For example, M is 5 and N is 10. Thus, the number of samples can be increased by adding not only in the time axis direction but also in the frequency direction. Therefore, the number of samples in the time axis direction can be reduced (in other words, in a short time). The above E t, f [X * ω, l · Y ω, l ], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ] are It is simply a sum, not an equation for the expected value (average value). However, in a formula for calculating a similarity coefficient r ′ ω, l described later, the square of E t, f [X * ω, l · Y ω, l ] is a numerator, and E t, f [| X ω, l | 2 ] And E t, f [| Y ω, l | 2 ] is the denominator, and the value of the similarity coefficient r ′ ω, l is the same even if a simple sum is obtained.

また、本実施形態では、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段と収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段とを別々とした。しかし、入力となるスペクトルを選択できるようにし、同一の計算手段で、再生信号スペクトルの振幅の二乗(パワースペクトル)の和も収音信号スペクトルの振幅の二乗(パワースペクトル)の和も計算しても良い。
次に、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[X ω,l・Yω,l]、Et,f[|Xω,l]、Et,f[|Yω,l]を用いて、再生信号スペクトルXω,lと収音信号スペクトルYω,lとの類似度係数r’ω,l
In the present embodiment, the calculation means for calculating the sum of the square of the amplitude of the reproduction signal spectrum (power spectrum) and the calculation means for calculating the sum of the square of the amplitude of the collected sound signal spectrum (power spectrum) are separated. . However, the input spectrum can be selected and the sum of the square of the amplitude of the reproduced signal spectrum (power spectrum) and the sum of the square of the amplitude of the collected signal spectrum (power spectrum) can be calculated by the same calculation means. Also good.
Next, the expected value (average value) of the two-dimensional vector of time and frequency E t, f [X * ω, l · Yω, l ], E t, f [| X ω, l | 2 ], E t , F [| Y ω, l | 2 ], the similarity coefficient r ′ ω, l between the reproduction signal spectrum X ω, l and the collected sound signal spectrum Y ω, l is obtained.

Figure 2007251917
により求める(ステップS2035)。類似度係数r’ω,lは0〜1の間の実数値をとる。
このような方法により類似度係数を求めるので、時間ベクトルを短時間にした場合にも類似度計算に利用できる特徴量を補うことができる。したがって、時間ベクトルを短時間にしても類似度計算の精度の低下を防ぐことができる。また、エコー消去技術に適用した場合には、エコー経路が頻繁に変化する場合でも、短時間で追従できる。
Figure 2007251917
(Step S2035). The similarity coefficient r′ω , l takes a real value between 0 and 1 .
Since the similarity coefficient is obtained by such a method, it is possible to supplement the feature quantity that can be used for the similarity calculation even when the time vector is shortened. Therefore, even if the time vector is shortened, it is possible to prevent a decrease in the accuracy of similarity calculation. Further, when applied to the echo cancellation technique, even if the echo path changes frequently, it can be tracked in a short time.

[第2実施形態]
第2実施形態のエコー消去装置200’も、図3の機能構成例と図4の処理フロー例で説明する。第1実施形態と異なる点は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[X ω,l・Yω,l]、Et,f[|Xω,l]、Et,f[|Yω,l]の計算で、点(ω,l)で極大値を持つ重み付け二次元窓関数Wm,nを用いることである。
[Second Embodiment]
The echo canceling apparatus 200 ′ of the second embodiment will also be described with reference to the functional configuration example of FIG. 3 and the processing flow example of FIG. The difference from the first embodiment is that an expected value (average value) of a two-dimensional vector of time and frequency E t, f [X * ω, l · Y ω, l ], E t, f [| X ω, l In the calculation of | 2 ], E t, f [| Y ω, l | 2 ], the weighted two-dimensional window function W m, n having the maximum value at the point (ω, l) is used.

そこで、エコー消去装置200’の二次元類似度計算部203’は、重み係数計算手段2034を有する。重み係数計算手段2034は、例えば、   Therefore, the two-dimensional similarity calculation unit 203 ′ of the echo canceller 200 ′ has a weight coefficient calculation unit 2034. The weight coefficient calculation means 2034 is, for example,

Figure 2007251917
により重み付け二次元窓関数を求める(ステップS2034)。ただし、Iは減衰率を決定する値(例えば0.5)である。
次に、第1の計算手段2031’、第2の計算手段2032’、第3の計算手段2033’が、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[X ω,l・Yω,l]、Et,f[|Xω,l]、Et,f[|Yω,l]を、
Figure 2007251917
により算出する(ステップS2031’、S2032’、S2033’)。
その他の処理は、第1実施形態と同じである。
[第3実施形態]
図5に、第3実施形態のエコー消去装置の機能構成例を示す。また、図6にエコー消去装置200bの処理フロー例を示す。エコー消去装置200bは、再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203b、ゲイン計算部104、積算部6、および周波数合成部105から構成される。類似度計算部103が二次元類似度計算部203bに置き換わった以外は、従来技術と同じ構成である。以下に、図1と異なる二次元類似度計算部203bについて説明する。
なお、第3実施形態のエコー消去装置は、再生信号と収音信号のクロススペクトルを式(1)の代わりに式(2)で計算する点で、第1実施形態のエコー消去装置と異なる。
Figure 2007251917
To obtain a weighted two-dimensional window function (step S2034). However, I is a value (for example, 0.5) which determines an attenuation factor.
Next, the first calculation unit 2031 ′, the second calculation unit 2032 ′, and the third calculation unit 2033 ′ use the expected value (average value) E t, f [X * ω] of the two-dimensional vector of time and frequency. , L · Y ω, l ], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ],
Figure 2007251917
(Steps S2031 ′, S2032 ′, S2033 ′).
Other processes are the same as those in the first embodiment.
[Third Embodiment]
FIG. 5 shows an example of the functional configuration of the echo cancellation apparatus of the third embodiment. FIG. 6 shows a processing flow example of the echo canceller 200b. The echo canceller 200b includes a reproduction signal frequency analysis unit 101, a collected sound signal frequency analysis unit 102, a two-dimensional similarity calculation unit 203b, a gain calculation unit 104, an integration unit 6, and a frequency synthesis unit 105. The The configuration is the same as that of the prior art except that the similarity calculation unit 103 is replaced with a two-dimensional similarity calculation unit 203b. Below, the two-dimensional similarity calculation part 203b different from FIG. 1 is demonstrated.
Note that the echo canceller of the third embodiment is different from the echo canceller of the first embodiment in that the cross spectrum of the reproduction signal and the collected sound signal is calculated by Formula (2) instead of Formula (1).

二次元類似度計算部203bは、再生信号と収音信号の振幅スペクトルの積の和を計算するクロス振幅スペクトル計算手段2031b、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第1パワースペクトル計算手段2032、収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第2パワースペクトル計算手段2033、類似度計算手段2035を備えている。二次元類似度計算部203bは、再生信号スペクトルXω,lと収音信号スペクトルYω,lを入力とする。
クロス振幅スペクトル計算手段2031bは、再生信号スペクトルXω,lの振幅と収音信号スペクトルYω,lの振幅の積の期待値(平均値)Et,f[|Xω,l|・|Yω,l|]を

Figure 2007251917
により算出する(ステップS2031b)。
第1パワースペクトル計算手段2032は、再生信号スペクトルXω,lの振幅の二乗の期待値(平均値)Et,f[|Xω,l]を
Figure 2007251917
により算出する(ステップS2032)。
第2パワースペクトル計算手段2033は、収音信号スペクトルYω,lの振幅の二乗の期待値(平均値)Et,f[|Yω,l]を、
Figure 2007251917
により算出する(ステップS2033)。 The two-dimensional similarity calculation unit 203b is a cross amplitude spectrum calculation unit 2031b that calculates the sum of the products of the amplitude spectrum of the reproduction signal and the collected sound signal, and a first that calculates the sum of the square of the amplitude of the reproduction signal spectrum (power spectrum) A power spectrum calculation unit 2032, a second power spectrum calculation unit 2033 that calculates the sum of the square of the amplitude of the collected sound signal spectrum (power spectrum), and a similarity calculation unit 2035 are provided. The two-dimensional similarity calculation unit 203b receives the reproduction signal spectrum Xω, l and the collected sound signal spectrum Yω, l as inputs.
The cross amplitude spectrum calculating means 2031b is an expected value (average value) E t, f [| X ω, l | · | of the product of the amplitude of the reproduction signal spectrum X ω, l and the amplitude of the collected sound signal spectrum Y ω, l. Y ω, l |]
Figure 2007251917
(Step S2031b).
The first power spectrum calculation means 2032 calculates the expected value (average value) E t, f [| X ω, l | 2 ] of the square of the amplitude of the reproduction signal spectrum X ω, l .
Figure 2007251917
(Step S2032).
The second power spectrum calculation means 2033 calculates the expected value (average value) E t, f [| Y ω, l | 2 ] of the square of the amplitude of the collected sound signal spectrum Y ω, l ,
Figure 2007251917
(Step S2033).

ここで、m、n、M、Nはそれぞれ自然数、ω+mはωからmサンプルシフトした値、l+nはlからnフレームシフトした値である。例えば、Mを5、Nを10とする。このように、時間軸方向だけでなく、周波数方向にも加算することで、サンプル数を増やすことができる。したがって、時間軸方向のサンプル数を少なく(言い換えると、短時間に)することができる。
なお、上記のEt,f[|Xω,l|・|Yω,l|]、Et,f[|Xω,l]、Et,f[|Yω,l]は、単なる和を求めており、期待値(平均値)を求める式とはなっていない。しかし、後述の類似度係数r’ω,lを求める式で、Et,f[Xω,l・Yω,l]の二乗が分子、Et,f[|Xω,l]とEt,f[|Yω,l]の積が分母となるため、単なる和を求めても、類似度係数r’ω,lの値は同じである。
Here, m, n, M, and N are natural numbers, ω + m is a value obtained by shifting m samples from ω, and l + n is a value obtained by shifting n frames from l. For example, M is 5 and N is 10. Thus, the number of samples can be increased by adding not only in the time axis direction but also in the frequency direction. Therefore, the number of samples in the time axis direction can be reduced (in other words, in a short time).
E t, f [| X ω, l | · | Y ω, l |], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ] Merely calculates the sum and is not an equation for calculating the expected value (average value). However, in a formula for calculating a similarity coefficient r ′ ω, l described later, the square of E t, f [X ω, l · Y ω, l ] is a numerator, and E t, f [| X ω, l | 2 ]. And E t, f [| Y ω, l | 2 ] is the denominator. Therefore, even if a simple sum is obtained , the value of the similarity coefficient r ′ ω, l is the same.

また、本実施形態では、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段と収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段とを別々とした。しかし、入力となるスペクトルを選択できるようにし、同一の計算手段で、再生信号スペクトルの振幅の二乗(パワースペクトル)の和も収音信号スペクトルの振幅の二乗(パワースペクトル)の和も計算しても良い。
次に、類似度計算手段2035は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[|Xω,l|・|Yω,l|]、Et,f[|Xω,l]、Et,f[|Yω,l]を用いて、再生信号スペクトルXω,lと収音信号スペクトルYω,lとの類似度係数r’ω,l

Figure 2007251917
により求める(ステップS2035)。類似度係数r’ω,lは0〜1の間の実数値をとる。 In the present embodiment, the calculation means for calculating the sum of the square of the amplitude of the reproduction signal spectrum (power spectrum) and the calculation means for calculating the sum of the square of the amplitude of the collected sound signal spectrum (power spectrum) are separated. . However, the input spectrum can be selected and the sum of the square of the amplitude of the reproduced signal spectrum (power spectrum) and the sum of the square of the amplitude of the collected signal spectrum (power spectrum) can be calculated by the same calculation means. Also good.
Next, the similarity calculation means 2035 calculates the expected value (average value) E t, f [| X ω, l | · | Y ω, l |], E t, f [| Using X ω, l | 2 ] and E t, f [| Y ω, l | 2 ], the similarity coefficient r ′ ω between the reproduction signal spectrum X ω, l and the collected sound signal spectrum Y ω, l l
Figure 2007251917
(Step S2035). The similarity coefficient r′ω , l takes a real value between 0 and 1 .

このように、振幅スペクトルのみから類似度を計算することで、位相のずれによる相関誤差を回避でき、類似度を高精度に計算できる。また、このような方法により類似度係数を求めるので、時間ベクトルを短時間にした場合にも類似度計算に利用できる特徴量を補うことができる。したがって、時間ベクトルを短時間にしても類似度計算の精度の低下を防ぐことができる。さらに、エコー消去技術に適用した場合には、エコー経路が頻繁に変化する場合でも、短時間で追従できる。   Thus, by calculating the similarity only from the amplitude spectrum, a correlation error due to a phase shift can be avoided, and the similarity can be calculated with high accuracy. In addition, since the similarity coefficient is obtained by such a method, it is possible to supplement the feature amount that can be used for similarity calculation even when the time vector is shortened. Therefore, even if the time vector is shortened, it is possible to prevent a decrease in the accuracy of similarity calculation. Furthermore, when applied to the echo cancellation technique, even if the echo path changes frequently, it can follow in a short time.

以下、図7を用いて、上記の類似度計算部の機能構成の例を説明する。
周波数分析部101から出力された再生信号スペクトルXω,lは、重複分割部2037において、X1−M,l〜X1+M,l、X2−M,l〜X2+M,l、…、Xω−M,l〜Xω+M,l、…、Xωa−M,l〜Xωa+M,lのように周波数分割される。また、周波数分析部102から出力された収音信号スペクトルYω,lは、重複分割部2039において、Y1−M,l〜Y1+M,l、Y2,l〜Y2+M,l、…、Yω−M,l〜Yω+M,l、…、Yωa−M,l〜Yωa+M,lのように周波数分割される。ここで、ωaは、周波数値番号の最大値である。例えば、各フレームにおいて、8kHzまでの周波数帯域をサンプル点数128でスペクトルを表した場合(ω=1,…,128)には、ωa=128となる。
なお、ω<0又はωa<ωのとき、Xω,l、Yω,lは各フレームの範囲外となるため、重複分割部2037と重複分割部2039は、Xω,l=Yω,l=0を出力する。
そして、X1−M,l〜X1+M,lとY1−M,l〜Y1+M,lから、Et,f[|X1,l|・|Y1,l|]、Et,f[|X1,l]、Et,f[|Y1,l]を求め、これより、類似度係数r’1,lを算出する。これを、すべてのωについて、すなわち、すべてのXω−M,l〜Xω+M,lとYω−M,l〜Yω+M,lの組について、スペクトルをひとつずつずらしながら行うことにより、類似度係数r’ω,lを算出する。
Hereinafter, an example of a functional configuration of the similarity calculation unit will be described with reference to FIG.
The reproduction signal spectrum X ω, l output from the frequency analysis unit 101 is converted into X 1 -M, 1 to X 1 + M, 1 , X 2 -M, 1 to X 2 + M, 1 ,. ω-M, l ~X ω + M, l, ..., X ωa-M, l ~X ωa + M, is frequency divided as l. In addition, the collected sound signal spectrum Y ω, l output from the frequency analysis unit 102 is converted into Y 1-M, 1 to Y 1 + M, l , Y 2, l to Y 2 + M, l ,. Y ω-M, l to Y ω + M, l ,..., Y ωa-M, l to Y ωa + M, l . Here, ωa is the maximum value of the frequency value number. For example, in each frame, when the spectrum is represented by 128 sample points in the frequency band up to 8 kHz (ω = 1,..., 128), ωa = 128.
Note that when ω <0 or ωa <ω, X ω, l , Y ω, l is outside the range of each frame, so the overlap division unit 2037 and the overlap division unit 2039 have X ω, l = Y ω, l = 0 is output.
Then, from X 1-M, l to X 1 + M, l and Y 1- M, l to Y 1 + M, l , E t, f [| X 1, l | · | Y 1, l |], E t, f [| X1 , l | 2 ] and Et, f [| Y1 , l | 2 ] are obtained, and the similarity coefficient r'1 , l is calculated therefrom. This is done by shifting the spectrum one by one for all ω, that is, for all X ω-M, 1 to X ω + M, l and Y ω-M, 1 to Y ω + M, l. The degree coefficient r ′ ω, l is calculated.

[第4実施形態]
第4実施形態のエコー消去装置200b’も、図5の機能構成例と図6の処理フロー例で説明する。第3実施形態と異なる点は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[Xω,l・Yω,l]、Et,f[|Xω,l]、Et,f[|Yω,l]の計算で、点(ω,l)で極大値を持つ重み付け二次元窓関数Wm,nを用いることである。
そこで、エコー消去装置200b’の二次元類似度計算部203b’は、重み係数計算手段2034を有する。重み係数計算手段2034は、例えば、

Figure 2007251917
により重み付け二次元窓関数を求める(ステップS2034)。ただし、Iは減衰率を決定する値(例えば0.5)である。 [Fourth Embodiment]
The echo canceling apparatus 200b ′ of the fourth embodiment will also be described with reference to the functional configuration example of FIG. 5 and the processing flow example of FIG. The difference from the third embodiment is that an expected value (average value) E t, f [X ω, l · Y ω, l ], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ] is to use a weighted two-dimensional window function W m, n having a maximum value at the point (ω, l).
Therefore, the two-dimensional similarity calculation unit 203b ′ of the echo canceller 200b ′ has a weight coefficient calculation unit 2034. The weight coefficient calculation means 2034 is, for example,
Figure 2007251917
To obtain a weighted two-dimensional window function (step S2034). However, I is a value (for example, 0.5) which determines an attenuation factor.

次に、第1の計算手段2031b’、第2の計算手段2032’、第3の計算手段2033’が、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[Xω+m,l+n・Yω+m,l+n]、Et,f[|Xω,l]、Et,f[|Yω,l]を、

Figure 2007251917
により算出する(ステップS2031b’、S2032’、S2033’)。
その他の処理は、第3実施形態と同じである。 Next, the first calculation unit 2031b ′, the second calculation unit 2032 ′, and the third calculation unit 2033 ′ perform the expected value (average value) E t, f [X ω + m, l + n · Y ω + m, l + n ], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ],
Figure 2007251917
(Steps S2031b ′, S2032 ′, S2033 ′).
Other processes are the same as those in the third embodiment.

[第5実施形態]
図8に、第5実施形態のエコー消去装置の機能構成例を示す。また、図9にエコー消去装置200cの処理フロー例を示す。エコー消去装置200cは、再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203c、ゲイン計算部104、積算部6、および周波数合成部105から構成される。類似度計算部103が二次元類似度計算部203cに置き換わった以外は、従来技術と同じ構成である。以下に、図1と異なる二次元類似度計算部203cについて説明する。
なお、第5実施形態のエコー消去装置は、再生信号と収音信号のクロススペクトルを式(1)の代わりに式(3)で計算する点で、第1実施形態のエコー消去装置と異なる。
[Fifth Embodiment]
FIG. 8 shows a functional configuration example of the echo cancellation apparatus of the fifth embodiment. FIG. 9 shows a processing flow example of the echo canceller 200c. The echo canceller 200c includes a reproduction signal frequency analysis unit 101, a collected sound signal frequency analysis unit 102, a two-dimensional similarity calculation unit 203c, a gain calculation unit 104, an integration unit 6, and a frequency synthesis unit 105. The The configuration is the same as that of the prior art except that the similarity calculation unit 103 is replaced with a two-dimensional similarity calculation unit 203c. Below, the two-dimensional similarity calculation part 203c different from FIG. 1 is demonstrated.
Note that the echo canceller of the fifth embodiment is different from the echo canceller of the first embodiment in that the cross spectrum of the reproduction signal and the collected sound signal is calculated by Equation (3) instead of Equation (1).

二次元類似度計算部203cは、再生信号と収音信号のクロススペクトルの和を計算するクロススペクトル計算手段2031c、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第1パワースペクトル計算手段2032、収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第2パワースペクトル計算手段2033、類似度計算手段2035を備えている。二次元類似度計算部203cは、再生信号スペクトルXω,lと収音信号スペクトルYω,lを入力とする。
クロススペクトル計算手段2031cは、再生信号スペクトルXω,lと収音信号スペクトルYω,lのクロススペクトルの期待値(平均値)Et,f[|Xω,l|・|Yω,l|]を

Figure 2007251917
により算出する(ステップS2031c)。すなわち、クロススペクトル計算手段2031cは、2つの信号のクロススペクトルの時間軸方向の所定の範囲における和の絶対値を求め、その絶対値について周波数軸方向の所定の範囲における和を求める。
第1パワースペクトル計算手段2032は、再生信号スペクトルXω,lの振幅の二乗の期待値(平均値)Et,f[|Xω,l]を
Figure 2007251917
により算出する(ステップS2032)。
第2パワースペクトル計算手段2033は、収音信号スペクトルYω,lの振幅の二乗の期待値(平均値)Et,f[|Yω,l]を、
Figure 2007251917
により算出する(ステップS2033)。 The two-dimensional similarity calculation unit 203c is a cross spectrum calculation unit 2031c that calculates the sum of the cross spectrums of the reproduction signal and the collected sound signal, and a first power spectrum calculation that calculates the sum of the squares (power spectra) of the amplitudes of the reproduction signal spectra. Means 2032, second power spectrum calculation means 2033 for calculating the sum of the squares of the amplitude (power spectrum) of the collected sound signal spectrum, and similarity calculation means 2035 are provided. The two-dimensional similarity calculation unit 203c receives the reproduction signal spectrum Xω, l and the sound collection signal spectrum Yω, l as inputs.
Cross spectrum calculation unit 2031c is reproduced signal spectrum X omega, l sound collection signal spectrum Y omega, the expected value of the cross-spectrum of the l (mean value) E t, f [| X ω, l | · | Y ω, l |]
Figure 2007251917
(Step S2031c). That is, the cross spectrum calculation means 2031c calculates the absolute value of the sum of the cross spectra of the two signals in a predetermined range in the time axis direction, and calculates the sum of the absolute values in the predetermined range in the frequency axis direction.
The first power spectrum calculation means 2032 calculates the expected value (average value) E t, f [| X ω, l | 2 ] of the square of the amplitude of the reproduction signal spectrum X ω, l .
Figure 2007251917
(Step S2032).
The second power spectrum calculation means 2033 calculates the expected value (average value) E t, f [| Y ω, l | 2 ] of the square of the amplitude of the collected sound signal spectrum Y ω, l ,
Figure 2007251917
(Step S2033).

ここで、m、n、M、M、N、Nはそれぞれ自然数、ω+mはωからmサンプルシフトした値、l+nはlからnフレームシフトした値である。例えば、Mを5、Mを5、Nを10、Nを10とする。このように、時間軸方向だけでなく、周波数方向にも加算することで、サンプル数を増やすことができる。したがって、時間軸方向のサンプル数を少なく(言い換えると、短時間に)することができる。
なお、上記のEt,f[|Xω,l|・|Yω,l|]、Et,f[|Xω,l]、Et,f[|Yω,l]は、単なる和を求めており、期待値(平均値)を求める式とはなっていない。しかし、後述の類似度係数r’ω,lを求める式で、Et,f[Xω,l・Yω,l]の二乗が分子、Et,f[|Xω,l]とEt,f[|Yω,l]の積が分母となるため、単なる和を求めても、類似度係数r’ω,lの値は同じである。
Here, m, n, M 1 , M 2 , N 1 and N 2 are natural numbers, ω + m is a value obtained by shifting m samples from ω, and l + n is a value obtained by shifting 1 frame by n frames. For example, M 1 is 5, M 2 is 5, N 1 is 10, and N 2 is 10. Thus, the number of samples can be increased by adding not only in the time axis direction but also in the frequency direction. Therefore, the number of samples in the time axis direction can be reduced (in other words, in a short time).
E t, f [| X ω, l | · | Y ω, l |], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ] Merely calculates the sum and is not an equation for calculating the expected value (average value). However, in a formula for calculating a similarity coefficient r ′ ω, l described later, the square of E t, f [X ω, l · Y ω, l ] is a numerator, and E t, f [| X ω, l | 2 ]. And E t, f [| Y ω, l | 2 ] is the denominator. Therefore, even if a simple sum is obtained , the value of the similarity coefficient r ′ ω, l is the same.

また、本実施形態では、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段と収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段とを別々とした。しかし、入力となるスペクトルを選択できるようにし、同一の計算手段で、再生信号スペクトルの振幅の二乗(パワースペクトル)の和も収音信号スペクトルの振幅の二乗(パワースペクトル)の和も計算しても良い。
次に、類似度計算手段2035は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[|Xω,l|・|Yω,l|]、Et,f[|Xω,l]、Et,f[|Yω,l]を用いて、再生信号スペクトルXω,lと収音信号スペクトルYω,lとの類似度係数r’ω,l

Figure 2007251917
により求める(ステップS2035)。類似度係数r’ω,lは0〜1の間の実数値をとる。 In the present embodiment, the calculation means for calculating the sum of the square of the amplitude of the reproduction signal spectrum (power spectrum) and the calculation means for calculating the sum of the square of the amplitude of the collected sound signal spectrum (power spectrum) are separated. . However, the input spectrum can be selected and the sum of the square of the amplitude of the reproduced signal spectrum (power spectrum) and the sum of the square of the amplitude of the collected signal spectrum (power spectrum) can be calculated by the same calculation means. Also good.
Next, the similarity calculation means 2035 calculates the expected value (average value) E t, f [| X ω, l | · | Y ω, l |], E t, f [| Using X ω, l | 2 ] and E t, f [| Y ω, l | 2 ], the similarity coefficient r ′ ω between the reproduction signal spectrum X ω, l and the collected sound signal spectrum Y ω, l l
Figure 2007251917
(Step S2035). The similarity coefficient r′ω , l takes a real value between 0 and 1 .

第1実施形態が二次元の複素相関に基づく類似度計算装置、第3実施形態が二次元の振幅相関に基づく類似度計算装置であるのに対し、第5実施形態では、時間方向の複素相関の絶対値から周波数方向の相関を計算することで、周波数方向の位相のずれによる相関誤差を回避して二次元複素相関よりも類似度を高精度に計算できる。また、時間方向の位相を考慮することで特徴量が増加し、二次元振幅相関より時間ベクトルを短時間にしても高精度に類似度を計算できる。   The first embodiment is a similarity calculation device based on a two-dimensional complex correlation, and the third embodiment is a similarity calculation device based on a two-dimensional amplitude correlation, whereas the fifth embodiment is a complex correlation in the time direction. By calculating the correlation in the frequency direction from the absolute value of, the correlation error due to the phase shift in the frequency direction can be avoided and the similarity can be calculated with higher accuracy than the two-dimensional complex correlation. Also, the feature amount increases by considering the phase in the time direction, and the similarity can be calculated with high accuracy even if the time vector is shortened by two-dimensional amplitude correlation.

[第6実施形態]
第6実施形態のエコー消去装置200c’も、図8の機能構成例と図9の処理フロー例で説明する。第5実施形態と異なる点は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[Xω,l・Yω,l]、Et,f[|Xω,l]、Et,f[|Yω,l]の計算で、点(ω,l)で極大値を持つ重み付け二次元窓関数Wm,nを用いることである。
そこで、エコー消去装置200c’の二次元類似度計算部203c’は、重み係数計算手段2034を有する。重み係数計算手段2034は、例えば、

Figure 2007251917
により重み付け二次元窓関数を求める(ステップS2034)。ただし、Iは減衰率を決定する値(例えば0.5)である。 [Sixth Embodiment]
The echo canceling apparatus 200c ′ of the sixth embodiment will also be described with reference to the functional configuration example of FIG. 8 and the processing flow example of FIG. The difference from the fifth embodiment is that an expected value (average value) E t, f [X ω, l · Y ω, l ], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ] is to use a weighted two-dimensional window function W m, n having a maximum value at the point (ω, l).
Therefore, the two-dimensional similarity calculation unit 203c ′ of the echo canceller 200c ′ has a weight coefficient calculation unit 2034. The weight coefficient calculation means 2034 is, for example,
Figure 2007251917
To obtain a weighted two-dimensional window function (step S2034). However, I is a value (for example, 0.5) which determines an attenuation factor.

次に、第1の計算手段2031c’、第2の計算手段2032’、第3の計算手段2033’が、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[Xω+m,l+n・Yω+m,l+n]、Et,f[|Xω,l]、Et,f[|Yω,l]を、

Figure 2007251917
により算出する(ステップS2031c’、S2032’、S2033’)。
その他の処理は、第5実施形態と同じである。 Next, the first calculation unit 2031c ′, the second calculation unit 2032 ′, and the third calculation unit 2033 ′ perform the expected value (average value) E t, f [X ω + m, l + n · Y ω + m, l + n ], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ],
Figure 2007251917
(Steps S2031c ′, S2032 ′, S2033 ′).
Other processes are the same as those in the fifth embodiment.

[第7実施形態]
図10に、本発明の二次元類似度計算部と適応フィルタとを用いたエコー消去装置の機能構成例を示す。適応フィルタ301には、従来技術を用いればよい。図11に、適応フィルタの機能構成例を示す。また、エコー消去装置300の処理フローを図12に示す。エコー消去装置300は、再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203、および適応フィルタ301から構成される。適応フィルタ301は、再生信号用の周波数分析部101’、収音信号用の周波数分析部102’、更新量計算部302、積算部6’、フィルタ更新部303、フィルタ計算部304、加算部7、および周波数合成部105’から構成される。
[Seventh Embodiment]
FIG. 10 shows a functional configuration example of an echo canceller using the two-dimensional similarity calculation unit and the adaptive filter of the present invention. A conventional technique may be used for the adaptive filter 301. FIG. 11 shows a functional configuration example of the adaptive filter. Further, the processing flow of the echo canceller 300 is shown in FIG. The echo canceller 300 includes a reproduction signal frequency analysis unit 101, a collected sound signal frequency analysis unit 102, a two-dimensional similarity calculation unit 203, and an adaptive filter 301. The adaptive filter 301 includes a reproduction signal frequency analysis unit 101 ′, a collected sound signal frequency analysis unit 102 ′, an update amount calculation unit 302, an integration unit 6 ′, a filter update unit 303, a filter calculation unit 304, and an addition unit 7. And a frequency synthesizer 105 ′.

再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203の処理フロー(ステップS101、S102、S203)は、第1実施形態と同じである。以下では、適応フィルタ301の処理フロー(ステップS301)について説明する。
再生信号用の周波数分析部101’は、再生信号x(k)を入力とし、再生信号スペクトルXω,lを出力する(ステップS101’)。収音信号用の周波数分析部102’は、収音信号y(k)を入力とし、収音信号スペクトルYω,lを出力する(ステップS102’)。更新量計算部302は、再生信号スペクトルXω,lとエコー消去信号スペクトルEω,lを入力とし、フィルタ更新量ΔH^ω,lを計算する(ステップS302)。フィルタ更新量ΔH^ω,lの計算方法としては、例えばFLMS(Fast Least-Mean Square)アルゴリズム(Ferrara E.Jr., Widrow B., “Acoustics Speech and Signal Processing”, IEEE Transactions on Signal Processing, vol.29, Issue 3, Jun 1981pp.679-683.)を用いることができる。フィルタ更新量ΔH^ω,lは、前記文献中の式(15)の右辺第2項に相当する。
The processing flow (steps S101, S102, S203) of the reproduction signal frequency analysis unit 101, the collected sound signal frequency analysis unit 102, and the two-dimensional similarity calculation unit 203 is the same as in the first embodiment. Hereinafter, the processing flow (step S301) of the adaptive filter 301 will be described.
The reproduction signal frequency analysis unit 101 ′ receives the reproduction signal x (k) and outputs the reproduction signal spectrum X ω, l (step S101 ′). The collected sound signal frequency analyzing unit 102 ′ receives the collected sound signal y (k) and outputs the collected sound signal spectrum Y ω, l (step S102 ′). The update amount calculation unit 302 receives the reproduction signal spectrum X ω, l and the echo cancellation signal spectrum E ω, l as inputs, and calculates a filter update amount ΔH ^ ω, l (step S302). As a calculation method of the filter update amount ΔH ^ ω, l , for example, the FLMS (Fast Least-Mean Square) algorithm (Ferrara E.Jr., Widrow B., “Acoustics Speech and Signal Processing”, IEEE Transactions on Signal Processing, vol. .29, Issue 3, Jun 1981pp.679-683.). The filter update amount ΔH ^ ω, l corresponds to the second term on the right side of the equation (15) in the document.

積算部6’は、フィルタ更新量ΔH^ω,lに類似度係数r’ω,lを積算し、フィルタ積算更新量r’ω,l・ΔH^ω,lを出力する(ステップS6’)。積算部6’によって、ダブルトーク(エコー信号に送話者の信号が混入する状態)雑音などの外乱に起因するエコー消去装置の性能劣化を、抑圧することができる。フィルタ積算更新量は、フィルタ更新量ΔH^ω,lと類似度係数r’ω,lとのその他の積算でも良い。
フィルタ更新部303は、フィルタ積算更新量r’ω,l・ΔH^ω,lを入力とし、フィルタ係数H^ω,lを出力する(ステップS303)。ここで、フィルタ係数H^ω,lは、
H^ω,l=H^ω,l−1+r’ω,l・ΔH^ω,l
により求める。なお、l−1とは、1フレーム前を示す値である。類似度係数r’ω,lは、マイクロホン2でエコー信号のみが収音された場合(受話シングルトークの状態)には、1に近い値となる。また、ダブルトークや雑音が多い場合には、0に近い値となる。このような類似度係数r’ω,lが、フィルタ更新量ΔH^ω,lに積算されることで、適応フィルタの更新量が制御される。
Integrating unit 6 ', the filter update amount [Delta] H ^ omega, similarity coefficient r to l' omega, integrates the l, filter accumulated update value r 'ω, l · ΔH ^ ω, and outputs the l (step S6') . The accumulating unit 6 ′ can suppress performance degradation of the echo canceller due to disturbance such as double talk (a state in which the signal of the sender is mixed in the echo signal) noise. The filter integration update amount may be another integration of the filter update amount ΔH ^ ω, l and the similarity coefficient r′ω, l .
The filter update unit 303 receives the filter integrated update amount r′ω, l · ΔH ^ ω, l and outputs the filter coefficient H ^ ω, l (step S303). Here, the filter coefficient H ^ ω, l is
H ^ ω, l = H ^ ω, l-1 + r'ω, l · ΔH ^ ω, l
Ask for. Note that l−1 is a value indicating the previous frame. The similarity coefficient r ′ ω, l is a value close to 1 when only the echo signal is collected by the microphone 2 (in the state of received single talk). In addition, when there is a lot of double talk or noise, the value is close to zero. The similarity coefficient r ′ ω, l is added to the filter update amount ΔH ^ ω, l , whereby the update amount of the adaptive filter is controlled.

フィルタ計算部304は、再生信号スペクトルXω,lとフィルタ係数H^ω,lを入力とし、擬似エコー信号スペクトルD^ω,lを出力する(ステップS304)。擬似エコー信号スペクトルD^ω,lは、
D^ω,l=H^ω,l・Xω,l
により求める。
加算部7は、収音信号スペクトルYω,lから擬似エコー信号スペクトルD^ω,lを減算し、エコー消去信号スペクトルEω,lを得る(ステップS7)。周波数合成部105’は、各周波数成分ωに対応するエコー消去信号スペクトルEω,lから、時間領域の信号e(k)を再合成して出力する(ステップS105’)。
The filter calculation unit 304 receives the reproduction signal spectrum Xω, l and the filter coefficient H ^ ω, l and outputs a pseudo echo signal spectrum D ^ ω, l (step S304). The pseudo echo signal spectrum D ^ ω, l is
D ^ ω, l = H ^ ω, lXω, l
Ask for.
Adding unit 7 is collected sound signal spectrum Y omega, the pseudo echo signal from the l spectra D ^ omega, subtracts l, echo-canceled signal spectrum E omega, obtain l (step S7). The frequency synthesizer 105 ′ re-synthesizes and outputs the time domain signal e (k) from the echo cancellation signal spectrum E ω, l corresponding to each frequency component ω (step S105 ′).

このような方法により類似度係数を求めるので、時間ベクトルを短時間にした場合にも類似度計算に利用できる特徴量を補うことができる。したがって、時間ベクトルを短時間にしても類似度計算の精度の低下を防ぐことができる。また、エコー消去技術に適用した場合には、エコー経路が頻繁に変化する場合でも、短時間で追従できる。なお、二次元類似度計算部203の代わりに、第2実施形態の二次元類似度計算部203’、第3実施形態の二次元類似度計算部203b、第4実施形態の二次元類似度計算部203b’、第5実施形態の二次元類似度計算部203c、第6実施形態の二次元類似度計算部203c’を用いても良い。   Since the similarity coefficient is obtained by such a method, the feature quantity that can be used for similarity calculation can be supplemented even when the time vector is shortened. Therefore, even if the time vector is shortened, it is possible to prevent a decrease in the accuracy of similarity calculation. Further, when applied to the echo cancellation technique, even if the echo path changes frequently, it can be tracked in a short time. In place of the two-dimensional similarity calculation unit 203, the two-dimensional similarity calculation unit 203 ′ of the second embodiment, the two-dimensional similarity calculation unit 203b of the third embodiment, and the two-dimensional similarity calculation of the fourth embodiment. The unit 203b ′, the two-dimensional similarity calculation unit 203c of the fifth embodiment, and the two-dimensional similarity calculation unit 203c ′ of the sixth embodiment may be used.

[変形例等]
本発明の類似度計算方法は、エコー消去装置以外に適用しても良い。第1実施形態〜第4実施形態の二次元類似度計算部において、一般に、時間軸方向の所定の範囲−N〜N、かつ、周波数軸方向の所定の範囲−M〜Mの範囲でスペクトルの積の和を計算しても良い。すなわち、例えば、第1実施形態の二次元類似度計算部203の第1の計算手段2031が、N、N、M、Mをそれぞれ自然数とし、式(1)に代えて次式でクロススペクトルの和を計算してもよい。

Figure 2007251917
他の実施形態における二次元類似度計算部においても同様である。
ここで、第1実施形態〜第6実施形態において、M、Mはサンプリング周波数に依存する整数であり、例えば、サンプリング周波数が16kHzの場合、Mは2から10の間の値、Mも2から10の値に設定するとよい。特に、M=5、M=5の付近でMとMを設定するのが望ましい。サンプリング周波数が2倍になれば、MとMの値も2倍にするとよい。一方、N、Nは使用環境における残響時間及び雑音に係る時定数に依存する自然数で、例えば、N=10、N=0とする。残響時間が長い場合には、例えば、N=100、N=0とする。 [Modifications, etc.]
The similarity calculation method of the present invention may be applied to devices other than the echo canceller. In the two-dimensional similarity calculation unit according to the first to fourth embodiments, generally, a predetermined range −N 1 to N 2 in the time axis direction and a predetermined range −M 1 to M 2 in the frequency axis direction. The sum of spectral products may be calculated over a range. That is, for example, the first calculation unit 2031 of the two-dimensional similarity calculation unit 203 according to the first embodiment sets N 1 , N 2 , M 1 , and M 2 as natural numbers, and replaces the equation (1) with the following equation: The sum of cross spectra may be calculated with
Figure 2007251917
The same applies to the two-dimensional similarity calculator in other embodiments.
Here, in the first to sixth embodiments, M 1 and M 2 are integers depending on the sampling frequency. For example, when the sampling frequency is 16 kHz, M 1 is a value between 2 and 10, M 2 may also be set to a value from 2 to 10. In particular, it is desirable to set M 1 and M 2 in the vicinity of M 1 = 5 and M 2 = 5. If the sampling frequency is doubled, the values of M 1 and M 2 are preferably doubled. On the other hand, N 1 and N 2 are natural numbers depending on reverberation time and noise time constant in the usage environment, and for example, N 1 = 10 and N 2 = 0. When the reverberation time is long, for example, N 1 = 100 and N 2 = 0.

本発明による類似度計算方法及びエコー消去方法の各ステップをコンピュータで実行可能なプログラムとして記述し、コンピュータでこの発明を実行してもよい。また、そのプログラムは、コンピュータで読み取り可能な記録媒体に記録しておき、そのプログラムを読み出して実行してもよい。
例えば、図13に示すように、各部がバス50に接続され、メモリ52に類似度計算プログラムが、又は、メモリ53にエコー消去プログラムが、CD−ROM、ハードディスクなどから、あるいは通信回線を介してインストールされてある。CPU51がこの類似度計算プログラム又はエコー消去プログラムを実行することにより、類似度計算方法又はエコー消去方法を実行することができる。記憶部55は、一時的にデータを記憶するためなどに用いられる。
Each step of the similarity calculation method and echo cancellation method according to the present invention may be described as a computer-executable program, and the present invention may be executed by the computer. The program may be recorded on a computer-readable recording medium, and the program may be read and executed.
For example, as shown in FIG. 13, each unit is connected to a bus 50, and a similarity calculation program is stored in the memory 52, or an echo cancellation program is stored in the memory 53 from a CD-ROM, a hard disk, or the like, or via a communication line. Installed. When the CPU 51 executes this similarity calculation program or echo cancellation program, the similarity calculation method or echo cancellation method can be executed. The storage unit 55 is used for temporarily storing data.

なお、第1実施形態における第1の計算手段2031(図3)、第2実施形態における第1の計算手段2031’(図3)、第3実施形態におけるクロス振幅スペクトル計算手段2031b(図5)、第4実施形態におけるクロススペクトル計算手段2031c(図8)、第5実施形態におけるクロススペクトル計算手段2031c’(図8)は、2つの信号のスペクトルの積の和を求めるという点で共通している。特許請求の範囲及び明細書における積和計算手段は、これらの計算手段を意味する。   The first calculation means 2031 (FIG. 3) in the first embodiment, the first calculation means 2031 ′ (FIG. 3) in the second embodiment, and the cross amplitude spectrum calculation means 2031b (FIG. 5) in the third embodiment. The cross spectrum calculation means 2031c (FIG. 8) in the fourth embodiment and the cross spectrum calculation means 2031c ′ (FIG. 8) in the fifth embodiment are common in that they obtain the sum of the products of the spectra of the two signals. Yes. The product-sum calculation means in the claims and the specification means these calculation means.

従来のエコー消去装置の機能構成例を示す図。The figure which shows the function structural example of the conventional echo cancellation apparatus. 従来のエコー消去装置の処理フローを示す図。The figure which shows the processing flow of the conventional echo cancellation apparatus. 第1実施形態、第2実施形態のエコー消去装置の機能構成例を示す図。The figure which shows the function structural example of the echo cancellation apparatus of 1st Embodiment, 2nd Embodiment. 第1実施形態、第2実施形態のエコー消去装置の処理フローを示す図。The figure which shows the processing flow of the echo cancellation apparatus of 1st Embodiment and 2nd Embodiment. 第3実施形態、第4実施形態のエコー消去装置の機能構成例を示す図。The figure which shows the function structural example of the echo cancellation apparatus of 3rd Embodiment and 4th Embodiment. 第3実施形態、第4実施形態のエコー消去装置の処理フローを示す図。The figure which shows the processing flow of the echo cancellation apparatus of 3rd Embodiment and 4th Embodiment. 二次元類似度計算部203bの機能構成例を示す図。The figure which shows the function structural example of the two-dimensional similarity calculation part 203b. 第5実施形態、第6実施形態のエコー消去装置の機能構成例を示す図。The figure which shows the function structural example of the echo cancellation apparatus of 5th Embodiment and 6th Embodiment. 第5実施形態、第6実施形態のエコー消去装置の処理フローを示す図。The figure which shows the processing flow of the echo cancellation apparatus of 5th Embodiment and 6th Embodiment. 本発明の二次元類似度計算部と適応フィルタとを用いたエコー消去装置の機能構成例を示す図。The figure which shows the function structural example of the echo cancellation apparatus using the two-dimensional similarity calculation part and adaptive filter of this invention. 適応フィルタの機能構成例を示す図。The figure which shows the function structural example of an adaptive filter. 第7実施形態のエコー消去装置の処理フローを示す図。The figure which shows the processing flow of the echo cancellation apparatus of 7th Embodiment. 本発明による類似度計算プログラム及びエコー消去方法がコンピュータにより実行される場合の構成例を示す図。The figure which shows the structural example in case the similarity calculation program by this invention and the echo cancellation method are performed by computer.

Claims (24)

2つの信号スペクトル間の類似度を求める類似度計算装置であって、
各信号スペクトルは、所定のサンプル数(以下、「フレーム」という。)、所定の周波数間隔(以下、「周波数値」という。)ごとに分析されたスペクトルであり、
周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの積の和を求める積和計算手段と
周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、各信号スペクトルの振幅の二乗の和を求めるパワースペクトル計算手段と
前記積和計算手段の出力と前記パワースペクトル計算手段の出力から類似度係数を求める類似度係数計算手段
を備える類似度計算装置。
A similarity calculation device for calculating a similarity between two signal spectra,
Each signal spectrum is a spectrum analyzed at a predetermined number of samples (hereinafter referred to as “frame”) and a predetermined frequency interval (hereinafter referred to as “frequency value”).
Product sum calculation means for calculating the sum of products of two signal spectra within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction, and within a predetermined range in the frequency axis direction and a predetermined range in the time axis direction A power spectrum calculation means for obtaining a sum of squares of the amplitudes of each signal spectrum, a similarity coefficient calculation means for obtaining a similarity coefficient from the output of the product-sum calculation means and the output of the power spectrum calculation means apparatus.
請求項1に記載の類似度計算装置において、
前記積和計算手段は、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号のクロススペクトルの和を求めるクロススペクトル計算手段である
ことを特徴とする類似度計算装置。
The similarity calculation apparatus according to claim 1,
The product sum calculation means is a cross spectrum calculation means for obtaining a sum of cross spectra of two signals within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. apparatus.
請求項1に記載の類似度計算装置において、
前記積和計算手段は、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの振幅の積の和を求めるクロス振幅スペクトル計算手段である
ことを特徴とする類似度計算装置。
The similarity calculation apparatus according to claim 1,
The product sum calculation means is a cross amplitude spectrum calculation means for obtaining a sum of amplitude products of two signal spectra within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. Similarity calculation device.
請求項1に記載の類似度計算装置において、
前記積和計算手段は、2つの信号のクロススペクトルの時間軸方向の所定の範囲における和の絶対値を求め、その絶対値について周波数軸方向の所定の範囲における和を求めるクロススペクトル計算手段である
ことを特徴とする類似度計算装置。
The similarity calculation apparatus according to claim 1,
The product-sum calculation unit is a cross-spectrum calculation unit that calculates an absolute value of a sum of a cross spectrum of two signals in a predetermined range in the time axis direction and calculates a sum of the absolute value in a predetermined range in the frequency axis direction. The similarity calculation apparatus characterized by the above.
請求項2記載の類似度計算装置であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数とするときに、
前記クロススペクトル計算手段は、
Figure 2007251917
を用いて2つの信号のクロススペクトルの和を求め、
前記パワースペクトル計算手段は、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算手段は、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算装置。
The similarity calculation device according to claim 2,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross spectrum calculation means includes:
Figure 2007251917
Is used to find the sum of the cross spectrum of the two signals,
The power spectrum calculation means includes
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Figure 2007251917
A similarity calculation device characterized by:
請求項3記載の類似度計算装置であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数とするときに、
前記クロス振幅スペクトル計算手段は、
Figure 2007251917
を用いて2つの信号スペクトルの振幅の積の和を求め、
前記パワースペクトル計算手段は、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算手段は、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算装置。
The similarity calculation device according to claim 3,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross amplitude spectrum calculating means includes:
Figure 2007251917
Is used to find the sum of the products of the amplitudes of the two signal spectra,
The power spectrum calculation means includes
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Figure 2007251917
A similarity calculation device characterized by:
請求項4記載の類似度計算装置であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数とするときに、
前記クロススペクトル計算手段は、
Figure 2007251917
を用いて2つの信号のクロススペクトルの和を求め、
前記パワースペクトル計算手段は、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算手段は、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算装置。
The similarity calculation device according to claim 4,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross spectrum calculation means includes:
Figure 2007251917
Is used to find the sum of the cross spectrum of the two signals,
The power spectrum calculation means includes
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Figure 2007251917
A similarity calculation device characterized by:
請求項2記載の類似度計算装置であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数、Wm,nを重みとするときに、
前記クロススペクトル計算手段は、
Figure 2007251917
を用いて2つの信号のクロススペクトルの和を求め、
前記パワースペクトル計算手段は、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算手段は、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算装置。
The similarity calculation device according to claim 2,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross spectrum calculation means includes:
Figure 2007251917
Is used to find the sum of the cross spectrum of the two signals,
The power spectrum calculation means includes
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Figure 2007251917
A similarity calculation device characterized by:
請求項3記載の類似度計算装置であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数、Wm,nを重みとするときに、
前記クロス振幅スペクトル計算手段は、
Figure 2007251917
を用いて2つの信号スペクトルの振幅の積の和を求め、
前記パワースペクトル計算手段は、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算手段は、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算装置。
The similarity calculation device according to claim 3,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross amplitude spectrum calculating means includes:
Figure 2007251917
Is used to find the sum of the products of the amplitudes of the two signal spectra,
The power spectrum calculation means includes
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Figure 2007251917
A similarity calculation device characterized by:
請求項4記載の類似度計算装置であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数、Wm,nを重みとするときに、
前記クロススペクトル計算手段は、
Figure 2007251917
を用いて2つの信号のクロススペクトルの和を求め、
前記パワースペクトル計算手段は、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算手段は、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算装置。
The similarity calculation device according to claim 4,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross spectrum calculation means includes:
Figure 2007251917
Is used to find the sum of the cross spectrum of the two signals,
The power spectrum calculation means includes
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Figure 2007251917
A similarity calculation device characterized by:
再生信号を周波数分析して再生信号スペクトルを得る第1の周波数分析部と、
収音信号を周波数分析して収音信号スペクトルを得る第2の周波数分析部と、
前記再生信号スペクトルと前記収音信号スペクトルとの類似度係数を計算する請求項1から10のいずれかに記載の類似度計算装置と、
前記類似度係数を前記収音信号スペクトルから、ゲイン係数を求めるゲイン計算部と、
前記ゲイン係数を前記収音信号スペクトルに積算し、エコー消去スペクトルを得る積算部と、
前記エコー消去スペクトルから時間領域の信号を得る周波数合成部
を備えるエコー消去装置。
A first frequency analysis unit for frequency analysis of the reproduction signal to obtain a reproduction signal spectrum;
A second frequency analysis unit that performs frequency analysis of the collected sound signal to obtain a collected sound signal spectrum;
The similarity calculation device according to any one of claims 1 to 10, which calculates a similarity coefficient between the reproduction signal spectrum and the collected sound signal spectrum;
A gain calculation unit for obtaining a gain coefficient from the collected sound signal spectrum for the similarity coefficient;
An integration unit that integrates the gain coefficient into the collected sound signal spectrum and obtains an echo cancellation spectrum;
An echo canceller comprising a frequency synthesizer that obtains a time-domain signal from the echo cancel spectrum.
再生信号を周波数分析して再生信号スペクトルを得る第1の周波数分析部と、
収音信号を周波数分析して収音信号スペクトルを得る第2の周波数分析部と、
前記再生信号スペクトルと前記収音信号スペクトルとの類似度係数を計算する請求項1から10のいずれかに記載の類似度計算装置と、
前記再生信号、前記収音信号および前記類似度係数を用いて、前記収音信号中の前記再生信号の成分を消去した出力信号を得る適応フィルタ部
を備えるエコー消去装置。
A first frequency analysis unit for frequency analysis of the reproduction signal to obtain a reproduction signal spectrum;
A second frequency analysis unit that performs frequency analysis of the collected sound signal to obtain a collected sound signal spectrum;
The similarity calculation device according to any one of claims 1 to 10, which calculates a similarity coefficient between the reproduction signal spectrum and the collected sound signal spectrum;
An echo cancellation apparatus comprising: an adaptive filter unit that obtains an output signal obtained by canceling a component of the reproduction signal in the sound pickup signal, using the reproduction signal, the sound pickup signal, and the similarity coefficient.
2つの信号スペクトル間の類似度を求める類似度計算方法であって、
各信号スペクトルは、所定のサンプル数(以下、「フレーム」という。)、所定の周波数間隔(以下、「周波数値」という。)ごとに分析されたスペクトルであり、
周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの積の和を求める積和計算ステップと
周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、各信号スペクトルの振幅の二乗の和を求めるパワースペクトル計算ステップと
前記積和計算ステップの出力と前記パワースペクトル計算ステップの出力から類似度係数を求める類似度係数計算ステップ
を有する類似度計算方法。
A similarity calculation method for calculating a similarity between two signal spectra,
Each signal spectrum is a spectrum analyzed at a predetermined number of samples (hereinafter referred to as “frame”) and a predetermined frequency interval (hereinafter referred to as “frequency value”).
A product-sum calculation step for obtaining a sum of products of two signal spectra within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction; and within a predetermined range in the frequency axis direction and a predetermined range in the time axis direction A power spectrum calculation step for obtaining a sum of squares of amplitudes of respective signal spectra, a similarity coefficient calculation step for obtaining a similarity coefficient from the output of the product-sum calculation step and the output of the power spectrum calculation step. Method.
請求項13に記載の類似度計算方法において、
前記積和計算ステップは、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号のクロススペクトルの和を求めるクロススペクトル計算ステップである
ことを特徴とする類似度計算方法。
The similarity calculation method according to claim 13,
The product sum calculation step is a cross spectrum calculation step for obtaining a sum of cross spectra of two signals within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. Method.
請求項13に記載の類似度計算方法において、
前記積和計算ステップは、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの振幅の積の和を求めるクロス振幅スペクトル計算ステップである
ことを特徴とする類似度計算方法。
The similarity calculation method according to claim 13,
The product sum calculation step is a cross amplitude spectrum calculation step for obtaining a sum of products of amplitudes of two signal spectra within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. Similarity calculation method.
請求項13に記載の類似度計算方法において、
前記積和計算ステップは、2つの信号のクロススペクトルの時間軸方向の所定の範囲における和の絶対値を求め、その絶対値について周波数軸方向の所定の範囲における和を求めるクロススペクトル計算ステップである
ことを特徴とする類似度計算方法。
The similarity calculation method according to claim 13,
The product-sum calculation step is a cross-spectrum calculation step for obtaining an absolute value of a sum of a cross spectrum of two signals in a predetermined range in the time axis direction and calculating a sum of the absolute values in a predetermined range in the frequency axis direction. A similarity calculation method characterized by the above.
請求項14記載の類似度計算方法であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数とするときに、
前記クロススペクトル計算ステップは、
Figure 2007251917
を用いて2つの信号のクロススペクトルの和を求め、
前記パワースペクトル計算ステップは、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算ステップは、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算方法。
The similarity calculation method according to claim 14, wherein
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross spectrum calculation step includes:
Figure 2007251917
Is used to find the sum of the cross spectrum of the two signals,
The power spectrum calculation step includes:
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Figure 2007251917
A similarity calculation method characterized by being obtained by
請求項15記載の類似度計算方法であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数とするときに、
前記クロス振幅スペクトル計算ステップは、
Figure 2007251917
を用いて2つの信号スペクトルの振幅の積の和を求め、
前記パワースペクトル計算ステップは、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算ステップは、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算方法。
The similarity calculation method according to claim 15, comprising:
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross amplitude spectrum calculation step includes:
Figure 2007251917
Is used to find the sum of the products of the amplitudes of the two signal spectra,
The power spectrum calculation step includes:
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Figure 2007251917
A similarity calculation method characterized by being obtained by
請求項16記載の類似度計算方法であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数とするときに、
前記クロススペクトル計算ステップは、
Figure 2007251917
を用いて2つの信号のクロススペクトルの和を求め、
前記パワースペクトル計算ステップは、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算ステップは、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算方法。
The similarity calculation method according to claim 16, comprising:
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross spectrum calculation step includes:
Figure 2007251917
Is used to find the sum of the cross spectrum of the two signals,
The power spectrum calculation step includes:
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Figure 2007251917
A similarity calculation method characterized by being obtained by
請求項14記載の類似度計算方法であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数、Wm,nを重みとするときに、
前記クロススペクトル計算ステップは、
Figure 2007251917
を用いて2つの信号のクロススペクトルの和を求め、
前記パワースペクトル計算ステップは、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算ステップは、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算方法。
The similarity calculation method according to claim 14, wherein
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross spectrum calculation step includes:
Figure 2007251917
Is used to find the sum of the cross spectrum of the two signals,
The power spectrum calculation step includes:
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Figure 2007251917
A similarity calculation method characterized by being obtained by
請求項15に記載の類似度計算方法であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数、Wm,nを重みとするときに、
前記クロス振幅スペクトル計算ステップは、
Figure 2007251917
を用いて2つの信号スペクトルの振幅の積の和を求め、
前記パワースペクトル計算ステップは、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算ステップは、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算方法。
The similarity calculation method according to claim 15, comprising:
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross amplitude spectrum calculation step includes:
Figure 2007251917
Is used to find the sum of the products of the amplitudes of the two signal spectra,
The power spectrum calculation step includes:
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Figure 2007251917
A similarity calculation method characterized by being obtained by
請求項16に記載の類似度計算方法であって、
ω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N、N、M、Mを自然数、Wm,nを重みとするときに、
前記クロススペクトル計算ステップは、
Figure 2007251917
を用いて2つの信号のクロススペクトルの和を求め、
前記パワースペクトル計算ステップは、
Figure 2007251917
また
Figure 2007251917
を用いて信号スペクトルの積の和を求め、
前記類似度係数計算ステップは、類似度係数r’ω,l
Figure 2007251917
により求める
ことを特徴とする類似度計算方法。
The similarity calculation method according to claim 16, comprising:
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross spectrum calculation step includes:
Figure 2007251917
Is used to find the sum of the cross spectrum of the two signals,
The power spectrum calculation step includes:
Figure 2007251917
Also
Figure 2007251917
Is used to find the sum of the product of the signal spectrum,
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Figure 2007251917
A similarity calculation method characterized by being obtained by
再生信号を周波数分析して再生信号スペクトルを得る第1の周波数分析ステップと、
収音信号を周波数分析して収音信号スペクトルを得る第2の周波数分析ステップと、
前記再生信号スペクトルと前記収音信号スペクトルとの類似度係数を計算する請求項13から22のいずれかに記載の類似度計算方法と、
前記類似度係数を前記収音信号スペクトルから、ゲイン係数を求めるゲイン計算ステップと、
前記ゲイン係数を前記収音信号スペクトルに積算し、エコー消去スペクトルを得る積算ステップと、
前記エコー消去スペクトルから時間領域の信号を得る周波数合成ステップ
を有するエコー消去方法。
A first frequency analysis step of obtaining a reproduction signal spectrum by frequency analysis of the reproduction signal;
A second frequency analysis step of performing frequency analysis of the collected sound signal to obtain a collected sound signal spectrum;
The similarity calculation method according to any one of claims 13 to 22, wherein a similarity coefficient between the reproduced signal spectrum and the collected sound signal spectrum is calculated.
A gain calculating step for obtaining a gain coefficient from the collected sound signal spectrum from the similarity coefficient;
Integrating the gain factor to the collected sound signal spectrum to obtain an echo cancellation spectrum;
An echo cancellation method comprising: a frequency synthesis step of obtaining a time domain signal from the echo cancellation spectrum.
再生信号を周波数分析して再生信号スペクトルを得る第1の周波数分析ステップと、
収音信号を周波数分析して収音信号スペクトルを得る第2の周波数分析ステップと、
前記再生信号スペクトルと前記収音信号スペクトルとの類似度係数を計算する請求項13から22のいずれかに記載の類似度計算方法と、
前記再生信号、前記収音信号および前記類似度係数を用いて、前記収音信号中の前記再生信号の成分を消去した出力信号を得る適応フィルタステップ
を有するエコー消去方法。
A first frequency analysis step of obtaining a reproduction signal spectrum by frequency analysis of the reproduction signal;
A second frequency analysis step of performing frequency analysis of the collected sound signal to obtain a collected sound signal spectrum;
The similarity calculation method according to any one of claims 13 to 22, wherein a similarity coefficient between the reproduced signal spectrum and the collected sound signal spectrum is calculated.
An echo canceling method comprising: an adaptive filter step of obtaining an output signal from which a component of the reproduced signal in the collected sound signal is eliminated, using the reproduced signal, the collected sound signal, and the similarity coefficient.
JP2006305023A 2005-11-21 2006-11-10 Similarity calculation device, echo cancellation device, similarity calculation method, echo cancellation method Active JP4520970B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006305023A JP4520970B2 (en) 2005-11-21 2006-11-10 Similarity calculation device, echo cancellation device, similarity calculation method, echo cancellation method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005336244 2005-11-21
JP2006040411 2006-02-17
JP2006305023A JP4520970B2 (en) 2005-11-21 2006-11-10 Similarity calculation device, echo cancellation device, similarity calculation method, echo cancellation method

Publications (2)

Publication Number Publication Date
JP2007251917A true JP2007251917A (en) 2007-09-27
JP4520970B2 JP4520970B2 (en) 2010-08-11

Family

ID=38595688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006305023A Active JP4520970B2 (en) 2005-11-21 2006-11-10 Similarity calculation device, echo cancellation device, similarity calculation method, echo cancellation method

Country Status (1)

Country Link
JP (1) JP4520970B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010220169A (en) * 2009-03-19 2010-09-30 Nippon Telegr & Teleph Corp <Ntt> Multi-channel echo canceling apparatus, method thereof and program thereof
JP2021079537A (en) * 2019-11-14 2021-05-27 株式会社日立製作所 Method for predicting and maintaining movable device

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134287A (en) * 1999-11-10 2001-05-18 Mitsubishi Electric Corp Noise suppressing device
JP2003188776A (en) * 2001-12-21 2003-07-04 Nippon Telegr & Teleph Corp <Ntt> Acoustic echo erasing method and device, and acoustic echo erasure program
JP2003309493A (en) * 2002-04-17 2003-10-31 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for reducing echo
JP2005107448A (en) * 2003-10-02 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> Noise reduction processing method, and device, program, and recording medium for implementing same method
JP2005292812A (en) * 2004-03-09 2005-10-20 Nippon Telegr & Teleph Corp <Ntt> Method and device to discriminate voice and noise, method and device to reduce noise, voice and noise discriminating program, noise reducing program, and recording medium for program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001134287A (en) * 1999-11-10 2001-05-18 Mitsubishi Electric Corp Noise suppressing device
JP2003188776A (en) * 2001-12-21 2003-07-04 Nippon Telegr & Teleph Corp <Ntt> Acoustic echo erasing method and device, and acoustic echo erasure program
JP2003309493A (en) * 2002-04-17 2003-10-31 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for reducing echo
JP2005107448A (en) * 2003-10-02 2005-04-21 Nippon Telegr & Teleph Corp <Ntt> Noise reduction processing method, and device, program, and recording medium for implementing same method
JP2005292812A (en) * 2004-03-09 2005-10-20 Nippon Telegr & Teleph Corp <Ntt> Method and device to discriminate voice and noise, method and device to reduce noise, voice and noise discriminating program, noise reducing program, and recording medium for program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010220169A (en) * 2009-03-19 2010-09-30 Nippon Telegr & Teleph Corp <Ntt> Multi-channel echo canceling apparatus, method thereof and program thereof
JP2021079537A (en) * 2019-11-14 2021-05-27 株式会社日立製作所 Method for predicting and maintaining movable device
JP7042315B2 (en) 2019-11-14 2022-03-25 株式会社日立製作所 How to predict and maintain mobile devices

Also Published As

Publication number Publication date
JP4520970B2 (en) 2010-08-11

Similar Documents

Publication Publication Date Title
KR101168002B1 (en) Method of processing a noisy sound signal and device for implementing said method
JP5528538B2 (en) Noise suppressor
US9818424B2 (en) Method and apparatus for suppression of unwanted audio signals
JP5127754B2 (en) Signal processing device
CN103325380B (en) Gain for signal enhancing is post-processed
JP2004502977A (en) Subband exponential smoothing noise cancellation system
JP5087024B2 (en) Echo canceling apparatus, method and program
EP2710590B1 (en) Super-wideband noise supression
JP5422054B2 (en) Time domain / frequency domain integrated echo cancellation apparatus and method
KR101581885B1 (en) Apparatus and Method for reducing noise in the complex spectrum
CN111988708A (en) Single-microphone-based howling suppression method and device
JP5443547B2 (en) Signal processing device
JP4520970B2 (en) Similarity calculation device, echo cancellation device, similarity calculation method, echo cancellation method
JP5840087B2 (en) Audio signal restoration apparatus and audio signal restoration method
JP2014194437A (en) Voice processing device, voice processing method and voice processing program
JP5889224B2 (en) Echo suppression gain estimation method, echo canceller and program using the same
JP6182862B2 (en) Signal processing apparatus, signal processing method, and signal processing program
JP5769672B2 (en) Echo suppression gain estimation method, echo canceller and program using the same
JP2011254420A (en) Echo elimination method, echo elimination device, and echo elimination program
JP2000105599A (en) Noise level time variation coefficient calculating method, device thereof, and noise reducing method
JP4456594B2 (en) Acoustic coupling amount calculation device, echo cancellation device and voice switch device using acoustic coupling amount calculation device, call state determination device, method thereof, program thereof and recording medium thereof
JP5526053B2 (en) Echo canceling method, apparatus and program thereof
JP5325134B2 (en) Echo canceling method, echo canceling apparatus, program thereof, and recording medium
Diethorn Subband noise reduction methods for speech enhancement
JP7380361B2 (en) Noise estimation device, noise estimation program, noise estimation method, and sound collection device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080313

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100511

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100521

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4520970

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140528

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350