JP2007251917A - Similarity calculation apparatus and method, and echo erasure apparatus and method - Google Patents
Similarity calculation apparatus and method, and echo erasure apparatus and method Download PDFInfo
- Publication number
- JP2007251917A JP2007251917A JP2006305023A JP2006305023A JP2007251917A JP 2007251917 A JP2007251917 A JP 2007251917A JP 2006305023 A JP2006305023 A JP 2006305023A JP 2006305023 A JP2006305023 A JP 2006305023A JP 2007251917 A JP2007251917 A JP 2007251917A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- similarity
- sum
- signal
- calculation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、2つの信号スペクトルの類似度を計算する類似度計算装置、類似度計算方法に関するものである。また、この類似度計算装置または類似度計算方法を用いた、音響エコーを消去するエコー消去装置、エコー消去方法に関するものである。 The present invention relates to a similarity calculation device and a similarity calculation method for calculating the similarity between two signal spectra. The present invention also relates to an echo erasing device and an echo erasing method for erasing an acoustic echo using the similarity calculating device or the similarity calculating method.
図1に、従来のエコー消去装置の機能構成例を示す。また、図2にエコー消去装置100の処理フローを示す。再生信号x(k)がスピーカ1からマイクロホン2へ回り込むことによって生じるエコーを消去した出力信号e(k)を生成する。従来の短時間スペクトル振幅(STSA : Short-Time Spectral Amplitude)推定に基づくエコー抑圧処理は、人間の聴覚特性が位相に鈍感である性質、及び音声とエコーの統計的な性質などを利用して、周波数領域でエコーの振幅成分を減算する。ここで、kは、所定間隔の離散時間を指す数(サンプル点の番号)である。サンプリングとは、アナログの音声信号をディジタル信号に変換するために、変数のある区間の値を1つの代表する値に置き換えることである。例えばサンプリング周波数16kHz(1秒間に16000回)で行われる。なお、スピーカ1に与える信号、マイクロホン2で収音された信号はアナログ信号である。以下の説明では、ディジタル信号を扱うので、それぞれDA変換器、AD変換器によって変換を行う必要があるが、それは当然のことであり、図示していない。
エコー消去装置100は、再生信号用の周波数分析部101、収音信号用の周波数分析部102、類似度係数計算部103、ゲイン計算部104、積算部6、および周波数合成部105から構成される。
FIG. 1 shows a functional configuration example of a conventional echo canceling apparatus. FIG. 2 shows a processing flow of the
The
周波数分析部101は、再生信号x(k)を入力とし、再生信号スペクトルXω,lを出力する(ステップS101)。ここで、周波数値ωは所定の周波数間隔で求めたスペクトルの周波数値の番号、フレーム番号lは周波数分析を行ったフレームの番号である。例えば、16kHzでサンプリングした256点の再生信号x(k−255),…,x(k)を1フレームとし、半フレーム(ここでは128点)ずらしながら周波数分析し、再生信号x(k)をフレーム単位で、8kHzまでの周波数帯域をサンプル点数128で表した再生信号スペクトルXω,l(ω=1,…,128)へ変換する。
The
周波数分析部102は、収音信号y(k)を入力とし、収音信号スペクトルYω,lを出力する(ステップS102)。類似度計算部103は、再生信号スペクトルXω,lと収音信号スペクトルYω,lを入力とし、類似度係数rω,lを出力する(ステップS103)。類似度係数の推定はコヒーレンス関数を用いる方法がこれまでに提案されている(非特許文献1)。再生信号スペクトルXω,lと収音信号スペクトルYω,lの類似度係数rω,lは、
ゲイン計算部104は、類似度係数rω,lと収音信号スペクトルYω,lを入力とし、ゲイン係数Gω,lを出力する(ステップS104)。ゲイン係数Gω,lは0〜1の実数値をとる。類似度が高いとき(類似度係数rω,lが1に近いとき)には小さい値、類似度が低いとき(類似度係数rω,lが0に近いとき)には大きい値をとる。積算部6は、収音信号スペクトルYω,lにゲイン係数Gω,lを積算し、エコー消去信号スペクトルEω,lを得る(ステップS6)。周波数合成部105は、各周波数成分ωに対応するエコー消去信号スペクトルEω,lから、時間領域の信号e(k)を再合成して出力する(ステップS105)。
The
従来のコヒーレンスに基づく類似度計算方法は、時間ベクトルの特徴量しか利用していなかった。これは、エコー経路を不変と仮定して、時間ベクトルの長時間の特徴量から類似度を算出するものである。そのため、エコー経路が変動した場合、類似度を精度良く推定できるまで一定の時間がかかっていた。実用上は、頻繁にエコー経路が変動することもあるため、類似度を精度よく計算することができないことがあった。また、類似度の誤推定がミュージカルノイズ発生の原因の一つになっていた。本発明の課題は、短時間で類似度を高精度に推定する類似度計算技術を提供すること、およびミュージカルノイズ発生を抑圧するエコー抑圧技術を提供することである。 The conventional similarity calculation method based on coherence uses only the feature quantity of the time vector. In this method, assuming that the echo path is unchanged, the similarity is calculated from the long-time feature quantity of the time vector. Therefore, when the echo path fluctuates, it takes a certain time until the similarity can be accurately estimated. In practical use, the echo path sometimes fluctuates frequently, so that the degree of similarity cannot be calculated accurately. In addition, erroneous estimation of similarity was one of the causes of musical noise. An object of the present invention is to provide a similarity calculation technique that estimates a similarity with high accuracy in a short time, and to provide an echo suppression technique that suppresses the occurrence of musical noise.
まず、所定のサンプル数(フレーム)、所定の周波数間隔(周波数値)ごとに分析されたスペクトルの類似度係数を求める手段を示す。本発明では、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの積の和と、各信号スペクトルの振幅の二乗の和を求める。そして、上記2つの信号スペクトルの積の和の二乗と各信号スペクトルの振幅の二乗(パワースペクトル)の和から類似度係数を求める。
そして、本発明では、前記の類似度係数を用いて、ゲイン計算や適応フィルタなどの方法によりエコーを消去した出力を得る。
First, a means for obtaining a similarity coefficient of a spectrum analyzed every predetermined number of samples (frame) and every predetermined frequency interval (frequency value) will be described. In the present invention, the sum of the product of two signal spectra and the sum of the square of the amplitude of each signal spectrum are determined within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. Then, a similarity coefficient is obtained from the sum of the square of the sum of the products of the two signal spectra and the sum of the square of the amplitude of each signal spectrum (power spectrum).
In the present invention, using the similarity coefficient, an output in which echo is eliminated by a method such as gain calculation or an adaptive filter is obtained.
本発明では、周波数ベクトルの特徴量も考慮することで、時間ベクトルを短時間にした場合にも類似度計算に利用できる特徴量を補うことができる。したがって、時間ベクトルを短時間にしても類似度計算の精度の低下を防ぐことができる。また、エコー消去技術に適用した場合には、エコー経路が頻繁に変化する場合でも、短時間で追従できる。 In the present invention, by considering the feature quantity of the frequency vector, the feature quantity that can be used for similarity calculation can be supplemented even when the time vector is shortened. Therefore, even if the time vector is shortened, it is possible to prevent a decrease in the accuracy of similarity calculation. Further, when applied to the echo cancellation technique, even if the echo path changes frequently, it can be tracked in a short time.
[第1実施形態]
図3に、第1実施形態のエコー消去装置の機能構成例を示す。また、図4にエコー消去装置200の処理フロー例を示す。エコー消去装置200は、再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203、ゲイン計算部104、積算部6、および周波数合成部105から構成される。類似度計算部103が二次元類似度計算部203に置き換わった以外は、従来技術と同じ構成である。以下に、図1と異なる二次元類似度計算部203について説明する。
[First Embodiment]
FIG. 3 shows a functional configuration example of the echo cancellation apparatus of the first embodiment. FIG. 4 shows an example of the processing flow of the echo canceller 200. The echo cancellation apparatus 200 includes a reproduction signal
二次元類似度計算部203は、クロススペクトルの期待値を計算する第1の計算手段2031、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第2の計算手段2032、収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第3の計算手段2033を備えている。二次元類似度計算部203は、再生信号スペクトルXω,lと収音信号スペクトルYω,lを入力とする。そして、第1の計算手段2031、第2の計算手段2032、第3の計算手段2033が、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[X* ω,l・Yω,l]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]を、
The two-dimensional similarity calculation unit 203 includes a
また、本実施形態では、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段と収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段とを別々とした。しかし、入力となるスペクトルを選択できるようにし、同一の計算手段で、再生信号スペクトルの振幅の二乗(パワースペクトル)の和も収音信号スペクトルの振幅の二乗(パワースペクトル)の和も計算しても良い。
次に、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[X* ω,l・Yω,l]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]を用いて、再生信号スペクトルXω,lと収音信号スペクトルYω,lとの類似度係数r’ω,lを
In the present embodiment, the calculation means for calculating the sum of the square of the amplitude of the reproduction signal spectrum (power spectrum) and the calculation means for calculating the sum of the square of the amplitude of the collected sound signal spectrum (power spectrum) are separated. . However, the input spectrum can be selected and the sum of the square of the amplitude of the reproduced signal spectrum (power spectrum) and the sum of the square of the amplitude of the collected signal spectrum (power spectrum) can be calculated by the same calculation means. Also good.
Next, the expected value (average value) of the two-dimensional vector of time and frequency E t, f [X * ω, l · Yω, l ], E t, f [| X ω, l | 2 ], E t , F [| Y ω, l | 2 ], the similarity coefficient r ′ ω, l between the reproduction signal spectrum X ω, l and the collected sound signal spectrum Y ω, l is obtained.
このような方法により類似度係数を求めるので、時間ベクトルを短時間にした場合にも類似度計算に利用できる特徴量を補うことができる。したがって、時間ベクトルを短時間にしても類似度計算の精度の低下を防ぐことができる。また、エコー消去技術に適用した場合には、エコー経路が頻繁に変化する場合でも、短時間で追従できる。
Since the similarity coefficient is obtained by such a method, it is possible to supplement the feature quantity that can be used for the similarity calculation even when the time vector is shortened. Therefore, even if the time vector is shortened, it is possible to prevent a decrease in the accuracy of similarity calculation. Further, when applied to the echo cancellation technique, even if the echo path changes frequently, it can be tracked in a short time.
[第2実施形態]
第2実施形態のエコー消去装置200’も、図3の機能構成例と図4の処理フロー例で説明する。第1実施形態と異なる点は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[X* ω,l・Yω,l]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]の計算で、点(ω,l)で極大値を持つ重み付け二次元窓関数Wm,nを用いることである。
[Second Embodiment]
The echo canceling apparatus 200 ′ of the second embodiment will also be described with reference to the functional configuration example of FIG. 3 and the processing flow example of FIG. The difference from the first embodiment is that an expected value (average value) of a two-dimensional vector of time and frequency E t, f [X * ω, l · Y ω, l ], E t, f [| X ω, l In the calculation of | 2 ], E t, f [| Y ω, l | 2 ], the weighted two-dimensional window function W m, n having the maximum value at the point (ω, l) is used.
そこで、エコー消去装置200’の二次元類似度計算部203’は、重み係数計算手段2034を有する。重み係数計算手段2034は、例えば、
Therefore, the two-dimensional similarity calculation unit 203 ′ of the echo canceller 200 ′ has a weight
次に、第1の計算手段2031’、第2の計算手段2032’、第3の計算手段2033’が、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[X* ω,l・Yω,l]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]を、
その他の処理は、第1実施形態と同じである。
[第3実施形態]
図5に、第3実施形態のエコー消去装置の機能構成例を示す。また、図6にエコー消去装置200bの処理フロー例を示す。エコー消去装置200bは、再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203b、ゲイン計算部104、積算部6、および周波数合成部105から構成される。類似度計算部103が二次元類似度計算部203bに置き換わった以外は、従来技術と同じ構成である。以下に、図1と異なる二次元類似度計算部203bについて説明する。
なお、第3実施形態のエコー消去装置は、再生信号と収音信号のクロススペクトルを式(1)の代わりに式(2)で計算する点で、第1実施形態のエコー消去装置と異なる。
Next, the
Other processes are the same as those in the first embodiment.
[Third Embodiment]
FIG. 5 shows an example of the functional configuration of the echo cancellation apparatus of the third embodiment. FIG. 6 shows a processing flow example of the echo canceller 200b. The echo canceller 200b includes a reproduction signal
Note that the echo canceller of the third embodiment is different from the echo canceller of the first embodiment in that the cross spectrum of the reproduction signal and the collected sound signal is calculated by Formula (2) instead of Formula (1).
二次元類似度計算部203bは、再生信号と収音信号の振幅スペクトルの積の和を計算するクロス振幅スペクトル計算手段2031b、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第1パワースペクトル計算手段2032、収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第2パワースペクトル計算手段2033、類似度計算手段2035を備えている。二次元類似度計算部203bは、再生信号スペクトルXω,lと収音信号スペクトルYω,lを入力とする。
クロス振幅スペクトル計算手段2031bは、再生信号スペクトルXω,lの振幅と収音信号スペクトルYω,lの振幅の積の期待値(平均値)Et,f[|Xω,l|・|Yω,l|]を
第1パワースペクトル計算手段2032は、再生信号スペクトルXω,lの振幅の二乗の期待値(平均値)Et,f[|Xω,l|2]を
第2パワースペクトル計算手段2033は、収音信号スペクトルYω,lの振幅の二乗の期待値(平均値)Et,f[|Yω,l|2]を、
The cross amplitude
The first power spectrum calculation means 2032 calculates the expected value (average value) E t, f [| X ω, l | 2 ] of the square of the amplitude of the reproduction signal spectrum X ω, l .
The second power spectrum calculation means 2033 calculates the expected value (average value) E t, f [| Y ω, l | 2 ] of the square of the amplitude of the collected sound signal spectrum Y ω, l ,
ここで、m、n、M、Nはそれぞれ自然数、ω+mはωからmサンプルシフトした値、l+nはlからnフレームシフトした値である。例えば、Mを5、Nを10とする。このように、時間軸方向だけでなく、周波数方向にも加算することで、サンプル数を増やすことができる。したがって、時間軸方向のサンプル数を少なく(言い換えると、短時間に)することができる。
なお、上記のEt,f[|Xω,l|・|Yω,l|]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]は、単なる和を求めており、期待値(平均値)を求める式とはなっていない。しかし、後述の類似度係数r’ω,lを求める式で、Et,f[Xω,l・Yω,l]の二乗が分子、Et,f[|Xω,l|2]とEt,f[|Yω,l|2]の積が分母となるため、単なる和を求めても、類似度係数r’ω,lの値は同じである。
Here, m, n, M, and N are natural numbers, ω + m is a value obtained by shifting m samples from ω, and l + n is a value obtained by shifting n frames from l. For example, M is 5 and N is 10. Thus, the number of samples can be increased by adding not only in the time axis direction but also in the frequency direction. Therefore, the number of samples in the time axis direction can be reduced (in other words, in a short time).
E t, f [| X ω, l | · | Y ω, l |], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ] Merely calculates the sum and is not an equation for calculating the expected value (average value). However, in a formula for calculating a similarity coefficient r ′ ω, l described later, the square of E t, f [X ω, l · Y ω, l ] is a numerator, and E t, f [| X ω, l | 2 ]. And E t, f [| Y ω, l | 2 ] is the denominator. Therefore, even if a simple sum is obtained , the value of the similarity coefficient r ′ ω, l is the same.
また、本実施形態では、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段と収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段とを別々とした。しかし、入力となるスペクトルを選択できるようにし、同一の計算手段で、再生信号スペクトルの振幅の二乗(パワースペクトル)の和も収音信号スペクトルの振幅の二乗(パワースペクトル)の和も計算しても良い。
次に、類似度計算手段2035は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[|Xω,l|・|Yω,l|]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]を用いて、再生信号スペクトルXω,lと収音信号スペクトルYω,lとの類似度係数r’ω,lを
Next, the similarity calculation means 2035 calculates the expected value (average value) E t, f [| X ω, l | · | Y ω, l |], E t, f [| Using X ω, l | 2 ] and E t, f [| Y ω, l | 2 ], the similarity coefficient r ′ ω between the reproduction signal spectrum X ω, l and the collected sound signal spectrum Y ω, l l
このように、振幅スペクトルのみから類似度を計算することで、位相のずれによる相関誤差を回避でき、類似度を高精度に計算できる。また、このような方法により類似度係数を求めるので、時間ベクトルを短時間にした場合にも類似度計算に利用できる特徴量を補うことができる。したがって、時間ベクトルを短時間にしても類似度計算の精度の低下を防ぐことができる。さらに、エコー消去技術に適用した場合には、エコー経路が頻繁に変化する場合でも、短時間で追従できる。 Thus, by calculating the similarity only from the amplitude spectrum, a correlation error due to a phase shift can be avoided, and the similarity can be calculated with high accuracy. In addition, since the similarity coefficient is obtained by such a method, it is possible to supplement the feature amount that can be used for similarity calculation even when the time vector is shortened. Therefore, even if the time vector is shortened, it is possible to prevent a decrease in the accuracy of similarity calculation. Furthermore, when applied to the echo cancellation technique, even if the echo path changes frequently, it can follow in a short time.
以下、図7を用いて、上記の類似度計算部の機能構成の例を説明する。
周波数分析部101から出力された再生信号スペクトルXω,lは、重複分割部2037において、X1−M,l〜X1+M,l、X2−M,l〜X2+M,l、…、Xω−M,l〜Xω+M,l、…、Xωa−M,l〜Xωa+M,lのように周波数分割される。また、周波数分析部102から出力された収音信号スペクトルYω,lは、重複分割部2039において、Y1−M,l〜Y1+M,l、Y2,l〜Y2+M,l、…、Yω−M,l〜Yω+M,l、…、Yωa−M,l〜Yωa+M,lのように周波数分割される。ここで、ωaは、周波数値番号の最大値である。例えば、各フレームにおいて、8kHzまでの周波数帯域をサンプル点数128でスペクトルを表した場合(ω=1,…,128)には、ωa=128となる。
なお、ω<0又はωa<ωのとき、Xω,l、Yω,lは各フレームの範囲外となるため、重複分割部2037と重複分割部2039は、Xω,l=Yω,l=0を出力する。
そして、X1−M,l〜X1+M,lとY1−M,l〜Y1+M,lから、Et,f[|X1,l|・|Y1,l|]、Et,f[|X1,l|2]、Et,f[|Y1,l|2]を求め、これより、類似度係数r’1,lを算出する。これを、すべてのωについて、すなわち、すべてのXω−M,l〜Xω+M,lとYω−M,l〜Yω+M,lの組について、スペクトルをひとつずつずらしながら行うことにより、類似度係数r’ω,lを算出する。
Hereinafter, an example of a functional configuration of the similarity calculation unit will be described with reference to FIG.
The reproduction signal spectrum X ω, l output from the
Note that when ω <0 or ωa <ω, X ω, l , Y ω, l is outside the range of each frame, so the
Then, from X 1-M, l to X 1 + M, l and Y 1- M, l to Y 1 + M, l , E t, f [| X 1, l | · | Y 1, l |], E t, f [| X1 , l | 2 ] and Et, f [| Y1 , l | 2 ] are obtained, and the similarity coefficient r'1 , l is calculated therefrom. This is done by shifting the spectrum one by one for all ω, that is, for all X ω-M, 1 to X ω + M, l and Y ω-M, 1 to Y ω + M, l. The degree coefficient r ′ ω, l is calculated.
[第4実施形態]
第4実施形態のエコー消去装置200b’も、図5の機能構成例と図6の処理フロー例で説明する。第3実施形態と異なる点は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[Xω,l・Yω,l]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]の計算で、点(ω,l)で極大値を持つ重み付け二次元窓関数Wm,nを用いることである。
そこで、エコー消去装置200b’の二次元類似度計算部203b’は、重み係数計算手段2034を有する。重み係数計算手段2034は、例えば、
The echo canceling apparatus 200b ′ of the fourth embodiment will also be described with reference to the functional configuration example of FIG. 5 and the processing flow example of FIG. The difference from the third embodiment is that an expected value (average value) E t, f [X ω, l · Y ω, l ], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ] is to use a weighted two-dimensional window function W m, n having a maximum value at the point (ω, l).
Therefore, the two-dimensional
次に、第1の計算手段2031b’、第2の計算手段2032’、第3の計算手段2033’が、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[Xω+m,l+n・Yω+m,l+n]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]を、
その他の処理は、第3実施形態と同じである。
Next, the
Other processes are the same as those in the third embodiment.
[第5実施形態]
図8に、第5実施形態のエコー消去装置の機能構成例を示す。また、図9にエコー消去装置200cの処理フロー例を示す。エコー消去装置200cは、再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203c、ゲイン計算部104、積算部6、および周波数合成部105から構成される。類似度計算部103が二次元類似度計算部203cに置き換わった以外は、従来技術と同じ構成である。以下に、図1と異なる二次元類似度計算部203cについて説明する。
なお、第5実施形態のエコー消去装置は、再生信号と収音信号のクロススペクトルを式(1)の代わりに式(3)で計算する点で、第1実施形態のエコー消去装置と異なる。
[Fifth Embodiment]
FIG. 8 shows a functional configuration example of the echo cancellation apparatus of the fifth embodiment. FIG. 9 shows a processing flow example of the
Note that the echo canceller of the fifth embodiment is different from the echo canceller of the first embodiment in that the cross spectrum of the reproduction signal and the collected sound signal is calculated by Equation (3) instead of Equation (1).
二次元類似度計算部203cは、再生信号と収音信号のクロススペクトルの和を計算するクロススペクトル計算手段2031c、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第1パワースペクトル計算手段2032、収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する第2パワースペクトル計算手段2033、類似度計算手段2035を備えている。二次元類似度計算部203cは、再生信号スペクトルXω,lと収音信号スペクトルYω,lを入力とする。
クロススペクトル計算手段2031cは、再生信号スペクトルXω,lと収音信号スペクトルYω,lのクロススペクトルの期待値(平均値)Et,f[|Xω,l|・|Yω,l|]を
第1パワースペクトル計算手段2032は、再生信号スペクトルXω,lの振幅の二乗の期待値(平均値)Et,f[|Xω,l|2]を
第2パワースペクトル計算手段2033は、収音信号スペクトルYω,lの振幅の二乗の期待値(平均値)Et,f[|Yω,l|2]を、
Cross
The first power spectrum calculation means 2032 calculates the expected value (average value) E t, f [| X ω, l | 2 ] of the square of the amplitude of the reproduction signal spectrum X ω, l .
The second power spectrum calculation means 2033 calculates the expected value (average value) E t, f [| Y ω, l | 2 ] of the square of the amplitude of the collected sound signal spectrum Y ω, l ,
ここで、m、n、M1、M2、N1、N2はそれぞれ自然数、ω+mはωからmサンプルシフトした値、l+nはlからnフレームシフトした値である。例えば、M1を5、M2を5、N1を10、N2を10とする。このように、時間軸方向だけでなく、周波数方向にも加算することで、サンプル数を増やすことができる。したがって、時間軸方向のサンプル数を少なく(言い換えると、短時間に)することができる。
なお、上記のEt,f[|Xω,l|・|Yω,l|]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]は、単なる和を求めており、期待値(平均値)を求める式とはなっていない。しかし、後述の類似度係数r’ω,lを求める式で、Et,f[Xω,l・Yω,l]の二乗が分子、Et,f[|Xω,l|2]とEt,f[|Yω,l|2]の積が分母となるため、単なる和を求めても、類似度係数r’ω,lの値は同じである。
Here, m, n, M 1 , M 2 , N 1 and N 2 are natural numbers, ω + m is a value obtained by shifting m samples from ω, and l + n is a value obtained by shifting 1 frame by n frames. For example, M 1 is 5, M 2 is 5, N 1 is 10, and N 2 is 10. Thus, the number of samples can be increased by adding not only in the time axis direction but also in the frequency direction. Therefore, the number of samples in the time axis direction can be reduced (in other words, in a short time).
E t, f [| X ω, l | · | Y ω, l |], E t, f [| X ω, l | 2 ], E t, f [| Y ω, l | 2 ] Merely calculates the sum and is not an equation for calculating the expected value (average value). However, in a formula for calculating a similarity coefficient r ′ ω, l described later, the square of E t, f [X ω, l · Y ω, l ] is a numerator, and E t, f [| X ω, l | 2 ]. And E t, f [| Y ω, l | 2 ] is the denominator. Therefore, even if a simple sum is obtained , the value of the similarity coefficient r ′ ω, l is the same.
また、本実施形態では、再生信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段と収音信号スペクトルの振幅の二乗(パワースペクトル)の和を計算する計算手段とを別々とした。しかし、入力となるスペクトルを選択できるようにし、同一の計算手段で、再生信号スペクトルの振幅の二乗(パワースペクトル)の和も収音信号スペクトルの振幅の二乗(パワースペクトル)の和も計算しても良い。
次に、類似度計算手段2035は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[|Xω,l|・|Yω,l|]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]を用いて、再生信号スペクトルXω,lと収音信号スペクトルYω,lとの類似度係数r’ω,lを
Next, the similarity calculation means 2035 calculates the expected value (average value) E t, f [| X ω, l | · | Y ω, l |], E t, f [| Using X ω, l | 2 ] and E t, f [| Y ω, l | 2 ], the similarity coefficient r ′ ω between the reproduction signal spectrum X ω, l and the collected sound signal spectrum Y ω, l l
第1実施形態が二次元の複素相関に基づく類似度計算装置、第3実施形態が二次元の振幅相関に基づく類似度計算装置であるのに対し、第5実施形態では、時間方向の複素相関の絶対値から周波数方向の相関を計算することで、周波数方向の位相のずれによる相関誤差を回避して二次元複素相関よりも類似度を高精度に計算できる。また、時間方向の位相を考慮することで特徴量が増加し、二次元振幅相関より時間ベクトルを短時間にしても高精度に類似度を計算できる。 The first embodiment is a similarity calculation device based on a two-dimensional complex correlation, and the third embodiment is a similarity calculation device based on a two-dimensional amplitude correlation, whereas the fifth embodiment is a complex correlation in the time direction. By calculating the correlation in the frequency direction from the absolute value of, the correlation error due to the phase shift in the frequency direction can be avoided and the similarity can be calculated with higher accuracy than the two-dimensional complex correlation. Also, the feature amount increases by considering the phase in the time direction, and the similarity can be calculated with high accuracy even if the time vector is shortened by two-dimensional amplitude correlation.
[第6実施形態]
第6実施形態のエコー消去装置200c’も、図8の機能構成例と図9の処理フロー例で説明する。第5実施形態と異なる点は、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[Xω,l・Yω,l]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]の計算で、点(ω,l)で極大値を持つ重み付け二次元窓関数Wm,nを用いることである。
そこで、エコー消去装置200c’の二次元類似度計算部203c’は、重み係数計算手段2034を有する。重み係数計算手段2034は、例えば、
The
Therefore, the two-dimensional
次に、第1の計算手段2031c’、第2の計算手段2032’、第3の計算手段2033’が、時間と周波数の二次元ベクトルの期待値(平均値)Et,f[Xω+m,l+n・Yω+m,l+n]、Et,f[|Xω,l|2]、Et,f[|Yω,l|2]を、
その他の処理は、第5実施形態と同じである。
Next, the
Other processes are the same as those in the fifth embodiment.
[第7実施形態]
図10に、本発明の二次元類似度計算部と適応フィルタとを用いたエコー消去装置の機能構成例を示す。適応フィルタ301には、従来技術を用いればよい。図11に、適応フィルタの機能構成例を示す。また、エコー消去装置300の処理フローを図12に示す。エコー消去装置300は、再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203、および適応フィルタ301から構成される。適応フィルタ301は、再生信号用の周波数分析部101’、収音信号用の周波数分析部102’、更新量計算部302、積算部6’、フィルタ更新部303、フィルタ計算部304、加算部7、および周波数合成部105’から構成される。
[Seventh Embodiment]
FIG. 10 shows a functional configuration example of an echo canceller using the two-dimensional similarity calculation unit and the adaptive filter of the present invention. A conventional technique may be used for the
再生信号用の周波数分析部101、収音信号用の周波数分析部102、二次元類似度計算部203の処理フロー(ステップS101、S102、S203)は、第1実施形態と同じである。以下では、適応フィルタ301の処理フロー(ステップS301)について説明する。
再生信号用の周波数分析部101’は、再生信号x(k)を入力とし、再生信号スペクトルXω,lを出力する(ステップS101’)。収音信号用の周波数分析部102’は、収音信号y(k)を入力とし、収音信号スペクトルYω,lを出力する(ステップS102’)。更新量計算部302は、再生信号スペクトルXω,lとエコー消去信号スペクトルEω,lを入力とし、フィルタ更新量ΔH^ω,lを計算する(ステップS302)。フィルタ更新量ΔH^ω,lの計算方法としては、例えばFLMS(Fast Least-Mean Square)アルゴリズム(Ferrara E.Jr., Widrow B., “Acoustics Speech and Signal Processing”, IEEE Transactions on Signal Processing, vol.29, Issue 3, Jun 1981pp.679-683.)を用いることができる。フィルタ更新量ΔH^ω,lは、前記文献中の式(15)の右辺第2項に相当する。
The processing flow (steps S101, S102, S203) of the reproduction signal
The reproduction signal
積算部6’は、フィルタ更新量ΔH^ω,lに類似度係数r’ω,lを積算し、フィルタ積算更新量r’ω,l・ΔH^ω,lを出力する(ステップS6’)。積算部6’によって、ダブルトーク(エコー信号に送話者の信号が混入する状態)雑音などの外乱に起因するエコー消去装置の性能劣化を、抑圧することができる。フィルタ積算更新量は、フィルタ更新量ΔH^ω,lと類似度係数r’ω,lとのその他の積算でも良い。
フィルタ更新部303は、フィルタ積算更新量r’ω,l・ΔH^ω,lを入力とし、フィルタ係数H^ω,lを出力する(ステップS303)。ここで、フィルタ係数H^ω,lは、
H^ω,l=H^ω,l−1+r’ω,l・ΔH^ω,l
により求める。なお、l−1とは、1フレーム前を示す値である。類似度係数r’ω,lは、マイクロホン2でエコー信号のみが収音された場合(受話シングルトークの状態)には、1に近い値となる。また、ダブルトークや雑音が多い場合には、0に近い値となる。このような類似度係数r’ω,lが、フィルタ更新量ΔH^ω,lに積算されることで、適応フィルタの更新量が制御される。
Integrating unit 6 ', the filter update amount [Delta] H ^ omega, similarity coefficient r to l' omega, integrates the l, filter accumulated update value r 'ω, l · ΔH ^ ω, and outputs the l (step S6') . The accumulating
The
H ^ ω, l = H ^ ω, l-1 + r'ω, l · ΔH ^ ω, l
Ask for. Note that l−1 is a value indicating the previous frame. The similarity coefficient r ′ ω, l is a value close to 1 when only the echo signal is collected by the microphone 2 (in the state of received single talk). In addition, when there is a lot of double talk or noise, the value is close to zero. The similarity coefficient r ′ ω, l is added to the filter update amount ΔH ^ ω, l , whereby the update amount of the adaptive filter is controlled.
フィルタ計算部304は、再生信号スペクトルXω,lとフィルタ係数H^ω,lを入力とし、擬似エコー信号スペクトルD^ω,lを出力する(ステップS304)。擬似エコー信号スペクトルD^ω,lは、
D^ω,l=H^ω,l・Xω,l
により求める。
加算部7は、収音信号スペクトルYω,lから擬似エコー信号スペクトルD^ω,lを減算し、エコー消去信号スペクトルEω,lを得る(ステップS7)。周波数合成部105’は、各周波数成分ωに対応するエコー消去信号スペクトルEω,lから、時間領域の信号e(k)を再合成して出力する(ステップS105’)。
The
D ^ ω, l = H ^ ω, l・Xω, l
Ask for.
Adding
このような方法により類似度係数を求めるので、時間ベクトルを短時間にした場合にも類似度計算に利用できる特徴量を補うことができる。したがって、時間ベクトルを短時間にしても類似度計算の精度の低下を防ぐことができる。また、エコー消去技術に適用した場合には、エコー経路が頻繁に変化する場合でも、短時間で追従できる。なお、二次元類似度計算部203の代わりに、第2実施形態の二次元類似度計算部203’、第3実施形態の二次元類似度計算部203b、第4実施形態の二次元類似度計算部203b’、第5実施形態の二次元類似度計算部203c、第6実施形態の二次元類似度計算部203c’を用いても良い。
Since the similarity coefficient is obtained by such a method, the feature quantity that can be used for similarity calculation can be supplemented even when the time vector is shortened. Therefore, even if the time vector is shortened, it is possible to prevent a decrease in the accuracy of similarity calculation. Further, when applied to the echo cancellation technique, even if the echo path changes frequently, it can be tracked in a short time. In place of the two-dimensional similarity calculation unit 203, the two-dimensional similarity calculation unit 203 ′ of the second embodiment, the two-dimensional
[変形例等]
本発明の類似度計算方法は、エコー消去装置以外に適用しても良い。第1実施形態〜第4実施形態の二次元類似度計算部において、一般に、時間軸方向の所定の範囲−N1〜N2、かつ、周波数軸方向の所定の範囲−M1〜M2の範囲でスペクトルの積の和を計算しても良い。すなわち、例えば、第1実施形態の二次元類似度計算部203の第1の計算手段2031が、N1、N2、M1、M2をそれぞれ自然数とし、式(1)に代えて次式でクロススペクトルの和を計算してもよい。
ここで、第1実施形態〜第6実施形態において、M1、M2はサンプリング周波数に依存する整数であり、例えば、サンプリング周波数が16kHzの場合、M1は2から10の間の値、M2も2から10の値に設定するとよい。特に、M1=5、M2=5の付近でM1とM2を設定するのが望ましい。サンプリング周波数が2倍になれば、M1とM2の値も2倍にするとよい。一方、N1、N2は使用環境における残響時間及び雑音に係る時定数に依存する自然数で、例えば、N1=10、N2=0とする。残響時間が長い場合には、例えば、N1=100、N2=0とする。
[Modifications, etc.]
The similarity calculation method of the present invention may be applied to devices other than the echo canceller. In the two-dimensional similarity calculation unit according to the first to fourth embodiments, generally, a predetermined range −N 1 to N 2 in the time axis direction and a predetermined range −M 1 to M 2 in the frequency axis direction. The sum of spectral products may be calculated over a range. That is, for example, the
Here, in the first to sixth embodiments, M 1 and M 2 are integers depending on the sampling frequency. For example, when the sampling frequency is 16 kHz, M 1 is a value between 2 and 10, M 2 may also be set to a value from 2 to 10. In particular, it is desirable to set M 1 and M 2 in the vicinity of M 1 = 5 and M 2 = 5. If the sampling frequency is doubled, the values of M 1 and M 2 are preferably doubled. On the other hand, N 1 and N 2 are natural numbers depending on reverberation time and noise time constant in the usage environment, and for example, N 1 = 10 and N 2 = 0. When the reverberation time is long, for example, N 1 = 100 and N 2 = 0.
本発明による類似度計算方法及びエコー消去方法の各ステップをコンピュータで実行可能なプログラムとして記述し、コンピュータでこの発明を実行してもよい。また、そのプログラムは、コンピュータで読み取り可能な記録媒体に記録しておき、そのプログラムを読み出して実行してもよい。
例えば、図13に示すように、各部がバス50に接続され、メモリ52に類似度計算プログラムが、又は、メモリ53にエコー消去プログラムが、CD−ROM、ハードディスクなどから、あるいは通信回線を介してインストールされてある。CPU51がこの類似度計算プログラム又はエコー消去プログラムを実行することにより、類似度計算方法又はエコー消去方法を実行することができる。記憶部55は、一時的にデータを記憶するためなどに用いられる。
Each step of the similarity calculation method and echo cancellation method according to the present invention may be described as a computer-executable program, and the present invention may be executed by the computer. The program may be recorded on a computer-readable recording medium, and the program may be read and executed.
For example, as shown in FIG. 13, each unit is connected to a bus 50, and a similarity calculation program is stored in the
なお、第1実施形態における第1の計算手段2031(図3)、第2実施形態における第1の計算手段2031’(図3)、第3実施形態におけるクロス振幅スペクトル計算手段2031b(図5)、第4実施形態におけるクロススペクトル計算手段2031c(図8)、第5実施形態におけるクロススペクトル計算手段2031c’(図8)は、2つの信号のスペクトルの積の和を求めるという点で共通している。特許請求の範囲及び明細書における積和計算手段は、これらの計算手段を意味する。 The first calculation means 2031 (FIG. 3) in the first embodiment, the first calculation means 2031 ′ (FIG. 3) in the second embodiment, and the cross amplitude spectrum calculation means 2031b (FIG. 5) in the third embodiment. The cross spectrum calculation means 2031c (FIG. 8) in the fourth embodiment and the cross spectrum calculation means 2031c ′ (FIG. 8) in the fifth embodiment are common in that they obtain the sum of the products of the spectra of the two signals. Yes. The product-sum calculation means in the claims and the specification means these calculation means.
Claims (24)
各信号スペクトルは、所定のサンプル数(以下、「フレーム」という。)、所定の周波数間隔(以下、「周波数値」という。)ごとに分析されたスペクトルであり、
周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの積の和を求める積和計算手段と
周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、各信号スペクトルの振幅の二乗の和を求めるパワースペクトル計算手段と
前記積和計算手段の出力と前記パワースペクトル計算手段の出力から類似度係数を求める類似度係数計算手段
を備える類似度計算装置。 A similarity calculation device for calculating a similarity between two signal spectra,
Each signal spectrum is a spectrum analyzed at a predetermined number of samples (hereinafter referred to as “frame”) and a predetermined frequency interval (hereinafter referred to as “frequency value”).
Product sum calculation means for calculating the sum of products of two signal spectra within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction, and within a predetermined range in the frequency axis direction and a predetermined range in the time axis direction A power spectrum calculation means for obtaining a sum of squares of the amplitudes of each signal spectrum, a similarity coefficient calculation means for obtaining a similarity coefficient from the output of the product-sum calculation means and the output of the power spectrum calculation means apparatus.
前記積和計算手段は、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号のクロススペクトルの和を求めるクロススペクトル計算手段である
ことを特徴とする類似度計算装置。 The similarity calculation apparatus according to claim 1,
The product sum calculation means is a cross spectrum calculation means for obtaining a sum of cross spectra of two signals within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. apparatus.
前記積和計算手段は、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの振幅の積の和を求めるクロス振幅スペクトル計算手段である
ことを特徴とする類似度計算装置。 The similarity calculation apparatus according to claim 1,
The product sum calculation means is a cross amplitude spectrum calculation means for obtaining a sum of amplitude products of two signal spectra within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. Similarity calculation device.
前記積和計算手段は、2つの信号のクロススペクトルの時間軸方向の所定の範囲における和の絶対値を求め、その絶対値について周波数軸方向の所定の範囲における和を求めるクロススペクトル計算手段である
ことを特徴とする類似度計算装置。 The similarity calculation apparatus according to claim 1,
The product-sum calculation unit is a cross-spectrum calculation unit that calculates an absolute value of a sum of a cross spectrum of two signals in a predetermined range in the time axis direction and calculates a sum of the absolute value in a predetermined range in the frequency axis direction. The similarity calculation apparatus characterized by the above.
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数とするときに、
前記クロススペクトル計算手段は、
前記パワースペクトル計算手段は、
前記類似度係数計算手段は、類似度係数r’ω,lを
ことを特徴とする類似度計算装置。 The similarity calculation device according to claim 2,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross spectrum calculation means includes:
The power spectrum calculation means includes
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数とするときに、
前記クロス振幅スペクトル計算手段は、
前記パワースペクトル計算手段は、
前記類似度係数計算手段は、類似度係数r’ω,lを
ことを特徴とする類似度計算装置。 The similarity calculation device according to claim 3,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross amplitude spectrum calculating means includes:
The power spectrum calculation means includes
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数とするときに、
前記クロススペクトル計算手段は、
前記パワースペクトル計算手段は、
前記類似度係数計算手段は、類似度係数r’ω,lを
ことを特徴とする類似度計算装置。 The similarity calculation device according to claim 4,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross spectrum calculation means includes:
The power spectrum calculation means includes
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数、Wm,nを重みとするときに、
前記クロススペクトル計算手段は、
前記パワースペクトル計算手段は、
前記類似度係数計算手段は、類似度係数r’ω,lを
ことを特徴とする類似度計算装置。 The similarity calculation device according to claim 2,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross spectrum calculation means includes:
The power spectrum calculation means includes
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数、Wm,nを重みとするときに、
前記クロス振幅スペクトル計算手段は、
前記パワースペクトル計算手段は、
前記類似度係数計算手段は、類似度係数r’ω,lを
ことを特徴とする類似度計算装置。 The similarity calculation device according to claim 3,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross amplitude spectrum calculating means includes:
The power spectrum calculation means includes
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数、Wm,nを重みとするときに、
前記クロススペクトル計算手段は、
前記パワースペクトル計算手段は、
前記類似度係数計算手段は、類似度係数r’ω,lを
ことを特徴とする類似度計算装置。 The similarity calculation device according to claim 4,
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross spectrum calculation means includes:
The power spectrum calculation means includes
The similarity coefficient calculation means calculates the similarity coefficient r ′ ω, l .
収音信号を周波数分析して収音信号スペクトルを得る第2の周波数分析部と、
前記再生信号スペクトルと前記収音信号スペクトルとの類似度係数を計算する請求項1から10のいずれかに記載の類似度計算装置と、
前記類似度係数を前記収音信号スペクトルから、ゲイン係数を求めるゲイン計算部と、
前記ゲイン係数を前記収音信号スペクトルに積算し、エコー消去スペクトルを得る積算部と、
前記エコー消去スペクトルから時間領域の信号を得る周波数合成部
を備えるエコー消去装置。 A first frequency analysis unit for frequency analysis of the reproduction signal to obtain a reproduction signal spectrum;
A second frequency analysis unit that performs frequency analysis of the collected sound signal to obtain a collected sound signal spectrum;
The similarity calculation device according to any one of claims 1 to 10, which calculates a similarity coefficient between the reproduction signal spectrum and the collected sound signal spectrum;
A gain calculation unit for obtaining a gain coefficient from the collected sound signal spectrum for the similarity coefficient;
An integration unit that integrates the gain coefficient into the collected sound signal spectrum and obtains an echo cancellation spectrum;
An echo canceller comprising a frequency synthesizer that obtains a time-domain signal from the echo cancel spectrum.
収音信号を周波数分析して収音信号スペクトルを得る第2の周波数分析部と、
前記再生信号スペクトルと前記収音信号スペクトルとの類似度係数を計算する請求項1から10のいずれかに記載の類似度計算装置と、
前記再生信号、前記収音信号および前記類似度係数を用いて、前記収音信号中の前記再生信号の成分を消去した出力信号を得る適応フィルタ部
を備えるエコー消去装置。 A first frequency analysis unit for frequency analysis of the reproduction signal to obtain a reproduction signal spectrum;
A second frequency analysis unit that performs frequency analysis of the collected sound signal to obtain a collected sound signal spectrum;
The similarity calculation device according to any one of claims 1 to 10, which calculates a similarity coefficient between the reproduction signal spectrum and the collected sound signal spectrum;
An echo cancellation apparatus comprising: an adaptive filter unit that obtains an output signal obtained by canceling a component of the reproduction signal in the sound pickup signal, using the reproduction signal, the sound pickup signal, and the similarity coefficient.
各信号スペクトルは、所定のサンプル数(以下、「フレーム」という。)、所定の周波数間隔(以下、「周波数値」という。)ごとに分析されたスペクトルであり、
周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの積の和を求める積和計算ステップと
周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、各信号スペクトルの振幅の二乗の和を求めるパワースペクトル計算ステップと
前記積和計算ステップの出力と前記パワースペクトル計算ステップの出力から類似度係数を求める類似度係数計算ステップ
を有する類似度計算方法。 A similarity calculation method for calculating a similarity between two signal spectra,
Each signal spectrum is a spectrum analyzed at a predetermined number of samples (hereinafter referred to as “frame”) and a predetermined frequency interval (hereinafter referred to as “frequency value”).
A product-sum calculation step for obtaining a sum of products of two signal spectra within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction; and within a predetermined range in the frequency axis direction and a predetermined range in the time axis direction A power spectrum calculation step for obtaining a sum of squares of amplitudes of respective signal spectra, a similarity coefficient calculation step for obtaining a similarity coefficient from the output of the product-sum calculation step and the output of the power spectrum calculation step. Method.
前記積和計算ステップは、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号のクロススペクトルの和を求めるクロススペクトル計算ステップである
ことを特徴とする類似度計算方法。 The similarity calculation method according to claim 13,
The product sum calculation step is a cross spectrum calculation step for obtaining a sum of cross spectra of two signals within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. Method.
前記積和計算ステップは、周波数軸方向の所定の範囲内かつ時間軸方向の所定の範囲内で、2つの信号スペクトルの振幅の積の和を求めるクロス振幅スペクトル計算ステップである
ことを特徴とする類似度計算方法。 The similarity calculation method according to claim 13,
The product sum calculation step is a cross amplitude spectrum calculation step for obtaining a sum of products of amplitudes of two signal spectra within a predetermined range in the frequency axis direction and within a predetermined range in the time axis direction. Similarity calculation method.
前記積和計算ステップは、2つの信号のクロススペクトルの時間軸方向の所定の範囲における和の絶対値を求め、その絶対値について周波数軸方向の所定の範囲における和を求めるクロススペクトル計算ステップである
ことを特徴とする類似度計算方法。 The similarity calculation method according to claim 13,
The product-sum calculation step is a cross-spectrum calculation step for obtaining an absolute value of a sum of a cross spectrum of two signals in a predetermined range in the time axis direction and calculating a sum of the absolute values in a predetermined range in the frequency axis direction. A similarity calculation method characterized by the above.
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数とするときに、
前記クロススペクトル計算ステップは、
前記パワースペクトル計算ステップは、
前記類似度係数計算ステップは、類似度係数r’ω,lを
ことを特徴とする類似度計算方法。 The similarity calculation method according to claim 14, wherein
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross spectrum calculation step includes:
The power spectrum calculation step includes:
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数とするときに、
前記クロス振幅スペクトル計算ステップは、
前記パワースペクトル計算ステップは、
前記類似度係数計算ステップは、類似度係数r’ω,lを
ことを特徴とする類似度計算方法。 The similarity calculation method according to claim 15, comprising:
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross amplitude spectrum calculation step includes:
The power spectrum calculation step includes:
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数とするときに、
前記クロススペクトル計算ステップは、
前記パワースペクトル計算ステップは、
前記類似度係数計算ステップは、類似度係数r’ω,lを
ことを特徴とする類似度計算方法。 The similarity calculation method according to claim 16, comprising:
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame and N 1 , N 2 , M 1 , M 2 are natural numbers,
The cross spectrum calculation step includes:
The power spectrum calculation step includes:
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数、Wm,nを重みとするときに、
前記クロススペクトル計算ステップは、
前記パワースペクトル計算ステップは、
前記類似度係数計算ステップは、類似度係数r’ω,lを
ことを特徴とする類似度計算方法。 The similarity calculation method according to claim 14, wherein
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross spectrum calculation step includes:
The power spectrum calculation step includes:
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数、Wm,nを重みとするときに、
前記クロス振幅スペクトル計算ステップは、
前記パワースペクトル計算ステップは、
前記類似度係数計算ステップは、類似度係数r’ω,lを
ことを特徴とする類似度計算方法。 The similarity calculation method according to claim 15, comprising:
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross amplitude spectrum calculation step includes:
The power spectrum calculation step includes:
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
Xω,lとYω,lをl番目のフレームのω番目の周波数値に対する信号スペクトル、N1、N2、M1、M2を自然数、Wm,nを重みとするときに、
前記クロススペクトル計算ステップは、
前記パワースペクトル計算ステップは、
前記類似度係数計算ステップは、類似度係数r’ω,lを
ことを特徴とする類似度計算方法。 The similarity calculation method according to claim 16, comprising:
When X ω, l and Y ω, l are signal spectra for the ω-th frequency value of the l-th frame, N 1 , N 2 , M 1 , M 2 are natural numbers, and W m, n is a weight,
The cross spectrum calculation step includes:
The power spectrum calculation step includes:
In the similarity coefficient calculation step, the similarity coefficient r ′ ω, l is calculated.
収音信号を周波数分析して収音信号スペクトルを得る第2の周波数分析ステップと、
前記再生信号スペクトルと前記収音信号スペクトルとの類似度係数を計算する請求項13から22のいずれかに記載の類似度計算方法と、
前記類似度係数を前記収音信号スペクトルから、ゲイン係数を求めるゲイン計算ステップと、
前記ゲイン係数を前記収音信号スペクトルに積算し、エコー消去スペクトルを得る積算ステップと、
前記エコー消去スペクトルから時間領域の信号を得る周波数合成ステップ
を有するエコー消去方法。 A first frequency analysis step of obtaining a reproduction signal spectrum by frequency analysis of the reproduction signal;
A second frequency analysis step of performing frequency analysis of the collected sound signal to obtain a collected sound signal spectrum;
The similarity calculation method according to any one of claims 13 to 22, wherein a similarity coefficient between the reproduced signal spectrum and the collected sound signal spectrum is calculated.
A gain calculating step for obtaining a gain coefficient from the collected sound signal spectrum from the similarity coefficient;
Integrating the gain factor to the collected sound signal spectrum to obtain an echo cancellation spectrum;
An echo cancellation method comprising: a frequency synthesis step of obtaining a time domain signal from the echo cancellation spectrum.
収音信号を周波数分析して収音信号スペクトルを得る第2の周波数分析ステップと、
前記再生信号スペクトルと前記収音信号スペクトルとの類似度係数を計算する請求項13から22のいずれかに記載の類似度計算方法と、
前記再生信号、前記収音信号および前記類似度係数を用いて、前記収音信号中の前記再生信号の成分を消去した出力信号を得る適応フィルタステップ
を有するエコー消去方法。 A first frequency analysis step of obtaining a reproduction signal spectrum by frequency analysis of the reproduction signal;
A second frequency analysis step of performing frequency analysis of the collected sound signal to obtain a collected sound signal spectrum;
The similarity calculation method according to any one of claims 13 to 22, wherein a similarity coefficient between the reproduced signal spectrum and the collected sound signal spectrum is calculated.
An echo canceling method comprising: an adaptive filter step of obtaining an output signal from which a component of the reproduced signal in the collected sound signal is eliminated, using the reproduced signal, the collected sound signal, and the similarity coefficient.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006305023A JP4520970B2 (en) | 2005-11-21 | 2006-11-10 | Similarity calculation device, echo cancellation device, similarity calculation method, echo cancellation method |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005336244 | 2005-11-21 | ||
JP2006040411 | 2006-02-17 | ||
JP2006305023A JP4520970B2 (en) | 2005-11-21 | 2006-11-10 | Similarity calculation device, echo cancellation device, similarity calculation method, echo cancellation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007251917A true JP2007251917A (en) | 2007-09-27 |
JP4520970B2 JP4520970B2 (en) | 2010-08-11 |
Family
ID=38595688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006305023A Active JP4520970B2 (en) | 2005-11-21 | 2006-11-10 | Similarity calculation device, echo cancellation device, similarity calculation method, echo cancellation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4520970B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010220169A (en) * | 2009-03-19 | 2010-09-30 | Nippon Telegr & Teleph Corp <Ntt> | Multi-channel echo canceling apparatus, method thereof and program thereof |
JP2021079537A (en) * | 2019-11-14 | 2021-05-27 | 株式会社日立製作所 | Method for predicting and maintaining movable device |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134287A (en) * | 1999-11-10 | 2001-05-18 | Mitsubishi Electric Corp | Noise suppressing device |
JP2003188776A (en) * | 2001-12-21 | 2003-07-04 | Nippon Telegr & Teleph Corp <Ntt> | Acoustic echo erasing method and device, and acoustic echo erasure program |
JP2003309493A (en) * | 2002-04-17 | 2003-10-31 | Nippon Telegr & Teleph Corp <Ntt> | Method, device and program for reducing echo |
JP2005107448A (en) * | 2003-10-02 | 2005-04-21 | Nippon Telegr & Teleph Corp <Ntt> | Noise reduction processing method, and device, program, and recording medium for implementing same method |
JP2005292812A (en) * | 2004-03-09 | 2005-10-20 | Nippon Telegr & Teleph Corp <Ntt> | Method and device to discriminate voice and noise, method and device to reduce noise, voice and noise discriminating program, noise reducing program, and recording medium for program |
-
2006
- 2006-11-10 JP JP2006305023A patent/JP4520970B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001134287A (en) * | 1999-11-10 | 2001-05-18 | Mitsubishi Electric Corp | Noise suppressing device |
JP2003188776A (en) * | 2001-12-21 | 2003-07-04 | Nippon Telegr & Teleph Corp <Ntt> | Acoustic echo erasing method and device, and acoustic echo erasure program |
JP2003309493A (en) * | 2002-04-17 | 2003-10-31 | Nippon Telegr & Teleph Corp <Ntt> | Method, device and program for reducing echo |
JP2005107448A (en) * | 2003-10-02 | 2005-04-21 | Nippon Telegr & Teleph Corp <Ntt> | Noise reduction processing method, and device, program, and recording medium for implementing same method |
JP2005292812A (en) * | 2004-03-09 | 2005-10-20 | Nippon Telegr & Teleph Corp <Ntt> | Method and device to discriminate voice and noise, method and device to reduce noise, voice and noise discriminating program, noise reducing program, and recording medium for program |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010220169A (en) * | 2009-03-19 | 2010-09-30 | Nippon Telegr & Teleph Corp <Ntt> | Multi-channel echo canceling apparatus, method thereof and program thereof |
JP2021079537A (en) * | 2019-11-14 | 2021-05-27 | 株式会社日立製作所 | Method for predicting and maintaining movable device |
JP7042315B2 (en) | 2019-11-14 | 2022-03-25 | 株式会社日立製作所 | How to predict and maintain mobile devices |
Also Published As
Publication number | Publication date |
---|---|
JP4520970B2 (en) | 2010-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101168002B1 (en) | Method of processing a noisy sound signal and device for implementing said method | |
JP5528538B2 (en) | Noise suppressor | |
US9818424B2 (en) | Method and apparatus for suppression of unwanted audio signals | |
JP5127754B2 (en) | Signal processing device | |
CN103325380B (en) | Gain for signal enhancing is post-processed | |
JP2004502977A (en) | Subband exponential smoothing noise cancellation system | |
JP5087024B2 (en) | Echo canceling apparatus, method and program | |
EP2710590B1 (en) | Super-wideband noise supression | |
JP5422054B2 (en) | Time domain / frequency domain integrated echo cancellation apparatus and method | |
KR101581885B1 (en) | Apparatus and Method for reducing noise in the complex spectrum | |
CN111988708A (en) | Single-microphone-based howling suppression method and device | |
JP5443547B2 (en) | Signal processing device | |
JP4520970B2 (en) | Similarity calculation device, echo cancellation device, similarity calculation method, echo cancellation method | |
JP5840087B2 (en) | Audio signal restoration apparatus and audio signal restoration method | |
JP2014194437A (en) | Voice processing device, voice processing method and voice processing program | |
JP5889224B2 (en) | Echo suppression gain estimation method, echo canceller and program using the same | |
JP6182862B2 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
JP5769672B2 (en) | Echo suppression gain estimation method, echo canceller and program using the same | |
JP2011254420A (en) | Echo elimination method, echo elimination device, and echo elimination program | |
JP2000105599A (en) | Noise level time variation coefficient calculating method, device thereof, and noise reducing method | |
JP4456594B2 (en) | Acoustic coupling amount calculation device, echo cancellation device and voice switch device using acoustic coupling amount calculation device, call state determination device, method thereof, program thereof and recording medium thereof | |
JP5526053B2 (en) | Echo canceling method, apparatus and program thereof | |
JP5325134B2 (en) | Echo canceling method, echo canceling apparatus, program thereof, and recording medium | |
Diethorn | Subband noise reduction methods for speech enhancement | |
JP7380361B2 (en) | Noise estimation device, noise estimation program, noise estimation method, and sound collection device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080313 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100126 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100511 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100521 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130528 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4520970 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140528 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |