JP2014150367A - Echo suppression gain estimation method, echo cancellation device using the same, and program - Google Patents

Echo suppression gain estimation method, echo cancellation device using the same, and program Download PDF

Info

Publication number
JP2014150367A
JP2014150367A JP2013017312A JP2013017312A JP2014150367A JP 2014150367 A JP2014150367 A JP 2014150367A JP 2013017312 A JP2013017312 A JP 2013017312A JP 2013017312 A JP2013017312 A JP 2013017312A JP 2014150367 A JP2014150367 A JP 2014150367A
Authority
JP
Japan
Prior art keywords
echo
value
power
echo power
correction value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013017312A
Other languages
Japanese (ja)
Other versions
JP5562451B1 (en
Inventor
Katsuhiro Fukui
勝宏 福井
Suehiro Shimauchi
末廣 島内
Kazunori Kobayashi
和則 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013017312A priority Critical patent/JP5562451B1/en
Application granted granted Critical
Publication of JP5562451B1 publication Critical patent/JP5562451B1/en
Publication of JP2014150367A publication Critical patent/JP2014150367A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To provide an echo suppression gain estimation method that is robust to a variation of an echo path.SOLUTION: The echo suppression gain estimation method includes an echo power correction value calculation step and an echo suppression gain calculation step. The echo power correction value calculation step inputs a pickup signal spectrum Yand an echo power estimate |D^|, and determines an echo power correction value Φfrom a least square solution that minimizes a difference between a power |Y|of the pickup signal spectrum Yand the product of the echo power estimate |D^|multiplied by the echo power correction value Φ. The echo suppression gain calculation step inputs the pickup signal spectrum Y, the echo power correction value Φand the echo power estimate |D^|, and calculates a gain coefficient for echo suppression that decreases as the echo power correction value Φincreases.

Description

この発明は、音響再生系を有する通信会議システム等に用いられるエコー消去装置及び、それに適用されるエコー抑圧ゲイン推定方法と、そのプログラムに関する。   The present invention relates to an echo canceller used in a communication conference system having an acoustic reproduction system, an echo suppression gain estimation method applied to the echo canceller, and a program therefor.

短時間スペクトル振幅(STSA:Sort-Time Spectral Amplitude)推定に基づくエコー抑圧処理は、エコーと近端話者音声の無相関を仮定してエコーを抑圧するゲイン係数を推定し、振幅周波数領域でエコーを抑圧する方法であり、例えば非特許文献1に記載されている。これに対し、エコー抑圧後の音声品質向上のため、非特許文献1に記載される上記ゲイン係数の推定方法(以下、「エコー抑圧ゲイン推定方法」と称す)を改善した手法として、特許文献1が提案されている。ここでは、特許文献1に開示されたエコー抑圧ゲイン推定方法を用いたエコー消去装置10の機能構成例を、図10に示してその動作を簡単に説明する。   Echo suppression processing based on short-time spectral amplitude (STSA) estimation estimates a gain coefficient that suppresses echo assuming no correlation between echo and near-end talker speech, and echoes in the amplitude frequency domain Is described in Non-Patent Document 1, for example. On the other hand, Patent Document 1 discloses a technique for improving the gain coefficient estimation method described in Non-Patent Document 1 (hereinafter referred to as “echo suppression gain estimation method”) in order to improve speech quality after echo suppression. Has been proposed. Here, a functional configuration example of the echo cancellation apparatus 10 using the echo suppression gain estimation method disclosed in Patent Document 1 is shown in FIG. 10 and its operation will be briefly described.

エコー消去装置10は、再生信号周波数分析部81と、収音信号周波数分析部82と、エコーパワー推定部83と、類似度係数計算部12と、エコー抑圧ゲイン計算部14と、乗算部85と、周波数合成部86とを備える。再生信号x(k)は、例えばサンプリング周波数16kHzで離散値とされた信号であり、スピーカ1によって音響信号に変換される。なお、再生信号を離散値化するAD変換器と、その離散値を連続値に変換するDA変換器については省略している。ここでkは、所定間隔の離散時間を示すサンプル点の番号であり、再生信号x(k)と収音信号y(k)はディジタル信号である。   The echo cancellation apparatus 10 includes a reproduction signal frequency analysis unit 81, a sound pickup signal frequency analysis unit 82, an echo power estimation unit 83, a similarity coefficient calculation unit 12, an echo suppression gain calculation unit 14, a multiplication unit 85, And a frequency synthesizer 86. The reproduction signal x (k) is a signal having a discrete value at a sampling frequency of 16 kHz, for example, and is converted into an acoustic signal by the speaker 1. Note that an AD converter that converts the reproduction signal into discrete values and a DA converter that converts the discrete values into continuous values are omitted. Here, k is a sample point number indicating a discrete time of a predetermined interval, and the reproduction signal x (k) and the sound collection signal y (k) are digital signals.

再生信号周波数分析部81は、再生信号の離散値を256点集めて1フレームとし、1/2オーバーラップ加算による周波数分析を行い、フレーム単位で8kHzまでの周波数範囲を128個の再生信号スペクトルXω,iに変換する。iはフレーム番号であり、ωはこの例の場合64Hzの間隔で得られる周波数スペクトルの番号(0〜127)である。 The reproduction signal frequency analysis unit 81 collects 256 discrete values of the reproduction signal to form one frame, performs frequency analysis by 1/2 overlap addition, and converts the frequency range up to 8 kHz in units of frames into 128 reproduction signal spectra X Convert to ω, i . i is a frame number, and ω is a frequency spectrum number (0 to 127) obtained at intervals of 64 Hz in this example.

マイクロホン2で収音される収音信号y(k)は、再生信号x(k)がスピーカ1から再生されたことによるエコーd(k)が、近端話者信号s(k)に重畳した信号である。その収音信号y(k)は、再生信号x(k)と同じように収音信号周波数分析部82によって収音信号スペクトルYω,iに変換される。Yω,iはYω,i=Dω,i+Sω,i、Dω,iはエコースペクトル、Sω,iは近端話者信号スペクトル、である。 The collected sound signal y (k) collected by the microphone 2 is superimposed on the near-end speaker signal s (k) by the echo d (k) generated by reproducing the reproduced signal x (k) from the speaker 1. Signal. The collected sound signal y (k) is converted into a collected sound signal spectrum Y ω, i by the collected sound signal frequency analysis unit 82 in the same manner as the reproduction signal x (k). Y ω, i is Y ω, i = D ω, i + S ω, i , D ω, i is an echo spectrum, and S ω, i is a near-end speaker signal spectrum.

エコーパワー推定部83は、再生信号スペクトルXω,iと収音信号スペクトルYω,iとを入力として式(1)に示すエコーパワー推定値|Dω,i^|を計算する。^は推定値であることを表わすが、その表記は式及び図中に示すものが正しい。 The echo power estimator 83 calculates an echo power estimated value | D ω, i ^ | 2 shown in Expression (1) with the reproduction signal spectrum X ω, i and the collected sound signal spectrum Y ω, i as inputs. ^ Represents an estimated value, but the notation is correct as shown in the equations and figures.

ここで、Hω,iはスピーカ1からマイクロホン2に回り込むエコー経路のスペクトル、|Hω,i^|は音響結合量の推定値である。min{ , }は最小値を選択する関数である。したがって、|Hω,i^|は隣接するフレーム間で小さい方の音響結合量がその推定値になる。 Here, H ω, i is the spectrum of the echo path that goes from the speaker 1 to the microphone 2, and | H ω, i ^ | 2 is the estimated value of the acoustic coupling amount. min {,} is a function for selecting the minimum value. Therefore, | H ω, i ^ | 2 is the estimated value of the smaller acoustic coupling amount between adjacent frames.

エコー抑圧ゲイン計算部14は、収音信号スペクトルYω,iと、エコーパワー推定値|Dω,i^|と、類似度係数|rω|を入力として式(2)に示すゲイン係数Gω,iを出力する。ゲイン係数Gω,iは0〜1の実数値をとり、収音信号スペクトルYω,i中にエコー成分が多い場合には小さな値、エコー成分以外の成分が多い場合には大きな値をとる。 The echo suppression gain calculation unit 14 receives the sound pickup signal spectrum Y ω, i , the echo power estimated value | D ω, i ^ | 2, and the similarity coefficient | r ω | G ω, i is output. The gain coefficient G ω, i takes a real value between 0 and 1, and takes a small value when there are many echo components in the collected sound signal spectrum Y ω, i , and a large value when there are many components other than the echo components. .

乗算部85は、収音信号スペクトルYω,iにゲイン係数Gω,iを乗算する。エコー成分が多い場合のゲイン係数Gω,iは小さな値となるので、乗算部85の出力信号はエコー成分が抑圧された近端話者信号スペクトル推定値Sω,i^となる。この各周波数成分ωに対応する近端話者信号スペクトル推定値Sω^は、周波数合成部86において時間領域の出力信号s^(k)に再合成される。 The multiplication unit 85 multiplies the collected sound signal spectrum Y ω, i by a gain coefficient G ω, i . Since the gain coefficient G ω, i when there are many echo components becomes a small value, the output signal of the multiplication unit 85 becomes the near-end speaker signal spectrum estimated value S ω, i ^ with the echo component suppressed. The near-end speaker signal spectrum estimated value S ω ^ corresponding to each frequency component ω is re-synthesized by the frequency synthesizer 86 into a time-domain output signal s ^ (k).

類似度係数計算部12は、再生信号スペクトルXω,iと収音信号スペクトルYω,iとを入力として、内積<Xω,i,Yω,i>を例えば式(3)で、再生信号スペクトルのノルム値‖Xω,i‖と、収音信号スペクトルのノルム値‖Yω,i‖を、例えば式(4)と式(5)でそれぞれ計算する。 The similarity coefficient calculation unit 12 receives the reproduction signal spectrum X ω, i and the collected sound signal spectrum Y ω, i as input, and reproduces the inner product <X ω, i , Y ω, i > by, for example, Expression (3) norm value ‖X signal spectrum omega, i ‖ a norm value of the collected sound signal spectrum ‖Y ω, i ‖, for example to calculate each by the formula (4) and (5).

ここで、*は複素共役であることを表わす。εは0<ε≦1を満たす忘却係数であり、指数関数的な減衰の時定数を決定する。例えばε=0.016とする。εが1に近づくほど現在の再生信号スペクトルXω,iと収音信号スペクトルYω,iに依存した(重み付けされた)それぞれの値になる。なお、隣接周波数にも着目した式(6)〜(8)を用いてもよい。 Here, * represents a complex conjugate. ε is a forgetting factor satisfying 0 <ε ≦ 1, and determines an exponential decay time constant. For example, ε = 0.016. As ε approaches 1, the value depends on (weights) the current reproduction signal spectrum X ω, i and the collected sound signal spectrum Y ω, i . In addition, you may use Formula (6)-(8) which paid its attention also to the adjacent frequency.

ここでM1〜M2は所定の周波数範囲を表わす。式(6)〜(8)は隣接周波数から相関を取った後に時間軸方向の相関を取る形である。相関を取る順番は逆でもよい。また、式(3)に替えて位相成分を考慮しない絶対値から求める式(9)を用いてもよい。 Here, M 1 to M 2 represent a predetermined frequency range. Expressions (6) to (8) are forms in which the correlation in the time axis direction is obtained after obtaining the correlation from the adjacent frequency. The order of correlation may be reversed. Further, instead of Expression (3), Expression (9) obtained from an absolute value that does not consider the phase component may be used.

類似度係数計算部12は、式(3)〜(5)でそれぞれの値を計算した後に、式(10)で類似度係数|rω|を計算する。 The similarity coefficient calculation unit 12 calculates the similarity coefficient | r ω | according to Expression (10) after calculating the respective values according to Expressions (3) to (5).

ここで類似度係数|rω|を算出する式(10)の導出根拠について説明する。 Here, the basis for deriving the equation (10) for calculating the similarity coefficient | r ω | will be described.

例えばウィナーフィルタ法(Wiener Filter以下「WF法」と称す)では、式(11)の評価量eεを最小とするゲイン係数Gω,iを推定してエコーを抑圧する。 For example, in the Wiener filter method (hereinafter referred to as “WF method”), the echo coefficient is suppressed by estimating the gain coefficient G ω, i that minimizes the evaluation amount e ε of Equation (11).

式(11)をGω,iで微分すると次式で表せる。 When equation (11) is differentiated by Gω, i , it can be expressed by the following equation.

式(12)を0と置いた式からゲイン係数Gω,iを求めると式(13)となる。 When the gain coefficient G ω, i is obtained from an equation in which equation (12) is set to 0, equation (13) is obtained.

式(13)を変形するとゲイン係数Gω,iは式(14)で表せる。 When the equation (13) is modified, the gain coefficient G ω, i can be expressed by the equation (14).

ここでrωはエコースペクトルDω,iと近端話者信号スペクトルSω,iの複素コヒーレンスを示す。Dω,i=Hω,i ω,iを用いてrωから未知のベクトルDω,iを消去すると式(15)で表せる。 Here, r ω indicates the complex coherence of the echo spectrum D ω, i and the near-end speaker signal spectrum S ω, i . If the unknown vector D ω, i is eliminated from r ω using D ω, i = H ω, i * X ω, i , it can be expressed by equation (15).

ここで*は複素共役を表す。式(15)から分かるようにDω,iを消去しても未知の変数であるHω,iが存在するため、rωを求めることは困難である。しかし、その絶対値ならば式(16)に示すようにHω,iが消去可能なことに着目する。 Here, * represents a complex conjugate. As can be seen from equation (15), even if D ω, i is eliminated, it is difficult to obtain r ω because there is an unknown variable H ω, i . However, it is noted that H ω, i can be erased as shown in the equation (16) if the absolute value.

そしてゲイン係数を次式に示すように与える。 The gain coefficient is given as shown in the following equation.

この式(17)から明らかなようにゲイン係数Gω,iは、類似度係数|rω|が1に近づくほど小さな値になりエコーが抑圧される。と同時にこのようにして求めたゲイン係数は、近端話者信号s(i)の欠損を軽減するように動作する。つまり、<Dω,i,Sω,i>=0となるほどの長時間を要することなく、短時間のスペクトル振幅を用いてエコーを抑圧するので、内積値が0でない分が誤差となって発生するミュージカルノイズの発生を抑圧することができる。 As is clear from the equation (17), the gain coefficient G ω, i becomes smaller as the similarity coefficient | r ω | approaches 1 and the echo is suppressed. At the same time, the gain coefficient obtained in this way operates to reduce the loss of the near-end speaker signal s (i). That is, the echo is suppressed using the short-time spectrum amplitude without requiring a long time to satisfy <D ω, i , S ω, i > = 0, so that the inner product value is not 0 is an error. Generation of musical noise that occurs can be suppressed.

特許第4787851号Japanese Patent No. 4787851

阪内澄宇、羽田陽一、片岡章俊著「STSA推定に基づくエコー抑圧処理のゲイン強調化方式」信学論(A),1vol.J88-A,no.6,Jun.2005,p695-703Sakauchi, S., Haneda, Y., Kataoka, A., “Echo suppression processing based on STSA estimation, gain emphasis method” (1), 1vol.J88-A, no.6, Jun.2005, p695-703

エコー消去装置の性能は、エコーパワーの推定精度に関係する。そのエコーパワー推定値の精度は、音響結合量(エコー経路のインパルス応答のパワースペクトル)の推定速度に依存する。推定速度が遅い場合、エコー経路が変動し、音響結合量に変化が生じた直後からしばらくの間、エコー消去性能が大きく低下しエコーが消し残ったりミュージカルノイズが発生したりするなどの問題が生じる。しかし、一般的に、近端話者信号などの外乱の影響を回避するため、収音信号の長時間データの分析に基づいて音響結合量が推定されるので、その推定速度を速めることは難しい。   The performance of the echo canceller is related to the estimation accuracy of the echo power. The accuracy of the estimated echo power value depends on the estimated speed of the acoustic coupling amount (power spectrum of the impulse response of the echo path). If the estimated speed is slow, the echo path fluctuates, and the echo cancellation performance drops significantly for a while from the time the acoustic coupling changes, causing problems such as echo remaining unerased or musical noise. . However, in general, in order to avoid the influence of disturbance such as a near-end speaker signal, the amount of acoustic coupling is estimated based on analysis of long-time data of the collected sound signal, so it is difficult to increase the estimated speed. .

この発明は、このような課題に鑑みてなされたものであり、エコー経路変動に強く、ミュージカルノイズの発生を抑圧することができるエコー抑圧ゲイン推定方法と、それを用いたエコー消去装置とプログラムを提供することを目的とする。   The present invention has been made in view of such problems, and is an echo suppression gain estimation method that is resistant to echo path fluctuations and can suppress the occurrence of musical noise, and an echo cancellation apparatus and program using the same. The purpose is to provide.

この発明のエコー抑圧ゲイン推定方法は、再生信号周波数分析段階と、収音信号周波数分析段階と、エコーパワー推定段階と、エコーパワー補正値計算段階と、エコー抑圧ゲイン計算段階と、を有する。再生信号周波数分析段階は、再生信号を周波数領域の再生信号スペクトルXω,iに変換する。収音信号周波数分析段階は、収音信号を周波数領域の収音信号スペクトルYω,iに変換する。エコーパワー推定段階は、再生信号スペクトルXω,iと収音信号スペクトルYω,iとを入力として全周波数領域のエコーパワー推定値|Dω,i^|を計算する。エコーパワー補正値計算段階は、収音信号スペクトルYω,iとエコーパワー推定値|Dω,i^|とを入力として、収音信号スペクトルYω,iのパワー|Yω,iと、エコーパワー推定値|Dω,i^|にエコーパワー補正値Φを乗じた値との差分を最小化する最小二乗解からエコーパワー補正値Φを求める。エコー抑圧ゲイン計算段階は、収音信号スペクトルYω,iとエコーパワー補正値Φとエコーパワー推定値|Dω,i^|とを入力として、エコーを抑圧するゲイン係数を上記エコーパワー補正値Φが大きな値をとるほど小さな値になるように計算する。 The echo suppression gain estimation method of the present invention includes a reproduction signal frequency analysis stage, a sound pickup signal frequency analysis stage, an echo power estimation stage, an echo power correction value calculation stage, and an echo suppression gain calculation stage. The reproduction signal frequency analysis stage converts the reproduction signal into a reproduction signal spectrum Xω, i in the frequency domain. In the collected signal frequency analysis step, the collected signal is converted into a collected signal spectrum Y ω, i in the frequency domain. In the echo power estimation step, the echo power estimated value | D ω, i ^ | 2 in the entire frequency region is calculated by using the reproduction signal spectrum X ω, i and the collected sound signal spectrum Y ω, i as inputs. In the echo power correction value calculation stage, the collected sound signal spectrum Y ω, i and the echo power estimated value | D ω, i ^ | 2 are input, and the power of the collected sound signal spectrum Y ω, i | Y ω, i | 2, the echo power estimate | D ω, i ^ | 2 to obtain the echo-power correction value [Phi i from the least-squares solution that minimizes the difference between the value obtained by multiplying the echo-power correction value [Phi i. Echo suppression gain calculating step, the sound collection signal spectrum Y omega, i and the echo-power correction value [Phi i and echo power estimate | D ω, i ^ | as inputs 2 and, the echo-power the gain coefficient for suppressing an echo Calculation is performed so that the correction value Φ i becomes smaller as the value increases.

この発明のエコー抑圧ゲイン推定方法によれば、エコーパワー推定値|Dω,i^|が、エコーパワー補正値Φによって動的に調整される。エコーパワー補正値Φは、0〜無限大の範囲で値をとり、全周波数領域から計算されるエコーパワー推定値|Dω,i^|の総エネルギーが全周波数領域から計算される実際のエコーパワーの総エネルギーより小さい場合は、大きな値をとるように動作する。その結果、エコーパワー補正値Φをエコーパワー推定値|Dω,i^|に乗ずることでゲイン係数が小さくなりエコーが抑圧される。 According to the echo suppression gain estimation method of the present invention, the echo power estimated value | D ω, i ^ | 2 is dynamically adjusted by the echo power correction value Φ i . The echo power correction value Φ i takes a value in the range of 0 to infinity, and the echo power estimated value | D ω, i ^ | 2 calculated from the entire frequency region is actually calculated from the entire frequency region. If it is smaller than the total energy of the echo power, it operates to take a large value. As a result, by multiplying the echo power correction value Φ i by the echo power estimated value | D ω, i ^ | 2 , the gain coefficient becomes small and the echo is suppressed.

また、全周波数領域から計算されるエコーパワー推定値|Dω,i^|の総エネルギーが全周波数領域から計算される実際のエコーパワーの総エネルギーより大きい場合は、エコーパワー補正値Φが小さな値をとるように動作する。その結果、エコーパワー補正値Φをエコーパワー推定値|Dω,i^|に乗ずることでゲイン係数が大きくなり近端話者信号の欠損を軽減するように動作する。 When the total energy of the echo power estimated value | D ω, i ^ | 2 calculated from the entire frequency region is larger than the total energy of the actual echo power calculated from the entire frequency region, the echo power correction value Φ i Works to take a small value. As a result, by multiplying the echo power correction value Φ i by the echo power estimated value | D ω, i ^ | 2 , the gain coefficient is increased, and the operation is performed to reduce the loss of the near-end speaker signal.

したがって、従来の方法に比べて、エコー経路の変動に対して頑健な音質劣化の少ないエコー抑圧を行うことが可能になる。   Therefore, compared with the conventional method, it is possible to perform echo suppression that is robust against fluctuations in the echo path and has little deterioration in sound quality.

この発明のエコー抑圧ゲイン推定方法を用いたエコー消去装置100の機能構成例を示す図。The figure which shows the function structural example of the echo cancellation apparatus 100 using the echo suppression gain estimation method of this invention. この発明のエコー抑圧ゲイン推定方法の動作フローを示す図。The figure which shows the operation | movement flow of the echo suppression gain estimation method of this invention. エコーパワー補正値計算部110の機能構成例を示す図。The figure which shows the function structural example of the echo power correction value calculation part 110. エコー抑圧ゲイン計算部120の機能構成例を示す図。The figure which shows the function structural example of the echo suppression gain calculation part 120. FIG. エコー抑圧ゲイン計算部120の動作フローを含めたエコー抑圧ゲイン推定方法の動作フローを示す図。The figure which shows the operation | movement flow of the echo suppression gain estimation method including the operation | movement flow of the echo suppression gain calculation part 120. エコーパワー補正値計算部210の機能構成例を示す図。The figure which shows the function structural example of the echo power correction value calculation part 210. FIG. 評価実験に用いた信号を示す図であり、(a)は再生信号x(i)、(b)は近端話者信号s(i)の一例を示す図。It is a figure which shows the signal used for evaluation experiment, (a) is a reproduction signal x (i), (b) is a figure which shows an example of a near-end speaker signal s (i). 評価実験に用いた信号を示す図であり、(a)は収音信号y(i)、(b)と(c)は従来法による出力信号e(i)、(d)は本発明による出力信号e(i)の一例を示す図。It is a figure which shows the signal used for evaluation experiment, (a) is the sound collection signal y (i), (b) and (c) are the output signals e (i) by a conventional method, (d) is the output by this invention. The figure which shows an example of signal e (i). 出力信号e(i)の音質を、従来法と比較した主観品質評価の評価結果の例を示す図。The figure which shows the example of the evaluation result of the subjective quality evaluation which compared the sound quality of the output signal e (i) with the conventional method. 従来のエコー消去装置10の機能構成を示す図。The figure which shows the function structure of the conventional echo cancellation apparatus 10. FIG.

以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。   Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.

〔発明の基本的な考え〕
実施例の説明の前に、この発明のエコーパワー推定値|Dω,i^|の動的調整方法について基本的な考えを説明する。この発明は、エコーのパワーペクトル|Dω,i^|と近端話者信号のパワースペクトル|Sω,i^|を統計的に無相関と仮定し、収音信号のパワースペクトル|Yω,iと、エコーパワー推定値|Dω,i^|にエコーパワー補正値Φを乗じた値との差分を最小化する最小二乗解からエコーパワー補正値Φを求め、求めたエコーパワー補正値Φをエコーパワー推定値|Dω,i^|に乗ずることでエコー経路変動に対して頑健なエコー抑圧を実現する考えである。
[Basic idea of the invention]
Prior to the description of the embodiment, the basic idea of the dynamic adjustment method of the echo power estimated value | D ω, i ^ | 2 of the present invention will be described. The present invention assumes that the echo power spectrum | D ω, i ^ | 2 and the power spectrum of the near-end speaker signal | S ω, i ^ | 2 are statistically uncorrelated, and the power spectrum of the collected sound signal | Y omega, i | 2, the echo power estimate | D ω, i ^ | 2 to determine the echo-power correction value [Phi i from the least-squares solution that minimizes the difference between the value obtained by multiplying the echo-power correction value [Phi i The echo power correction value Φ i thus obtained is multiplied by the estimated echo power value | D ω, i ^ | 2 to achieve echo suppression that is robust against echo path fluctuations.

従来のゲイン係数計算式(式(17))に対して、本発明では次式によりゲイン係数を求める。なお、Gω,i のpは、上記した従来技術のゲイン係数Gω,iと区別するための記号である。 In contrast to the conventional gain coefficient calculation formula (formula (17)), the present invention obtains the gain coefficient by the following formula. Note that p in G ω, i p is a symbol for distinguishing from the above-described prior art gain coefficient G ω, i .

ここでωは周波数番号、iはフレーム番号、Φはエコーパワー補正値を表わす。エコーパワー補正値Φは、次式で表わせる評価量eεを最小化することで得られる。 Here, ω represents a frequency number, i represents a frame number, and Φ i represents an echo power correction value. The echo power correction value Φ i is obtained by minimizing the evaluation amount e ε expressed by the following equation.

ここで添え字のFは、周波数軸方向の各値(ノルム、内積)であることを意味する。式(19)をΦで微分すると式(20)で表わせる。 Here, the subscript F means each value (norm, inner product) in the frequency axis direction. When equation (19) is differentiated by Φ i , it can be expressed by equation (20).

式(20)を0と置いた式(21)   Equation (21) with Equation (20) set to 0

からエコーパワー補正値Φを求めると式(22)となる。ここで添え字のFの周波数軸方向とは、ω方向(ω=0〜L−1)のサンプル列の各値(ノルム、内積)であることを意味する。 When the echo power correction value Φ i is obtained from the above, equation (22) is obtained. Here, the frequency axis direction of the subscript F means each value (norm, inner product) of the sample sequence in the ω direction (ω = 0 to L−1).

実用上、内積とノルムは、式(23)と式(24)に示すように全周波数領域に加え、過去Nフレームにわたる範囲でそれぞれ計算しても良い。Nは、例えば1〜200程度の数である。   Practically, the inner product and norm may be calculated in the range over the past N frames in addition to the entire frequency region as shown in equations (23) and (24). N is a number of about 1 to 200, for example.

ここで、Lは周波数番号の総数を表わす。周波数分析長(FFT点数)を例えば256点とした場合、Lはナイキスト周波数を超えない半分の分析点数である128とする。式(23)と式(24)よりエコーパワー補正値Φは、式(25)で表わせる。 Here, L represents the total number of frequency numbers. When the frequency analysis length (FFT points) is, for example, 256 points, L is 128, which is a half analysis point that does not exceed the Nyquist frequency. From the equations (23) and (24), the echo power correction value Φ i can be expressed by the equation (25).

以下、式(22)の動作について考える。近端話者信号のパワースペクトル|Sω,iとエコーパワー推定値|Dω,i^|が無相関であるとすると式(22)は次式に示すように近似できる。 Hereinafter, the operation of Expression (22) will be considered. Assuming that the power spectrum | S ω, i | 2 of the near-end speaker signal and the echo power estimated value | D ω, i ^ | 2 are uncorrelated, Equation (22) can be approximated as shown in the following equation.

更に式(26)は、エコーパワースペクトル|Dω,iとエコーパワー推定値|Dω,i^|のスペクトル構造が一致していると仮定すると、式(27)に示すように近似できる。 Furthermore, assuming that the spectral structure of the echo power spectrum | D ω, i | 2 and the echo power estimated value | D ω, i ^ | 2 is the same as the equation (26), as shown in the equation (27): Can be approximated.

このようにエコーパワー補正値Φは、エコーパワースペクトル|Dω,iとエコーパワー推定値|Dω,i^|とのエネルギー比で表わせる。式(27)は、式(24)も参照すると、エコーパワー補正値Φを求めるのに用いるエコーパワー推定値|Dω,i^|のエネルギーよりも、全周波数領域から計算される実際のエコーパワースペクトルのエネルギーが大きいほど、大きなエコーパワー補正値となることを表わしている。 Thus the echo-power correction value [Phi i is the echo power spectrum | D omega, i | 2 and the echo power estimate | D ω, i ^ | expressed by energy ratio between 2. Equation (27) is actually calculated from the entire frequency region rather than the energy of the echo power estimated value | D ω, i ^ | 2 used to obtain the echo power correction value Φ i, with reference to Equation (24). This indicates that the larger the energy of the echo power spectrum, the larger the echo power correction value.

式(27)より、エコーパワースペクトル|Dω,iのエネルギーとエコーパワー推定値|Dω,i^|のエネルギーが等しい場合、エコーパワー補正値Φは1となる。また、エコーパワー推定値|Dω,i^|の方がエコーパワースペクトル|Dω,iよりエネルギーが小さい場合、エコーパワー補正値Φは1より大きな値となる。また、エコーパワー推定値|Dω,i^|の方がエコーパワースペクトル|Dω,iよりエネルギーが大きい場合、エコーパワー補正値Φは1より小さな値となるように動作する。 From the equation (27), when the energy of the echo power spectrum | D ω, i | 2 and the energy of the echo power estimated value | D ω, i ^ | 2 are equal, the echo power correction value Φ i is 1. Further, when the estimated echo power value | D ω, i ^ | 2 is smaller in energy than the echo power spectrum | D ω, i | 2 , the echo power correction value Φ i is a value larger than 1. Further, when the echo power estimated value | D ω, i ^ | 2 has larger energy than the echo power spectrum | D ω, i | 2 , the echo power correction value Φ i operates so as to be a value smaller than 1. .

上記したように、エコーパワー補正値Φは、過去Nフレームの短い時間で更新されるので、エコーパワー推定値|Dω,i^|の調整を高速で行える。その結果、この発明のエコー抑圧ゲイン推定方法は、エコー経路の変動に頑健なエコー抑圧を実現することができる。 As described above, since the echo power correction value Φ i is updated in a short time of the past N frames, the echo power estimated value | D ω, i ^ | 2 can be adjusted at high speed. As a result, the echo suppression gain estimation method of the present invention can realize echo suppression that is robust against fluctuations in the echo path.

図1に、この発明のエコー消去装置100の機能構成例を示す。その動作フローを図2に示す。エコー消去装置100は、再生信号周波数分析部81と、収音信号周波数分析部82と、エコーパワー推定部83と、エコーパワー補正値計算部110と、エコー抑圧ゲイン計算部120と、乗算部85と、周波数合成部86と、を具備する。エコー消去装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。   FIG. 1 shows a functional configuration example of an echo canceling apparatus 100 according to the present invention. The operation flow is shown in FIG. The echo cancellation apparatus 100 includes a reproduction signal frequency analysis unit 81, a sound pickup signal frequency analysis unit 82, an echo power estimation unit 83, an echo power correction value calculation unit 110, an echo suppression gain calculation unit 120, and a multiplication unit 85. And a frequency synthesizer 86. The echo canceling apparatus 100 is realized by reading a predetermined program into a computer composed of, for example, a ROM, a RAM, a CPU, and the like, and executing the program by the CPU.

再生信号周波数分析部81は、再生信号x(i)を周波数領域の再生信号スペクトルXω,iに変換する(ステップS81)。収音信号周波数分析部82は、収音信号y(i)を周波数領域の収音信号スペクトルYω,iに変換する(ステップS82)。 The reproduction signal frequency analysis unit 81 converts the reproduction signal x (i) into a reproduction signal spectrum Xω, i in the frequency domain (step S81). The collected sound signal frequency analysis unit 82 converts the collected sound signal y (i) into a collected sound signal spectrum Y ω, i in the frequency domain (step S82).

エコーパワー推定部83は、再生信号スペクトルXω,iと収音信号スペクトルYω,iとを入力としてエコーパワー推定値|Dω,i^|を計算する(ステップS83)。エコーパワー補正値計算部110は、収音信号スペクトルYω,iとエコーパワー推定値|Dω,i^|とを入力として、収音信号スペクトルYω,iのパワー|Yω,iと、エコーパワー推定値|Dω,i^|にエコーパワー補正値Φを乗じた値との差分を最小化する最小二乗解からエコーパワー補正値Φを求める(ステップS110)。 The echo power estimator 83 calculates the echo power estimated value | D ω, i ^ | 2 using the reproduction signal spectrum X ω, i and the collected sound signal spectrum Y ω, i as inputs (step S83). The echo power correction value calculator 110 receives the collected sound signal spectrum Y ω, i and the echo power estimated value | D ω, i ^ | 2 as input, and the power of the collected sound signal spectrum Y ω, i | Y ω, i The echo power correction value Φ i is obtained from the least squares solution that minimizes the difference between | 2 and the echo power estimated value | D ω, i ^ | 2 multiplied by the echo power correction value Φ i (step S110). .

エコー抑圧ゲイン計算部120は、収音信号スペクトルYω,iと、エコーパワー補正値Φとエコーパワー推定値|Dω^|とを入力として、エコーを抑圧するゲイン係数Gω,i をエコーパワー補正値Φが大きな値をとるほど小さな値になるように計算する(ステップS120)。なお、乗算部85と周波数合成部86の処理ステップは省略している。 The echo suppression gain calculation unit 120 receives the collected sound signal spectrum Y ω, i , the echo power correction value Φ i and the echo power estimated value | D ω ^ | 2 as input, and a gain coefficient G ω, i for suppressing the echo. p is calculated so that the smaller the echo power correction value Φ i is, the smaller the value is (step S120). Note that the processing steps of the multiplication unit 85 and the frequency synthesis unit 86 are omitted.

エコー消去装置100は、従来のエコー消去装置10(図10)の類似度係数計算部12がエコーパワー補正値計算部110に、エコー抑圧ゲイン計算部14がエコー抑圧ゲイン計算部120に置き換わった以外は、従来技術と同じ構成である。この新しい構成のエコーパワー補正値計算部110とエコー抑圧ゲイン計算部120について、更に詳しく説明する。   The echo cancellation apparatus 100 is similar to the conventional echo cancellation apparatus 10 (FIG. 10) except that the similarity coefficient calculation unit 12 is replaced with an echo power correction value calculation unit 110 and the echo suppression gain calculation unit 14 is replaced with an echo suppression gain calculation unit 120. Is the same configuration as the prior art. The echo power correction value calculator 110 and the echo suppression gain calculator 120 of this new configuration will be described in more detail.

〔エコーパワー補正値計算部〕
図3に、エコーパワー補正値計算部110のより具体的な機能構成例を示す。エコーパワー補正値計算部110は、内積演算手段110aと、ノルム演算手段110bと、除算手段110cと、レジスタ110dと、レジスタ110eと、を備える。
[Echo power correction value calculation section]
FIG. 3 shows a more specific functional configuration example of the echo power correction value calculation unit 110. The echo power correction value calculation unit 110 includes an inner product calculation unit 110a, a norm calculation unit 110b, a division unit 110c, a register 110d, and a register 110e.

内積演算手段110aは、エコーパワー推定部83が出力するエコーパワー推定値|Dω,i^|と収音信号周波数分析部82が出力する収音信号スペクトルYω,iとを入力として、例えば、式(28)で内積を計算する。 The inner product calculation means 110a receives the echo power estimated value | D ω, i ^ | 2 output from the echo power estimation unit 83 and the sound collection signal spectrum Y ω, i output from the sound collection signal frequency analysis unit 82, For example, the inner product is calculated by Expression (28).

ノルム演算手段110bは、エコーパワー推定部83が出力するエコーパワー推定値|Dω,i^|を入力として、例えば、式(29)でノルムを計算する。 The norm calculation unit 110b receives the echo power estimated value | Dω, i ^ | 2 output from the echo power estimation unit 83 as an input, and calculates the norm by, for example, Expression (29).

ここでαは強調係数であり、その値はレジスタ110eに記憶されている。強調係数αは正の数であり例えば2とする。なお、内積は式(30)、ノルムは式(31)で計算しても良い。   Here, α is an enhancement coefficient, and the value is stored in the register 110e. The enhancement coefficient α is a positive number, for example, 2. The inner product may be calculated by equation (30), and the norm may be calculated by equation (31).

ここでεは0<ε≦1を満たす忘却係数であり、指数関数的な減衰の時定数を決定する。例えばε=0.16とする。εが1に近づくほど現フレームの計算値(式(30)と式(31)の右辺第1項)に依存した(重み付けされた)値になる。   Here, ε is a forgetting factor that satisfies 0 <ε ≦ 1, and determines an exponential decay time constant. For example, ε = 0.16. As ε approaches 1, it becomes a (weighted) value that depends on the calculated value of the current frame (the first term on the right side of Equation (30) and Equation (31)).

除算手段110cは、内積演算手段110aで計算した内積と、ノルム演算手段110bで計算したノルムと、を入力として式(32)でエコーパワー補正値Φを計算する。 The dividing unit 110c calculates the echo power correction value Φ i using the equation (32) with the inner product calculated by the inner product calculating unit 110a and the norm calculated by the norm calculating unit 110b as inputs.

エコーパワー補正値Φは、エコーパワー推定値の平方根の大きさ|Dω,i^|をα乗した値と収音信号スペクトルの大きさ|Yω,i|をα乗した値との内積値を、エコーパワー推定値の平方根|Dω,i^|の大きさの2α乗の値で除した値である。 The echo power correction value Φ i is a value obtained by multiplying the square root magnitude | D ω, i ^ | of the echo power estimated value to the α power and a value obtained by multiplying the magnitude of the collected sound signal spectrum | Y ω, i | by the α power. This is a value obtained by dividing the inner product value by the value of the square root of the estimated echo power value | D ω, i ^ |

また、上記した式(28)と式(29)の関係から、エコーパワー補正値Φは、エコーパワー推定値の平方根の大きさ|Dω,i^|のα乗と収音信号スペクトルの大きさ|Yω,i|のα乗とを乗じた値を全周波数領域と過去数フレームにわたる所定の範囲で計算した値を全て加算した値(式(28))を、エコーパワー推定値の平方根|Dω,i^|の大きさの2α乗の値を全周波数領域と過去数フレームにわたる所定の範囲で計算した値を全て加算した値(式(29))で除した値であるともいえる。 Further, from the relationship between the above formulas (28) and (29), the echo power correction value Φ i is the α power of the square root magnitude | D ω, i ^ | The value obtained by multiplying the value obtained by multiplying the magnitude | Y ω, i | by the α-th power in a predetermined range over the entire frequency region and the past several frames (formula (28)) is the echo power estimated value. The square root | D ω, i ^ | is the value obtained by dividing the value of 2α to the power of 2α by a value obtained by adding all values calculated in a predetermined range over the entire frequency region and the past several frames (formula (29)). I can say that.

〔エコー抑圧ゲイン計算部〕
図4に、エコー抑圧ゲイン計算部120のより具体的な機能構成例を示す。エコー抑圧ゲイン計算部120は、エコーパワー調整手段120aと、減算手段120bと、除算手段120cと、エコーの消し残りを無くす定数Cを記録したレジスタ120dと、強調係数βを記録したレジスタ120eとを備える。
[Echo suppression gain calculator]
FIG. 4 shows a more specific functional configuration example of the echo suppression gain calculation unit 120. The echo suppression gain calculation unit 120 includes an echo power adjusting unit 120a, a subtracting unit 120b, a dividing unit 120c, a register 120d that records a constant C that eliminates an echo cancellation residue, and a register 120e that records an enhancement coefficient β. Prepare.

エコーパワー調整手段120aは、エコーパワー推定値|Dω,i^|とエコーパワー補正値Φを入力として、エコーパワー推定値の平方根|Dω,i^|を強調係数βでべき乗した後にお互いを乗算し、さらにその値に定数Cを乗算してエコーパワー調整値を計算する(図5のステップS120a)。このエコーパワー調整過程を含むことで、エコー成分を十分に抑圧することが可能になる。 The echo power adjusting means 120a receives the echo power estimated value | D ω, i ^ | 2 and the echo power correction value Φ i as input, and squares the echo power estimated value | D ω, i ^ | The echo power adjustment value is calculated by multiplying each other and multiplying that value by a constant C (step S120a in FIG. 5). By including this echo power adjustment process, the echo component can be sufficiently suppressed.

減算手段120bは、エコーパワー調整値と収音信号スペクトルYω,iとを入力とし、収音信号スペクトルの大きさ|Yω,i|を強調係数βでべき乗した値からエコーパワー調整値を減算する(ステップS120b)。 The subtracting unit 120b receives the echo power adjustment value and the collected sound signal spectrum Y ω, i as input, and obtains the echo power adjustment value from a value obtained by raising the magnitude | Y ω, i | Subtract (Step S120b).

除算手段120cは、減算手段120bの出力信号を、収音信号スペクトルの大きさ|Yω,i|を強調係数βでべき乗した値で除算してゲイン係数Gω,i を出力する(ステップS120c)。つまり、エコー抑圧ゲイン計算部120は、式(33)を計算してゲイン係数Gω,i を出力する。 The dividing unit 120c divides the output signal of the subtracting unit 120b by the value obtained by raising the magnitude | Y ω, i | of the collected sound signal spectrum by the power of the enhancement coefficient β, and outputs a gain coefficient G ω, i p (step). S120c). That is, the echo suppression gain calculator 120, the gain coefficient G omega by calculating the equation (33), and outputs the i p.

ここで強調係数βは正の数であるとして例えばαと同じ値の2とする。定数Cは正の数であるとして例えば1.0とする。強調係数βと、定数Cは、ゲイン係数Gω,i を適当な値に調整するものである。強調係数β=2とするとウィナーフィルタに近い式になる。 Here, the enhancement coefficient β is assumed to be a positive number, for example, 2 which is the same value as α. The constant C is assumed to be a positive number, for example, 1.0. And emphasis coefficient beta, the constant C is to adjust the gain factor G omega, the i p to a suitable value. When the enhancement coefficient β = 2, the expression is close to a Wiener filter.

以上のようにして求めたゲイン係数Gω,i は、近端話者信号s(i)の欠損を軽減するようにエコー消去装置100を動作させる。したがって、従来法に比べてエコー経路の変動に頑健なミュージカルノイズ発生の少ないエコー抑圧を行うことが可能になる。 Gain factor G omega obtained as described above, i p operates the echo canceller 100 to reduce the defects of the near-end talker signal s (i). Therefore, it is possible to perform echo suppression with less musical noise generation, which is more robust to echo path fluctuations than the conventional method.

図6に、エコーパワー補正値Φの大きさに上限と下限を設けるようにしたエコーパワー補正値計算部210の機能構成例を示す。エコーパワー補正値計算部210は、内積演算手段110aと、ノルム演算手段110bと、除算手段110cと、レジスタ110dと、レジスタ110eと、上下限調整手段210aと、を備える。エコーパワー補正値計算部210は、上下限調整手段210aを備える点で、エコーパワー補正値計算部110と異なる。 FIG. 6 shows a functional configuration example of the echo power correction value calculation unit 210 in which an upper limit and a lower limit are provided for the magnitude of the echo power correction value Φ i . The echo power correction value calculation unit 210 includes an inner product calculation unit 110a, a norm calculation unit 110b, a division unit 110c, a register 110d, a register 110e, and an upper / lower limit adjustment unit 210a. The echo power correction value calculation unit 210 is different from the echo power correction value calculation unit 110 in that it includes upper and lower limit adjustment means 210a.

上下限調整手段210aは、除算手段110cで計算されたエコーパワー補正値Φに対して次式に示すような上限Rmaxと下限Rminを設定したエコーパワー補正値Φ′を出力する。 The upper / lower limit adjustment unit 210a outputs an echo power correction value Φ i ′ in which an upper limit R max and a lower limit R min are set as shown in the following equation with respect to the echo power correction value Φ i calculated by the division unit 110c.

実施例1で説明したエコーパワー補正値計算部110は、エコーの経路変動や経路変化の際に、エコーパワーのスペクトル包落が保たれることを前提にしている。つまり、エコーとその推定値のスペクトル構造が一致していることを前提にしている。   The echo power correction value calculation unit 110 described in the first embodiment is based on the premise that the spectral envelope of the echo power is maintained when the echo path changes or changes. In other words, it is assumed that the spectral structure of the echo and its estimated value match.

この前提が崩れるとき、エコーパワー補正値が正しく求まらない。そこで、エコーパワー補正値計算部210は、エコーパワー補正値が必要以上に小さくなり過ぎたり、大きくなり過ぎたりすることを防止する。例えば、Rmax=100dB,Rmin=0dB、とする。 When this assumption is broken, the echo power correction value cannot be obtained correctly. Therefore, the echo power correction value calculation unit 210 prevents the echo power correction value from becoming too small or too large. For example, R max = 100 dB and R min = 0 dB.

エコーパワー補正値計算部210を備えたこの発明のエコー消去装置100′は、エコースペクトルと近端話者信号スペクトルのベクトルが完全には直交しない実際の場面におけるエコー抑圧性能を安定化させる効果を奏する。   The echo canceling apparatus 100 ′ of the present invention including the echo power correction value calculation unit 210 has an effect of stabilizing the echo suppression performance in an actual scene where the vectors of the echo spectrum and the near-end speaker signal spectrum are not completely orthogonal. Play.

〔評価実験の結果〕
この発明のエコー抑圧ゲイン推定方法を、短時間スペクトル振幅エコー抑圧処理に適用して従来法と性能比較を行った。従来法は、FDCC(Frequency-Domain Cross Correlation)を備えたエコー抑圧法とした(参考文献:C.Faller and C.Tournery,”Robust acoustic echo control using a simple echo path model,”Process. ICASSP2006, vol.5,pp.281-284, May 2006.)。性能の比較は、シミュレーション試験及び主観品質評価法のMUSHRA法で行った。試験条件は、サンプリング周波数16kHz、周波数分析長256点、1/2オーバーラップ加算による周波数分析合成、エコー経路の残響時間は300msの部屋とした。
[Results of evaluation experiment]
The performance of the echo suppression gain estimation method of the present invention was compared with that of the conventional method by applying it to the short-time spectral amplitude echo suppression processing. The conventional method is an echo suppression method with FDCC (Frequency-Domain Cross Correlation) (reference: C. Faller and C. Tournery, “Robust acoustic echo control using a simple echo path model,” Process. ICASSP2006, vol. .5, pp.281-284, May 2006.). The performance was compared by the simulation test and the subjective quality evaluation method MUSHRA method. The test conditions were a sampling frequency of 16 kHz, a frequency analysis length of 256 points, frequency analysis synthesis by 1/2 overlap addition, and a room with an echo path reverberation time of 300 ms.

図7に、評価実験に用いた再生信号x(k)(a)と近端話者信号s(k)(b)を示す。横軸は時間「秒」、縦軸は振幅である。エコーの急な増加をシミュレートする目的で、12秒の時点でエコーd(k)(図1参照)を約20dB急速に増加させた。0〜4秒のA区間と4〜8秒のB区間は、再生信号x(k)のみと近端話者信号s(k)のみのシングルトークの状態である。8〜12秒のC区間と12〜16秒のD区間はダブルトークの状態である。   FIG. 7 shows the reproduced signal x (k) (a) and the near-end speaker signal s (k) (b) used in the evaluation experiment. The horizontal axis represents time “second”, and the vertical axis represents amplitude. In order to simulate a sudden increase in echo, the echo d (k) (see FIG. 1) was rapidly increased by about 20 dB at 12 seconds. The A section of 0 to 4 seconds and the B section of 4 to 8 seconds are single talk states of only the reproduction signal x (k) and only the near-end speaker signal s (k). The C section of 8 to 12 seconds and the D section of 12 to 16 seconds are in a double talk state.

図8に、従来法と本発明とで得られた出力信号s^(k)(図1参照)を示す。横軸は時間「秒」、縦軸は振幅であり、時間軸は図7と同じ時間である。(a)はマイクロホンで収音した収音信号y(k)、(b)は従来法で音響結合量を推定するフレーム数を10個(F=10)とした場合の出力信号s^(k)、(c)は従来法で同じフレーム数を200個(F=200)とした場合の出力信号s^(k)、(d)は本発明で同じフレーム数を200個(F=200)とした場合の出力信号s^(k)、である。   FIG. 8 shows an output signal s ^ (k) (see FIG. 1) obtained by the conventional method and the present invention. The horizontal axis is the time “second”, the vertical axis is the amplitude, and the time axis is the same time as in FIG. (A) is a sound pickup signal y (k) picked up by a microphone, and (b) is an output signal s ^ (k when the number of frames for estimating the acoustic coupling amount by the conventional method is 10 (F = 10). ), (C) are output signals s (k) when the same number of frames is 200 (F = 200) in the conventional method, and (d) is the same number of frames (F = 200) in the present invention. Is an output signal s ^ (k).

収音信号y(k)のA区間にエコーが見て取れ、何れの方法(b),(c),(d)でもエコーが抑圧されていることが分かる。注目すべき点は、エコーを急激に増加させた12秒の直後の各方法による波形である。それらの波形を比較すると、本発明(d)の出力信号s^(k)の波形が、近端話者信号s(k)の波形に最も近いことが分かる。この結果は、本発明のエコー抑圧ゲイン推定方法が、エコー経路が変動した直後であってもエコーを最も抑圧できていることを表わしている。   An echo can be seen in section A of the collected sound signal y (k), and it can be seen that the echo is suppressed by any of the methods (b), (c), and (d). What should be noted is the waveform obtained by each method immediately after 12 seconds when the echo is suddenly increased. Comparing these waveforms, it can be seen that the waveform of the output signal s (k) of the present invention (d) is closest to the waveform of the near-end speaker signal s (k). This result indicates that the echo suppression gain estimation method of the present invention can suppress the echo most even immediately after the echo path is changed.

図9に、主観品質評価法で各方法の出力信号s^(k)の音質を評価した結果を示す。(a)はC区間、(b)はD区間の評価結果を示す。横方向は各方式、縦方向は主観値である。   FIG. 9 shows the result of evaluating the sound quality of the output signal s ^ (k) of each method by the subjective quality evaluation method. (A) shows the evaluation result of C section, (b) shows the evaluation result of D section. The horizontal direction is each method, and the vertical direction is the subjective value.

エコー経路を変化させる前のC区間における主観値は、従来法F=200のスコアが最も高く、本発明はそのスコアにほぼ等しい65.58であった。一方、エコー経路を変化させた直後のD区間では、本発明が最も高いスコア22.75を示した。D区間では、フレーム数が少ない従来法F=10のスコアが、フレーム数の多い従来法F=200よりも良くなり逆転している。   The subjective value in the C section before changing the echo path has the highest score of the conventional method F = 200, and the present invention was 65.58 which is almost equal to the score. On the other hand, in the D section immediately after changing the echo path, the present invention showed the highest score of 22.75. In the section D, the score of the conventional method F = 10 with a small number of frames is better than that of the conventional method F = 200 with a large number of frames.

また、従来法F=10よりも本発明のスコアが良いことから、本発明のエコー抑圧ゲイン推定方法は、エコー経路の変動に対して高速且つ正確に対応でき、エコー経路の変動に頑健であることが分かる。   Further, since the score of the present invention is better than that of the conventional method F = 10, the echo suppression gain estimation method of the present invention can cope with echo path fluctuations quickly and accurately and is robust to echo path fluctuations. I understand that.

以上のようにこの発明のエコー抑圧ゲイン推定方法を用いることでエコー経路の変動に頑健であると共に、高いエコー抑圧性能を達成しながらミュージカルノイズ発生も軽減することができる。   As described above, by using the echo suppression gain estimation method of the present invention, it is robust against echo path fluctuations, and the generation of musical noise can be reduced while achieving high echo suppression performance.

なお、この発明の方法及び装置は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記方法及び装置において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。   In addition, the method and apparatus of this invention are not limited to the above-mentioned embodiment, In the range which does not deviate from the meaning of this invention, it can change suitably. Further, the processes described in the above method and apparatus are not only executed in time series according to the order of description, but also may be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. Good.

また、上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。   Further, when the processing means in the above apparatus is realized by a computer, the processing contents of functions that each apparatus should have are described by a program. Then, by executing this program on the computer, the processing means in each apparatus is realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−
R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-
R (Recordable) / RW (ReWritable) or the like can be used as a magneto-optical recording medium, MO (Magneto Optical disc) or the like as a semiconductor memory, EEP-ROM (Electronically Erasable and Programmable Read Only Memory) or the like as a semiconductor memory.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a recording device of a server computer and transferring the program from the server computer to another computer via a network.

また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   Each means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.

Claims (8)

再生信号を周波数領域の再生信号スペクトルXω,iに変換する再生信号周波数分析段階と、
収音信号を周波数領域の収音信号スペクトルYω,iに変換する収音信号周波数分析段階と、
上記再生信号スペクトルXω,iと上記収音信号スペクトルYω,iとを入力として全周波数領域のエコーパワー推定値|Dω,i^|を計算するエコーパワー推定段階と、
上記収音信号スペクトルYω,iと上記エコーパワー推定値|Dω,i^|とを入力として、上記収音信号スペクトルYω,iのパワー|Yω,iと、上記エコーパワー推定値|Dω,i^|にエコーパワー補正値Φを乗じた値との差分を最小化する最小二乗解からエコーパワー補正値Φを求めるエコーパワー補正値計算段階と、
上記収音信号スペクトルYω,iと上記エコーパワー補正値Φと上記エコーパワー推定値|Dω,i^|とを入力として、エコーを抑圧するゲイン係数を、上記エコーパワー補正値Φが大きな値をとるほど小さな値になるように計算するエコー抑圧ゲイン計算段階と、
を有するエコー抑圧ゲイン推定方法。
A reproduction signal frequency analysis stage for converting the reproduction signal into a reproduction signal spectrum X ω, i in the frequency domain;
A sound collecting signal frequency analysis stage for converting the sound collecting signal into a sound collecting signal spectrum Y ω, i in the frequency domain;
An echo power estimation step of calculating an echo power estimate value | D ω, i ^ | 2 in the entire frequency region by using the reproduction signal spectrum X ω, i and the sound pickup signal spectrum Y ω, i as inputs;
Using the collected sound signal spectrum Y ω, i and the estimated echo power value | D ω, i ^ | 2 as input , the power | Y ω, i | 2 of the collected sound signal spectrum Y ω, i and the echo power estimate | D ω, i ^ | and echo power correction value calculation step of determining an echo power correction value [Phi i 2 to the difference between the value obtained by multiplying the echo-power correction value [Phi i from the least-squares solution that minimizes,
The sound collection signal spectrum Y ω, i , the echo power correction value Φ i and the echo power estimation value | D ω, i ^ | 2 are input, and the gain coefficient for suppressing the echo is the echo power correction value Φ. an echo suppression gain calculation stage for calculating so that i becomes larger as i takes a larger value;
An echo suppression gain estimation method comprising:
請求項1に記載のエコー抑圧ゲイン推定方法において、
上記エコーパワー補正値計算段階は、
エコーパワー補正値Φを求めるのに用いる上記エコーパワー推定値|Dω,i^|のエネルギーよりも、全周波数領域から計算される実際のエコーパワースペクトルのエネルギーが大きいほど、大きなエコーパワー補正値を求める段階、
であることを特徴とするエコー抑圧ゲイン推定方法。
The echo suppression gain estimation method according to claim 1,
The echo power correction value calculation stage is as follows:
The larger the energy of the actual echo power spectrum calculated from the entire frequency region than the energy of the echo power estimated value | D ω, i ^ | 2 used for obtaining the echo power correction value Φ i , the larger the echo power Obtaining a correction value;
An echo suppression gain estimation method characterized by:
請求項1又は2に記載のエコー抑圧ゲイン推定方法において、
上記エコーパワー補正値計算段階は、
エコーパワー推定値の平方根の大きさ|Dω,i^|のα乗と収音信号スペクトルの大きさ|Yω,i|のα乗とを乗じた値を全周波数範囲と過去Nフレームにわたる所定の範囲で計算した値を全て加算した値を、エコーパワー推定値の平方根|Dω,i^|の大きさの2α乗の値を全周波数領域と過去Nフレームにわたる所定の範囲で計算した値を全て加算した値で除した値を、エコーパワー補正値Φとして計算する段階、
であることを特徴とするエコー抑圧ゲイン推定方法。
The echo suppression gain estimation method according to claim 1 or 2,
The echo power correction value calculation stage is as follows:
The magnitude of the square root of the estimated echo power value | D ω, i ^ | raised to the α power of the collected sound signal spectrum | Y ω, i | multiplied by the α power of the entire frequency range and the past N frames A value obtained by adding all the values calculated in a predetermined range was calculated in the predetermined range over the entire frequency region and the past N frames as the value of the square root of the echo power estimated value | D ω, i ^ | Calculating a value obtained by dividing all values by an added value as an echo power correction value Φ i ;
An echo suppression gain estimation method characterized by:
請求項1乃至3の何れかに記載のエコー抑圧ゲイン推定方法において、
上記エコー抑圧ゲイン計算段階は、上記エコーパワー推定値の平方根|Dω,i^|の大きさをβでべき乗した値に、上記エコーパワー補正値Φを乗算したエコーパワー調整値を生成するエコーパワー調整過程を、含むことを特徴とするエコー抑圧ゲイン推定方法。
The echo suppression gain estimation method according to any one of claims 1 to 3,
The echo suppression gain calculation step generates an echo power adjustment value obtained by multiplying the value of the square root | D ω, i ^ | of the echo power estimated value to the power of β and the echo power correction value Φ i. An echo suppression gain estimation method comprising an echo power adjustment process.
請求項4に記載のエコー抑圧ゲイン推定方法において、
上記エコー抑圧ゲイン計算段階は、
上記エコーパワー調整過程と、
上記収音信号スペクトルの大きさ|Yω,i|を上記βでべき乗した値から上記エコーパワー調整値を減算する減算過程と、
上記減算過程の出力信号を上記収音信号スペクトルの大きさ|Yω,i|を上記βでべき乗した値で除算する除算過程と、
から成ることを特徴とするエコー抑圧ゲイン推定方法。
The echo suppression gain estimation method according to claim 4,
The echo suppression gain calculation stage is
The above echo power adjustment process,
A subtraction process for subtracting the echo power adjustment value from a value obtained by raising the magnitude | Y ω, i |
A division process of dividing the output signal of the subtraction process by a value obtained by raising the magnitude | Y ω, i | of the collected sound signal spectrum to the power of β;
An echo suppression gain estimation method comprising:
請求項1乃至5の何れかに記載のエコー抑圧ゲイン推定方法において、
上記エコーパワー補正値計算段階は、
計算して求めたエコーパワー補正値Φの大きさに、上限と下限を設ける上下限調整過程を含むことを特徴とするエコー抑圧ゲイン推定方法。
The echo suppression gain estimation method according to any one of claims 1 to 5,
The echo power correction value calculation stage is as follows:
An echo suppression gain estimation method comprising an upper and lower limit adjustment process for setting an upper limit and a lower limit in the magnitude of the echo power correction value Φ i obtained by calculation.
再生信号を周波数領域の再生信号スペクトルXω,iに変換する再生信号周波数分析部と、
収音信号を周波数領域の収音信号スペクトルYω,iに変換する収音信号周波数分析部と、
上記再生信号スペクトルXω,iと上記収音信号スペクトルYω,iとを入力として全周波数領域のエコーパワー推定値|Dω,i^|を計算するエコーパワー推定部と、
上記収音信号スペクトルYω,iと上記エコーパワー推定値|Dω,i^|とを入力として、上記収音信号スペクトルYω,iのパワー|Yω,iと、上記エコーパワー推定値|Dω,i^|にエコーパワー補正値Φを乗じた値との差分を最小化する最小二乗解からエコーパワー補正値を求めるエコーパワー補正値計算部と、
上記収音信号スペクトルYωと上記エコーパワー補正値Φと上記エコーパワー推定値|Dω,i とを入力として、エコーを抑圧するゲイン係数を上記エコーパワー補正値Φが大きな値をとるほど小さな値になるように計算するエコー抑圧ゲイン計算部と、
を具備するエコー抑圧ゲイン推定装置。
A reproduction signal frequency analyzer for converting the reproduction signal into a reproduction signal spectrum Xω, i in the frequency domain;
A sound collection signal frequency analysis unit for converting the sound collection signal into a frequency domain sound collection signal spectrum Y ω, i ;
An echo power estimator for calculating an echo power estimate value | D ω, i ^ | 2 in the entire frequency region by using the reproduced signal spectrum X ω, i and the collected sound signal spectrum Y ω, i as inputs;
Using the collected sound signal spectrum Y ω, i and the estimated echo power value | D ω, i ^ | 2 as input , the power | Y ω, i | 2 of the collected sound signal spectrum Y ω, i and the echo An echo power correction value calculation unit for obtaining an echo power correction value from a least squares solution that minimizes a difference from a value obtained by multiplying the estimated power value | D ω, i ^ | 2 by an echo power correction value Φ i ;
The sound collection signal spectrum , the echo power correction value Φ i, and the echo power estimation value | D ω, i 2 are input, and the gain coefficient for suppressing the echo is set to a large value for the echo power correction value Φ i. An echo suppression gain calculator that calculates the value to be as small as possible,
An echo suppression gain estimation apparatus comprising:
請求項1乃至6の何れかに記載したエコー抑圧ゲイン推定方法を、コンピュータで処理するためのプログラム。   A program for processing the echo suppression gain estimation method according to any one of claims 1 to 6 by a computer.
JP2013017312A 2013-01-31 2013-01-31 Echo suppression gain estimation method, echo canceller and program using the same Active JP5562451B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013017312A JP5562451B1 (en) 2013-01-31 2013-01-31 Echo suppression gain estimation method, echo canceller and program using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013017312A JP5562451B1 (en) 2013-01-31 2013-01-31 Echo suppression gain estimation method, echo canceller and program using the same

Publications (2)

Publication Number Publication Date
JP5562451B1 JP5562451B1 (en) 2014-07-30
JP2014150367A true JP2014150367A (en) 2014-08-21

Family

ID=51417029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013017312A Active JP5562451B1 (en) 2013-01-31 2013-01-31 Echo suppression gain estimation method, echo canceller and program using the same

Country Status (1)

Country Link
JP (1) JP5562451B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014150368A (en) * 2013-01-31 2014-08-21 Nippon Telegr & Teleph Corp <Ntt> Echo suppression gain estimation method, echo cancellation device using the same, and program
JP2014175986A (en) * 2013-03-12 2014-09-22 Nippon Telegr & Teleph Corp <Ntt> Acoustic coupling amount estimation device, echo canceller, and method and program thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3002374B2 (en) * 1993-12-03 2000-01-24 松下電器産業株式会社 Control method of voice switch used together with echo canceller
JP3420705B2 (en) * 1998-03-16 2003-06-30 日本電信電話株式会社 Echo suppression method and apparatus, and computer-readable storage medium storing echo suppression program
JP3507020B2 (en) * 2000-09-08 2004-03-15 日本電信電話株式会社 Echo suppression method, echo suppression device, and echo suppression program storage medium

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014150368A (en) * 2013-01-31 2014-08-21 Nippon Telegr & Teleph Corp <Ntt> Echo suppression gain estimation method, echo cancellation device using the same, and program
JP2014175986A (en) * 2013-03-12 2014-09-22 Nippon Telegr & Teleph Corp <Ntt> Acoustic coupling amount estimation device, echo canceller, and method and program thereof

Also Published As

Publication number Publication date
JP5562451B1 (en) 2014-07-30

Similar Documents

Publication Publication Date Title
US8271277B2 (en) Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium
JP4568733B2 (en) Noise suppression device, noise suppression method, noise suppression program, and computer-readable recording medium
JP4787851B2 (en) Echo suppression gain estimation method, echo canceller using the same, device program, and recording medium
JP5452655B2 (en) Multi-sensor voice quality improvement using voice state model
KR101737824B1 (en) Method and Apparatus for removing a noise signal from input signal in a noisy environment
JP5634959B2 (en) Noise / dereverberation apparatus, method and program thereof
JPH10513273A (en) Spectral subtraction noise suppression method
JP5087024B2 (en) Echo canceling apparatus, method and program
JP5769671B2 (en) Echo suppression gain estimation method, echo canceller and program using the same
JP5889224B2 (en) Echo suppression gain estimation method, echo canceller and program using the same
JP5769670B2 (en) Echo suppression gain estimation method, echo canceller and program using the same
JP5562451B1 (en) Echo suppression gain estimation method, echo canceller and program using the same
JP6721165B2 (en) Input sound mask processing learning device, input data processing function learning device, input sound mask processing learning method, input data processing function learning method, program
JP5769672B2 (en) Echo suppression gain estimation method, echo canceller and program using the same
JP2004078021A (en) Method, device, and program for sound pickup
Schmidt et al. Reduction of non-stationary noise using a non-negative latent variable decomposition
CN112712816A (en) Training method and device of voice processing model and voice processing method and device
JP5044594B2 (en) Multi-channel echo canceller, method and program thereof
JP6827908B2 (en) Speech enhancement device, speech enhancement learning device, speech enhancement method, program
Mirabilii et al. Simulating wind noise with airflow speed-dependent characteristics
JP5325134B2 (en) Echo canceling method, echo canceling apparatus, program thereof, and recording medium
KR101537653B1 (en) Method and system for noise reduction based on spectral and temporal correlations
JP4094522B2 (en) Echo canceling apparatus, method, echo canceling program, and recording medium recording the program
WO2021100094A1 (en) Sound source signal estimation device, sound source signal estimation method, and program
CN113990343A (en) Training method and device of voice noise reduction model and voice noise reduction method and device

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140603

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140610

R150 Certificate of patent or registration of utility model

Ref document number: 5562451

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150