JP2014017698A - Echo suppression gain estimation method, echo elimination apparatus using the same, and program - Google Patents
Echo suppression gain estimation method, echo elimination apparatus using the same, and program Download PDFInfo
- Publication number
- JP2014017698A JP2014017698A JP2012154350A JP2012154350A JP2014017698A JP 2014017698 A JP2014017698 A JP 2014017698A JP 2012154350 A JP2012154350 A JP 2012154350A JP 2012154350 A JP2012154350 A JP 2012154350A JP 2014017698 A JP2014017698 A JP 2014017698A
- Authority
- JP
- Japan
- Prior art keywords
- echo
- signal spectrum
- estimated value
- value
- echo power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
Description
この発明は、音響再生系を有する通信会議システム等に用いられるエコー消去装置及び、それに適用されるエコー抑圧ゲイン推定方法と、そのプログラムに関する。 The present invention relates to an echo canceller used in a communication conference system having an acoustic reproduction system, an echo suppression gain estimation method applied to the echo canceller, and a program therefor.
短時間スペクトル振幅(STSA:Sort-Time Spectral Amplitude)推定に基づくエコー抑圧処理は、エコーと近端話者音声の無相関を仮定してエコーを抑圧するゲイン係数を推定し、振幅周波数領域でエコーを抑圧する方法であり、例えば非特許文献1に記載されている。これに対し、エコー抑圧後の音声品質向上のため、非特許文献1に記載される上記ゲイン係数の推定方法(以下、「エコー抑圧ゲイン推定方法」と称す)を改善した手法として、特許文献1が提案されている。ここでは、特許文献1に開示されたエコー抑圧ゲイン推定方法を用いたエコー消去装置10の機能構成例を、図6に示してその動作を簡単に説明する。
Echo suppression processing based on short-time spectral amplitude (STSA) estimation estimates a gain coefficient that suppresses echo assuming no correlation between echo and near-end talker speech, and echoes in the amplitude frequency domain Is described in Non-Patent
エコー消去装置10は、再生信号周波数分析部81と、収音信号周波数分析部82と、エコーパワー推定部83と、類似度係数計算部12と、エコー抑圧ゲイン計算部14と、乗算部85と、周波数合成部86とを備える。再生信号x(k)は、例えばサンプリング周波数16kHzで離散値とされた信号であり、スピーカ1によって音響信号に変換される。なお、再生信号を離散値化するAD変換器と、その離散値を連続値に変換するDA変換器については省略している。
The
再生信号周波数分析部81は、再生信号の離散値を256点集めて1フレームとし、1/2オーバーラップ加算による周波数分析を行い、フレーム単位で8kHzまでの周波数範囲を128個の再生信号スペクトルXωに変換する。kはフレーム番号であり、ωはこの例の場合64Hzの間隔で得られる周波数スペクトルの番号(1〜128)である。
The reproduction signal
マイクロホン2で収音される収音信号y(k)は、再生信号x(k)がスピーカ1から再生されたことによるエコーd(k)が、近端話者信号s(k)に重畳した信号である。その収音信号y(k)は、再生信号x(k)と同じように収音信号周波数分析部82によって収音信号スペクトルYωに変換される。YωはYω=Dω+Sω、Dωはエコースペクトル、Sωは近端話者信号スペクトル、である。
The collected sound signal y (k) collected by the
エコーパワー推定部83は、再生信号スペクトルXωと収音信号スペクトルYωとを入力として式(1)に示すエコーパワー推定値|Dω^|2を計算する。^は推定値であることを表わすが、その表記は式及び図中に示すものが正しい。
The
ここで、Hωはスピーカ1からマイクロホン2に回り込むエコー経路のスペクトル、|Hω^|2は音響結合量の推定値であり、|Hω^|2 ̄は1フレーム過去の音響結合量の推定値である。min{ , }は最小値を選択する関数である。したがって、|Hω^|2は隣接するフレーム間で小さい方の音響結合量がその推定値になる。
Here, H ω is the spectrum of the echo path that goes from the
エコー抑圧ゲイン計算部14は、収音信号スペクトルYωと、エコーパワー推定値|Dω^|2と、類似度係数|rω|を入力として式(2)に示すゲイン係数Gωを出力する。ゲイン係数Gωは0〜1の実数値をとり、収音信号スペクトルYω中にエコー成分が多い場合には小さな値、エコー成分以外の成分が多い場合には大きな値をとる。
The echo suppression
乗算部85は、収音信号スペクトルYωにゲイン係数Gωを乗算する。エコー成分が多い場合のゲイン係数Gωは小さな値となるので、乗算部85の出力信号はエコー成分が抑圧された近端話者信号スペクトル推定値Sω^となる。この各周波数成分ωに対応する近端話者信号スペクトル推定値Sω^は、周波数合成部86において時間領域の出力信号e(k)に再合成される。
The
類似度係数計算部12は、再生信号スペクトルXωと収音信号スペクトルYωとを入力として、内積<Xω,Yω>を例えば式(3)で、再生信号スペクトルのノルム値‖Xω‖と、収音信号スペクトルのノルム値‖Yω‖を、例えば式(4)と式(5)でそれぞれ計算する。
The similarity
ここで、*は複素共役、 ̄は1フレーム過去であることを表わす。εは0<ε≦1を満たす忘却係数であり、指数関数的な減衰の時定数を決定する。例えばε=0.016とする。εが1に近づくほど現在の再生信号スペクトルXωと収音信号スペクトルYωに依存した(重み付けされた)それぞれの値になる。なお、周波数軸方向にも着目した式(6)〜(8)を用いてもよい。 Here, * represents a complex conjugate and  ̄ represents one frame in the past. ε is a forgetting factor satisfying 0 <ε ≦ 1, and determines an exponential decay time constant. For example, ε = 0.016. As ε approaches 1, the values depend (weight) on the current reproduction signal spectrum X ω and the collected sound signal spectrum Y ω . In addition, you may use Formula (6)-(8) which paid its attention also to the frequency-axis direction.
ここでM1〜M2は所定の周波数範囲を表わす。式(6)〜(8)は周波数軸方向に相関を取った後に時間軸方向の相関を取る形である。相関を取る順番は逆でもよい。また、式(3)に替えて位相成分を考慮しない絶対値から求める式(9)を用いてもよい。
類似度係数計算部12は、式(3)〜(5)でそれぞれの値を計算した後に、式(10)で類似度係数|rω|を計算する。
ここで類似度係数|rω|を算出する式(10)の導出根拠について説明する。
例えばウィナーフィルタ法(Wiener Filter以下「WF法」と称す)では、式(11)の評価量εを最小とするゲイン係数Gωを推定してエコーを抑圧する。
For example, in Wiener filter method (referred to as Wiener Filter the "WF method"), for suppressing an echo by estimating the gain factor G omega which minimizes the evaluation value ε of the formula (11).
式(11)をGωで微分すると次式で表せる。
式(12)を0と置いた式からゲイン係数Gωを求めると式(13)となる。
式(13)を変形するとゲイン係数Gωは式(14)で表せる。
ここでrωはエコースペクトルDωと近端話者信号スペクトルSωの複素コヒーレンスを示す。Dω=Hω *Xωを用いてrωから未知のベクトルDωを消去すると式(15)で表せる。 Here, r ω indicates the complex coherence of the echo spectrum D ω and the near-end speaker signal spectrum S ω . Clearing the unknown vector D omega from r omega using D ω = H ω * X ω represented by the formula (15).
ここで*は複素共役を表す。式(15)から分かるようにDωを消去しても未知の変数であるHωが存在するため、rωを求めることは困難である。しかし、その絶対値ならば式(16)に示すようにHωが消去可能なことに着目する。 Here, * represents a complex conjugate. As can be seen from equation (15), even if Dω is eliminated, it is difficult to obtain rω because there is an unknown variable Hω . However, it is noted that H ω can be erased as shown in the equation (16) if the absolute value.
そしてゲイン係数を次式に示すように与える。
この式(17)から明らかなようにゲイン係数Gωは、類似度係数|rω|が1に近づくほど小さな値になりエコーが抑圧される。と同時にこのようにして求めたゲイン係数は、近端話者信号s(k)の欠損を軽減するように動作する。つまり、<Dω,Sω>=0となるほどの長時間を要することなく、短時間のスペクトル振幅を用いてエコーを抑圧するので、内積値が0でない分が誤差となって発生するミュージカルノイズの発生を抑圧することができる。
As is clear from the equation (17), the gain coefficient Gω becomes smaller as the similarity coefficient | rω |
類似度係数|rω|は、収音信号中のエコー成分の割合を表す値で0〜1の間の値をとる係数である。したがって、近端話者信号s(k)の欠損を軽減するように動作するが、類似度係数|rω|は1より大きな値をとることができないため、エコーをより大きく抑圧するようには動作しない。その結果、エコーが十分に抑圧できない場合があり、抑圧し切れなかったエコー成分が音質劣化として聴感上知覚される場合がある。エコーが十分に抑圧できない場合とは、近端話者信号s(k)の相関が残ってエコーが真値より小さく見積もられてしまう場合である。また、近端話者信号s(k)の相関が残る現象は、近端話者信号s(k)が大きい場合に顕著になる。 The similarity coefficient | r ω | is a coefficient representing a ratio of echo components in the collected sound signal and takes a value between 0 and 1. Therefore, although it operates so as to reduce the loss of the near-end speaker signal s (k), the similarity coefficient | r ω | cannot take a value larger than 1, so that the echo is suppressed more greatly. Do not work. As a result, the echo may not be sufficiently suppressed, and the echo component that cannot be completely suppressed may be perceived as auditory perception as sound quality degradation. The case where the echo cannot be sufficiently suppressed is a case where the correlation of the near-end speaker signal s (k) remains and the echo is estimated to be smaller than the true value. Further, the phenomenon that the correlation of the near-end speaker signal s (k) remains becomes significant when the near-end speaker signal s (k) is large.
この発明は、このような課題に鑑みてなされたものであり、エコー成分が残ることに起因する音質劣化を防止するエコー抑圧ゲイン推定方法と、それを用いたエコー消去装置とそのプログラムを提供することを目的とする。 The present invention has been made in view of such problems, and provides an echo suppression gain estimation method for preventing deterioration in sound quality caused by remaining echo components, an echo canceller using the same, and a program thereof. For the purpose.
この発明のエコー抑圧ゲイン推定方法は、再生信号周波数分析段階と、収音信号周波数分析段階と、エコーパワー推定段階と、エコーパワー補正係数計算段階と、エコー抑圧ゲイン計算段階と、を有する。再生信号周波数分析段階は、再生信号を周波数領域の再生信号スペクトルXωに変換する。収音信号周波数分析段階は、収音信号を周波数領域の収音信号スペクトルYωに変換する。エコーパワー推定段階は、再生信号スペクトルXωと収音信号スペクトルYωとを入力としてエコーパワー推定値|Dω^|2と音響結合量の推定値|Hω^|2を計算する。エコーパワー補正係数計算段階は、再生信号スペクトルXωと収音信号スペクトルYωと音響結合量の推定値|Hω^|2とを入力として、強調係数αとしてエコーパワー補正係数推定値γω^を次式で計算する。 The echo suppression gain estimation method of the present invention includes a reproduction signal frequency analysis stage, a sound pickup signal frequency analysis stage, an echo power estimation stage, an echo power correction coefficient calculation stage, and an echo suppression gain calculation stage. The reproduction signal frequency analysis step converts the reproduction signal into a reproduction signal spectrum Xω in the frequency domain. Collected sound signal frequency analysis stage converts the collected sound signal to the sound collection signal spectrum Y omega in the frequency domain. In the echo power estimation step, the echo power estimated value | D ω ^ | 2 and the acoustic coupling amount estimated value | H ω ^ | 2 are calculated by using the reproduction signal spectrum X ω and the collected sound signal spectrum Y ω as inputs. In the echo power correction coefficient calculation stage, the reproduction signal spectrum X ω , the collected sound signal spectrum Y ω, and the estimated value | H ω ^ | 2 of the acoustic coupling amount are input and the echo power correction coefficient estimated value γ ω is used as the enhancement coefficient α. ^ Is calculated by the following equation.
エコー抑圧ゲイン計算段階は、収音信号スペクトルYωとエコーパワー補正係数推定値γω^とエコーパワー推定値|Dω^|2とを入力として、エコーを抑圧するゲイン係数をエコーパワー補正係数推定値γω^が大きな値をとるほど小さな値になるように計算する。 In the echo suppression gain calculation stage, the sound collection signal spectrum Y ω , the echo power correction coefficient estimated value γ ω ^ and the echo power estimated value | D ω ^ | 2 are input, and the gain coefficient for suppressing the echo is the echo power correction coefficient. Calculation is performed so that the estimated value γ ω ^ becomes smaller as the estimated value becomes larger.
この発明のエコー抑圧ゲイン推定方法によれば、エコーパワー補正係数推定値が0〜無限大の範囲の値をとり、エコーパワー補正係数推定値が大きな値をとるほどゲイン係数が小さくなりエコーが抑圧され、逆にエコーパワー補正係数推定値が小さな値をとるほどゲイン係数が大きくなり近端話者信号の欠損を軽減するように動作する。したがって、従来法に比べてエコーを十分に抑圧できるように動作し、音声歪みに対してより頑健な音質劣化の少ないエコー抑圧を行うことが可能になる。 According to the echo suppression gain estimation method of the present invention, the echo power correction coefficient estimated value takes a value in the range of 0 to infinity, and the larger the value of the echo power correction coefficient estimated value is, the smaller the gain coefficient becomes and the echo is suppressed. Conversely, the smaller the estimated value of the echo power correction coefficient is, the larger the gain coefficient is, and the operation is performed to reduce the loss of the near-end speaker signal. Therefore, it is possible to perform echo suppression with less deterioration in sound quality, which operates more satisfactorily than the conventional method, and is more robust against audio distortion.
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。 Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.
〔発明の基本的な考え〕
実施例の説明の前に、この発明のエコー抑圧方法の基本的な考えを説明する。この発明は、エコースペクトルDωと近端話者信号スペクトルSωとの相関を踏まえた評価量εの最小解を新たに得ることで、エコー抑圧ゲイン推定の高精度化を図る考えである。
[Basic idea of the invention]
Prior to the description of the embodiments, the basic idea of the echo suppression method of the present invention will be described. This invention is to obtain a minimum solution evaluation value ε in light of the correlation between the echo spectrum D omega and the near-end talker's signal spectrum S omega newly, it is the idea to improve the accuracy of the echo suppression gain estimator.
上記した式(13)を変形するとゲイン係数Gω pは次式で表せる。なお、Gω pのpは、上記した従来技術のゲイン係数Gωと区別するための記号である。 When the above equation (13) is modified, the gain coefficient G ω p can be expressed by the following equation. Note that p in G ω p is a symbol for distinguishing from the above-described prior art gain coefficient G ω .
ここで、γωはエコーパワー補正係数であり、エコースペクトルDωと収音信号スペクトルYωの内積値をエコースペクトルの二乗ノルム値‖Dω‖2で除した値を示す。式(18)から分かるように未知の変数であるDωが存在するため、このままではゲインを求めることは困難である。 Here, γ ω is an echo power correction coefficient, and indicates a value obtained by dividing the inner product value of the echo spectrum D ω and the collected sound signal spectrum Y ω by the square norm value エ コ ー D ω ‖ 2 of the echo spectrum. Because there is D omega unknown variables as seen from equation (18), it is difficult to obtain a gain in this state.
そこでこの発明では、上記した式(1)の|Dω^|2=|Hω^|2|Xω|2の関係を用いてエコーパワー補正係数γωを更に式展開する。そして、エコーパワー補正係数γωを式(19)に示すように与える。 Therefore, in this invention, the above-mentioned equation (1) | further expression expansion echo power correction coefficient gamma omega using two relationships | D ω ^ | 2 = | H ω ^ | 2 | X ω. Then, giving an echo power correction coefficient gamma omega as shown in equation (19).
ここで、*は複素共役を表す。式(19)から分かるようにDωを消去しても未知の変数であるHωが存在するためγωを求めることは困難である。そこで、この発明では、式(20)に示すように、γωの絶対値をとり、また、|Hω|を|Hω^|で代用することで求める。ここで|Hω^|は|Hω^|2の平方根を示す。 Here, * represents a complex conjugate. As can be seen from equation (19), even if Dω is eliminated, it is difficult to obtain γω because there is an unknown variable Hω . Therefore, in the present invention, as shown in the equation (20), the absolute value of γ ω is taken, and | H ω | is obtained by substituting | H ω ^ |. Here | H ω ^ | are | show the square root of 2 | H ω ^.
エコーパワー補正係数推定値γω^は、再生信号スペクトルXωと収音信号スペクトルYωとの内積値の絶対値|<Xω,Yω>|を、再生信号スペクトルXωの二乗ノルム値‖Xω‖2に音響結合量の推定値の平方根|Hω^|を乗じた値で除した値である。内積|<Xω,Yω>|を例えば式(21)で、再生信号スペクトルの二乗ノルム値‖Xω‖2を例えば式(22)で、それぞれ計算する。 Echo-power correction coefficient estimates gamma omega ^, the absolute value of the inner product value of the reproduced signal spectrum X omega sound collection signal spectrum Y ω | <X ω, Y ω> | a squared norm value of the reproduced signal spectrum X omega ‖X omega ‖ 2 to the square root of the estimated value of the acoustic coupling amount | H ω ^ | is a value obtained by dividing the value obtained by multiplying. The inner product | <X ω , Y ω > | is calculated by, for example, equation (21), and the square norm value ‖X ω ‖ 2 of the reproduction signal spectrum is calculated by, for example, equation (22).
なお、式(21)、式(22)に置き換えて、周波数軸方向にも着目した式(23)、式(24)を用いてもよい。
なお、式(20)を一般化すると次式で表わせる。
αは強調係数、その値は0より大きな整数である。上記した式(20)はα=2とした場合である。 α is an enhancement coefficient, and its value is an integer greater than zero. The above equation (20) is a case where α = 2.
そして、ゲイン係数を次式に示すように与える。
式(26)を一般化すると次式で表せる。
式(27)のエコーパワー補正係数推定値γω^は、上記式(25)に示した一般化したγω^である。エコーパワー補正係数推定値γω^は0〜無限大の範囲で値をとる。よって、エコーパワー補正係数推定値γω^が大きければゲイン係数Gω pが小さくなりエコーが抑圧される。また、エコーパワー補正係数推定値γω^が小さければゲイン係数Gω pが大きくなり近端話者信号の欠損を軽減するように動作する。その結果、エコーを十分に抑圧できるように動作し、音声歪みに対してより頑健な音質劣化の少ないエコー抑圧を行うことが可能になる。 The echo power correction coefficient estimated value γ ω ^ in equation (27) is the generalized γ ω ^ shown in the above equation (25). The echo power correction coefficient estimated value γ ω ^ takes a value in the range of 0 to infinity. Therefore, if the echo power correction coefficient estimated value γ ω ^ is large, the gain coefficient G ω p is small and the echo is suppressed. Also, if the echo power correction coefficient estimated value γ ω ^ is small, the gain coefficient G ω p becomes large and operates so as to reduce the loss of the near-end speaker signal. As a result, the echo can be sufficiently suppressed, and it is possible to perform echo suppression with less deterioration in sound quality, which is more robust against voice distortion.
図1に、この発明のエコー消去装置100の機能構成例を示す。その動作フローを図2に示す。エコー消去装置100は、再生信号周波数分析部81と、収音信号周波数分析部82と、エコーパワー推定部83と、エコーパワー補正係数計算部110と、エコー抑圧ゲイン計算部120と、乗算部85と、周波数合成部86と、を具備する。エコー消去装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
FIG. 1 shows a functional configuration example of an
再生信号周波数分析部81は、再生信号を周波数領域の再生信号スペクトルに変換する(ステップS81)。収音信号周波数分析部82は、収音信号y(k)を周波数領域の収音信号スペクトルYωに変換する(ステップS82)。
The reproduction signal
エコーパワー推定部83は、再生信号スペクトルXωと収音信号スペクトルYωとを入力としてエコーパワー推定値|Dω^|2と音響結合量の推定値|Hω^|2を、上記式(1)で計算する(ステップS83)。エコーパワー補正係数計算部110は、再生信号スペクトルXωと収音信号スペクトルYωと音響結合量の推定値|Hω^|2とを入力として、エコーパワー補正係数推定値γω^を計算する(ステップS110)。
Echo
エコー抑圧ゲイン計算部120は、収音信号スペクトルYωと、エコーパワー補正係数推定値γω^と、エコーパワー推定値|Dω^|2とを入力として、エコーを抑圧するゲイン係数Gω pをエコーパワー補正係数推定値γω^が大きな値をとるほど小さな値になるように計算する(ステップS120)。なお、乗算部85と周波数合成部86の処理ステップは省略している。
The echo suppression
エコー消去装置100は、従来のエコー消去装置10(図6)の類似度係数計算部12がエコーパワー補正係数計算部110に、エコー抑圧ゲイン計算部14がエコー抑圧ゲイン計算部120に置き換わった以外は、従来技術と同じ構成である。この新しい構成のエコーパワー補正係数計算部110とエコー抑圧ゲイン計算部120について、更に詳しく説明する。
The
〔エコーパワー補正係数計算部〕
図3に、エコーパワー補正係数計算部110のより具体的な機能構成例を示す。エコーパワー補正係数計算部110は、内積演算手段110aと、ノルム演算手段110bと、除算手段110cと、レジスタ110dと、レジスタ110eと、を備える。
[Echo power correction coefficient calculator]
FIG. 3 shows a more specific functional configuration example of the echo power correction
内積演算手段110aは、再生信号スペクトルXωと収音信号スペクトルYωとを入力として、例えば、内積の絶対値を式(28)で演算する。 Inner product calculation means 110a is input with the reproduced signal spectrum X omega sound collection signal spectrum Y omega, for example, calculates the absolute value of the inner product in equation (28).
ここでαは強調係数であり、その値はレジスタ110eに記憶されている。また、εは上記した忘却係数であり、例えばε=0.016といった値が、予めレジスタ110dに記憶されている。εが1に近づくほど現在の再生信号スペクトルXωと収音信号スペクトルYωに依存した(重み付けされた)それぞれの値になる。
Here, α is an enhancement coefficient, and the value is stored in the
ノルム演算手段110bは、式(29)で再生信号スペクトルXωのノルム値‖Xω‖2を演算する。 The norm calculation means 110b calculates the norm value ‖X ω ‖ 2 of the reproduction signal spectrum X ω using the equation (29).
除算手段110cは、内積値と再生信号スペクトルのα乗ノルム値‖Xω‖αと音響結合量の推定値|Hω^|2とを入力として、上記した式(25)の演算をしてエコーパワー補正係数推定値γω^を出力する。 The dividing means 110c receives the inner product value, the α power norm value ‖X ω ‖ α of the reproduction signal spectrum, and the estimated value | H ω ^ | 2 of the acoustic coupling amount, and performs the calculation of the above equation (25). The echo power correction coefficient estimated value γ ω ^ is output.
〔エコー抑圧ゲイン計算部〕
図4に、エコー抑圧ゲイン計算部120のより具体的な機能構成例を示す。エコー抑圧ゲイン計算部120は、エコーパワー調整手段120aと、減算手段120bと、除算手段120cと、エコーの消し残りを無くす定数Cを記録したレジスタ120dと、強調係数αを記録したレジスタ120eとを備える。
[Echo suppression gain calculator]
FIG. 4 shows a more specific functional configuration example of the echo suppression
エコーパワー調整手段120aは、エコーパワー推定値|Dω^|2とエコーパワー補正係数推定値γω^を入力として、エコーパワー推定値のノルム|Dω^|を強調係数αでべき乗した後にお互いを乗算し、さらにその値に定数Cを乗算してエコーパワー調整値を計算する(図5のステップS120a)。 The echo power adjusting means 120a receives the echo power estimated value | D ω ^ | 2 and the echo power correction coefficient estimated value γ ω ^ as input, and after raising the norm | D ω ^ | Multiply each other, and further multiply the value by a constant C to calculate an echo power adjustment value (step S120a in FIG. 5).
減算手段120bは、エコーパワー調整値と収音信号スペクトルYωとを入力とし、収音信号スペクトルYωの絶対値を強調係数αでべき乗した値からエコーパワー調整値を減算する(ステップS120b)。 Subtracting means 120b inputs the echo power adjustment value and the collected signal spectrum Y omega, subtracts the echo-power adjustment values to absolute values of sound collection signal spectrum Y omega from the value raised to the power of the enhancement coefficient alpha (step S120b) .
除算手段120cは、減算手段120bの出力信号を、収音信号スペクトルYωの絶対値を強調係数αでべき乗した値で除算してゲイン係数Gω pを出力する(ステップS120c)。つまり、エコー抑圧ゲイン計算部120は、式(30)を計算してゲイン係数Gω pを出力する。
Dividing means 120c is the output signal of the subtracting means 120b, by dividing by a power value of the absolute value of the collected sound signal spectrum Y omega with emphasis coefficient α and outputs a gain factor G omega p (step S120c). That is, the echo suppression
ここで強調係数αは正の数であるとして例えば2とする。定数Cは正の数であるとして例えば1.0とする。強調係数αと、定数Cは、ゲイン係数Gω pを適当な値に調整するものである。強調係数α=2とするとウィナーフィルタに近い式になる。 Here, the enhancement coefficient α is assumed to be a positive number, for example, 2. The constant C is assumed to be a positive number, for example, 1.0. The enhancement coefficient α and the constant C are used to adjust the gain coefficient G ω p to an appropriate value. When the emphasis coefficient α = 2, the expression is close to a Wiener filter.
以上のようにして求めたゲイン係数Gω pは、近端話者信号s(k)の欠損を軽減するようにエコー消去装置100を動作させる。したがって、従来法に比べて音声歪みに対して頑健なミュージカルノイズ発生の少ないエコー抑圧を行うことが可能になる。
The gain coefficient G ω p obtained as described above operates the
なお、この発明の方法及び装置は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、音響結合量の推定値|Hω^|は、エコーパワー推定部83で計算したものを、エコーパワー補正係数計算部110で用いる例で説明を行ったが、再生信号スペクトルXωと収音信号スペクトルYωとが入力されるエコーパワー補正係数計算部110で音響結合量の推定値|Hω^|を求めるようにしても良い。
In addition, the method and apparatus of this invention are not limited to the above-mentioned embodiment, In the range which does not deviate from the meaning of this invention, it can change suitably. For example, the estimate of the acoustic coupling amount | H ω ^ | is the one computed in the echo
また、上記方法及び装置において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。また、上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。 Further, the processes described in the above method and apparatus are not only executed in time series according to the order of description, but also may be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes. Good. Further, when the processing means in the above apparatus is realized by a computer, the processing contents of functions that each apparatus should have are described by a program. Then, by executing this program on the computer, the processing means in each apparatus is realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−
R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-
R (Recordable) / RW (ReWritable) or the like can be used as a magneto-optical recording medium, MO (Magneto Optical disc) or the like as a semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory) or the like as a semiconductor memory.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a recording device of a server computer and transferring the program from the server computer to another computer via a network.
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 Each means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.
Claims (5)
収音信号を周波数領域の収音信号スペクトルYωに変換する収音信号周波数分析段階と、
上記再生信号スペクトルXωと上記収音信号スペクトルYωとを入力としてエコーパワー推定値|Dω^|2と音響結合量の推定値|Hω^|2を計算するエコーパワー推定段階と、
上記再生信号スペクトルXωと上記収音信号スペクトルYωと上記音響結合量の推定値|Hω^|2とを入力として、強調係数αとしてエコーパワー補正係数推定値γω^を次式で計算する
エコーパワー補正係数計算段階と、
上記収音信号スペクトルYωと上記エコーパワー補正係数推定値γω^と上記エコーパワー推定値|Dω^|2とを入力として、エコーを抑圧するゲイン係数を上記エコーパワー補正係数推定値γω^が大きな値をとるほど小さな値になるように計算するエコー抑圧ゲイン計算段階と、
を有するエコー抑圧ゲイン推定方法。 A reproduction signal frequency analysis stage for converting the reproduction signal into a reproduction signal spectrum Xω in the frequency domain;
A collected signal frequency analysis step of converting the collected sound signal to the sound collection signal spectrum Y omega of the frequency domain,
An echo power estimation stage for calculating an echo power estimated value | D ω ^ | 2 and an acoustic coupling amount estimated value | H ω ^ | 2 using the reproduction signal spectrum X ω and the collected sound signal spectrum Y ω as inputs;
The reproduction signal spectrum Xω , the collected sound signal spectrum Yω, and the estimated value | H ω ^ | 2 of the acoustic coupling amount are input, and an echo power correction coefficient estimated value γ ω ^ as an enhancement coefficient α is expressed by the following equation. calculate
Echo power correction coefficient calculation stage,
The sound collection signal spectrum Y ω , the echo power correction coefficient estimated value γ ω ^ and the echo power estimated value | D ω ^ | 2 are input, and a gain coefficient for suppressing echo is the echo power correction coefficient estimated value γ. Echo suppression gain calculation stage for calculating so that ω ^ becomes smaller as the value increases,
An echo suppression gain estimation method comprising:
上記エコー抑圧ゲイン計算段階は、上記エコーパワー推定値の平方根|Dω^|を上記αでべき乗した値に、上記エコーパワー補正係数推定値γω^を乗算したエコーパワー調整値を生成するエコーパワー調整過程を、含むことを特徴とするエコー抑圧ゲイン推定方法。 The echo suppression gain estimation method according to claim 1,
The echo suppression gain calculating step generates an echo power adjustment value by multiplying a value obtained by multiplying the square root of the echo power estimated value | D ω ^ | by the power α and the echo power correction coefficient estimated value γ ω ^. An echo suppression gain estimation method comprising a power adjustment process.
上記エコー抑圧ゲイン計算段階は、
上記エコーパワー調整過程と、
上記収音信号スペクトルの大きさ|Yω|を上記αでべき乗した値から上記エコーパワー調整値を減算する減算過程と、
上記減算過程の出力信号を上記収音信号スペクトルの大きさ|Yω|を上記αでべき乗した値で除算する除算過程と、
から成ることを特徴とするエコー抑圧ゲイン推定方法。 The echo suppression gain estimation method according to claim 2,
The echo suppression gain calculation stage is
The above echo power adjustment process,
A subtraction process for subtracting the echo power adjustment value from a value obtained by raising the magnitude of the collected sound signal spectrum | Y ω | to the power of α;
A division process of dividing the output signal of the subtraction process by a value obtained by raising the magnitude | Y ω | of the collected sound signal spectrum to the power of α;
An echo suppression gain estimation method comprising:
収音信号を周波数領域の収音信号スペクトルYωに変換する収音信号周波数分析部と、
上記再生信号スペクトルXωと上記収音信号スペクトルYωとを入力としてエコーパワー推定値|Dω^|2と音響結合量の推定値|Hω^|2を計算するエコーパワー推定部と、
上記再生信号スペクトルXωと上記収音信号スペクトルYωと上記音響結合量の推定値|Hω^|2とを入力として、強調係数αとしてエコーパワー補正係数推定値γω^を次式で計算する
エコーパワー補正係数計算部と、
上記収音信号スペクトルYωと上記エコーパワー補正係数推定値γω^と上記エコーパワー推定値|Dω^|2とを入力として、エコーを抑圧するゲイン係数を上記エコーパワー補正係数推定値γω^が大きな値をとるほど小さな値になるように計算するエコー抑圧ゲイン計算部と、
を具備するエコー抑圧ゲイン推定装置。 A reproduction signal frequency analysis unit for converting the reproduction signal into a reproduction signal spectrum Xω in the frequency domain;
A collected signal frequency analysis unit for converting the collected sound signal to the sound collection signal spectrum Y omega of the frequency domain,
An echo power estimator for calculating the echo power estimated value | D ω ^ | 2 and the acoustic coupling amount estimated value | H ω ^ | 2 using the reproduction signal spectrum X ω and the collected sound signal spectrum Y ω as inputs;
The reproduction signal spectrum Xω , the collected sound signal spectrum Yω, and the estimated value | H ω ^ | 2 of the acoustic coupling amount are input, and an echo power correction coefficient estimated value γ ω ^ as an enhancement coefficient α is expressed by the following equation. calculate
An echo power correction coefficient calculator,
The sound collection signal spectrum Y ω , the echo power correction coefficient estimated value γ ω ^ and the echo power estimated value | D ω ^ | 2 are input, and a gain coefficient for suppressing echo is the echo power correction coefficient estimated value γ. an echo suppression gain calculator that calculates a smaller value as ω ^ takes a larger value;
An echo suppression gain estimation apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012154350A JP5769672B2 (en) | 2012-07-10 | 2012-07-10 | Echo suppression gain estimation method, echo canceller and program using the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012154350A JP5769672B2 (en) | 2012-07-10 | 2012-07-10 | Echo suppression gain estimation method, echo canceller and program using the same |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014017698A true JP2014017698A (en) | 2014-01-30 |
JP5769672B2 JP5769672B2 (en) | 2015-08-26 |
Family
ID=50112011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012154350A Expired - Fee Related JP5769672B2 (en) | 2012-07-10 | 2012-07-10 | Echo suppression gain estimation method, echo canceller and program using the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5769672B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014017697A (en) * | 2012-07-10 | 2014-01-30 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression gain estimation method, echo elimination apparatus using the same, and program |
JP2014150368A (en) * | 2013-01-31 | 2014-08-21 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression gain estimation method, echo cancellation device using the same, and program |
CN106782586A (en) * | 2016-11-14 | 2017-05-31 | 阔地教育科技有限公司 | A kind of acoustic signal processing method and device |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009188724A (en) * | 2008-02-06 | 2009-08-20 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression gain estimation method, echo canceler using the same, device program and recording medium |
JP2010103875A (en) * | 2008-10-27 | 2010-05-06 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression apparatus, echo suppression method, echo suppression program, and recording medium |
JP2010187086A (en) * | 2009-02-10 | 2010-08-26 | Nippon Telegr & Teleph Corp <Ntt> | Echo cancellation device, and method and program for the same |
-
2012
- 2012-07-10 JP JP2012154350A patent/JP5769672B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009188724A (en) * | 2008-02-06 | 2009-08-20 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression gain estimation method, echo canceler using the same, device program and recording medium |
JP2010103875A (en) * | 2008-10-27 | 2010-05-06 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression apparatus, echo suppression method, echo suppression program, and recording medium |
JP2010187086A (en) * | 2009-02-10 | 2010-08-26 | Nippon Telegr & Teleph Corp <Ntt> | Echo cancellation device, and method and program for the same |
Non-Patent Citations (1)
Title |
---|
JPN7015001023; Masahiro Fukui,et al.: 'Acoustic-Coupling Level Estimation for Performance Improvement of Echo Reduction' Proceedings of the 11th International Workshop on Acoustic Echo and Noise Control , 20080914, pages.1-4, IWAENC * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014017697A (en) * | 2012-07-10 | 2014-01-30 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression gain estimation method, echo elimination apparatus using the same, and program |
JP2014150368A (en) * | 2013-01-31 | 2014-08-21 | Nippon Telegr & Teleph Corp <Ntt> | Echo suppression gain estimation method, echo cancellation device using the same, and program |
CN106782586A (en) * | 2016-11-14 | 2017-05-31 | 阔地教育科技有限公司 | A kind of acoustic signal processing method and device |
Also Published As
Publication number | Publication date |
---|---|
JP5769672B2 (en) | 2015-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4787851B2 (en) | Echo suppression gain estimation method, echo canceller using the same, device program, and recording medium | |
JP4568733B2 (en) | Noise suppression device, noise suppression method, noise suppression program, and computer-readable recording medium | |
JP5087024B2 (en) | Echo canceling apparatus, method and program | |
KR101737824B1 (en) | Method and Apparatus for removing a noise signal from input signal in a noisy environment | |
JP5769671B2 (en) | Echo suppression gain estimation method, echo canceller and program using the same | |
CN112309417B (en) | Method, device, system and readable medium for processing audio signal with wind noise suppression | |
JP5769672B2 (en) | Echo suppression gain estimation method, echo canceller and program using the same | |
JP5769670B2 (en) | Echo suppression gain estimation method, echo canceller and program using the same | |
JP5161157B2 (en) | Frequency domain echo removal apparatus, frequency domain echo removal method, program | |
JP5889224B2 (en) | Echo suppression gain estimation method, echo canceller and program using the same | |
JP2003140700A (en) | Method and device for noise removal | |
JP5562451B1 (en) | Echo suppression gain estimation method, echo canceller and program using the same | |
JP2014194437A (en) | Voice processing device, voice processing method and voice processing program | |
JP5044594B2 (en) | Multi-channel echo canceller, method and program thereof | |
JP5609157B2 (en) | Coefficient setting device and noise suppression device | |
JP6827908B2 (en) | Speech enhancement device, speech enhancement learning device, speech enhancement method, program | |
JP5325134B2 (en) | Echo canceling method, echo canceling apparatus, program thereof, and recording medium | |
JP5583181B2 (en) | Cascade connection type transmission system parameter estimation method, cascade connection type transmission system parameter estimation device, program | |
JP6542705B2 (en) | Speech detection apparatus, speech detection method, program, recording medium | |
JP4769161B2 (en) | Echo canceller apparatus, method thereof, program thereof, and recording medium thereof | |
JP7235117B2 (en) | ECHO ERASE DEVICE, ECHO ERASE METHOD, AND PROGRAM | |
JP5097148B2 (en) | Acoustic coupling amount calculation device, method and program | |
JP5925149B2 (en) | Acoustic coupling amount estimating apparatus, echo canceling apparatus, method and program thereof | |
JP5815614B2 (en) | Reverberation suppression apparatus and method, program, and recording medium | |
JP4209348B2 (en) | Echo suppression method, apparatus for implementing this method, program, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140813 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150616 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150623 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5769672 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |