JP5466581B2 - Echo canceling method, echo canceling apparatus, and echo canceling program - Google Patents
Echo canceling method, echo canceling apparatus, and echo canceling program Download PDFInfo
- Publication number
- JP5466581B2 JP5466581B2 JP2010128725A JP2010128725A JP5466581B2 JP 5466581 B2 JP5466581 B2 JP 5466581B2 JP 2010128725 A JP2010128725 A JP 2010128725A JP 2010128725 A JP2010128725 A JP 2010128725A JP 5466581 B2 JP5466581 B2 JP 5466581B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- echo
- relaxation coefficient
- vowel
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、マイクで収音される収音信号からスピーカで再生される受話信号に起因するエコー成分を、周波数毎にゲインを乗じて抑圧する反響消去技術に関する。 The present invention relates to an echo canceling technique for suppressing an echo component caused by a received signal reproduced by a speaker from a collected signal collected by a microphone by multiplying a gain for each frequency.
反響消去装置は、適応フィルタによる線形エコー消去と、振幅スペクトル制御による非線形エコー抑圧の2段構成となっているものがある。非特許文献1記載の反響消去装置10が、2段構成の反響消去装置の従来技術として知られている。図1を用いて、反響消去装置10の概略を説明する。
Some echo cancellation apparatuses have a two-stage configuration of linear echo cancellation by an adaptive filter and nonlinear echo suppression by amplitude spectrum control. An echo canceling device 10 described in Non-Patent
スピーカ2で再生された受話信号x(n)はエコー経路5を経て、マイク3に回り込む。反響消去装置10は、マイク3で収音される収音信号y(n)からスピーカ2で再生される受話信号x(n)に起因するエコー成分を抑圧する。なお、nは時刻を表す整数である。
The received signal x (n) reproduced by the
この構成では、適応フィルタ部11において、受話端1から入力される受話信号x(n)を用いて、収音信号y(n)から線形処理でエコー成分を消去し、残留エコー信号d1(n)を求める。さらに、周波数領域変換部13において、残留エコー信号d1(n)を現在時刻nからd1(n)、d1(n−1)、…、d1(n−L+1)のL個分を1フレームとし、周波数領域の信号D1(f,k)に変換する。D1(f,k)は残留エコー信号d1(n)をフーリエ変換したものであり、fは離散角周波数を、kはフレーム時刻を表し、フーリエ変換長をFとしたときfは1からFの整数である。
In this configuration, the
雑音抑圧部15において、残留エコー信号D1(f,k)に含まれる雑音成分を抑圧し、雑音除去信号D2(f,k)を求める。周波数領域変換部17において、受話信号x(n)を周波数領域の信号X(f,k)に変換する。さらに、残留エコー抑圧部18において、この信号X(f,k)を用いて、雑音除去信号D2(f,k)に含まれる残留エコー成分を抑圧し、送話信号D3(f,k)を求める。時間領域変換部19において、送話信号D3(f,k)を時間領域の送話信号d3(n)に変換し、送話端4へ出力する。
The
ここで残留エコー抑圧部18におけるエコー抑圧処理の部分に着目する。残留エコー抑圧部18では、エコー抑圧ゲインG(f,k)を求め、残留エコー抑圧部18の入力信号であるD2(f,k)に対して周波数領域でG(f,k)を乗ずることでエコーを抑圧している。具体的にはエコー抑圧ゲインG(f,k)を
G(f,k)=(|D2(f,k)|2−|Y^(f,k)|2)/|D2(f,k)|2 (1)
として計算する。|・|は絶対値を取ることを表す。さらに、送話信号D3(f,k)を
D3(f,k)=G(f,k)D2(f,k) (2)
として計算する。
式(1)のY^(f,k)は疑似残留エコーであり、非特許文献1では
E[|Y^(f,k)|2]=E[|H(f,k)|2]|X(f,k)|2+βE[|Y^(f,k-1)|2] (3)
として求めている。H(f,k)は疑似残留エコー経路を表し、E[|X(f,k)|2]とE[|D2(f,k)|2]の比の最小値等を用いて求める。E[・]は集合平均を取ることを表す。βは忘却定数で残響時間に合わせた値に設定する。
Here, attention is focused on the part of echo suppression processing in the residual
Calculate as | · | Represents taking an absolute value. Further, the transmission signal D 3 (f, k) is changed to D 3 (f, k) = G (f, k) D 2 (f, k) (2)
Calculate as
Y ^ (f, k) in equation (1) is a pseudo-residual echo.
E [| Y ^ (f, k) | 2 ] = E [| H (f, k) | 2 ] | X (f, k) | 2 + βE [| Y ^ (f, k-1) | 2 ] (3)
Asking. H (f, k) represents a pseudo residual echo path, and is obtained using the minimum value of the ratio of E [| X (f, k) | 2 ] and E [| D 2 (f, k) | 2 ]. . E [•] represents taking a set average. β is a forgetting constant and is set to a value that matches the reverberation time.
残留エコー抑圧部18における振幅スペクトル制御は、適応フィルタ部11でエコーが消しきれなかった場合に残る残留エコー成分を消去することができる。しかし、適応フィルタ部11と異なり、エコー抑圧量に応じてエコーとは関係ない送話音声も一部抑圧してしまう。その結果、送話音声が歪んで聞き取りづらくなってしまう問題がある。
The amplitude spectrum control in the residual
そこで、非特許文献1では、音声歪を軽減する方法として原音付加率1−αを設定する方法を提案している。つまり、送話信号を式(2)の代わりに
D3(f,k)=(1−α)D3(f,k)+αG(f,k)D2(f,k)(4)
としてエコー抑圧ゲインG(f,k)の影響を軽減する。ここで原音付加率αは0から1の実数である。
Therefore, Non-Patent
To reduce the influence of the echo suppression gain G (f, k). Here, the original sound addition rate α is a real number from 0 to 1.
原音付加率を大きくし、エコー抑圧ゲインを小さくすれば音声の歪は少なくなるが、その分エコー消去性能は悪くなり、この二つはトレードオフの関係になっている。最適な原音付加率は、抑圧対象の信号により異なるが、従来技術の原音付加率は固定であり、必ずしも状況に応じた値を設定することができず、最適な原音付加率を設定できないという問題がある。 If the original sound addition rate is increased and the echo suppression gain is decreased, the distortion of the sound is reduced, but the echo cancellation performance is deteriorated accordingly, and the two are in a trade-off relationship. The optimal original sound addition rate varies depending on the signal to be suppressed, but the original sound addition rate of the prior art is fixed, and it is not always possible to set a value according to the situation, and the optimal original sound addition rate cannot be set. There is.
反響消去装置において、母音部分の信号に対して最適な原音付加率とした場合、子音部分の信号は、もともとの振幅が小さいことに加え、周波数スペクトルの特性が抑圧により変化するため別の子音に聞き間違えるという弊害が生じると考えられる。以下、図2を用いて説明する。送話音声が母音の場合、送話音声に残留エコーが重畳した信号(図2A参照)に、残留エコー抑圧処理により送話音声の欠損が生じた場合にも元のスペクトルと概形はあまり変わらない(図2B参照)。同様の原音付加率で送話音声が子音の場合、送話音声に残留エコーが重畳した信号(図2C参照)に、残留エコー抑圧処理により送話音声の欠損が生じると、もともとの振幅が小さいことに加え、周波数スペクトルの特性が抑圧により変化するため(図2D参照)、元のスペクトルと大きく異なるものとなり、別の子音に聞き間違える等の問題が生じる。 In the echo canceller, when the optimal original sound addition rate is set for the vowel part signal, the consonant part signal has a small original amplitude, and the frequency spectrum characteristics change due to suppression. It seems that there will be a negative effect of making mistakes. Hereinafter, a description will be given with reference to FIG. When the transmitted voice is a vowel, the original spectrum and the outline are not so different even when the transmitted voice is lost due to the residual echo suppression process in the signal (see FIG. 2A) in which the residual echo is superimposed on the transmitted voice. No (see FIG. 2B). When the transmission voice is a consonant with the same original sound addition rate, if the transmission voice is lost due to the residual echo suppression process in the signal in which the residual echo is superimposed on the transmission voice (see FIG. 2C), the original amplitude is small. In addition, since the characteristics of the frequency spectrum change due to the suppression (see FIG. 2D), the frequency spectrum is greatly different from the original spectrum, causing problems such as misunderstanding of another consonant.
逆に、子音部分の信号に対して最適な原音付加率とした場合には、母音部分で十分なエコー消去性能を得ることができないという問題が生じる。 On the other hand, when the original sound addition rate is optimal for the signal of the consonant part, there arises a problem that sufficient echo canceling performance cannot be obtained in the vowel part.
上記の課題を解決するために、本発明に係る反響消去技術は、収音信号に基づいて得られる信号d(n)及び受話信号x(n)を、フレーム毎にそれぞれ周波数領域の信号D(f,k)及びX(f,k)に変換し、信号D(f,k)及びX(f,k)を用いて、エコー抑圧ゲインGb^(f,k)を求め、信号D(f,k)からエコー成分を取り除いた信号D’(f,k)を用いて、抑圧対象の信号が母音であるか子音であるかを判定し、抑圧対象の信号が母音であると判定された場合にはγ2を緩和係数β(k)とし、それ以外の場合にはγ1を緩和係数β(k)とし、信号D(f,k)とエコー抑圧ゲインGb^(f,k)と緩和係数β(k)との積から信号D(f,k)と緩和係数β(k)との積を減算しD(f,k)に加算した結果が得られるような処理を行って、第2残留エコー抑圧信号D3(f,k)を求め、第2残留エコー抑圧信号D3(f,k)を時間領域の信号d3(n)に変換する。但し、nは時刻を、f=1,2,…,Fは離散角周波数を、kはフレーム時刻を表し、γ1<γ2とする。 In order to solve the above-described problem, the echo canceling technique according to the present invention converts a signal d (n) and a received signal x (n) obtained based on a collected sound signal into a frequency domain signal D () for each frame. f, k) and X (f, k), and using the signals D (f, k) and X (f, k), the echo suppression gain Gb ^ (f, k) is obtained and the signal D (f , K) using the signal D ′ (f, k) obtained by removing the echo component, it is determined whether the signal to be suppressed is a vowel or a consonant, and the signal to be suppressed is determined to be a vowel. In this case, γ 2 is the relaxation coefficient β (k), and in other cases, γ 1 is the relaxation coefficient β (k), and the signal D (f, k) and the echo suppression gain Gb ^ (f, k) The result obtained by subtracting the product of the signal D (f, k) and the relaxation coefficient β (k) from the product of the relaxation coefficient β (k) and adding it to D (f, k) is obtained. It performs processing as a second residual echo suppressed signal D 3 (f, k) the calculated, converted second residual echo suppressed signal D 3 (f, k) to the signal d 3 (n) of the time domain . Here, n represents time, f = 1, 2,..., F represents discrete angular frequency, k represents frame time, and γ 1 <γ 2 .
本発明は、状況に応じてエコー抑圧ゲインの大きさを変更し、十分にエコー抑圧をしながら、音声歪を同時に少なくするという効果を奏する。 The present invention produces an effect of simultaneously reducing sound distortion while changing the magnitude of the echo suppression gain according to the situation and sufficiently suppressing the echo.
以下、本発明の実施の形態について、詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail.
<反響消去装置100>
反響消去装置100は、マイク3で収音される収音信号y(n)からスピーカ2で再生される受話信号x(n)に起因するエコー成分を周波数毎にエコー抑圧ゲインを乗じて抑圧する。
<Echo canceling apparatus 100>
The echo canceling apparatus 100 suppresses the echo component caused by the received signal x (n) reproduced by the
反響消去装置100は、例えば、図3に示すように、適応フィルタ部11、周波数領域変換部13及び17、雑音抑圧部15、時間領域変換部19、第1残留エコー抑圧部130、母音子音判定部140、緩和係数決定部150及び第2残留エコー抑圧部160を有する。図3及び図4を用いて実施例1に係る反響消去装置100を説明する。なお、図3中、図1と対応する部分には同一の符号を付し、説明を省略する。以下の図についても同様に省略する。
<適応フィルタ部11>
適応フィルタ部11は、受話端1から入力される受話信号x(n)を用いて、マイク3から入力される収音信号y(n)から線形処理でエコー成分を消去し、残留エコー信号d1(n)を求め(s11)、周波数領域変換部13へ出力する。例えば図5に示すように、適応フィルタ部11は、エコー予測部11a、減算部11b及びエコー経路推定部11cを備える。
For example, as shown in FIG. 3, the echo cancellation apparatus 100 includes an
<
The
エコー予測部11aは、フィルタ係数ベクトルH’(n)と受話信号x(n)を受け取り、これを以下の式のように畳み込み、疑似エコー信号y’(n)を求め、これを減算部11bへ送る。
The
y’(n)=H’ T(n)X(n)
但し、
H’(n)=[h’(n,0)…h’(n,L−1)]T
X(n)=[x(n)…x(n−L+1)]T
であり、[ ]Tはベクトルの転置を、Lはフィルタ長を、h’(n,l)は各フィルタ係数を表す。
y ′ (n) = H ′ T (n) X (n)
However,
H ′ (n) = [h ′ (n, 0)... H ′ (n, L−1)] T
X (n) = [x (n)... X (n−L + 1)] T
[] T represents vector transposition, L represents filter length, and h ′ (n, l) represents each filter coefficient.
減算部11bは、収音信号y(n)と疑似エコー信号y’(n)を受け取り、収音信号y(n)から疑似エコー信号y’(n)を差し引き、残留エコー信号d1(n)(=y(n)−y’(n))を求め、周波数領域変換部13とエコー経路推定部11cへ送る。
The subtractor 11b receives the collected sound signal y (n) and the pseudo echo signal y ′ (n), subtracts the pseudo echo signal y ′ (n) from the collected sound signal y (n), and obtains a residual echo signal d 1 (n ) (= Y (n) −y ′ (n)) is obtained and sent to the frequency
エコー経路推定部11cは、残留エコー信号d1(n)と受話信号x(n)を受け取り、これに基づき、収音信号y(n)と疑似エコー信号y’(n)との誤差が小さくなるようにエコー予測部11aのフィルタ係数ベクトルH’(n)が更新し、エコー予測部11aに送る。例えば、NLMS(Normalized Least Mean Square)アルゴリズムを用いて、以下の式のようにフィルタ係数h’(n+1)を更新する。
The echo
H’(n+1)=H’(n)+(μd1(n)X(n))/(XT(n)X(n))
但し、μは推定を安定にするために設定されるステップサイズである。
<周波数領域変換部13及び17>
周波数領域変換部13は、例えば、残留エコー信号d1(n)を受け取り、現在時刻nからd1(n)、d1(n−1)、…、d1(n−L+1)のL個分を1フレームとし、フレーム毎に周波数領域の信号D2(f,k)に変換し(s13)、雑音抑圧部15に送る。なお、反響消去装置100に適応フィルタ部11を設けない場合には、周波数領域変換部13は、収音信号y(n)を受け取る構成としてもよい。Lは通常10msや20msに対応するサンプル数を用いる。
H ′ (n + 1) = H ′ (n) + (μd 1 (n) X (n)) / (X T (n) X (n))
However, μ is a step size set to stabilize the estimation.
<Frequency
The frequency
周波数領域変換部17は、受話信号x(n)を受け取り、フレーム毎に周波数領域の信号X(f,k)に変換し(s17)、第1エコー抑圧部130に送る。なお、変換方式としては、離散フーリエ変換(DFT:discrete Fourier transform)や短時間フーリエ変換(STFT:short-time Fourier transform)等がある。
<雑音抑圧部15>
雑音抑圧部15は、周波数領域の残留エコー信号D1(f,k)を受け取り、この信号D1(f,k)に含まれる雑音成分N(f,k)を抑圧し、雑音除去信号D2(f,k)を求め(s15)、第1残留エコー抑圧部130と第2残留エコー抑圧部160へ送る。雑音抑圧部15は、例えば図6に示すように、雑音レベル推定部15a、雑音抑圧ゲイン計算部15b、乗算部15cを備える。
The
<
The
雑音レベル推定部15aは、信号D1(f,k)を受け取り、音声の存在しない区間の入力信号D1(f,k)から集合平均E[|N(f,k)|2]を求める。但し、N(f,k)は残留エコー信号D1(f,k)に含まれる雑音成分とする。
The noise
雑音抑圧ゲイン計算部15bは、信号D1(f,k)と集合平均E[|N(f,k)|2]を受け取り、以下の式により、雑音抑圧ゲインGa^(f,k)を求める。
The noise suppression
乗算部15cは、残留エコー信号D1(f,k)に雑音抑圧ゲインGa^(f,k)を乗じて、雑音除去信号D2(f,k)を求める。その際、以下の式にように、雑音除去信号D2(f,k)に適当な割合1−αで残留エコー信号D1(f,k)(原音)を付加し、音声歪をマスクして雑音除去信号D2(f,k)の聴感上の劣化を抑える構成としてもよい。
D2(f,k)=(1−α)D1(f,k)+αGa^(f,k)D1(f,k)
The
D 2 (f, k) = (1-α) D 1 (f, k) + αGa ^ (f, k) D 1 (f, k)
<第1残留エコー抑圧部130>
第1残留エコー抑圧部130は、雑音除去信号D2(f,k)と受話信号X(f,k)を受け取り、これを用いてエコー抑圧ゲインGb^(f,k)を求め、これを信号D2(f,k)に乗じて第1残留エコー抑圧信号D’3(f,k)を求める(s130)。第1残留エコー抑圧部130は、第1残留エコー抑圧信号D’3(f,k)を母音子音判定部140に送り、エコー抑圧ゲインGb^(f,k)を第2残留エコー抑圧部160に送る。
<First Residual
The first residual
第1残留エコー抑圧部130は、例えば図7に示すように、エコー抑圧ゲイン計算部131と乗算部135を備える。さらに、エコー抑圧ゲイン計算部131は、音響結合量推定部132、エコーレベル推定部133、ゲイン計算部134を備える。図7及び図8を用いて各部の処理を説明する。
The first residual
音響結合量推定部132は、雑音除去信号D2(f,k)と受話信号X(f,k)を受け取る。音響結合量推定部132は、雑音除去信号D2(f,k)と受話信号X(f,k)の集合平均E[|D2(f,k)|2]、E[|X(f,k)|2]をそれぞれ求め、E[|D2(f,k)|2]、E[|X(f,k)|2]の比の最小値を更新することによって、音響結合量の周波数特性E[|H(f,k)|2]を求め(s132)、エコーレベル推定部133へ送る。
The acoustic coupling
エコーレベル推定部133は、音響結合量の周波数特性E[|H(f,k)|2]と受話信号X(f,k)を受け取り、式(3)により、疑似残留エコーY^(f,k)の集合平均E[|Y^(f,k)|2]を求め(s133)、ゲイン計算部134に送る。
The echo
E[|Y^(f,k)|2]=E[|H(f,k)|2]|X(f,k)|2+βE[|Y^(f,k-1)|2] (3)
ゲイン計算部134は、疑似残留エコーY^(f,k)と雑音除去信号D2(f,k)を受け取り、式(1)により、エコー抑圧ゲインGb^(f,k)を求め(s131,s134)、乗算部135と第2残留エコー抑圧部135に送る。
E [| Y ^ (f, k) | 2 ] = E [| H (f, k) | 2 ] | X (f, k) | 2 + βE [| Y ^ (f, k-1) | 2 ] (3)
G(f,k)=(|D2(f,k)|2−|Y^(f,k)|2)/|D2(f,k)|2 (1)
乗算部135は、式(2)により、雑音除去信号D2(f,k)にエコー抑圧ゲインGb^(f,k)を乗じて、第1残留エコー抑圧信号D’3(f,k)を求め(s135)、母音子音判定部140に送る。
D’3(f,k)=G(f,k)D2(f,k) (2)
G (f, k) = (| D 2 (f, k) | 2 − | Y ^ (f, k) | 2 ) / | D 2 (f, k) | 2 (1)
The
D ′ 3 (f, k) = G (f, k) D 2 (f, k) (2)
<母音子音判定部140>
母音子音判定部140は、第1残留エコー抑圧信号D’3(f,k)を受け取り、これを用いて、抑圧対象の信号D2(f,k)が母音であるか子音であるかを判定する(s140)。母音子音判定部140は、例えば図7に示すように、判定用評価値計算部141と判定部143を備える。図7及び図9を用いて各部の処理を説明する。
<Vowel
The vowel
判定用評価値計算部141は、第1残留エコー抑圧信号D’3(f,k)を受け取り、以下の式で、第1残留エコー抑圧信号D’3(f,k)のスペクトルのスパース性を示す値S(D’3(k))を求め(s141)、判定部143に送る。
The evaluation value calculator for
但し、D’3(k)はD’3(f,k)のベクトル表記であり、D’3(k)={D’3(0,k),D’3(1,k),…,D’3(F,k)}であり、fhは考慮する最高周波数を、flは考慮する最低周波数を表す。例えば、音声通話通信で用いられる300Hz〜3kHzや可聴域20Hz〜20kHzを最低周波数及び最高周波数として設定する。この式(5)において、 However, D ′ 3 (k) is a vector notation of D ′ 3 (f, k), and D ′ 3 (k) = {D ′ 3 (0, k), D ′ 3 (1, k),. , D ′ 3 (F, k)}, f h represents the highest frequency considered, and f l represents the lowest frequency considered. For example, 300 Hz to 3 kHz and audible range 20 Hz to 20 kHz used in voice call communication are set as the lowest frequency and the highest frequency. In this formula (5),
であり、|D’3(f,k)|のfl≦f≦fhでの値が最もスパースなとき(1つの周波数成分のみ値を持ち、他の周波数成分は0のとき)に1をとり、最もスパースでないとき(全ての周波数成分が同じ値のとき)に√(fh−fl+1)をとる。そのため、0≦S(D’3(k))≦1であり、D’3(f,k)が母音のスペクトルの場合S(D’3(k))は1に近い値となり(図2B参照)、子音の場合S(D’3(k))は0に近い値となる(図2D参照)。 1 when the value of | D ′ 3 (f, k) | at f l ≦ f ≦ f h is the most sparse (when only one frequency component has a value and the other frequency component is 0). √ (f h −f l +1) is taken when it is least sparse (when all frequency components have the same value). Therefore, 0 ≦ S (D ′ 3 (k)) ≦ 1, and when D ′ 3 (f, k) is a vowel spectrum, S (D ′ 3 (k)) is a value close to 1 (FIG. 2B). In the case of a consonant, S (D ′ 3 (k)) is a value close to 0 (see FIG. 2D).
そこで、判定部143は、スパース性を示す値S(D’3(k))を受け取り、S(D’3(k))が予め定められた閾値T以上か否か判定し、閾値T以上の場合には母音と判定し、閾値T未満の場合には子音と判定する(s143)。判定部143は、判定結果j(k)を緩和係数決定部150へ送る。閾値Tは0≦T≦1であり、実験等により予め母音子音を判定することができるように定められる(例えばT=0.5)。また、判定結果j(k)には、例えば、子音であることを表す情報として0を、母音であることを表す情報として1を設定してもよい。
Therefore, the
なお、母音子音判定に第1残留エコー抑圧信号D’3(f,k)を用いるのは、判定に用いる信号に、受話信号に由来するエコー成分が残っていると、抑圧対象の信号の性質を誤判定するためである。よって、エコー成分を取り除いた信号であれば、母音子音判定に用いることができる。エコー成分を取り除いた信号とは、例えば、適応フィルタ部11において線形処理でエコー成分を消去したか、または、第1残留エコー抑圧部130で非線形エコー抑圧したか、少なくとも一方の処理を行った信号であればよい。よって、図7中、長破線で示すように雑音除去信号D2(f,k)を母音子音判定部に送る構成としてもよい。但し、残留エコー成分が含まれるため、判定の精度は落ちる。
Note that the first residual echo suppression signal D ′ 3 (f, k) is used for the vowel consonant determination when the echo component derived from the received signal remains in the signal used for the determination. This is because of erroneous determination. Therefore, any signal from which the echo component is removed can be used for vowel consonant determination. The signal from which the echo component has been removed is, for example, a signal in which the
<緩和係数決定部150>
緩和係数決定部150は、抑圧対象の信号が母音であると判定された場合には1を緩和係数β(k)とし、それ以外の場合にはγを緩和係数β(k)とする(s150)。但し、γは0≦γ<1とし、実験等により予め適切な値を求め、予め定めておく。
例えば、緩和係数決定部150は、図10に示すように、記憶部151、153及び切替部155を備える。図9及び図10を用いて各部の処理を説明する。緩和係数決定部150は、判定結果j(k)を受け取る。j(k)が母音であることを表す情報の場合には、切替部155は、記憶部151と接続する。緩和係数決定部150は、記憶部151から1を取り出し、β(k)=1として、緩和係数β(k)を決定し、出力する(s150、s151)。j(k)が子音であることを表す情報の場合には、切替部155は、記憶部153と接続する。緩和係数決定部150は、記憶部153からγを取り出し、β(k)=γとして、緩和係数β(k)を決定し、出力する(s150、s153)。
<Relaxation
The relaxation
For example, the relaxation
なお、母音子音判定部140の判定部143と緩和係数決定部150の処理は、以下の式で表すことができる。
In addition, the process of the
<第2残留エコー抑圧部160>
第2残留エコー抑圧部160は、例えば、第2残留エコー抑圧部160は、D2(f,k)とGb^(f,k)とβ(k)を受け取り、以下の式により第2残留エコー抑圧信号D3(f,k)を求め(s160)、時間領域変換部19に送る。
<Second Residual
For example, the second
D3(f,k)={1−β(k)(1−Gb^(f,k))}D2(f,k) (7)
このときの第2残留エコー抑圧部160の構成例を図11Aに示す。以下、簡単に処理を説明する。減算部162aは、記憶部161aから取り出した値1から受け取ったエコー抑圧ゲインGb^(f,k)を差し引き、(1−Gb^(f,k))を求める。乗算部163aは、この値に緩和係数β(k)を乗じ、β(k)(1−Gb^(f,k)を求める。減算部165aは記憶部164aから取り出した値1からβ(k)(1−Gb^(f,k)を差し引き、{1―β(k)(1−Gb^(f,k))}を求める。乗算部166aにおいて、この値を雑音除去信号D2(f,k)に乗じて、第2残留エコー抑圧信号D3(f,k)を求め出力する。
このような構成とすることで、送話音声を子音と判定した場合、エコー抑圧ゲインを弱めて送話音声の子音の周波数成分の欠損を緩和することができる。
D 3 (f, k) = {1-β (k) (1-Gb ^ (f, k))} D 2 (f, k) (7)
A configuration example of the second residual
With such a configuration, when the transmitted voice is determined to be a consonant, it is possible to reduce the loss of the frequency component of the consonant of the transmitted voice by weakening the echo suppression gain.
<時間領域変換部19>
時間領域変換部19は、第2残留エコー抑圧信号D3(f,k)を受け取り、これを時間領域の信号d3(n)に変換し(s19)、送話端4に送る。なお、変換方式は、周波数領域変換部13及び17の変換方式に対応する逆フーリエ変換等であればよい。
[プログラム及び記録媒体]
上述した反響消去装置は、コンピュータにより機能させることもできる。この場合はコンピュータに、目的とする装置(各種実施例で図に示した機能構成をもつ装置)として機能させるためのプログラム、またはその処理手順(各実施例で示したもの)の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。
<効果>
このような構成とすることによって、状況に応じて緩和係数(原音付加率)を変更することができ、十分にエコー抑圧をしながら、音声歪を同時に少なくするという効果を奏する。そのため、従来技術と比較して、より音声が聞き取りやすくなる。
<Time
The time
[Program and recording medium]
The echo canceling apparatus described above can also be operated by a computer. In this case, each process of a program for causing a computer to function as a target device (a device having the functional configuration shown in the drawings in various embodiments) or a processing procedure (shown in each embodiment) is processed by the computer. A program to be executed by the computer may be downloaded from a recording medium such as a CD-ROM, a magnetic disk, or a semiconductor storage device or via a communication line into the computer, and the program may be executed.
<Effect>
With such a configuration, the relaxation coefficient (original sound addition rate) can be changed according to the situation, and there is an effect that the sound distortion is simultaneously reduced while sufficiently suppressing the echo. Therefore, it becomes easier to hear the voice as compared with the prior art.
抑圧対象の信号が子音か母音かを判定して、判定結果に応じて緩和係数(原音付加率)を変更するので、抑圧対象の信号が子音の場合には、エコー抑圧ゲインを小さく緩和し、音声の歪が小さくし、聞き取り誤りの発生等を防止する。抑圧対象の信号が母音の場合には、エコー抑圧ゲインを大きくし、十分なエコー消去性能を得ることができる。 Since it is determined whether the signal to be suppressed is a consonant or a vowel, and the relaxation coefficient (original sound addition rate) is changed according to the determination result, if the signal to be suppressed is a consonant, the echo suppression gain is reduced to a small value, The distortion of the voice is reduced and the occurrence of listening errors is prevented. When the signal to be suppressed is a vowel, the echo suppression gain can be increased and sufficient echo cancellation performance can be obtained.
つまり、本実施例では、音声の性質に従って時刻毎に適切なエコー抑圧ゲインを設定でき、エコー消去量と音声の聞き取りやすさをバランスよく両立することができる。その結果、ハンズフリー通話等での音声がより聞き取りやすくなる。 That is, in the present embodiment, an appropriate echo suppression gain can be set for each time according to the nature of the voice, and the echo cancellation amount and the ease of listening to the voice can be balanced. As a result, it becomes easier to hear the voice in a hands-free call or the like.
なお、このエコー抑圧ゲインの緩和に関しては非線形抑圧処理に対して有効なものであり、適応フィルタ部11の側へ導入しても、もともと音声歪がない上にエコー消去量が減少するだけで逆効果である。また、雑音抑圧の方へ導入することは可能だが、雑音は多くの場合音声の子音に近い広帯域なスペクトルを持つため、雑音が子音と判定され雑音抑圧性能を低下させる結果となり、本発明の効果を得ることはできない。
This relaxation of the echo suppression gain is effective for nonlinear suppression processing, and even if it is introduced to the
[変形例]
反響消去装置100に入力される入力信号及び収音信号がアナログ信号の場合には、反響消去装置100は、アナログ信号をデジタル信号に変換する図示しないA/D変換部を有してもよい。また、送話端4にアナログ信号を出力する場合には、反響消去装置100は、デジタル信号をアナログ信号に変換する図示しないD/A変換部を有してもよい。
[Modification]
When the input signal and the collected sound signal input to the echo canceling apparatus 100 are analog signals, the echo canceling apparatus 100 may include an A / D conversion unit (not shown) that converts the analog signal into a digital signal. When outputting an analog signal to the transmitting end 4, the echo canceling apparatus 100 may include a D / A conversion unit (not shown) that converts a digital signal into an analog signal.
適応フィルタ部11において、周波数領域の受話信号X(f,k)及び収音信号Y(f,k)を用いて、エコー成分を消去してもよい。その場合、周波数領域変換部13は、適応フィルタ部11の前段に設けられる。適応フィルタ部11は、周波数領域変換部13及び17の出力信号X(f,k)及びY(f,k)を受信する。
The
第2残留エコー抑圧部160は、図7に長破線で示すように、Gb^(f,k)に代えてD’3(f,k)を受け取り、以下の式(8)により第2残留エコー抑圧信号D3(f,k)を求めてもよい。
The second residual
D3(f,k)=(1-β(k))D2(f,k)+β(k)D'3(f,k) (8)
なお、式(2)より、D’3(f,k)=Gb^(f,k)D2(f,k)である。この場合の第2残留エコー抑圧部160の構成を図11Bに示す。乗算部162bは記憶部161bから取り出した値1から、受け取った緩和係数β(k)を差し引き、(1−β(k))を求める。乗算部163は、受け取った雑音除去信号D2(f,k)にこの値(1−β(k))を乗じ、(1−β(k))D2(f,k)を求める。乗算部164bは、受け取ったD’3(f,k)に緩和係数β(k)を乗じ、β(k)D’3(f,k)を求める。加算部165bは、(1−β(k))D2(f,k)とβ(k)D’3(f,k)を加算し、第2残留エコー抑圧信号D3(f,k)を求め、出力する。
D 3 (f, k) = (1-β (k)) D 2 (f, k) + β (k) D ' 3 (f, k) (8)
Incidentally, the equation (2), a D '3 (f, k) = Gb ^ (f, k) D 2 (f, k). FIG. 11B shows the configuration of the second residual
なお、第2残留エコー抑圧部160の構成は図11A、図11Bの構成に限定されるものではなく、雑音除去信号D2(f,k)とエコー抑圧ゲインGb^(f,k)と緩和係数β(k)との積から雑音除去信号D2(f,k)と緩和係数β(k)との積を減算し、減算結果をD2(f,k)に加算した結果が得られるような処理を行って、第2残留エコー抑圧信号D3(f,k)を求めることができればよい。
Note that the configuration of the second residual
本発明のポイントは、母音子音判定部140で抑圧対象の信号が母音であるか子音であるかを判定し、判定結果を用いて緩和係数β(k)を変更することである。よって、図4中破線で示すように、適応フィルタ部11における線形エコー消去処理(s11)や、雑音抑圧部15の雑音抑圧処理(s15)は必ずしも行わなくともよく、対応する各部はそれぞれ設けなくともよい。また、母音子音判定部140に第1残留エコー抑圧信号D’3(f,k)以外の信号を送る場合には、第1残留エコー抑圧部130における第1残留エコー抑圧処理(s130)のうち、少なくともエコー抑圧ゲイン計算部131においてエコー抑圧ゲインを求めればよく(s131)、図8中破線で示すように、乗算部135での乗算処理(s135)は行わなくともよく、乗算部135は設けなくともよい。なお、適応フィルタ部11、雑音抑圧部15、第1残留エコー抑圧部130、母音子音判定部140における処理は例示であり、他の従来技術を用いてもよい。
The point of the present invention is that the vowel
例えば、母音子音判定部140の判定用評価値計算部141において、参考文献1記載の方法で第1残留エコー抑圧信号D’3(f,k)のスペクトルのスパース性を求めてもよい。
[参考文献1]荒木章子、中谷智広、澤田宏著、"ディリクレ事前分布を用いた音声のスパース性に基づく音源数推定と音源分離"、音響学会2009年秋季研究発表会、2009
なお、参考文献1において、ディリクレ分布はφの値が1より小さい場合、ベクトルαがスパースなほど大きな値となる。
For example, the determination evaluation
[Reference 1] Akiko Araki, Tomohiro Nakatani, Hiroshi Sawada, "Sound source number estimation and sound source separation based on speech sparsity using Dirichlet prior distribution", Acoustical Society of Japan 2009 Fall Meeting, 2009
In
また、母音子音判定部140は、スペクトルのスパース性を示す値を用いずに、例えば参考文献2または3記載の方法で、抑圧対象の信号D2(f,k)が母音であるか子音であるかを判定してもよい。
[参考文献2]澤田秀之、大加戸稔著、”雑音環境下における音声インターフェース構築のための特定話者のセンシング”、電気学会論文誌、2006、Vol.126, No.11, pp.1446-1453
[参考文献3]二矢田勝行、星見昌克著、”帯域パワーとLPCケプストラム係数の時系列を用いた不特定話者用子音認識法”、電子情報通信学会論文誌D、1986、Vol.J69-D、No.6、pp.949-957
この場合、参考文献2においては波形の絶対値の時間平均の大きさで母音子音を判断し、参考文献3においてはパワーの変動を見てパワーディップ(子音部)を抽出する。
Further, the vowel
[Reference 2] Hideyuki Sawada and Satoshi Okado, "Sensing of a specific speaker for voice interface construction under noisy environment", IEEJ Transactions, 2006, Vol.126, No.11, pp.1446- 1453
[Reference 3] Katsuyuki Niyada and Masakatsu Hoshimi, “Consonant recognition method for unspecified speakers using time series of band power and LPC cepstrum coefficient”, IEICE Transactions D, 1986, Vol. -D, No.6, pp.949-957
In this case, in
なお、適応フィルタ部11等を設けない場合には、周波数領域変換部13が受け取る信号は、残留エコー信号d1(n)以外の収音信号y(n)に基づいて得られる信号(例えば収音信号y(n)自体等)でもよい。
When the
また、第1残留エコー抑圧部130及び第2残留エコー抑圧部160が受け取る信号は、雑音除去信号D2(f,k)以外の周波数領域の各信号Y(f,k)、D1(f,k)の何れかであってもよく、反響消去装置の構成に合わせて適宜変更する。
The signals received by the first residual
緩和係数決定部150では、β(k)=1またはγとしているが、これに限定されるものではなく、β(k)=γ1(=αγ)またはγ2(=α)(但し、0<α<1)として緩和係数に定数αを乗じてもよい。αとαγの値は実験等により母音に適切な緩和係数として、子音に適切な緩和係数として予め定められる(例えばα=0.5、γ=0.5とし、γ1=0.25、γ2=0.5など)。
In the relaxation
また、γ1、γ2、緩和係数β(k)は周波数毎に異なる値をとる構成としてもよい。このとき、γ1={γ1(0),γ1(1),…,γ1(F)}、γ2={γ2(0),γ2(1),…,γ2(F)}、β(k)={β(0,k),β(1,k),…,β(F,k)}であり、γ1(f)≦γ2(f)であり、少なくとも一部の離散角周波数f’において、γ1(f’)<γ2(f’)であればよい。このような構成とすることで、周波数毎に適切な緩和係数を設定することができる。例えば、周波数が高くなるほど、子音部分が多くなるので、緩和係数が小さくなるように設定する構成が考えられる。
Further, γ 1 , γ 2 , and the relaxation coefficient β (k) may have different values for each frequency. At this time, γ 1 = {γ 1 ( 0), γ 1 (1), ..., γ 1 (F)},
<反響消去装置200>
図3、4、7、12、13を用いて実施例2に係る反響消去装置200について実施例1と異なる部分のみ説明する。緩和係数決定部250の構成及び処理内容が実施例1と異なる。
<Echo canceling device 200>
Only a portion different from the first embodiment will be described with respect to the echo canceling apparatus 200 according to the second embodiment with reference to FIGS. The configuration and processing contents of the relaxation
母音子音判定部140は、判定結果j(k)に加えて、図7中一点鎖線で示すように、判定用評価値計算部141で求めたスパース性を示す値S(D’3(k))も緩和係数決定部250へ出力する。
<緩和係数決定部250>
緩和係数決定部250は、判定結果j(k)とスパース性を示す値S(D’3(k))を受け取る。j(k)が母音であることを表す情報の場合には、切替部258は、記憶部251と接続する。緩和係数決定部250は、記憶部251から1を取り出し、β(k)=1として、緩和係数β(k)を決定し、出力する(s250、s251)。
In addition to the determination result j (k), the vowel
<Relaxation
The relaxation
j(k)が子音であることを表す情報の場合には、切替部258は、加算部257と接続する。緩和係数決定部250は、加算部257からγ1(k)=1−κ(T−S(D’(k))を受け取り、β(k)=γ1として、緩和係数β(k)を決定し、出力する(s250、s257)。なお、0≦κ≦1/Tとする。図13にS(D’(k))とβ(k)の関係を示す。
When j (k) is information indicating that it is a consonant, the
なお、減算部254は、記憶部254から取り出した閾値Tから受け取ったS(D’(k))を差し引き、(T−S(D’(k)))を求める。乗算部256は、記憶部255から取り出した値κを(T−S(D’(k)))に乗じ、κ(T−S(D’(k))を求める。加算部257は、記憶部251から取り出した値1からκ(T−S(D’(k))を差し引き、γ1(k)を求め、格納しておく。
Note that the
なお、母音子音判定部140の判定部143と緩和係数決定部250の処理は、以下の式で表すことができる。
In addition, the process of the
<効果>
このような構成とすることで、実施例1と同様の効果を奏する。さらにS(D’(k))<Tとなる範囲のうちでも、非常にスパース性の低い信号は抑圧を小さ目に、ある程度スパース性のある信号に対しては抑圧を大き目に設定するといった柔軟な設定が可能となる。
<Effect>
By adopting such a configuration, the same effects as those of the first embodiment are obtained. Furthermore, even within the range where S (D ′ (k)) <T, a signal having a very low sparsity is set to a small suppression, and a signal having a certain degree of sparsity is set to a large suppression. Setting is possible.
[変形例]
実施例2では、閾値TとS(D’(k))の関係により、場合分けして緩和係数β(k)を求めているが、場合分けせず、緩和係数β(k)はS(D’(k))が増加するにしたがって単調増加する値であるとしてもよい。
[Modification]
In the second embodiment, the relaxation coefficient β (k) is obtained for each case according to the relationship between the threshold value T and S (D ′ (k)). However, the relaxation coefficient β (k) is determined as S ( It may be a value that monotonously increases as D ′ (k)) increases.
前述のとおり、0≦S(D’3(k))≦1なので、閾値T=1とすれば、このような構成を実現することができる。さらに、母音子音判定部の処理を省き、簡略化することができる。つまり、図7において、母音子音判定部140は判定用評価値計算部141のみを備え、S(D’(k))のみを出力する。図12において、記憶部251と切替部258を設けず、緩和係数決定部250は、フレーム毎にβ(k)=1−κ(T−S(D’(k))を算出し、出力する。このような構成の場合にも、状況に応じてエコー抑圧ゲインの大きさを変更することができ、非常にスパース性の低い信号は抑圧を小さ目に、ある程度スパース性のある信号に対しては抑圧を大き目に設定するといった柔軟な設定が可能となる。
As described above, since 0 ≦ S (D ′ 3 (k)) ≦ 1, such a configuration can be realized by setting the threshold T = 1. Furthermore, the processing of the vowel consonant determination unit can be omitted and simplified. That is, in FIG. 7, the vowel
なお、κは周波数毎に異なる値をとる構成としてもよい。このとき、κ={κ(0),κ(1),…,κ(F)}であり、少なくとも一部の離散角周波数f’において、1−κ(f’)(T−S(D’(k))<γ2(f’)であればよい。このような構成とすることで、β(k)を周波数毎に異なる値とし、より細かな緩和係数の設定を可能とする。 Note that κ may have a different value for each frequency. At this time, κ = {κ (0), κ (1),..., Κ (F)}, and at least a part of the discrete angular frequency f ′ is 1−κ (f ′) (TS−D (D It suffices if “(k)) <γ 2 (f ′). With such a configuration, β (k) is set to a different value for each frequency, and a finer relaxation coefficient can be set.
<反響消去装置300>
図3、4、7、15、16を用いて実施例3に係る反響消去装置300について実施例1と異なる部分のみ説明する。緩和係数決定部350の構成及び処理内容が実施例1と異なる。
<緩和係数決定部350>
緩和係数決定部350は、判定結果j(k)と受話信号X(k)と第1残留エコー抑圧信号D’3(k)を受け取る。j(k)が母音であることを表す情報の場合には、切替部356は、記憶部354と接続する。
<Echo canceling device 300>
Only the parts different from the first embodiment of the echo canceling apparatus 300 according to the third embodiment will be described with reference to FIGS. The configuration and processing contents of the relaxation
<Relaxation
The relaxation
送話音声検知部351及び判定部352は、それぞれ判定結果j(k)を受け取り、j(k)が子音であることを表す情報の場合には、以下の処理を行う。
The transmitted
まず、送話音声検知部351において、||D’3(k)||/||X(k)||を求める。なお、||・||はノルムをとることを表し、X(k)={X(0,k),X(1,k),…,X(F,k)}である。
First, in the transmitted
判定部352は、この値||D’3(k)||/||X(k)||を受け取り、閾値Trより小さいか否かを判定し、判定結果j2(k)を切替部356に出力する。j2(k)が閾値Trより小さいことを表す情報の場合には、切替部356は、判定結果j(k)の値に係らず、記憶部354と接続する。緩和係数決定部350は、記憶部354から1を取り出し、β(k)=1として、緩和係数β(k)を決定し、出力する(s350、s354)。但し、Trは予め定められた正の実数であり、送話音声の子音部分が受話信号よりも十分に小さくなった場合に緩和係数が1になるよう調整するための値であり、実験等により予め適切な値を求め、予め定めておく。Trは0より大きな値であり、例えばTr=0.01とする。
The
切替部356は、上述の場合を除いて(つまり、判定結果j(k)が子音であることを表す情報を受け取り、かつ、判定結果j2(k)が閾値Trより大きいことを表す情報を受け取った場合)には、記憶部355と接続する。緩和係数決定部350は、記憶部355からγ1(0≦γ1<1)を取り出し、β(k)=γ1として、緩和係数β(k)を決定し、出力する(s350、s355)。
Except for the above case, switching
なお、母音子音判定部140の判定部143と緩和係数決定部350の処理は、以下の式で表すことができる。
In addition, the process of the
<効果>
このような構成とすることで、実施例1と同様の効果を得ることができる。さらに、送話音声が存在しない、または、送話音声が非常に小さいときには、第1エコー抑圧信号D’3(f,k)がスパース性を持っていたとしても緩和係数を1にするので、抑圧ゲインを緩和することなく、十分なエコー消去が可能となる。このようにスパース性の判定と通話状態の判定の両方を用いてゲインを緩和することで、抑圧を緩和する必要がない送話音声がない区間等において、エコーを十分に抑圧することができる。
<Effect>
By adopting such a configuration, the same effect as in the first embodiment can be obtained. Furthermore, when the transmission voice does not exist or the transmission voice is very small, the relaxation coefficient is set to 1 even if the first echo suppression signal D ′ 3 (f, k) has sparsity. Sufficient echo cancellation can be performed without reducing the suppression gain. As described above, by reducing the gain using both the sparsity determination and the call state determination, it is possible to sufficiently suppress the echo in a section where there is no transmission voice that does not require suppression.
本発明の反響消去方法は、ハンズフリー通話、ハンズフリー音声認識等に利用することができる。 The echo canceling method of the present invention can be used for hands-free calling, hands-free speech recognition, and the like.
100、200、300 反響消去装置
11 適応フィルタ部
13、17 周波数領域変換部
15 雑音抑圧部
19 時間領域変換部
130 第1残留エコー抑圧部
140 母音子音判定部
150、250、350 緩和係数決定部
160 第2残留エコー抑圧部
100, 200, 300
Claims (9)
収音信号に基づいて得られる信号d(n)及び受話信号x(n)を、フレーム毎にそれぞれ周波数領域の信号D(f,k)及びX(f,k)に変換する周波数領域変換ステップと、
前記信号D(f,k)及びX(f,k)を用いて、エコー抑圧ゲインGb^(f,k)を求めるエコー抑圧ゲイン計算ステップと、
前記信号D(f,k)からエコー成分を取り除いた信号D’(f,k)を用いて、抑圧対象の信号が母音であるか子音であるかを判定する母音子音判定ステップと、
前記母音子音判定ステップにおいて、前記抑圧対象の信号が母音であると判定された場合には前記γ2を緩和係数β(k)とし、それ以外の場合には前記γ1を緩和係数β(k)とする緩和係数決定ステップと、
前記信号D(f,k)と前記エコー抑圧ゲインGb^(f,k)と前記緩和係数β(k)との積から前記信号D(f,k)と前記緩和係数β(k)との積を減算しD(f,k)に加算した結果が得られるような処理を行って、第2残留エコー抑圧信号D3(f,k)を求める第2残留エコー抑圧ステップと、
第2残留エコー抑圧信号D3(f,k)を時間領域の信号d3(n)に変換する時間領域変換ステップと、
を有する反響消去方法。 n represents time, f = 1, 2,..., F represents discrete angular frequency, k represents frame time, and γ 1 <γ 2 .
Frequency domain conversion step of converting the signal d (n) and the received signal x (n) obtained based on the collected sound signal into frequency domain signals D (f, k) and X (f, k) for each frame, respectively. When,
An echo suppression gain calculation step for obtaining an echo suppression gain Gb ^ (f, k) using the signals D (f, k) and X (f, k);
A vowel consonant determination step for determining whether a signal to be suppressed is a vowel or a consonant using a signal D ′ (f, k) obtained by removing an echo component from the signal D (f, k);
In the vowel consonant determination step, when it is determined that the signal to be suppressed is a vowel, γ 2 is set as a relaxation coefficient β (k), and in other cases, γ 1 is set as a relaxation coefficient β (k ) And a relaxation coefficient determination step
From the product of the signal D (f, k), the echo suppression gain Gb ^ (f, k), and the relaxation coefficient β (k), the signal D (f, k) and the relaxation coefficient β (k) A second residual echo suppression step for obtaining a second residual echo suppression signal D 3 (f, k) by performing a process so as to obtain a result obtained by subtracting the product and adding the result to D (f, k);
A time domain conversion step of converting the second residual echo suppression signal D 3 (f, k) into a time domain signal d 3 (n);
An echo canceling method.
前記母音子音判定ステップにおいて、前記信号D(f,k)からエコー成分を取り除いた信号D’(f,k)を用いて、当該信号のスペクトルのスパース性を示す値S(D’(k))を求め、当該値S(D’(k))が閾値T以上の場合には母音と判定し、閾値T未満の場合には子音と判定する、
ことを特徴とする反響消去方法。 The echo cancellation method according to claim 1 ,
In the vowel consonant determination step, a value S (D ′ (k)) indicating the sparsity of the spectrum of the signal using the signal D ′ (f, k) obtained by removing the echo component from the signal D (f, k). ), And when the value S (D ′ (k)) is greater than or equal to the threshold T, it is determined as a vowel, and when it is less than the threshold T, it is determined as a consonant.
An echo canceling method characterized by the above.
前記緩和係数決定ステップにおいて、前記抑圧対象の信号が母音であると判定された場合には前記γ2=1を緩和係数β(k)とし、それ以外の場合には前記0≦γ1<1を緩和係数β(k)とする、
ことを特徴とする反響消去方法。 The echo cancellation method according to claim 1 or 2,
In the relaxation coefficient determination step, when it is determined that the signal to be suppressed is a vowel, the γ 2 = 1 is set as the relaxation coefficient β (k), and in other cases, the 0 ≦ γ 1 <1 Is the relaxation coefficient β (k),
An echo canceling method characterized by the above.
前記緩和係数決定ステップにおいて、前記抑圧対象の信号が母音であると判定された場合には前記γ2=1を緩和係数β(k)とし、それ以外の場合には前記γ1(k)=1−κ(T−S(D’(k))を緩和係数β(f)とする、
ことを特徴とする反響消去方法。 3. The echo canceling method according to claim 2, wherein 0 ≦ S (D ′ (k)) ≦ 1, 0 ≦ T ≦ 1, 0 ≦ κ ≦ 1 / T,
In the relaxation coefficient determining step, when it is determined that the signal to be suppressed is a vowel, the γ 2 = 1 is set as the relaxation coefficient β (k), and in other cases, the γ 1 (k) = 1−κ (TS (D ′ (k)) is a relaxation coefficient β (f),
An echo canceling method characterized by the above.
Trは予め定められた正の実数であり、
前記緩和係数決定ステップにおいて、前記抑圧対象の信号が母音であると判定された場合、または、(||D’(k)||/||X(k)||)<Trを満たす場合には前記γ2=1を緩和係数β(k)とし、それ以外の場合には前記0≦γ1<1を緩和係数β(k)とする、
ことを特徴とする反響消去方法。 The echo cancellation method according to claim 1 or 2,
T r is a predetermined positive real number,
When it is determined in the relaxation coefficient determination step that the signal to be suppressed is a vowel or when (|| D ′ (k) |||| (X (k) ||) < Tr Γ 2 = 1 is a relaxation coefficient β (k), and in other cases, 0 ≦ γ 1 <1 is a relaxation coefficient β (k).
An echo canceling method characterized by the above.
収音信号に基づいて得られる信号d(n)及び受話信号x(n)を、フレーム毎にそれぞれ周波数領域の信号D(f,k)及びX(f,k)に変換する周波数領域変換ステップと、
前記信号D(f,k)及びX(f,k)を用いて、エコー抑圧ゲインGb^(f,k)を求めるエコー抑圧ゲイン計算ステップと、
前記信号D(f,k)からエコー成分を取り除いた信号D’(f,k)を用いて、前記信号D(f,k)のスペクトルのスパース性を示す値S(D’(k))を求める母音子音判定用評価値計算ステップと、
前記S(D’(k))の値が大きいほど、緩和係数β(k)を大きくする緩和係数決定ステップと、
前記信号D(f,k)と前記エコー抑圧ゲインGb^(f,k)と前記緩和係数β(k)との積から前記信号D(f,k)と前記緩和係数β(k)との積を減算しD(f,k)に加算した結果が得られるような処理を行って、第2残留エコー抑圧信号D3(f,k)を求める第2残留エコー抑圧ステップと、
第2残留エコー抑圧信号D3(f,k)を時間領域の信号d3(n)に変換する時間領域変換ステップと、
を有する反響消去方法。 n represents time, f = 1, 2,..., F represents discrete angular frequency, k represents frame time,
Frequency domain conversion step of converting the signal d (n) and the received signal x (n) obtained based on the collected sound signal into frequency domain signals D (f, k) and X (f, k) for each frame, respectively. When,
An echo suppression gain calculation step for obtaining an echo suppression gain Gb ^ (f, k) using the signals D (f, k) and X (f, k);
A value S (D ′ (k)) indicating the sparsity of the spectrum of the signal D (f, k) using the signal D ′ (f, k) obtained by removing an echo component from the signal D (f, k). An evaluation value calculation step for vowel consonant determination to obtain
A relaxation coefficient determining step for increasing the relaxation coefficient β (k) as the value of S (D ′ (k)) increases;
From the product of the signal D (f, k), the echo suppression gain Gb ^ (f, k), and the relaxation coefficient β (k), the signal D (f, k) and the relaxation coefficient β (k) A second residual echo suppression step for obtaining a second residual echo suppression signal D 3 (f, k) by performing a process so as to obtain a result obtained by subtracting the product and adding the result to D (f, k);
A time domain conversion step of converting the second residual echo suppression signal D 3 (f, k) into a time domain signal d 3 (n);
An echo canceling method.
前記γ1、γ2、β(k)は周波数毎に異なる値をとることができ、γ1={γ1(0),γ1(1),…,γ1(F)}、γ2={γ2(0),γ2(1),…,γ2(F)}、β(k)={β(0,k),β(1,k),…,β(F,k)}であり、少なくとも一部の離散角周波数f’において、γ1(f’)<γ2(f’)である、
ことを特徴とする反響消去方法。 The echo canceling method according to any one of claims 1 to 6,
The γ 1 , γ 2 , β (k) can take different values for each frequency, and γ 1 = {γ 1 (0), γ 1 (1),..., Γ 1 (F)}, γ 2 = {Γ 2 (0), γ 2 (1),..., Γ 2 (F)}, β (k) = {β (0, k), β (1, k),. )}, And γ 1 (f ′) <γ 2 (f ′) at least at some of the discrete angular frequencies f ′.
An echo canceling method characterized by the above.
収音信号に基づいて得られる信号d(n)及び受話信号x(n)を、フレーム毎にそれぞれ周波数領域の信号D(f,k)及びX(f,k)に変換する周波数領域変換部と、
前記信号D(f,k)及びX(f,k)を用いて、エコー抑圧ゲインGb^(f,k)を求めるエコー抑圧ゲイン計算部と、
前記信号D(f,k)からエコー成分を取り除いた信号D’(f,k)を用いて、抑圧対象の信号が母音であるか子音であるかを判定する母音子音判定部と、
前記母音子音判定部において、前記抑圧対象の信号が母音であると判定された場合には前記γ2を緩和係数β(k)とし、それ以外の場合には前記γ1を緩和係数β(k)とする緩和係数決定部と、
前記信号D(f,k)と前記エコー抑圧ゲインGb^(f,k)と前記緩和係数β(k)との積から前記信号D(f,k)と前記緩和係数β(k)との積を減算しD(f,k)に加算した結果が得られるような処理を行って、第2残留エコー抑圧信号D3(f,k)を求める第2残留エコー抑圧部と、
第2残留エコー抑圧信号D3(f,k)を時間領域の信号d3(n)に変換する時間領域変換部と、
を有する反響消去装置。 n represents time, f = 1, 2,..., F represents discrete angular frequency, k represents frame time, and γ 1 <γ 2 .
Frequency domain converter for converting signal d (n) and received signal x (n) obtained based on the collected sound signal into frequency domain signals D (f, k) and X (f, k) for each frame, respectively. When,
An echo suppression gain calculator for obtaining an echo suppression gain Gb ^ (f, k) using the signals D (f, k) and X (f, k);
A vowel consonant determination unit that determines whether a signal to be suppressed is a vowel or a consonant using a signal D ′ (f, k) obtained by removing an echo component from the signal D (f, k);
When the vowel consonant determination unit determines that the signal to be suppressed is a vowel, the γ 2 is set as a relaxation coefficient β (k); otherwise, γ 1 is set as a relaxation coefficient β (k ) And a relaxation coefficient determination unit
From the product of the signal D (f, k), the echo suppression gain Gb ^ (f, k), and the relaxation coefficient β (k), the signal D (f, k) and the relaxation coefficient β (k) A second residual echo suppression unit that obtains a second residual echo suppression signal D 3 (f, k) by performing a process such that a product is subtracted and added to D (f, k);
A time domain converter that converts the second residual echo suppression signal D 3 (f, k) into a time domain signal d 3 (n);
An echo canceling device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010128725A JP5466581B2 (en) | 2010-06-04 | 2010-06-04 | Echo canceling method, echo canceling apparatus, and echo canceling program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010128725A JP5466581B2 (en) | 2010-06-04 | 2010-06-04 | Echo canceling method, echo canceling apparatus, and echo canceling program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011254420A JP2011254420A (en) | 2011-12-15 |
JP5466581B2 true JP5466581B2 (en) | 2014-04-09 |
Family
ID=45417947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010128725A Expired - Fee Related JP5466581B2 (en) | 2010-06-04 | 2010-06-04 | Echo canceling method, echo canceling apparatus, and echo canceling program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5466581B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6036141B2 (en) * | 2012-10-11 | 2016-11-30 | ヤマハ株式会社 | Sound processor |
JP6165503B2 (en) * | 2013-05-21 | 2017-07-19 | シャープ株式会社 | Echo suppression device and echo suppression method |
CN106571148B (en) * | 2016-11-14 | 2020-04-28 | 阔地教育科技有限公司 | Automatic gain control method and device for audio signal |
US20230060081A1 (en) * | 2020-02-26 | 2023-02-23 | Sony Group Corporation | Signal processing device, signal processing method, and program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3420705B2 (en) * | 1998-03-16 | 2003-06-30 | 日本電信電話株式会社 | Echo suppression method and apparatus, and computer-readable storage medium storing echo suppression program |
JP4247203B2 (en) * | 2005-05-06 | 2009-04-02 | 日本電信電話株式会社 | Automatic volume control method, automatic volume control device, program, recording medium |
-
2010
- 2010-06-04 JP JP2010128725A patent/JP5466581B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011254420A (en) | 2011-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4283212B2 (en) | Noise removal apparatus, noise removal program, and noise removal method | |
JP5528538B2 (en) | Noise suppressor | |
JP4863713B2 (en) | Noise suppression device, noise suppression method, and computer program | |
JP3963850B2 (en) | Voice segment detection device | |
JP4632047B2 (en) | Signal processing method and apparatus | |
JP5183828B2 (en) | Noise suppressor | |
US8391471B2 (en) | Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium | |
JP4377952B1 (en) | Adaptive filter and echo canceller having the same | |
WO2016056167A1 (en) | Echo cancellation device, echo cancellation program, and echo cancellation method | |
JP4957810B2 (en) | Sound processing apparatus, sound processing method, and sound processing program | |
JP2000347688A (en) | Noise suppressor | |
JP6545419B2 (en) | Acoustic signal processing device, acoustic signal processing method, and hands-free communication device | |
JP2009014937A (en) | Echo suppressing device, echo suppressing method and computer program | |
JP5595605B2 (en) | Audio signal restoration apparatus and audio signal restoration method | |
JP2014106494A (en) | Speech enhancement devices, speech enhancement method and computer program for speech enhancement | |
JP5466581B2 (en) | Echo canceling method, echo canceling apparatus, and echo canceling program | |
JP4591685B2 (en) | Double talk state determination method, echo cancellation method, double talk state determination device, echo cancellation device, and program | |
JP2000330597A (en) | Noise suppressing device | |
JP2007251354A (en) | Microphone and sound generation method | |
JP2003250193A (en) | Echo elimination method, device for executing the method, program and recording medium therefor | |
JP2000105599A (en) | Noise level time variation coefficient calculating method, device thereof, and noise reducing method | |
JP2010156742A (en) | Signal processing device and method thereof | |
Vashkevich et al. | Petralex: A smartphone-based real-time digital hearing aid with combined noise reduction and acoustic feedback suppression | |
WO2022195955A1 (en) | Echo suppressing device, echo suppressing method, and echo suppressing program | |
JP2003264483A (en) | Device and method for suppressing echo, telephone set, and video telephone system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140124 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5466581 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |