JP6537997B2 - Echo suppressor, method thereof, program, and recording medium - Google Patents
Echo suppressor, method thereof, program, and recording medium Download PDFInfo
- Publication number
- JP6537997B2 JP6537997B2 JP2016079702A JP2016079702A JP6537997B2 JP 6537997 B2 JP6537997 B2 JP 6537997B2 JP 2016079702 A JP2016079702 A JP 2016079702A JP 2016079702 A JP2016079702 A JP 2016079702A JP 6537997 B2 JP6537997 B2 JP 6537997B2
- Authority
- JP
- Japan
- Prior art keywords
- gain
- level
- echo
- signal
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Description
本発明は、ハンズフリー通話装置においてスピーカからマイクロホンへ回り込んだ音(音響エコー)を抑圧するための技術に関する。 The present invention relates to a technique for suppressing a sound (sound echo) that has traveled from a speaker to a microphone in a hands-free communication device.
エコー抑圧技術の従来技術として特許文献1が知られている。
特許文献1のエコー抑圧装置の前段に適応フィルタを用いたエコー消去装置を設けた構成を図1に示す。以下、図1の構成の処理の概要を説明する。
FIG. 1 shows a configuration in which an echo cancellation device using an adaptive filter is provided at the front stage of the echo suppression device of
適応フィルタ部91は、再生手段2に入力される受話信号x(t)(以下、単に再生手段2の受話信号ともいう)に対して適応フィルタを用いてフィルタリングを行い、エコー成分の推定値y'1(t)を求める。ただし、tは離散化された時刻を示すインデックスである。減算部92は、収音手段3で収音した収音信号y1(t)からエコー成分の推定値y'1(t)を減じて、誤差信号y2(t)を求める。なお、適応フィルタ部91は、受話信号x(t)と誤差信号y2(t)とを用いて適応フィルタのフィルタ係数を更新する。周波数領域変換部93は、時間領域の誤差信号y2(t)を周波数領域の誤差信号Y2(ω)に変換する。ただし、ωは周波数を示すインデックスである。周波数領域変換部94は受話信号x(t)を周波数領域の受話信号X(ω)に変換する。音響結合量推定部95は、周波数領域の誤差信号Y2(ω)と周波数領域の受話信号X(ω)とを用いて、音響結合量D(ω)を推定する。エコーレベル推定部96は、周波数領域の受話信号X(ω)のレベルに音響結合量を乗じて、周波数領域の誤差信号Y2(ω)に含まれるエコー成分のレベルを推定する。ゲイン取得部97は、エコー成分のレベルの推定値R(ω)と周波数領域の誤差信号Y2(ω)とを用いてゲインG(ω)を取得する。乗算部98は、周波数領域の誤差信号Y2(ω)にゲインG(ω)を乗じて、周波数領域の送話信号Y3(ω)を求める。時間領域変換部99は周波数領域の送話信号Y3(ω)を時間領域の送話信号y3(t)に変換し、エコー消去装置90の出力値として出力する。
The
このような構成により、特許文献1の構成では、前段の適応フィルタを用いたエコー消去装置で消去しきれなかった残留エコーの抑圧を行う。
With such a configuration, in the configuration of
前段の適応フィルタを用いたエコー消去装置のエコー消去が安定していれば、特許文献1のエコー抑圧装置で残留エコーを抑圧可能である。
If the echo cancellation of the echo cancellation apparatus using the preceding adaptive filter is stable, the echo suppression apparatus of
しかしながら、再生手段2のスピーカユニットやスピーカアンプで再生音に歪が生じるような過大な受話信号が特許文献1のエコー抑圧装置に入力されると、その歪成分は前段の適応フィルタを用いたエコー消去装置では消去できず、大きな残留エコーとなる。従来のエコー抑圧装置では、急激に増加する残留エコーに対応できず、抑圧が十分に行われないという問題が生じる。なお、前段に適応フィルタを用いたエコー消去装置を設けずに、特許文献1のエコー抑圧装置を単体でエコー抑圧装置として用いた場合にも同様に、急激に増加するエコーに対応できず、抑圧が十分に行われないという問題が生じる。
However, when an excessive reception signal that causes distortion in the reproduced sound by the speaker unit or the speaker amplifier of the reproduction means 2 is input to the echo suppression apparatus of
本発明は、過大な受話信号が入力されスピーカユニットやスピーカアンプで歪が生じても、安定してエコーを抑圧することができるエコー抑圧装置、その方法、プログラム、及び記録媒体を提供することである。 The present invention provides an echo suppression apparatus capable of stably suppressing an echo even when distortion occurs in a speaker unit or a speaker amplifier by inputting an excessive reception signal, a method, a program, and a recording medium. is there.
上記の課題を解決するために、本発明の一態様によれば、エコー抑圧装置は、周波数領域の収音信号に基づく値と、周波数領域の受話信号との比から、再生手段と収音手段との間の音響結合量を周波数領域毎に推定する音響結合量推定部と、周波数領域の受話信号のレベルに音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、受話信号のレベルと、エコー成分のレベルの推定値と、収音信号のレベルとを用いて、再生手段において受話信号を再生する際に、受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得部と、周波数領域の収音信号に基づく値にゲインG(ω)を乗じるエコー抑圧部とを含む。 In order to solve the above-mentioned problems, according to one aspect of the present invention, an echo suppression apparatus is provided with a reproduction means and a sound collection means from the ratio of a value based on a collected sound signal in the frequency domain to a reception signal in the frequency domain. And the level of the reception signal in the frequency domain multiplied by the amount of acoustic coupling to calculate the level of the echo component contained in the collected signal for each frequency band. When reproducing the reception signal in the reproduction means using the echo level estimation unit to be estimated, the level of the reception signal, the estimated value of the level of the echo component, and the level of the collected signal, the level of the reception signal is large If there is a possibility that distortion occurs in the reproduced sound, a gain acquisition unit for obtaining, for each frequency, a gain G (ω) having a larger amount of suppression than the gain used if distortion does not temporarily occur, and sound collection in the frequency domain Gay to value based on signal And an echo suppression unit multiplied by the G (ω).
上記の課題を解決するために、本発明の他の態様によれば、エコー抑圧方法は、周波数領域の収音信号に基づく値と、周波数領域の受話信号との比から、再生手段と収音手段との間の音響結合量を周波数領域毎に推定する音響結合量推定ステップと、周波数領域の受話信号のレベルに音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定ステップと、受話信号のレベルと、エコー成分のレベルの推定値と、収音信号のレベルとを用いて、再生手段において受話信号を再生する際に、受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得ステップと、周波数領域の収音信号に基づく値にゲインG(ω)を乗じるエコー抑圧ステップとを含む。 In order to solve the above problems, according to another aspect of the present invention, an echo suppression method comprises: reproducing means and sound collection from the ratio of a value based on a collected sound signal in the frequency domain to a reception signal in the frequency domain An acoustic coupling amount estimation step of estimating the acoustic coupling amount between the means and the frequency domain, and multiplying the level of the reception signal in the frequency domain by the acoustic coupling amount to obtain the level of the echo component included in the collected signal per frequency band When the receiving signal is reproduced by the reproduction means using the echo level estimation step to be estimated, the level of the receiving signal, the estimated value of the level of the echo component, and the level of the collected signal, the level of the receiving signal is If distortion is likely to occur in the reproduced sound because it is large, a gain acquisition step for obtaining for each frequency a gain G (ω) having a larger amount of suppression than a gain used if distortion does not temporarily occur, and sound Comprising a value based on the No. and echo suppression step of multiplying a gain G (ω).
本発明によれば、過大な受話信号が入力されスピーカユニットやスピーカアンプで歪が生じても、安定してエコーを抑圧することができるという効果を奏する。 According to the present invention, it is possible to stably suppress an echo even if an excessive reception signal is input and distortion occurs in the speaker unit or the speaker amplifier.
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。 Hereinafter, embodiments of the present invention will be described. In the drawings used in the following description, the same reference numerals are given to constituent parts having the same functions and steps for performing the same processing, and redundant description will be omitted. The processing performed for each element of a vector or matrix is applied to all elements of the vector or matrix unless otherwise noted.
<第一実施形態>
図2は第一実施形態に係るエコー抑圧装置100の機能ブロック図を、図3はその処理フローの例を示す。
First Embodiment
FIG. 2 shows a functional block diagram of the echo suppressor 100 according to the first embodiment, and FIG. 3 shows an example of its processing flow.
エコー抑圧装置100は、適応フィルタ部101、減算部102、周波数領域変換部103、周波数領域変換部104、音響結合量推定部105、エコーレベル推定部106、過大レベル検出部110、ゲイン取得部120、エコー抑圧部108及び時間領域変換部109を含む。
The echo suppression apparatus 100 includes an
エコー抑圧装置100は、再生手段2で再生する受話信号x(t)と収音手段3で収音した収音信号y1(t)とを入力とし、収音信号y1(t)からエコー成分の推定値を消去及び抑圧した送話信号y3(t)を求め、出力する。以下、各部の処理内容を説明する。 The echo suppressor 100 receives the reception signal x (t) reproduced by the reproduction means 2 and the collected signal y 1 (t) collected by the sound collecting means 3 as an input, and the echo signal y 1 (t) A transmission signal y 3 (t) obtained by eliminating and suppressing the estimated value of the component is obtained and output. The processing content of each part will be described below.
再生手段2は、スピーカ、スピーカユニット、スピーカアンプ等からなり、受話信号x(t)を再生する。収音手段3はマイクロホン等からなり、収音信号y1(t)を出力する。 The reproduction means 2 is composed of a speaker, a speaker unit, a speaker amplifier, etc., and reproduces the received signal x (t). The sound collection means 3 is composed of a microphone or the like, and outputs a sound collection signal y 1 (t).
<適応フィルタ部101>
適応フィルタ部101は、再生手段2の受話信号x(t)と誤差信号y2(t)とを受け取り、これらの値を用いて、収音手段3の収音信号y1(t)に含まれるエコー成分の推定値y'1(t)を求め(S101)、出力する。
<
The
例えば、受話信号x(t)と後述するフィルタ係数H(t)を用いて、次式により、推定値y'1(t)を求める。
y'1(t)=H(t)TX(t) (1)
H(t)=(h(0), h(1), ... , h(L-1))T (2)
X(t)=(x(t), x(t-1), ... , x(t-L+1))T (3)
ただし、上付き添え字Tは転置を表し、ATはベクトルAの転置を表し、Lは適応フィルタのタップ長を表す。
For example, using the reception signal x (t) and a filter coefficient H (t) described later, an estimated value y ′ 1 (t) is obtained by the following equation.
y ' 1 (t) = H (t) T X (t) (1)
H (t) = (h (0), h (1), ..., h (L-1)) T (2)
X (t) = (x (t), x (t-1), ..., x (t-L + 1)) T (3)
However, the superscript T denotes the transpose, A T denotes the transpose of a vector A, L represents a tap length of the adaptive filter.
ここで、フィルタ係数H(t)は、適応フィルタ部101内部の図示しないフィルタ係数更新部において、更新される。例えば、NLMSアルゴリズムを用いる場合には次式によりフィルタ係数H(t)を更新する。
H(t+1)=H(t)+aX(t)y2(t)/X(t)TX(t) (4)
0<a<2 (5)
ただし、aはNLMSアルゴリズムのステップサイズを表す。フィルタ係数H(t)の更新方法や求め方はこの方法に限らず、従来の方法を用いればよい。
Here, the filter coefficient H (t) is updated in a filter coefficient update unit (not shown) inside the
H (t + 1) = H (t) + aX (t) y 2 (t) / X (t) T X (t) (4)
0 <a <2 (5)
Where a represents the step size of the NLMS algorithm. The method of updating or determining the filter coefficient H (t) is not limited to this method, and a conventional method may be used.
<減算部102>
減算部102は、収音手段3の収音信号y1(t)とエコー成分の推定値y'1(t)とを受け取り、その差分y1(t)-y'1(t)を求め(S102)、誤差信号y2(t)(=y1(t)-y'1(t))として出力する。
<
The
<周波数領域変換部103及び周波数領域変換部104>
周波数領域変換部103は、誤差信号y2(t)を受け取り、周波数領域の誤差信号Y2(ω)に変換し(S103)、出力する。変換方法としてはFFT(短時間フーリエ変換)等を用いることができる。
<Frequency
The frequency
周波数領域変換部104は、受話信号x(t)を受け取り、周波数領域変換部103と同様の変換方法を用いて、周波数領域の受話信号X(ω)に変換し(S104)、出力する。
The frequency
<音響結合量推定部105>
音響結合量推定部105は、周波数領域の誤差信号Y2(ω)と周波数領域の受話信号X(ω)とを受け取り、誤差信号Y2(ω)と、周波数領域の受話信号との比から、再生手段と収音手段との間の音響結合量D(ω)を周波数領域毎に推定し(S105)、出力する。例えば、音響結合量D(ω)は、再生手段2と収音手段3との間の伝達特性の振幅値であり、周波数領域の誤差信号Y2(ω)と周波数領域の受話信号X(ω)の絶対値の比で求められる。また、音響結合量の精度を向上するために時間平滑化が行われる。音響結合量D(ω)は次式により求められる。
D(ω)=E{|Y2(ω)|/|X(ω)|} (6)
ただし、E{A}はAの平均値を取ることを表し、|A|はAの絶対値をとることを表す。
<Acoustic Coupling
The acoustic coupling
D (ω) = E {| Y 2 (ω) | / | X (ω) |} (6)
However, E {A} represents taking an average value of A, and | A | represents taking an absolute value of A.
<エコーレベル推定部106>
エコーレベル推定部106は、周波数領域の受話信号X(ω)と音響結合量D(ω)とを受け取り、周波数領域の受話信号X(ω)のレベルに音響結合量D(ω)を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定し(S106)、推定値R(ω)を出力する。
<Echo
The echo
例えば、部屋の反響を無視した場合、エコー成分のレベルは、受話信号X(ω)に音響結合量D(ω)を乗じることで推定可能できる。しかし、実際には部屋の音響が存在するため、反響成分も含めてエコー成分を推定する必要がある。通常、部屋の音響成分は時間とともに指数減衰するので、次式により、エコー成分のレベルの推定を行う。
R(ω)=D(ω)・P(ω)
P(ω)=|X(ω)| for P'(ω)≦|X(ω)|
P(ω)=u・P'(ω)+(l-u)・|X(ω)| for P'(ω)>|X(ω)| (7)
ただし、P(ω)は反響に相当する時間平滑を行ったあとの受話信号であり、P'(ω)は1フレーム前のP(ω)であり、uは反響の長さ(残響時間)の想定値を調整するための係数でありあらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
For example, when the room echo is ignored, the level of the echo component can be estimated by multiplying the reception signal X (ω) by the acoustic coupling amount D (ω). However, since there is room sound in practice, it is necessary to estimate the echo component including the echo component. Usually, since the acoustic component of the room decays exponentially with time, the level of the echo component is estimated by the following equation.
R (ω) = D (ω) · P (ω)
P (ω) = | X (ω) | for P '(ω) ≦ | X (ω) |
P (ω) = u · P ′ (ω) + (lu) · | X (ω) | for P ′ (ω)> | X (ω) | (7)
Where P (ω) is the received signal after time smoothing corresponding to the echo, P ′ (ω) is P (ω) one frame before, and u is the echo length (reverberation time) It is a coefficient for adjusting the assumed value of and a fixed value is set in advance. For example, u takes a value of 0 ≦ u <1, and an environment with longer reverberation time is simulated as closer to 1 and an environment with shorter reverberation time is simulated as closer to 0.
<過大レベル検出部110>
過大レベル検出部110は、時間領域の受話信号x(t)を受け取り、受話信号x(t)のレベルs(t)を求め(S110)、出力する。受話信号x(t)のレベルs(t)は、受話信号x(t)の絶対値s(t)=|x(t)|や、絶対値を平滑化した信号s(t)=α・s'(t)+(l-α)・|x(t)|や、以下の式で計算される受話信号x(t)の最大値保持レベルを用いる。
s(t)=|x(t)| for s'(t)≦|x(t)|
s(t)=α・s'(t)+(l-α)・|x(t)| for s'(t)>|x(t)|
s(t)は反響に相当する時間平滑を行ったあとの受話信号であり、s'(t)は1フレーム前のs(t)であり、αは平滑化関数であり、0から1の間の値をとる。
<Excessive
The excessive
s (t) = | x (t) | for s' (t) ≦ | x (t) |
s (t) = α · s ′ (t) + (l−α) · x (t) | for s ′ (t)> | x (t) |
s (t) is a received signal after time smoothing corresponding to the echo, s' (t) is s (t) one frame before, α is a smoothing function, 0 to 1 Take the value between
<ゲイン取得部120>
ゲイン取得部120は、エコー成分のレベルの推定値R(ω)と、受話信号x(t)のレベルs(t)と、周波数領域の誤差信号Y2(ω)とを受け取り、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求め(S120)、出力する。
<
図4はゲイン取得部120の機能ブロック図を、図5はその処理フローの例を示す。
FIG. 4 shows a functional block diagram of the
ゲイン取得部120は、通常時乗算係数記憶部121、過大時乗算係数記憶部122、係数選択部123、係数乗算部124及びエコー抑圧ゲイン取得部125を含む。
(通常時乗算係数記憶部121及び過大時乗算係数記憶部122)
通常時乗算係数記憶部121及び過大時乗算係数記憶部122には、予め通常時乗算係数γ1及び過大時乗算係数γ2をそれぞれ記憶しておく。γ1<γ2とする。
The
(Normal multiplication
The normal multiplication
(係数選択部123)
係数選択部123は、受話信号x(t)のレベルs(t)を受け取り、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性がある場合、過大時乗算係数記憶部122から過大時乗算係数γ2を取り出し、係数乗算部124に出力する(S123)。また、歪が生じない場合、通常時乗算係数記憶部121から通常時乗算係数γ1を取り出し、係数乗算部124に出力する(S123)。例えば、受話信号x(t)のレベルs(t)があらかじめ設定した閾値β1を超えた場合に、再生音に歪が生じる可能性がある(以下、このレベルを過大レベルともいう)と判定する。閾値β1は再生手段2に合わせて実験、シミュレーション等により予め調べておけばよい。
(Coefficient selection unit 123)
The
(係数乗算部124)
係数乗算部124は、エコー成分のレベルの推定値R(ω)と、係数選択部123において選択された過大時乗算係数γ2または通常時乗算係数γ1とを乗じて積(γ1R(ω)またはγ2R(ω))を求め(S124)、出力する。乗じた後の信号(γ1R(ω)またはγ2R(ω))がエコー成分のレベルの推定値として利用される。γ1<γ2なので、歪が生じる可能性があることを示す場合には、エコー成分のレベルが高く見積もられることとなる。
(Coefficient multiplication unit 124)
(エコー抑圧ゲイン取得部125)
エコー抑圧ゲイン取得部125は、積(γ1R(ω)またはγ2R(ω))と周波数領域の誤差信号Y2(ω)とを受け取り、周波数帯域毎に、積(γ1R(ω)またはγ2R(ω))と誤差信号Y2(ω)のレベルとを比較し、積が大きい程抑圧量の大きいゲインを設定し、後述するエコー抑圧部108で用いるゲインG(ω)とし(S125)、出力する。
(Echo suppression gain acquisition unit 125)
The echo suppression
例えば、特許文献1と同様の方法により、ゲインを設定することができる。まず、誤差信号Y2(ω)にエコー成分が多く含まれている場合、積(γ1R(ω)またはγ2R(ω))と誤差信号Y2(ω)のレベルが近い値をとるので、積(γ1R(ω)またはγ2R(ω))に予め設定した固定値、例えば1以上の固定係数Cを乗じた値より、誤差信号Y2(ω)のレベルが小さい場合に、エコー成分が多く含まれる期間として検出する。例えば、誤差信号Y2(ω)のレベルをW(ω)とすると、この条件は次式で表される。
W(ω)≦C・γR(ω) (8)
ただし、γはγ1またはγ2である。なお、誤差信号Y2(ω)のレベルW(ω)としては、誤差信号Y2(ω)の絶対値や、絶対値を平滑化した信号を用いればよい。例えば、
W(ω)=|Y(ω)| for W'(ω)≦|Y(ω)|
W(ω)=u・W'(ω)+(l-u)・|Y(ω)| for W'(ω)>|Y(ω)|
とする。ただし、W(ω)は反響に相当する時間平滑を行ったあとの受話信号であり、W'(ω)は1フレーム前のW(ω)であり、uは反響の長さ(残響時間)の想定値を調整するための係数でありあらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
For example, the gain can be set by the same method as that of
W (ω) ≦ C · γR (ω) (8)
However, γ is γ 1 or γ 2 . As the level W (omega) of the error signal Y 2 (omega), the absolute value and the error signal Y 2 (omega), the absolute value may be used smoothed signal. For example,
W (ω) = | Y (ω) | for W '(ω) ≦ | Y (ω) |
W (ω) = u · W ′ (ω) + (lu) · | Y (ω) | for W ′ (ω)> | Y (ω) |
I assume. Where W (ω) is the received signal after time smoothing corresponding to echo, W '(ω) is W (ω) one frame before, and u is the echo length (reverberation time) It is a coefficient for adjusting the assumed value of and a fixed value is set in advance. For example, u takes a value of 0 ≦ u <1, and an environment with longer reverberation time is simulated as closer to 1 and an environment with shorter reverberation time is simulated as closer to 0.
エコー成分が多く含まれる期間として検出されたら、その帯域の瞬時利得係数g(ω)を、あらかじめ固定値で設定したエコー抑圧量Dに設定する。ただし、エコー抑圧量Dは例えば0≦D<1の値をとり、小さい値にするほどエコー抑圧量が増加するが、ダブルトーク時の近端話者音声の劣化が増加する。次に、エコー成分が多く含まれる期間として検出されなかった場合は、エコー成分が小さいので、瞬時利得係数g(ω)を予め設定した固定値、例えば1に設定し、誤差信号Y2(ω)をそのまま通過させる。このゲイン制御を式で表せば次式となる。
g(ω)=D for W(ω)≦C・R(ω)
g(ω)=1 for W(ω)>C・R(ω)
次に、瞬時利得係数g(ω)を時間平滑化して、エコー抑圧部108に出力するゲインG(ω)を求める。時間平滑化することでゲインの急激な変化による音質劣化を抑えることができる。時間平滑化は、例えば次式のように行われる。
G(ω)=a・G'(ω)+(l-a)・g(ω) for g(ω)≦G'(ω)
G(ω)=b・G'(ω)+(l-b)・g(ω) for g(ω)>G'(ω) (9)
ただし、G'(ω)は1フレーム前のゲインG(ω)である。aはゲイン下降時の平滑化係数、bはゲイン上昇時の平滑化係数であり、あらかじめ固定値で設定される。aとbは0から1の間の値をとり、1に近いほど長い時間での平滑化となり、0に近いほど短い時間での時間平滑化となる。
When it is detected as a period in which a large amount of echo components are contained, the instantaneous gain coefficient g (ω) of that band is set to an echo suppression amount D set in advance as a fixed value. However, the amount of echo suppression D takes, for example, a value of 0 ≦ D <1, and the smaller the value, the more the echo suppression amount increases, but the deterioration of the near-end speaker voice at the time of double talk increases. Next, when the echo component is not detected as a period including a large amount of echo components, the echo component is small, so the instantaneous gain coefficient g (ω) is set to a preset fixed value, for example, 1 and the error signal Y 2 (ω Let pass). This gain control can be expressed by the following equation.
g (ω) = D for W (ω) ≦ C · R (ω)
g (ω) = 1 for W (ω)> C · R (ω)
Next, the instantaneous gain coefficient g (ω) is time-smoothed to obtain a gain G (ω) to be output to the
G (ω) = a · G ′ (ω) + (la) · g (ω) for g (ω) ≦ G ′ (ω)
G (ω) = b · G ′ (ω) + (lb) · g (ω) for g (ω)> G ′ (ω) (9)
Here, G ′ (ω) is a gain G (ω) one frame before. a is a smoothing coefficient at the time of gain decrease, b is a smoothing coefficient at the time of gain increase, and is set in advance as a fixed value. a and b take values between 0 and 1, and the closer to 1, the longer time is smoothed, and the closer to 0, the shorter time is smoothed.
なお、上述のゲイン取得方法は、例示であって、周波数帯域毎に、積(γ1R(ω)またはγ2R(ω))と誤差信号Y2(ω)のレベルとを比較し、積が大きい程抑圧量の大きいゲインを設定することができれば、他の方法であってもよい。例えば、時間平滑化を行わなず、g(ω)をそのままゲインG(ω)としても用いてもよい。 The above gain acquisition method is an example, and the product (γ 1 R (ω) or γ 2 R (ω)) is compared with the level of the error signal Y 2 (ω) for each frequency band, Other methods may be used as long as the larger the product, the larger the amount of suppression can be set. For example, g (ω) may be used as gain G (ω) as it is without performing time smoothing.
<エコー抑圧部108>
エコー抑圧部108は、周波数領域の誤差信号Y2(ω)とゲインG(ω)とを受け取り、周波数領域の誤差信号Y2(ω)にゲインG(ω)を乗じ、送話信号Y3(ω)(Y3(ω)=G(ω)Y2(ω))を求め(S108)、出力する。
<
Echo suppressing
<時間領域変換部109>
時間領域変換部109は、送話信号Y3(ω)を受け取り、時間領域の送話信号y3(t)に変換し(S109)、出力する。変換方法としては、周波数領域変換部103及び周波数領域変換部104で用いた変換方法に対応するものを用いればよい。例えば、IFFT(逆短時間フーリエ変換)等を用いることができる。
<Time
The time
<効果>
以上の構成により、過大な受話信号を検出した場合のみ、大きな係数をエコーレベルに乗算することで、スピーカユニットやスピーカアンプの歪によるエコーの増加分を含んだエコーレベルに近い値が推定され、安定したエコー抑圧を行うことが可能である。
<Effect>
With the above configuration, a value close to the echo level including an increase in echo due to distortion of the speaker unit or the speaker amplifier is estimated by multiplying the echo level by a large coefficient only when an excessive reception signal is detected. It is possible to perform stable echo suppression.
<変形例>
必ずしも適応フィルタ部101、減算部102を含まなくともよい。その場合、S103以降の処理では、誤差信号y2(t)に代えて収音信号y1(t)を用いればよい。なお、誤差信号y2(t)は収音信号y1(t)からエコー成分の推定値y'1(t)を減じた値であり、収音信号y1(t)に基づく値と言える。もちろん、収音信号y1(t)自体も収音信号y1(t)に基づく値と言える。
<Modification>
The
本実施形態では、過大レベル検出部110において、受話信号x(t)のレベルs(t)を求めるだけだが、レベルs(t)が閾値β1を超えるか否かを判定し、判定結果を出力する構成としてもよい。係数選択部123では、判定結果(レベルs(t)が閾値β1を超えるか否か、言い換えると、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性があるか否かを示す判定結果)に従って、係数を選択すればよい。
In the present embodiment, the excessive
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。
第二実施形態では、ゲイン取得部120に代えて、ゲイン取得部220を含む。
Second Embodiment
Description will be made focusing on parts different from the first embodiment.
In the second embodiment, a
<ゲイン取得部220>
ゲイン取得部220は、エコー成分のレベルの推定値R(ω)と、受話信号x(t)のレベルs(t)と、周波数領域の誤差信号Y2(ω)とを受け取り、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求め(S220)、出力する。
<
図6はゲイン取得部220の機能ブロック図を、図7はその処理フローの例を示す。
FIG. 6 shows a functional block diagram of the
ゲイン取得部220は、エコー抑圧ゲイン取得部225、過大時ゲイン記憶部226及びゲイン選択部227を含む。
The
(エコー抑圧ゲイン取得部225)
エコー抑圧ゲイン取得部225は、エコー成分のレベルの推定値R(ω)と誤差信号Y2(ω)とを受け取り、エコー成分のレベルの推定値R(ω)と誤差信号Y2(ω)のレベルとを比較し、エコー成分のレベルの推定値R(ω)が大きい程抑圧量の大きいゲインG(1,ω)を周波数帯域毎に設定し(S225)、出力する。具体的な処理は、エコー抑圧ゲイン取得部125と同様であり、積(γ1R(ω)またはγ2R(ω))に代えて、エコー成分のレベルの推定値R(ω)を用いる点が異なる。
(Echo suppression gain acquisition unit 225)
The echo suppression
(過大時ゲイン記憶部226)
過大時ゲイン記憶部226には、予め過大時ゲインG(2,ω)を記憶しておく。なお、エコー抑圧ゲイン取得部225で得られるどのようなG(1,ω)に対してもG(2,ω)<G(1,ω)を満たすように、過大時ゲインG(2,ω)を設定する。要は、過大時ゲインG(2,ω)が、ゲインG(1,ω)よりも抑圧量が大きいものとする。
(Excessive gain storage unit 226)
The excessive gain
(ゲイン選択部227)
ゲイン選択部227は、過大レベル検出部110で求めた受話信号x(t)のレベルs(t)を受け取り、受話信号x(t)のレベルs(t)のレベルが大きいために再生音に歪が生じる可能性がある場合、過大時ゲイン記憶部226から過大時ゲインG(2,ω)を取り出し、エコー抑圧部108で用いるゲインG(ω)として出力し(S227)、歪が生じない場合にはエコー抑圧ゲイン取得部225で求めたゲインG(1,ω)をエコー抑圧部108で用いるゲインG(ω)として出力する(S227)。例えば、受話信号x(t)のレベルs(t)があらかじめ設定した閾値β2を超えた場合に、再生音に歪が生じる可能性があると判定する。閾値β2は再生手段2に合わせて実験、シミュレーション等により予め調べておけばよい。
(Gain selection unit 227)
The
<効果>
このような構成とすることで、第一実施形態と同様の効果を得ることができる。なお、第一実施形態の変形例と本実施形態とを組合せてもよい。
<Effect>
With such a configuration, the same effect as that of the first embodiment can be obtained. A modification of the first embodiment may be combined with the present embodiment.
例えば、本実施形態では、過大レベル検出部110において、受話信号x(t)のレベルs(t)を求めるだけだが、レベルs(t)が閾値β2を超えるか否かを判定し、判定結果を出力する構成としてもよい。ゲイン選択部227では、判定結果(レベルs(t)が閾値β2を超えるか否か、言い換えると、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性があるか否かを示す判定結果)に従って、ゲインを選択すればよい。
For example, in the present embodiment, the
<第三実施形態>
第一実施形態と異なる部分を中心に説明する。第三実施形態は、第一実施形態と第二実施形態とを組み合わせた構成である。
第三実施形態では、ゲイン取得部120に代えて、ゲイン取得部320を含む。
Third Embodiment
Description will be made focusing on parts different from the first embodiment. The third embodiment is a configuration in which the first embodiment and the second embodiment are combined.
In the third embodiment, a
<ゲイン取得部320>
ゲイン取得部320は、エコー成分のレベルの推定値R(ω)と、受話信号x(t)のレベルs(t)と、周波数領域の誤差信号Y2(ω)とを受け取り、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求め(S320)、出力する。
<
図8はゲイン取得部320の機能ブロック図を、図9はその処理フローの例を示す。
FIG. 8 shows a functional block diagram of the
ゲイン取得部320は、通常時乗算係数記憶部121、過大時乗算係数記憶部122、係数選択部123、係数乗算部124、エコー抑圧ゲイン取得部325、過大時ゲイン記憶部226及びゲイン選択部227を含む。
The
なお、係数選択部123で用いる閾値β1とゲイン選択部227で用いる閾値β2とは、β1<β2となるように設定する。
Note that the threshold value beta 2 used in the threshold beta 1 and gain
(エコー抑圧ゲイン取得部325)
エコー抑圧ゲイン取得部325は、積(γ1R(ω)またはγ2R(ω))と周波数領域の誤差信号Y2(ω)とを受け取り、周波数帯域毎に、積(γ1R(ω)またはγ2R(ω))と誤差信号Y2(ω)のレベルとを比較し、積が大きい程抑圧量の大きいゲインを設定し、ゲインG(1,ω)をゲイン選択部227に出力する(S325)。
(Echo suppression gain acquisition unit 325)
The echo suppression
過大時ゲイン記憶部226及びゲイン選択部227の処理内容は第二実施形態と同様である。このとき、β2<s(t)の場合には、ゲイン選択部227において、過大時ゲインG(2,ω)が選択されることは明らかなので、係数選択部123、係数乗算部124、エコー抑圧ゲイン取得部325の処理は省略してもよい。
The processing contents of the excessive
<効果>
このような構成とすることで、第一実施形態、第二実施形態と同様の効果を得ることができる。本実施形態では、閾値β1を超え閾値β2以下の場合は第一実施形態に示すようにエコー成分に過大時乗算係数を乗じ、閾値β2を超えた場合は第二実施形態に示すようにゲインを強制的に過大時ゲインに置き換える。
<Effect>
With such a configuration, the same effects as those of the first embodiment and the second embodiment can be obtained. In the present embodiment, in the case of less than the threshold value beta 2 exceeds the threshold value beta 1 multiplied by the excess time multiplication coefficient to the echo component, as shown in the first embodiment, if the threshold is exceeded beta 2 as shown in the second embodiment Force the gain to be replaced with the overtime gain.
このようにすることにより、過大な受話信号で歪が、それほど大きくいない場合は、推定エコーを大きく見積もることで対応し、歪が大きい場合は、送話音声を完全に抑える。なお、第一実施形態の変形例と本実施形態とを組合せてもよい。 By doing this, when the distortion is not so large with an excessive reception signal, the estimated echo is largely estimated, and when the distortion is large, the transmission voice is completely suppressed. A modification of the first embodiment may be combined with the present embodiment.
例えば、本実施形態では、過大レベル検出部110において、受話信号x(t)のレベルs(t)を求めるだけだが、レベルs(t)が閾値β1またはβ2を超えるか否かを判定し、判定結果を出力する構成としてもよい。係数選択部123では、判定結果(レベルs(t)が閾値β1を超えるか否か、言い換えると、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性があるか否かを示す判定結果)に従って、係数を選択すればよい。ゲイン選択部227では、判定結果(レベルs(t)が閾値β2を超えるか否か、言い換えると、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性があるか否かを示す判定結果)に従って、ゲインを選択すればよい。
For example, in the present embodiment, the
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<Other Modifications>
The present invention is not limited to the above embodiments and modifications. For example, the various processes described above may be performed not only in chronological order according to the description, but also in parallel or individually depending on the processing capability of the apparatus that executes the process or the necessity. In addition, changes can be made as appropriate without departing from the spirit of the present invention.
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
<Program and Recording Medium>
In addition, various processing functions in each device described in the above-described embodiment and modification may be realized by a computer. In that case, the processing content of the function that each device should have is described by a program. By executing this program on a computer, various processing functions in each of the above-described devices are realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。 The program describing the processing content can be recorded in a computer readable recording medium. As the computer readable recording medium, any medium such as a magnetic recording device, an optical disc, a magneto-optical recording medium, a semiconductor memory, etc. may be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。 Further, this program is distributed, for example, by selling, transferring, lending, etc. a portable recording medium such as a DVD, a CD-ROM or the like in which the program is recorded. Furthermore, the program may be stored in a storage device of a server computer, and the program may be distributed by transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 For example, a computer that executes such a program first temporarily stores a program recorded on a portable recording medium or a program transferred from a server computer in its own storage unit. Then, at the time of execution of the process, the computer reads the program stored in its storage unit and executes the process according to the read program. In another embodiment of the program, the computer may read the program directly from the portable recording medium and execute processing in accordance with the program. Furthermore, each time a program is transferred from this server computer to this computer, processing according to the received program may be executed sequentially. In addition, a configuration in which the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes processing functions only by executing instructions and acquiring results from the server computer without transferring the program to the computer It may be Note that the program includes information provided for processing by a computer that conforms to the program (such as data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In addition, although each device is configured by executing a predetermined program on a computer, at least a part of the processing content may be realized as hardware.
Claims (8)
前記周波数領域の受話信号のレベルに前記音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、
前記受話信号のレベルと、前記エコー成分のレベルの推定値と、前記収音信号のレベルとを用いて、前記再生手段において前記受話信号を再生する際に、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得部と、
前記周波数領域の収音信号に基づく値に前記ゲインG(ω)を乗じるエコー抑圧部とを含み、
前記ゲイン取得部は、
通常時乗算係数は過大時乗算係数よりも小さいものとし、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合には過大時乗算係数を選択し、歪が生じない場合には通常時乗算係数を選択する係数選択部と、
前記エコー成分のレベルの推定値と、前記係数選択部において選択された過大時乗算係数または通常時乗算係数とを乗じて積を求める係数乗算部と、
周波数帯域毎に、前記積と前記収音信号に基づく値のレベルとを比較し、前記積が大きい程抑圧量の大きいゲインを設定し、前記ゲインG(ω)とするエコー抑圧ゲイン取得部とを含む、
エコー抑圧装置。 An acoustic coupling amount estimation unit for estimating an acoustic coupling amount between the reproduction means and the sound pickup means for each frequency domain from a ratio between a value based on a collected sound signal in the frequency domain and a reception signal in the frequency domain;
An echo level estimation unit that estimates the level of the echo component included in the collected signal by multiplying the level of the reception signal in the frequency domain by the acoustic coupling amount;
When the reproduction signal is reproduced by the reproduction means using the level of the reception signal, the estimated value of the level of the echo component, and the level of the collected signal, the level of the reception signal is large. A gain acquisition unit which obtains, for each frequency, a gain G (ω) having a larger amount of suppression than a gain used if distortion does not occur if distortion may occur in the reproduced sound;
An echo suppression unit that multiplies the gain G (ω) by a value based on the collected sound signal in the frequency domain;
The gain acquisition unit
If the normal multiplication coefficient is smaller than the excessive multiplication coefficient, and if there is a possibility that distortion occurs in the reproduced sound because the level of the reception signal is large, the excessive multiplication coefficient is selected, and no distortion occurs. And a coefficient selection unit for selecting a multiplication coefficient at a normal time,
A coefficient multiplication unit which obtains a product by multiplying the estimated value of the level of the echo component and the over-time multiplication coefficient or the normal-time multiplication coefficient selected in the coefficient selection unit;
An echo suppression gain acquisition unit which compares, for each frequency band, the product with the level of a value based on the collected sound signal, sets a larger gain as the product is larger, and sets the gain as the gain G (ω); including,
Echo suppressor.
前記周波数領域の受話信号のレベルに前記音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、
前記受話信号のレベルと、前記エコー成分のレベルの推定値と、前記収音信号のレベルとを用いて、前記再生手段において前記受話信号を再生する際に、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得部と、
前記周波数領域の収音信号に基づく値に前記ゲインG(ω)を乗じるエコー抑圧部とを含み、
前記ゲイン取得部は、
前記エコー成分のレベルの推定値と前記収音信号に基づく値のレベルとを比較し、前記エコー成分のレベルの推定値が大きい程抑圧量の大きいゲインG(1,ω)を周波数帯域毎に設定するエコー抑圧ゲイン取得部と、
過大時ゲインG(2,ω)は、ゲインG(1,ω)よりも抑圧量が大きいものとし、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合には過大時ゲインG(2,ω)を選択し、歪が生じない場合にはゲインG(1,ω)を選択し、前記ゲインG(ω)とするゲイン選択部とを含む、
エコー抑圧装置。 An acoustic coupling amount estimation unit for estimating an acoustic coupling amount between the reproduction means and the sound pickup means for each frequency domain from a ratio between a value based on a collected sound signal in the frequency domain and a reception signal in the frequency domain;
An echo level estimation unit that estimates the level of the echo component included in the collected signal by multiplying the level of the reception signal in the frequency domain by the acoustic coupling amount;
When the reproduction signal is reproduced by the reproduction means using the level of the reception signal, the estimated value of the level of the echo component, and the level of the collected signal, the level of the reception signal is large. A gain acquisition unit which obtains, for each frequency, a gain G (ω) having a larger amount of suppression than a gain used if distortion does not occur if distortion may occur in the reproduced sound;
An echo suppression unit that multiplies the gain G (ω) by a value based on the collected sound signal in the frequency domain;
The gain acquisition unit
The estimated value of the level of the echo component is compared with the level of the value based on the collected sound signal, and the larger the estimated value of the level of the echo component, the larger the gain G (1, ω) of the suppression amount is for each frequency band An echo suppression gain acquisition unit to be set;
It is assumed that the excessive gain G (2, ω) has a larger suppression amount than the gain G (1, ω), and if the level of the reception signal is large, distortion may occur in the reproduced sound. Selecting a time gain G (2, ω), and selecting no gain G (1, ω) if distortion does not occur;
Echo suppressor.
前記周波数領域の受話信号のレベルに前記音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、
前記受話信号のレベルと、前記エコー成分のレベルの推定値と、前記収音信号のレベルとを用いて、前記再生手段において前記受話信号を再生する際に、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得部と、
前記周波数領域の収音信号に基づく値に前記ゲインG(ω)を乗じるエコー抑圧部とを含み、
前記ゲイン取得部は、
β1<β2とし、受話信号のレベルをs(t)とし、通常時乗算係数は過大時乗算係数よりも小さいものとし、β1<s(t)≦β2の場合には過大時乗算係数を選択し、s(t)≦β1の場合には通常時乗算係数を選択する係数選択部と、
前記エコー成分のレベルの推定値と、前記係数選択部において選択された過大時乗算係数または通常時乗算係数とを乗じて積を求める係数乗算部と、
周波数帯域毎に、前記積と前記収音信号に基づく値のレベルとを比較し、前記積が大きい程抑圧量の大きいゲインG(1,ω)を設定するエコー抑圧ゲイン取得部と、
過大時ゲインG(2,ω)は、ゲインG(1,ω)よりも抑圧量大きいものとし、β2<s(t)の場合には過大時ゲインG(2,ω)を選択し、s(t)≦β2の場合にはゲインG(1,ω)を選択し、前記ゲインG(ω)するゲイン選択部とを含む、
エコー抑圧装置。 An acoustic coupling amount estimation unit for estimating an acoustic coupling amount between the reproduction means and the sound pickup means for each frequency domain from a ratio between a value based on a collected sound signal in the frequency domain and a reception signal in the frequency domain;
An echo level estimation unit that estimates the level of the echo component included in the collected signal by multiplying the level of the reception signal in the frequency domain by the acoustic coupling amount;
When the reproduction signal is reproduced by the reproduction means using the level of the reception signal, the estimated value of the level of the echo component, and the level of the collected signal, the level of the reception signal is large. A gain acquisition unit which obtains, for each frequency, a gain G (ω) having a larger amount of suppression than a gain used if distortion does not occur if distortion may occur in the reproduced sound;
An echo suppression unit that multiplies the gain G (ω) by a value based on the collected sound signal in the frequency domain;
The gain acquisition unit
It is assumed that β 1 <β 2 , the level of the reception signal is s (t), the normal time multiplication factor is smaller than the overtime multiplication factor, and if β 1 <s (t) ≦ β 2 , the overtime multiplication is performed A coefficient selection unit which selects a coefficient, and in the case of s (t) ≦ β 1 selects a normal multiplication coefficient;
A coefficient multiplication unit which obtains a product by multiplying the estimated value of the level of the echo component and the over-time multiplication coefficient or the normal-time multiplication coefficient selected in the coefficient selection unit;
An echo suppression gain acquisition unit that compares, for each frequency band, the product with the level of a value based on the collected signal, and sets a gain G (1, ω) with a larger amount of suppression as the product is larger;
The overrun gain G (2, ω) is larger than the gain G (1, ω) by the amount of suppression, and in the case of β 2 <s (t), the overrun gain G (2, ω) is selected, in the case of s (t) ≦ β 2 selects the gain G (1, ω), and a gain selection unit for the gain G (ω),
Echo suppressor.
前記周波数領域の受話信号のレベルに前記音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定ステップと、
前記受話信号のレベルと、前記エコー成分のレベルの推定値と、前記収音信号のレベルとを用いて、前記再生手段において前記受話信号を再生する際に、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得ステップと、
前記周波数領域の収音信号に基づく値に前記ゲインG(ω)を乗じるエコー抑圧ステップとを含み、
前記ゲイン取得ステップは、
通常時乗算係数は過大時乗算係数よりも小さいものとし、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合には過大時乗算係数を選択し、歪が生じない場合には通常時乗算係数を選択する係数選択ステップと、
前記エコー成分のレベルの推定値と、前記係数選択ステップにおいて選択された過大時乗算係数または通常時乗算係数とを乗じて積を求める係数乗算ステップと、
周波数帯域毎に、前記積と前記収音信号に基づく値のレベルとを比較し、前記積が大きい程抑圧量の大きいゲインを設定し、前記ゲインG(ω)とするエコー抑圧ゲイン取得ステップとを含む、
エコー抑圧方法。 An acoustic coupling amount estimation step of estimating, for each frequency domain, an acoustic coupling amount between the reproduction means and the sound collecting means from a ratio between a value based on a collected sound signal in the frequency domain and a reception signal in the frequency domain;
An echo level estimation step of estimating the level of the echo component included in the collected signal by multiplying the level of the reception signal in the frequency domain by the acoustic coupling amount;
When the reproduction signal is reproduced by the reproduction means using the level of the reception signal, the estimated value of the level of the echo component, and the level of the collected signal, the level of the reception signal is large. A gain acquisition step of obtaining, for each frequency, a gain G (ω) having a larger amount of suppression than a gain used if distortion does not occur if distortion may occur in the reproduced sound;
Look including the echo suppression step of multiplying the gain G (omega) the value based on the collected sound signal in the frequency domain,
The gain acquisition step is
If the normal multiplication coefficient is smaller than the excessive multiplication coefficient, and if there is a possibility that distortion occurs in the reproduced sound because the level of the reception signal is large, the excessive multiplication coefficient is selected, and no distortion occurs. And a coefficient selection step of selecting a multiplication coefficient normally.
A coefficient multiplication step for obtaining a product by multiplying the estimated value of the level of the echo component and the over-time multiplication coefficient or the normal-time multiplication coefficient selected in the coefficient selection step;
An echo suppression gain acquisition step of comparing the product with the level of a value based on the collected sound signal for each frequency band, setting a larger gain as the product is larger, and setting the gain as the gain G (ω); including,
Echo suppression method.
前記周波数領域の受話信号のレベルに前記音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定ステップと、
前記受話信号のレベルと、前記エコー成分のレベルの推定値と、前記収音信号のレベルとを用いて、前記再生手段において前記受話信号を再生する際に、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得ステップと、
前記周波数領域の収音信号に基づく値に前記ゲインG(ω)を乗じるエコー抑圧ステップとを含み、
前記ゲイン取得ステップは、
前記エコー成分のレベルの推定値と前記収音信号に基づく値のレベルとを比較し、前記エコー成分のレベルの推定値が大きい程抑圧量の大きいゲインG(1,ω)を周波数帯域毎に設定するエコー抑圧ゲイン取得ステップと、
過大時ゲインG(2,ω)は、ゲインG(1,ω)よりも抑圧量が大きいものとし、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合には過大時ゲインG(2,ω)を選択し、歪が生じない場合にはゲインG(1,ω)を選択し、前記ゲインG(ω)とするゲイン選択ステップとを含む、
エコー抑圧方法。 An acoustic coupling amount estimation step of estimating, for each frequency domain, an acoustic coupling amount between the reproduction means and the sound collecting means from a ratio between a value based on a collected sound signal in the frequency domain and a reception signal in the frequency domain;
An echo level estimation step of estimating the level of the echo component included in the collected signal by multiplying the level of the reception signal in the frequency domain by the acoustic coupling amount;
When the reproduction signal is reproduced by the reproduction means using the level of the reception signal, the estimated value of the level of the echo component, and the level of the collected signal, the level of the reception signal is large. A gain acquisition step of obtaining, for each frequency, a gain G (ω) having a larger amount of suppression than a gain used if distortion does not occur if distortion may occur in the reproduced sound;
Look including the echo suppression step of multiplying the gain G (omega) the value based on the collected sound signal in the frequency domain,
The gain acquisition step is
The estimated value of the level of the echo component is compared with the level of the value based on the collected sound signal, and the larger the estimated value of the level of the echo component, the larger the gain G (1, ω) of the suppression amount is for each frequency band An echo suppression gain acquisition step to be set;
It is assumed that the excessive gain G (2, ω) has a larger suppression amount than the gain G (1, ω), and if the level of the reception signal is large, distortion may occur in the reproduced sound. Selecting a gain G (2, ω) and selecting a gain G (1, ω) if no distortion occurs, and selecting the gain G (ω).
Echo suppression method.
前記周波数領域の受話信号のレベルに前記音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定ステップと、
前記受話信号のレベルと、前記エコー成分のレベルの推定値と、前記収音信号のレベルとを用いて、前記再生手段において前記受話信号を再生する際に、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得ステップと、
前記周波数領域の収音信号に基づく値に前記ゲインG(ω)を乗じるエコー抑圧ステップとを含み、
前記ゲイン取得ステップは、
β 1 <β 2 とし、受話信号のレベルをs(t)とし、通常時乗算係数は過大時乗算係数よりも小さいものとし、β 1 <s(t)≦β 2 の場合には過大時乗算係数を選択し、s(t)≦β 1 の場合には通常時乗算係数を選択する係数選択ステップと、
前記エコー成分のレベルの推定値と、前記係数選択ステップにおいて選択された過大時乗算係数または通常時乗算係数とを乗じて積を求める係数乗算ステップと、
周波数帯域毎に、前記積と前記収音信号に基づく値のレベルとを比較し、前記積が大きい程抑圧量の大きいゲインG(1,ω)を設定するエコー抑圧ゲイン取得ステップと、
過大時ゲインG(2,ω)は、ゲインG(1,ω)よりも抑圧量大きいものとし、β 2 <s(t)の場合には過大時ゲインG(2,ω)を選択し、s(t)≦β 2 の場合にはゲインG(1,ω)を選択し、前記ゲインG(ω)するゲイン選択ステップとを含む、
エコー抑圧方法。 An acoustic coupling amount estimation step of estimating, for each frequency domain, an acoustic coupling amount between the reproduction means and the sound collecting means from a ratio between a value based on a collected sound signal in the frequency domain and a reception signal in the frequency domain;
An echo level estimation step of estimating the level of the echo component included in the collected signal by multiplying the level of the reception signal in the frequency domain by the acoustic coupling amount;
When the reproduction signal is reproduced by the reproduction means using the level of the reception signal, the estimated value of the level of the echo component, and the level of the collected signal, the level of the reception signal is large. A gain acquisition step of obtaining, for each frequency, a gain G (ω) having a larger amount of suppression than a gain used if distortion does not occur if distortion may occur in the reproduced sound;
Look including the echo suppression step of multiplying the gain G (omega) the value based on the collected sound signal in the frequency domain,
The gain acquisition step is
It is assumed that β 1 <β 2 , the level of the reception signal is s (t), the normal time multiplication factor is smaller than the overtime multiplication factor, and if β 1 <s (t) ≦ β 2 , the overtime multiplication is performed select the coefficients, a coefficient selection step of selecting a normal multiplication factor in the case of s (t) ≦ β 1,
A coefficient multiplication step for obtaining a product by multiplying the estimated value of the level of the echo component and the over-time multiplication coefficient or the normal-time multiplication coefficient selected in the coefficient selection step;
An echo suppression gain acquisition step of comparing the product with the level of a value based on the collected sound signal for each frequency band, and setting a gain G (1, ω) with a larger amount of suppression as the product is larger;
The overrun gain G (2, ω) is larger than the gain G (1, ω) by the amount of suppression, and in the case of β 2 <s (t), the overrun gain G (2, ω) is selected, in the case of s (t) ≦ β 2 selects the gain G (1, ω), and a gain selection step of the gain G (ω),
Echo suppression method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016079702A JP6537997B2 (en) | 2016-04-12 | 2016-04-12 | Echo suppressor, method thereof, program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016079702A JP6537997B2 (en) | 2016-04-12 | 2016-04-12 | Echo suppressor, method thereof, program, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017191992A JP2017191992A (en) | 2017-10-19 |
JP6537997B2 true JP6537997B2 (en) | 2019-07-03 |
Family
ID=60086181
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016079702A Active JP6537997B2 (en) | 2016-04-12 | 2016-04-12 | Echo suppressor, method thereof, program, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6537997B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021184587A (en) | 2019-11-12 | 2021-12-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Echo suppression device, echo suppression method, and echo suppression program |
EP4290778A1 (en) | 2021-03-16 | 2023-12-13 | Panasonic Intellectual Property Corporation of America | Echo suppressing device, echo suppressing method, and echo suppressing program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4413205B2 (en) * | 2006-06-21 | 2010-02-10 | 日本電信電話株式会社 | Echo suppression method, apparatus, echo suppression program, recording medium |
JP4787851B2 (en) * | 2008-02-06 | 2011-10-05 | 日本電信電話株式会社 | Echo suppression gain estimation method, echo canceller using the same, device program, and recording medium |
CN102165707B (en) * | 2008-09-24 | 2013-12-04 | 三菱电机株式会社 | Echo cancelling device |
JP5016581B2 (en) * | 2008-10-27 | 2012-09-05 | 日本電信電話株式会社 | Echo suppression device, echo suppression method, echo suppression program, recording medium |
BR112013016222B1 (en) * | 2011-02-03 | 2020-12-15 | Telefonaktiebolaget L M Ericsson (Publ) | METHOD OF ESTIMATING ECO POWER, ECO SUPPRESSION METHOD, HARMONIC ECO POWER ESTIMATOR, ECO CANCELER, AND, USER EQUIPMENT |
-
2016
- 2016-04-12 JP JP2016079702A patent/JP6537997B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017191992A (en) | 2017-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5075042B2 (en) | Echo canceling apparatus, echo canceling method, program thereof, and recording medium | |
KR102170172B1 (en) | Echo suppression | |
JP5391103B2 (en) | Multi-channel echo canceling method, multi-channel echo canceling apparatus, multi-channel echo canceling program and recording medium therefor | |
KR102190833B1 (en) | Echo suppression | |
EP2987313B1 (en) | Echo removal | |
JP2016506673A (en) | Echo suppression | |
JP5161157B2 (en) | Frequency domain echo removal apparatus, frequency domain echo removal method, program | |
JP6537997B2 (en) | Echo suppressor, method thereof, program, and recording medium | |
JP5469564B2 (en) | Multi-channel echo cancellation method, multi-channel echo cancellation apparatus and program thereof | |
JP2003250193A (en) | Echo elimination method, device for executing the method, program and recording medium therefor | |
JP5524316B2 (en) | Parameter estimation apparatus, echo cancellation apparatus, parameter estimation method, and program | |
JP5438629B2 (en) | Stereo echo canceling method, stereo echo canceling device, stereo echo canceling program | |
JP2008060715A (en) | Echo canceller, method thereof, program thereof, and recording medium therefor | |
JP5583181B2 (en) | Cascade connection type transmission system parameter estimation method, cascade connection type transmission system parameter estimation device, program | |
CN110265048B (en) | Echo cancellation method, device, equipment and storage medium | |
JP2011160429A (en) | Echo elimination device | |
JP2017191987A (en) | Echo suppressor, method thereof, program, and record medium | |
JP4769161B2 (en) | Echo canceller apparatus, method thereof, program thereof, and recording medium thereof | |
JP7235117B2 (en) | ECHO ERASE DEVICE, ECHO ERASE METHOD, AND PROGRAM | |
JP5925149B2 (en) | Acoustic coupling amount estimating apparatus, echo canceling apparatus, method and program thereof | |
JP5086969B2 (en) | Echo canceling apparatus, method thereof, program thereof, and recording medium thereof | |
JP5325134B2 (en) | Echo canceling method, echo canceling apparatus, program thereof, and recording medium | |
WO2019244535A1 (en) | Echo cancellation device, echo cancellation method, and program | |
JP4094523B2 (en) | Echo canceling apparatus, method, echo canceling program, and recording medium recording the program | |
JP4504892B2 (en) | Echo canceling method, echo canceling apparatus, program, recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190402 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190605 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6537997 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |