JP2017191992A - エコー抑圧装置、その方法、プログラム、及び記録媒体 - Google Patents

エコー抑圧装置、その方法、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2017191992A
JP2017191992A JP2016079702A JP2016079702A JP2017191992A JP 2017191992 A JP2017191992 A JP 2017191992A JP 2016079702 A JP2016079702 A JP 2016079702A JP 2016079702 A JP2016079702 A JP 2016079702A JP 2017191992 A JP2017191992 A JP 2017191992A
Authority
JP
Japan
Prior art keywords
gain
level
echo
unit
received signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016079702A
Other languages
English (en)
Other versions
JP6537997B2 (ja
Inventor
和則 小林
Kazunori Kobayashi
和則 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016079702A priority Critical patent/JP6537997B2/ja
Publication of JP2017191992A publication Critical patent/JP2017191992A/ja
Application granted granted Critical
Publication of JP6537997B2 publication Critical patent/JP6537997B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

【課題】過大な受話信号が入力されスピーカユニットやスピーカアンプで歪が生じても、安定してエコーを抑圧することができる技術を提供することである。【解決手段】周波数領域の収音信号に基づく値と、周波数領域の受話信号との比から、再生手段と収音手段との間の音響結合量を周波数領域毎に推定する音響結合量推定部と、周波数領域の受話信号のレベルに音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、受話信号のレベルと、エコー成分のレベルの推定値と、収音信号のレベルとを用いて、再生手段において受話信号を再生する際に、受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得部と、周波数領域の収音信号に基づく値にゲインG(ω)を乗じるエコー抑圧部とを含む。【選択図】図2

Description

本発明は、ハンズフリー通話装置においてスピーカからマイクロホンへ回り込んだ音(音響エコー)を抑圧するための技術に関する。
エコー抑圧技術の従来技術として特許文献1が知られている。
特許文献1のエコー抑圧装置の前段に適応フィルタを用いたエコー消去装置を設けた構成を図1に示す。以下、図1の構成の処理の概要を説明する。
適応フィルタ部91は、再生手段2に入力される受話信号x(t)(以下、単に再生手段2の受話信号ともいう)に対して適応フィルタを用いてフィルタリングを行い、エコー成分の推定値y'1(t)を求める。ただし、tは離散化された時刻を示すインデックスである。減算部92は、収音手段3で収音した収音信号y1(t)からエコー成分の推定値y'1(t)を減じて、誤差信号y2(t)を求める。なお、適応フィルタ部91は、受話信号x(t)と誤差信号y2(t)とを用いて適応フィルタのフィルタ係数を更新する。周波数領域変換部93は、時間領域の誤差信号y2(t)を周波数領域の誤差信号Y2(ω)に変換する。ただし、ωは周波数を示すインデックスである。周波数領域変換部94は受話信号x(t)を周波数領域の受話信号X(ω)に変換する。音響結合量推定部95は、周波数領域の誤差信号Y2(ω)と周波数領域の受話信号X(ω)とを用いて、音響結合量D(ω)を推定する。エコーレベル推定部96は、周波数領域の受話信号X(ω)のレベルに音響結合量を乗じて、周波数領域の誤差信号Y2(ω)に含まれるエコー成分のレベルを推定する。ゲイン取得部97は、エコー成分のレベルの推定値R(ω)と周波数領域の誤差信号Y2(ω)とを用いてゲインG(ω)を取得する。乗算部98は、周波数領域の誤差信号Y2(ω)にゲインG(ω)を乗じて、周波数領域の送話信号Y3(ω)を求める。時間領域変換部99は周波数領域の送話信号Y3(ω)を時間領域の送話信号y3(t)に変換し、エコー消去装置90の出力値として出力する。
このような構成により、特許文献1の構成では、前段の適応フィルタを用いたエコー消去装置で消去しきれなかった残留エコーの抑圧を行う。
特開2008−5094号公報
前段の適応フィルタを用いたエコー消去装置のエコー消去が安定していれば、特許文献1のエコー抑圧装置で残留エコーを抑圧可能である。
しかしながら、再生手段2のスピーカユニットやスピーカアンプで再生音に歪が生じるような過大な受話信号が特許文献1のエコー抑圧装置に入力されると、その歪成分は前段の適応フィルタを用いたエコー消去装置では消去できず、大きな残留エコーとなる。従来のエコー抑圧装置では、急激に増加する残留エコーに対応できず、抑圧が十分に行われないという問題が生じる。なお、前段に適応フィルタを用いたエコー消去装置を設けずに、特許文献1のエコー抑圧装置を単体でエコー抑圧装置として用いた場合にも同様に、急激に増加するエコーに対応できず、抑圧が十分に行われないという問題が生じる。
本発明は、過大な受話信号が入力されスピーカユニットやスピーカアンプで歪が生じても、安定してエコーを抑圧することができるエコー抑圧装置、その方法、プログラム、及び記録媒体を提供することである。
上記の課題を解決するために、本発明の一態様によれば、エコー抑圧装置は、周波数領域の収音信号に基づく値と、周波数領域の受話信号との比から、再生手段と収音手段との間の音響結合量を周波数領域毎に推定する音響結合量推定部と、周波数領域の受話信号のレベルに音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、受話信号のレベルと、エコー成分のレベルの推定値と、収音信号のレベルとを用いて、再生手段において受話信号を再生する際に、受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得部と、周波数領域の収音信号に基づく値にゲインG(ω)を乗じるエコー抑圧部とを含む。
上記の課題を解決するために、本発明の他の態様によれば、エコー抑圧方法は、周波数領域の収音信号に基づく値と、周波数領域の受話信号との比から、再生手段と収音手段との間の音響結合量を周波数領域毎に推定する音響結合量推定ステップと、周波数領域の受話信号のレベルに音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定ステップと、受話信号のレベルと、エコー成分のレベルの推定値と、収音信号のレベルとを用いて、再生手段において受話信号を再生する際に、受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得ステップと、周波数領域の収音信号に基づく値にゲインG(ω)を乗じるエコー抑圧ステップとを含む。
本発明によれば、過大な受話信号が入力されスピーカユニットやスピーカアンプで歪が生じても、安定してエコーを抑圧することができるという効果を奏する。
従来技術のエコー消去装置の機能ブロック図。 第一実施形態に係るエコー消去装置の機能ブロック図。 第一実施形態に係るエコー消去装置の処理フローの例を示す図。 第一実施形態に係るゲイン取得部の機能ブロック図。 第一実施形態に係るゲイン取得部の処理フローの例を示す図。 第二実施形態に係るゲイン取得部の機能ブロック図。 第二実施形態に係るゲイン取得部の処理フローの例を示す図。 第三実施形態に係るゲイン取得部の機能ブロック図。 第三実施形態に係るゲイン取得部の処理フローの例を示す図。
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態>
図2は第一実施形態に係るエコー抑圧装置100の機能ブロック図を、図3はその処理フローの例を示す。
エコー抑圧装置100は、適応フィルタ部101、減算部102、周波数領域変換部103、周波数領域変換部104、音響結合量推定部105、エコーレベル推定部106、過大レベル検出部110、ゲイン取得部120、エコー抑圧部108及び時間領域変換部109を含む。
エコー抑圧装置100は、再生手段2で再生する受話信号x(t)と収音手段3で収音した収音信号y1(t)とを入力とし、収音信号y1(t)からエコー成分の推定値を消去及び抑圧した送話信号y3(t)を求め、出力する。以下、各部の処理内容を説明する。
再生手段2は、スピーカ、スピーカユニット、スピーカアンプ等からなり、受話信号x(t)を再生する。収音手段3はマイクロホン等からなり、収音信号y1(t)を出力する。
<適応フィルタ部101>
適応フィルタ部101は、再生手段2の受話信号x(t)と誤差信号y2(t)とを受け取り、これらの値を用いて、収音手段3の収音信号y1(t)に含まれるエコー成分の推定値y'1(t)を求め(S101)、出力する。
例えば、受話信号x(t)と後述するフィルタ係数H(t)を用いて、次式により、推定値y'1(t)を求める。
y'1(t)=H(t)TX(t) (1)
H(t)=(h(0), h(1), ... , h(L-1))T (2)
X(t)=(x(t), x(t-1), ... , x(t-L+1))T (3)
ただし、上付き添え字Tは転置を表し、ATはベクトルAの転置を表し、Lは適応フィルタのタップ長を表す。
ここで、フィルタ係数H(t)は、適応フィルタ部101内部の図示しないフィルタ係数更新部において、更新される。例えば、NLMSアルゴリズムを用いる場合には次式によりフィルタ係数H(t)を更新する。
H(t+1)=H(t)+aX(t)y2(t)/X(t)TX(t) (4)
0<a<2 (5)
ただし、aはNLMSアルゴリズムのステップサイズを表す。フィルタ係数H(t)の更新方法や求め方はこの方法に限らず、従来の方法を用いればよい。
<減算部102>
減算部102は、収音手段3の収音信号y1(t)とエコー成分の推定値y'1(t)とを受け取り、その差分y1(t)-y'1(t)を求め(S102)、誤差信号y2(t)(=y1(t)-y'1(t))として出力する。
<周波数領域変換部103及び周波数領域変換部104>
周波数領域変換部103は、誤差信号y2(t)を受け取り、周波数領域の誤差信号Y2(ω)に変換し(S103)、出力する。変換方法としてはFFT(短時間フーリエ変換)等を用いることができる。
周波数領域変換部104は、受話信号x(t)を受け取り、周波数領域変換部103と同様の変換方法を用いて、周波数領域の受話信号X(ω)に変換し(S104)、出力する。
<音響結合量推定部105>
音響結合量推定部105は、周波数領域の誤差信号Y2(ω)と周波数領域の受話信号X(ω)とを受け取り、誤差信号Y2(ω)と、周波数領域の受話信号との比から、再生手段と収音手段との間の音響結合量D(ω)を周波数領域毎に推定し(S105)、出力する。例えば、音響結合量D(ω)は、再生手段2と収音手段3との間の伝達特性の振幅値であり、周波数領域の誤差信号Y2(ω)と周波数領域の受話信号X(ω)の絶対値の比で求められる。また、音響結合量の精度を向上するために時間平滑化が行われる。音響結合量D(ω)は次式により求められる。
D(ω)=E{|Y2(ω)|/|X(ω)|} (6)
ただし、E{A}はAの平均値を取ることを表し、|A|はAの絶対値をとることを表す。
<エコーレベル推定部106>
エコーレベル推定部106は、周波数領域の受話信号X(ω)と音響結合量D(ω)とを受け取り、周波数領域の受話信号X(ω)のレベルに音響結合量D(ω)を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定し(S106)、推定値R(ω)を出力する。
例えば、部屋の反響を無視した場合、エコー成分のレベルは、受話信号X(ω)に音響結合量D(ω)を乗じることで推定可能できる。しかし、実際には部屋の音響が存在するため、反響成分も含めてエコー成分を推定する必要がある。通常、部屋の音響成分は時間とともに指数減衰するので、次式により、エコー成分のレベルの推定を行う。
R(ω)=D(ω)・P(ω)
P(ω)=|X(ω)| for P'(ω)≦|X(ω)|
P(ω)=u・P'(ω)+(l-u)・|X(ω)| for P'(ω)>|X(ω)| (7)
ただし、P(ω)は反響に相当する時間平滑を行ったあとの受話信号であり、P'(ω)は1フレーム前のP(ω)であり、uは反響の長さ(残響時間)の想定値を調整するための係数でありあらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
<過大レベル検出部110>
過大レベル検出部110は、時間領域の受話信号x(t)を受け取り、受話信号x(t)のレベルs(t)を求め(S110)、出力する。受話信号x(t)のレベルs(t)は、受話信号x(t)の絶対値s(t)=|x(t)|や、絶対値を平滑化した信号s(t)=α・s'(t)+(l-α)・|x(t)|や、以下の式で計算される受話信号x(t)の最大値保持レベルを用いる。
s(t)=|x(t)| for s'(t)≦|x(t)|
s(t)=α・s'(t)+(l-α)・|x(t)| for s'(t)>|x(t)|
s(t)は反響に相当する時間平滑を行ったあとの受話信号であり、s'(t)は1フレーム前のs(t)であり、αは平滑化関数であり、0から1の間の値をとる。
<ゲイン取得部120>
ゲイン取得部120は、エコー成分のレベルの推定値R(ω)と、受話信号x(t)のレベルs(t)と、周波数領域の誤差信号Y2(ω)とを受け取り、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求め(S120)、出力する。
図4はゲイン取得部120の機能ブロック図を、図5はその処理フローの例を示す。
ゲイン取得部120は、通常時乗算係数記憶部121、過大時乗算係数記憶部122、係数選択部123、係数乗算部124及びエコー抑圧ゲイン取得部125を含む。
(通常時乗算係数記憶部121及び過大時乗算係数記憶部122)
通常時乗算係数記憶部121及び過大時乗算係数記憶部122には、予め通常時乗算係数γ1及び過大時乗算係数γ2をそれぞれ記憶しておく。γ1<γ2とする。
(係数選択部123)
係数選択部123は、受話信号x(t)のレベルs(t)を受け取り、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性がある場合、過大時乗算係数記憶部122から過大時乗算係数γ2を取り出し、係数乗算部124に出力する(S123)。また、歪が生じない場合、通常時乗算係数記憶部121から通常時乗算係数γ1を取り出し、係数乗算部124に出力する(S123)。例えば、受話信号x(t)のレベルs(t)があらかじめ設定した閾値β1を超えた場合に、再生音に歪が生じる可能性がある(以下、このレベルを過大レベルともいう)と判定する。閾値β1は再生手段2に合わせて実験、シミュレーション等により予め調べておけばよい。
(係数乗算部124)
係数乗算部124は、エコー成分のレベルの推定値R(ω)と、係数選択部123において選択された過大時乗算係数γ2または通常時乗算係数γ1とを乗じて積(γ1R(ω)またはγ2R(ω))を求め(S124)、出力する。乗じた後の信号(γ1R(ω)またはγ2R(ω))がエコー成分のレベルの推定値として利用される。γ1<γ2なので、歪が生じる可能性があることを示す場合には、エコー成分のレベルが高く見積もられることとなる。
(エコー抑圧ゲイン取得部125)
エコー抑圧ゲイン取得部125は、積(γ1R(ω)またはγ2R(ω))と周波数領域の誤差信号Y2(ω)とを受け取り、周波数帯域毎に、積(γ1R(ω)またはγ2R(ω))と誤差信号Y2(ω)のレベルとを比較し、積が大きい程抑圧量の大きいゲインを設定し、後述するエコー抑圧部108で用いるゲインG(ω)とし(S125)、出力する。
例えば、特許文献1と同様の方法により、ゲインを設定することができる。まず、誤差信号Y2(ω)にエコー成分が多く含まれている場合、積(γ1R(ω)またはγ2R(ω))と誤差信号Y2(ω)のレベルが近い値をとるので、積(γ1R(ω)またはγ2R(ω))に予め設定した固定値、例えば1以上の固定係数Cを乗じた値より、誤差信号Y2(ω)のレベルが小さい場合に、エコー成分が多く含まれる期間として検出する。例えば、誤差信号Y2(ω)のレベルをW(ω)とすると、この条件は次式で表される。
W(ω)≦C・γR(ω) (8)
ただし、γはγ1またはγ2である。なお、誤差信号Y2(ω)のレベルW(ω)としては、誤差信号Y2(ω)の絶対値や、絶対値を平滑化した信号を用いればよい。例えば、
W(ω)=|Y(ω)| for W'(ω)≦|Y(ω)|
W(ω)=u・W'(ω)+(l-u)・|Y(ω)| for W'(ω)>|Y(ω)|
とする。ただし、W(ω)は反響に相当する時間平滑を行ったあとの受話信号であり、W'(ω)は1フレーム前のW(ω)であり、uは反響の長さ(残響時間)の想定値を調整するための係数でありあらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
エコー成分が多く含まれる期間として検出されたら、その帯域の瞬時利得係数g(ω)を、あらかじめ固定値で設定したエコー抑圧量Dに設定する。ただし、エコー抑圧量Dは例えば0≦D<1の値をとり、小さい値にするほどエコー抑圧量が増加するが、ダブルトーク時の近端話者音声の劣化が増加する。次に、エコー成分が多く含まれる期間として検出されなかった場合は、エコー成分が小さいので、瞬時利得係数g(ω)を予め設定した固定値、例えば1に設定し、誤差信号Y2(ω)をそのまま通過させる。このゲイン制御を式で表せば次式となる。
g(ω)=D for W(ω)≦C・R(ω)
g(ω)=1 for W(ω)>C・R(ω)
次に、瞬時利得係数g(ω)を時間平滑化して、エコー抑圧部108に出力するゲインG(ω)を求める。時間平滑化することでゲインの急激な変化による音質劣化を抑えることができる。時間平滑化は、例えば次式のように行われる。
G(ω)=a・G'(ω)+(l-a)・g(ω) for g(ω)≦G'(ω)
G(ω)=b・G'(ω)+(l-b)・g(ω) for g(ω)>G'(ω) (9)
ただし、G'(ω)は1フレーム前のゲインG(ω)である。aはゲイン下降時の平滑化係数、bはゲイン上昇時の平滑化係数であり、あらかじめ固定値で設定される。aとbは0から1の間の値をとり、1に近いほど長い時間での平滑化となり、0に近いほど短い時間での時間平滑化となる。
なお、上述のゲイン取得方法は、例示であって、周波数帯域毎に、積(γ1R(ω)またはγ2R(ω))と誤差信号Y2(ω)のレベルとを比較し、積が大きい程抑圧量の大きいゲインを設定することができれば、他の方法であってもよい。例えば、時間平滑化を行わなず、g(ω)をそのままゲインG(ω)としても用いてもよい。
<エコー抑圧部108>
エコー抑圧部108は、周波数領域の誤差信号Y2(ω)とゲインG(ω)とを受け取り、周波数領域の誤差信号Y2(ω)にゲインG(ω)を乗じ、送話信号Y3(ω)(Y3(ω)=G(ω)Y2(ω))を求め(S108)、出力する。
<時間領域変換部109>
時間領域変換部109は、送話信号Y3(ω)を受け取り、時間領域の送話信号y3(t)に変換し(S109)、出力する。変換方法としては、周波数領域変換部103及び周波数領域変換部104で用いた変換方法に対応するものを用いればよい。例えば、IFFT(逆短時間フーリエ変換)等を用いることができる。
<効果>
以上の構成により、過大な受話信号を検出した場合のみ、大きな係数をエコーレベルに乗算することで、スピーカユニットやスピーカアンプの歪によるエコーの増加分を含んだエコーレベルに近い値が推定され、安定したエコー抑圧を行うことが可能である。
<変形例>
必ずしも適応フィルタ部101、減算部102を含まなくともよい。その場合、S103以降の処理では、誤差信号y2(t)に代えて収音信号y1(t)を用いればよい。なお、誤差信号y2(t)は収音信号y1(t)からエコー成分の推定値y'1(t)を減じた値であり、収音信号y1(t)に基づく値と言える。もちろん、収音信号y1(t)自体も収音信号y1(t)に基づく値と言える。
本実施形態では、過大レベル検出部110において、受話信号x(t)のレベルs(t)を求めるだけだが、レベルs(t)が閾値β1を超えるか否かを判定し、判定結果を出力する構成としてもよい。係数選択部123では、判定結果(レベルs(t)が閾値β1を超えるか否か、言い換えると、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性があるか否かを示す判定結果)に従って、係数を選択すればよい。
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。
第二実施形態では、ゲイン取得部120に代えて、ゲイン取得部220を含む。
<ゲイン取得部220>
ゲイン取得部220は、エコー成分のレベルの推定値R(ω)と、受話信号x(t)のレベルs(t)と、周波数領域の誤差信号Y2(ω)とを受け取り、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求め(S220)、出力する。
図6はゲイン取得部220の機能ブロック図を、図7はその処理フローの例を示す。
ゲイン取得部220は、エコー抑圧ゲイン取得部225、過大時ゲイン記憶部226及びゲイン選択部227を含む。
(エコー抑圧ゲイン取得部225)
エコー抑圧ゲイン取得部225は、エコー成分のレベルの推定値R(ω)と誤差信号Y2(ω)とを受け取り、エコー成分のレベルの推定値R(ω)と誤差信号Y2(ω)のレベルとを比較し、エコー成分のレベルの推定値R(ω)が大きい程抑圧量の大きいゲインG(1,ω)を周波数帯域毎に設定し(S225)、出力する。具体的な処理は、エコー抑圧ゲイン取得部125と同様であり、積(γ1R(ω)またはγ2R(ω))に代えて、エコー成分のレベルの推定値R(ω)を用いる点が異なる。
(過大時ゲイン記憶部226)
過大時ゲイン記憶部226には、予め過大時ゲインG(2,ω)を記憶しておく。なお、エコー抑圧ゲイン取得部225で得られるどのようなG(1,ω)に対してもG(2,ω)<G(1,ω)を満たすように、過大時ゲインG(2,ω)を設定する。要は、過大時ゲインG(2,ω)が、ゲインG(1,ω)よりも抑圧量が大きいものとする。
(ゲイン選択部227)
ゲイン選択部227は、過大レベル検出部110で求めた受話信号x(t)のレベルs(t)を受け取り、受話信号x(t)のレベルs(t)のレベルが大きいために再生音に歪が生じる可能性がある場合、過大時ゲイン記憶部226から過大時ゲインG(2,ω)を取り出し、エコー抑圧部108で用いるゲインG(ω)として出力し(S227)、歪が生じない場合にはエコー抑圧ゲイン取得部225で求めたゲインG(1,ω)をエコー抑圧部108で用いるゲインG(ω)として出力する(S227)。例えば、受話信号x(t)のレベルs(t)があらかじめ設定した閾値β2を超えた場合に、再生音に歪が生じる可能性があると判定する。閾値β2は再生手段2に合わせて実験、シミュレーション等により予め調べておけばよい。
<効果>
このような構成とすることで、第一実施形態と同様の効果を得ることができる。なお、第一実施形態の変形例と本実施形態とを組合せてもよい。
例えば、本実施形態では、過大レベル検出部110において、受話信号x(t)のレベルs(t)を求めるだけだが、レベルs(t)が閾値β2を超えるか否かを判定し、判定結果を出力する構成としてもよい。ゲイン選択部227では、判定結果(レベルs(t)が閾値β2を超えるか否か、言い換えると、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性があるか否かを示す判定結果)に従って、ゲインを選択すればよい。
<第三実施形態>
第一実施形態と異なる部分を中心に説明する。第三実施形態は、第一実施形態と第二実施形態とを組み合わせた構成である。
第三実施形態では、ゲイン取得部120に代えて、ゲイン取得部320を含む。
<ゲイン取得部320>
ゲイン取得部320は、エコー成分のレベルの推定値R(ω)と、受話信号x(t)のレベルs(t)と、周波数領域の誤差信号Y2(ω)とを受け取り、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求め(S320)、出力する。
図8はゲイン取得部320の機能ブロック図を、図9はその処理フローの例を示す。
ゲイン取得部320は、通常時乗算係数記憶部121、過大時乗算係数記憶部122、係数選択部123、係数乗算部124、エコー抑圧ゲイン取得部325、過大時ゲイン記憶部226及びゲイン選択部227を含む。
なお、係数選択部123で用いる閾値β1とゲイン選択部227で用いる閾値β2とは、β12となるように設定する。
(エコー抑圧ゲイン取得部325)
エコー抑圧ゲイン取得部325は、積(γ1R(ω)またはγ2R(ω))と周波数領域の誤差信号Y2(ω)とを受け取り、周波数帯域毎に、積(γ1R(ω)またはγ2R(ω))と誤差信号Y2(ω)のレベルとを比較し、積が大きい程抑圧量の大きいゲインを設定し、ゲインG(1,ω)をゲイン選択部227に出力する(S325)。
過大時ゲイン記憶部226及びゲイン選択部227の処理内容は第二実施形態と同様である。このとき、β2<s(t)の場合には、ゲイン選択部227において、過大時ゲインG(2,ω)が選択されることは明らかなので、係数選択部123、係数乗算部124、エコー抑圧ゲイン取得部325の処理は省略してもよい。
<効果>
このような構成とすることで、第一実施形態、第二実施形態と同様の効果を得ることができる。本実施形態では、閾値β1を超え閾値β2以下の場合は第一実施形態に示すようにエコー成分に過大時乗算係数を乗じ、閾値β2を超えた場合は第二実施形態に示すようにゲインを強制的に過大時ゲインに置き換える。
このようにすることにより、過大な受話信号で歪が、それほど大きくいない場合は、推定エコーを大きく見積もることで対応し、歪が大きい場合は、送話音声を完全に抑える。なお、第一実施形態の変形例と本実施形態とを組合せてもよい。
例えば、本実施形態では、過大レベル検出部110において、受話信号x(t)のレベルs(t)を求めるだけだが、レベルs(t)が閾値β1またはβ2を超えるか否かを判定し、判定結果を出力する構成としてもよい。係数選択部123では、判定結果(レベルs(t)が閾値β1を超えるか否か、言い換えると、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性があるか否かを示す判定結果)に従って、係数を選択すればよい。ゲイン選択部227では、判定結果(レベルs(t)が閾値β2を超えるか否か、言い換えると、受話信号x(t)のレベルs(t)が大きいために再生音に歪が生じる可能性があるか否かを示す判定結果)に従って、ゲインを選択すればよい。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (7)

  1. 周波数領域の収音信号に基づく値と、周波数領域の受話信号との比から、再生手段と収音手段との間の音響結合量を周波数領域毎に推定する音響結合量推定部と、
    前記周波数領域の受話信号のレベルに前記音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、
    前記受話信号のレベルと、前記エコー成分のレベルの推定値と、前記収音信号のレベルとを用いて、前記再生手段において前記受話信号を再生する際に、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得部と、
    前記周波数領域の収音信号に基づく値に前記ゲインG(ω)を乗じるエコー抑圧部とを含む、
    エコー抑圧装置。
  2. 請求項1のエコー抑圧装置であって、
    前記ゲイン取得部は、
    通常時乗算係数は過大時乗算係数よりも小さいものとし、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合には過大時乗算係数を選択し、歪が生じない場合には通常時乗算係数を選択する係数選択部と、
    前記エコー成分のレベルの推定値と、前記係数選択部において選択された過大時乗算係数または通常時乗算係数とを乗じて積を求める係数乗算部と、
    周波数帯域毎に、前記積と前記収音信号に基づく値のレベルとを比較し、前記積が大きい程抑圧量の大きいゲインを設定し、前記ゲインG(ω)とするエコー抑圧ゲイン取得部とを含む、
    エコー抑圧装置。
  3. 請求項1のエコー抑圧装置であって、
    前記ゲイン取得部は、
    前記エコー成分のレベルの推定値と前記収音信号に基づく値のレベルとを比較し、前記エコー成分のレベルの推定値が大きい程抑圧量の大きいゲインG(1,ω)を周波数帯域毎に設定するエコー抑圧ゲイン取得部と、
    過大時ゲインG(2,ω)は、ゲインG(1,ω)よりも抑圧量が大きいものとし、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合には過大時ゲインG(2,ω)を選択し、歪が生じない場合にはゲインG(1,ω)を選択し、前記ゲインG(ω)とするゲイン選択部とを含む、
    エコー抑圧装置。
  4. 請求項1のエコー抑圧装置であって、
    前記ゲイン取得部は、
    β12とし、受話信号のレベルをs(t)とし、通常時乗算係数は過大時乗算係数よりも小さいものとし、β1<s(t)≦β2の場合には過大時乗算係数を選択し、s(t)≦β1の場合には通常時乗算係数を選択する係数選択部と、
    前記エコー成分のレベルの推定値と、前記係数選択部において選択された過大時乗算係数または通常時乗算係数とを乗じて積を求める係数乗算部と、
    周波数帯域毎に、前記積と前記収音信号に基づく値のレベルとを比較し、前記積が大きい程抑圧量の大きいゲインG(1,ω)を設定するエコー抑圧ゲイン取得部と、
    過大時ゲインG(2,ω)は、ゲインG(1,ω)よりも抑圧量大きいものとし、β2<s(t)の場合には過大時ゲインG(2,ω)を選択し、s(t)≦β2の場合にはゲインG(1,ω)を選択し、前記ゲインG(ω)するゲイン選択部とを含む、
    エコー抑圧装置。
  5. 周波数領域の収音信号に基づく値と、周波数領域の受話信号との比から、再生手段と収音手段との間の音響結合量を周波数領域毎に推定する音響結合量推定ステップと、
    前記周波数領域の受話信号のレベルに前記音響結合量を乗じて収音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定ステップと、
    前記受話信号のレベルと、前記エコー成分のレベルの推定値と、前記収音信号のレベルとを用いて、前記再生手段において前記受話信号を再生する際に、前記受話信号のレベルが大きいために再生音に歪が生じる可能性がある場合、仮に歪が生じない場合に用いるゲインよりも、抑圧量の大きいゲインG(ω)を周波数毎に求めるゲイン取得ステップと、
    前記周波数領域の収音信号に基づく値に前記ゲインG(ω)を乗じるエコー抑圧ステップとを含む、
    エコー抑圧方法。
  6. 請求項1から請求項4の何れかのエコー抑圧装置としてコンピュータを機能させるためのプログラム。
  7. 請求項1から請求項4の何れかのエコー抑圧装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2016079702A 2016-04-12 2016-04-12 エコー抑圧装置、その方法、プログラム、及び記録媒体 Active JP6537997B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016079702A JP6537997B2 (ja) 2016-04-12 2016-04-12 エコー抑圧装置、その方法、プログラム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016079702A JP6537997B2 (ja) 2016-04-12 2016-04-12 エコー抑圧装置、その方法、プログラム、及び記録媒体

Publications (2)

Publication Number Publication Date
JP2017191992A true JP2017191992A (ja) 2017-10-19
JP6537997B2 JP6537997B2 (ja) 2019-07-03

Family

ID=60086181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016079702A Active JP6537997B2 (ja) 2016-04-12 2016-04-12 エコー抑圧装置、その方法、プログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP6537997B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3829151A1 (en) 2019-11-12 2021-06-02 Panasonic Intellectual Property Corporation of America Echo suppression device, echo suppression method, and echo suppression program
WO2022195955A1 (ja) 2021-03-16 2022-09-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008005094A (ja) * 2006-06-21 2008-01-10 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体
JP2009188724A (ja) * 2008-02-06 2009-08-20 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置と、装置プログラムと記録媒体
WO2010035308A1 (ja) * 2008-09-24 2010-04-01 三菱電機株式会社 エコー消去装置
JP2010103875A (ja) * 2008-10-27 2010-05-06 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラム、記録媒体
US20130287216A1 (en) * 2011-02-03 2013-10-31 Telefonaktiebolaget L M Ericsson (Publ) Estimation and suppression of harmonic loudspeaker nonlinearities

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008005094A (ja) * 2006-06-21 2008-01-10 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体
JP2009188724A (ja) * 2008-02-06 2009-08-20 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置と、装置プログラムと記録媒体
WO2010035308A1 (ja) * 2008-09-24 2010-04-01 三菱電機株式会社 エコー消去装置
JP2010103875A (ja) * 2008-10-27 2010-05-06 Nippon Telegr & Teleph Corp <Ntt> エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラム、記録媒体
US20130287216A1 (en) * 2011-02-03 2013-10-31 Telefonaktiebolaget L M Ericsson (Publ) Estimation and suppression of harmonic loudspeaker nonlinearities

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3829151A1 (en) 2019-11-12 2021-06-02 Panasonic Intellectual Property Corporation of America Echo suppression device, echo suppression method, and echo suppression program
US11197093B2 (en) 2019-11-12 2021-12-07 Panasonic Intellectual Property Corporation Of America Echo suppression device, echo suppression method, and non-transitory computer-readable recording medium which records echo suppression program
WO2022195955A1 (ja) 2021-03-16 2022-09-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム

Also Published As

Publication number Publication date
JP6537997B2 (ja) 2019-07-03

Similar Documents

Publication Publication Date Title
JP5391103B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体
EP2982101B1 (en) Noise reduction
KR102190833B1 (ko) 에코 억제
JP6422884B2 (ja) エコー抑圧
JP5016581B2 (ja) エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラム、記録媒体
JP5469564B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置及びそのプログラム
RU2744518C1 (ru) Устройство голосовой связи, способ голосовой связи и программа
JP5161157B2 (ja) 周波数領域エコー除去装置、周波数領域エコー除去方法、プログラム
JP6537997B2 (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
JP4709714B2 (ja) エコー消去装置、その方法、そのプログラム、およびその記録媒体
US11197093B2 (en) Echo suppression device, echo suppression method, and non-transitory computer-readable recording medium which records echo suppression program
JP2011160429A (ja) エコー消去装置
JP2017191987A (ja) エコー消去装置、その方法、プログラム、及び記録媒体
KR102045953B1 (ko) 칼만필터 기반의 다채널 입출력 음향학적 반향 제거 방법
JP5925149B2 (ja) 音響結合量推定装置、エコー消去装置、その方法及びプログラム
JP4504891B2 (ja) 反響消去方法、反響消去装置、プログラム、記録媒体
JP4559989B2 (ja) エコー抑圧方法、エコー抑圧プログラム、記録媒体
WO2019244535A1 (ja) エコー消去装置、エコー消去方法、プログラム
JP2014042108A (ja) 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム
JP6075783B2 (ja) エコー消去装置、エコー消去方法及びプログラム
WO2018087855A1 (ja) エコーキャンセラ装置、エコー消去方法、及びエコー消去プログラム
JP7235117B2 (ja) エコー消去装置、エコー消去方法、プログラム
JP4504892B2 (ja) 反響消去方法、反響消去装置、プログラム、記録媒体
JP6356087B2 (ja) エコー消去装置、その方法及びプログラム
JP5086969B2 (ja) エコーキャンセル装置、その方法、そのプログラム、およびその記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190605

R150 Certificate of patent or registration of utility model

Ref document number: 6537997

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150