JP4413205B2 - エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体 - Google Patents

エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体 Download PDF

Info

Publication number
JP4413205B2
JP4413205B2 JP2006171045A JP2006171045A JP4413205B2 JP 4413205 B2 JP4413205 B2 JP 4413205B2 JP 2006171045 A JP2006171045 A JP 2006171045A JP 2006171045 A JP2006171045 A JP 2006171045A JP 4413205 B2 JP4413205 B2 JP 4413205B2
Authority
JP
Japan
Prior art keywords
level
gain
echo
value
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006171045A
Other languages
English (en)
Other versions
JP2008005094A (ja
Inventor
和則 小林
賢一 古家
陽一 羽田
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006171045A priority Critical patent/JP4413205B2/ja
Publication of JP2008005094A publication Critical patent/JP2008005094A/ja
Application granted granted Critical
Publication of JP4413205B2 publication Critical patent/JP4413205B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

本発明はテレビ会議や音声会議などハンズフリー通信のエコー抑圧方法および装置に関する。
従来技術のエコー抑圧装置について説明する。
図8は特許文献1で開示された従来技術のエコー抑圧装置800の構成図である。従来技術のエコー抑圧装置800は、ゲイン乗算部801と、音響結合量推定部802と、送話判定部803と、受話判定部804と、ゲイン制御部805により構成される。
本エコー抑圧装置800は、スピーカとマイクロホンを用いた拡声通話においてマイク受音信号に混入するスピーカ音であるエコーを抑圧する。入力信号は、通話相手からの受信信号である受話信号と、自地点のマイクロホンで受音した信号であるマイク受音信号であり、出力信号は、自地点のスピーカから出力する信号であるスピーカ出力信号と、通話相手への送信信号である送話信号である。本装置は、マイク受音信号にエコーが主に含まれる場合は1よりも小さいゲインをマイク受音信号に乗算し、送話信号とすることで、マイク受音信号に含まれるエコーを抑圧する。
以下に、本装置の詳細について述べる。
音響結合量推定部802は、スピーカとマイクロホン間の伝達特性の振幅値である音響結合量A(t)を求める。ここではtは離散化された時刻を表す。スピーカ出力信号とマイク受音信号の時間平均レベルを観測し、その比をとって、音響結合量を求める。スピーカ出力信号をX(t)、マイク受音信号をY(t)とした場合、音響結合量A(t)は式(1)により求められる。
A(t)=E{|Y(t)|/|X(t)|} 式(1)
ただし、E{・}は平均時間をとること、|・|は絶対値を取ることを表す。
送話判定部803は、受話信号X(t)と音響結合量A(t)とマイク受音信号Y(t)より、送話の判定をする。マイク受音信号Y(t)の時間平滑レベルを観測し、その時間平滑レベルがあらかじめ与えられた固定閾値を越え、さらに、音響結合量A(t)に受話信号X(t)の時間平滑レベルを乗じた推定音響エコーレベルを定数倍した閾値を越えた場合に送話と判定する。
受話判定部804は、受話信号から、受話の判定をする。受話信号X(t)の時間平滑レベルを観測し、そのレベルがあらかじめ与えた固定閾値を越えた場合に受話と判定する。
ゲイン制御部805は、送話判定部803と受話判定部804の判定結果より、ゲイン値を制御する。受話が検出され、送話が検出されない場合は、マイク受音信号にエコーのみが含まれるので、あらかじめ設定したエコー抑圧ゲインをゲイン値とし、これ以外の場合には、ゲイン値を1とする。また、ゲイン値の不連続な変化による音声の劣化を防ぐため、ゲイン値が滑らかに変化するように、時間平滑化が行われる。
ゲイン乗算部801は、ゲイン制御部805で設定されたゲイン値を、マイク受音信号に乗じ、送話信号とする。
以上の処理により、マイク受音信号にエコーのみが含まれる期間のみ、1未満のゲイン値がマイク受音信号に乗じられ、エコーが抑圧された送話信号となる。マイク受音信号にエコーが含まれないか、近端話者の音声が含まれる場合は、マイク受音信号がそのまま送話信号となり、通話相手に送話音声を伝えることができる。
特許第3082898号明細書
しかし、従来技術のエコー抑圧方法では、受話音声と近端話者の音声が同時に存在するダブルトーク時において問題が生じる。ダブルトーク時に送話が検出された場合には、エコーが抑圧されずに、そのまま送話信号となってしまい、相手側に伝わってしまうために、会話がしづらくなる。もし、送話が検出されなかった場合には、近端話者の音声が抑圧され、小さいレベルの音声となってしまうため、相手側で、音声が聞き取りづらくなる。このように、従来のエコー抑圧技術では双方向通話性能が充分ではない。
本発明の目的は、受話音声と近端話者の音声が同時に存在するダブルトーク時の双方向通話性能を向上するエコー抑圧方法を提供することにある。
本発明によるエコー抑圧方法は、マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換処理と、スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換処理と、周波数領域信号に変換されたマイク受音信号と、周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達関数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定処理と、周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定処理と、周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定処理と、推定エコーレベルと、推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御処理と、周波数領域信号に変換されたマイク受音信号にゲイン制御処理で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算処理と、ゲイン乗算処理で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換処理とを含むことを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、周波数帯域毎に施される前記ゲイン制御処理は、推定エコーレベルに予め設定した固定係数を乗じて求めた閾値と、推定マイクレベルとを比較し、推定マイクレベルが閾値より小さい場合は予め設定したエコー抑圧ゲインを瞬時利得係数値とし、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これらの瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、推定エコーレベルに予め設定した固定係数を乗じて求めた複数の閾値と、推定マイクレベルとをそれぞれ比較し、推定マイクレベルが何れかの閾値よりも小さい場合は、推定マイクレベル以上の値を持つ閾値のうち最も推定マイクレベルに近い値を持つ閾値に対応する予め設定されたエコー抑圧ゲインを瞬時利得係数値と定め、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これら瞬時利得係数値を時間平滑した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、周波数領域信号に変換されたマイク受音信号から、マイク受音信号に含まれる定常雑音のレベルを周波数領域毎に推定するマイク雑音レベル推定処理と、周波数領域信号に変換されたスピーカ出力信号から、スピーカ出力信号に含まれる定常雑音のレベルを周波数帯域毎に推定する受話雑音レベル推定処理と、周波数領域信号に変換されたスピーカ出力信号からスピーカ出力信号に含まれる定常雑音レベルを減じた信号の時間平滑レベルに前記音響結合量を乗じて、マイク受音信号に含まれるエコー成分の推定エコーレベルを周波数帯域毎に推定するエコーレベル推定処理と、推定エコーレベルに予め設定した固定係数を乗じた値と、推定マイクレベルとを比較し、推定エコーレベルが大きい場合は予め設定したエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合は、予め設定した固定値を瞬時エコー抑圧利得係数値とし、マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と推定マイクレベルとを比較し、雑音レベルが大きい場合は予め設定した雑音抑圧ゲイン瞬時雑音抑圧利得係数値とし、これ以外の場合は予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記瞬時エコー抑圧係数値と、前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値をゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、周波数帯域毎に施されるゲイン制御処理の出力となるゲイン値を周波数軸で平滑化する周波数特性平滑化処理を付加し、周波数帯域毎に施されるゲイン乗算処理は、周波数領域に変換されたマイク受音信号に周波数特性平滑化処理において平滑化後のゲイン値を、周波数帯域毎に乗算することを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、スピーカ出力信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のスピーカ信号を、2以上でN未満のN’個の周波数成分のスピーカ出力信号に変換するスピーカ出力信号の帯域分割数変換処理と、マイク受音信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のマイク受音信号をN’個の周波数成分のマイク受音信号に変換するマイク受音信号の帯域分割数変換処理と、ゲイン制御処理の出力であるN’個の周波数帯域のゲイン値をN個の周波数帯域のゲイン値に変換するゲインの帯域分割数変換処理を付加し、N個の周波数帯域毎に施されていた処理を、帯域分割数変換後のN’の周波数帯域毎とすることを特徴とする。
本発明によるエコー抑圧方法は更に、前記エコー抑圧方法において、エコーレベル推定処理は、予め設定したM個の残響時間に対応した時定数で時間平滑化してエコーレベルを計算する2以上のM個のエコーレベル計算処理部を有し、周波数帯域ごとに設けられたゲイン制御処理は、M個の残響時間に対応した推定エコーレベルに予め設定した固定係数を乗じた値と推定マイクレベルとを各々比較し、推定エコーレベルが大きい場合はあらかじめ残響時間ごとに設定されたエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時エコー抑圧利得係数値としてM個の瞬時エコー抑圧利得係数を求め、マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と推定マイクレベルとを比較し、雑音レベルが大きい場合はあらかじめ設定した雑音抑圧ゲインを瞬時雑音抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時雑音抑圧利得係数値とし、M個の瞬時エコー抑圧利得係数値と瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域ごとに設定することを特徴とする。
本発明の以上で説明する第1〜5の実施例によれば、マイク受音信号に対し、帯域別にエコー抑圧のためのゲインを与えることで、受話音声と近端話者音声の両方が存在するダブルトーク区間においても、エコーを抑圧しながら、近端話者音声のレベル変動を抑え、高品質な双方向通信を行うことが可能である。
更に本発明の第2の実施例によれば、空調やファンなどの定常雑音を抑圧することができる。本発明の第3の実施例によれば、不連続な周波数特性を軽減し、より自然な音質を実現することができる。本発明の第4の実施例によれば、演算する帯域数を軽減し、演算量を削減することができる。本発明の第5の実施例によれば、残響時間の長い環境においても、十分なエコー抑圧をしながら、近端話者の音声劣化を最小限とすることができる。
本発明によるエコー抑圧装置はハードウェアによって構成し、ハードウェアによって構成したエコー抑圧装置により本発明によるエコー抑圧方法を実行させる実施形態も可能であるが、最も簡素に実現するには本発明によるエコー抑圧プログラムをコンピュータにインストールし、コンピュータにエコー抑圧装置として機能させ、本発明によるエコー抑圧方法を実行させる実施形態が最良の実施形態である。
コンピュータにより本発明によるエコー抑圧装置を構成するには、コンピュータにインストールしたエコー抑圧プログラムによりコンピュータには少なくとも、マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換部と、スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換部と、周波数領域信号に変換されたマイク受音信号と、周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達係数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定部と、周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定部と、推定エコーレベルと、推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御部と、周波数領域信号に変換されたマイク受音信号にゲイン制御部で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算部と、ゲイン乗算部で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換部とを構築し、エコー抑圧装置として機能させる。
本発明の実施例を説明する前に、本発明によるエコー抑圧装置の利用状況の概要を図7を用いて説明する。図7に示す700は本発明の各実施例で説明するエコー抑圧装置を示す。本発明によるエコー抑圧装置700の入力信号は通話相手からの受信信号である受話信号と、自地点のマイクロホンMで受音した信号であるマイク受音信号であり、出力信号は、自地点のスピーカSPから出力する信号であるスピーカ出力信号と、通話相手への送信信号である送話信号である。
図7に示すように、マイク受音信号は、近端話者の音声に加えて、スピーカ出力音がマイクロホンMに回り込んだ信号(エコー)が含まれる。エコー抑圧装置700はこのエコーを抑圧し、会話をしやすくする。また、エコー抑圧装置700の各入力信号は、AD変換により、アナログ信号から離散時間の信号に変換され、各出力信号は、離散時間信号からDA変換によりアナログ信号に変換されている。
本発明では、マイク受音信号をN個の周波数帯域信号に分割し、周波数帯域ごとでエコーを抑圧するためのゲインを信号に乗じ、エコーを抑圧する。ただし、Nは2以上の整数である。エコー成分の多く含まれる帯域はゲインを小さくして抑圧し、近端話者の音声が多く含まれる帯域はゲインを予め定めた固定値、例えば1として通過させるようにゲイン値を制御する。このようにすることで、エコーと近端話者の音声が同時に存在するダブルトーク期間であっても、近端話者の音声のレベルの減衰を抑えながら、エコーを抑圧することが可能となり、双方向通話性能を向上させることができる。
図1に、本発明の第1実施例であるエコー抑圧装置100のブロック図を示す。本発明の第1実施例で提案するエコー抑圧装置100は、マイク受音信号を周波数領域信号に変換する第1周波数領域変換部101と、逆周波数領域変換部102と、スピーカ出力信号を周波数領域信号に変換する第2周波数領域変換部103と、ゲイン乗算部104〜104と、音響結合量推定部105〜105と、エコーレベル推定部106〜106と、マイクレベル推定部107〜107と、ゲイン制御部108〜108とにより構成される。
第1周波数領域変換部101は、マイク受音信号をN個の周波数成分を持つ周波数領域信号に変換する。周波数領域への変換はフーリエ変換や帯域分割フィルタバンクにより行うことができる。変換後のマイク受話信号をY(Ω)で表す。ただし、Ωは周波数領域変換でのN個の周波数帯域の中心周波数ω〜ωN−1に対応した離散的な周波数である。この周波数領域変換は、1サンプル以上の複数サンプルごとに行われる。この周波数領域変換が行われる間隔を1フレームと表す。このような処理により、1フレームごとに、周波数領域に変換された受話信号Y(Ω)が得られる。
スピーカ出力信号を周波数領域信号に変換する第2周波数領域変換部103は、マイク受音信号の第1周波数領域変換部101と同様の処理によりスピーカ出力信号をN個の周波数成分に変換する。変換後のスピーカ出力信号をX(Ω)で表す。
周波数帯域ごとに設けられた音響結合量推定部105〜105は、マイク受音信号の第1周波数領域変換部101の出力Y(Ω)とスピーカ出力信号の第2周波数領域変換部103の出力X(Ω)から、周波数帯域ごとの音響結合量A(Ω)を求める。音響結合量とは、スピーカとマイク間の伝達関数の振幅値であり、周波数領域変換後のスピーカ出力信号とマイク受音信号の絶対値の比で求められる。また、音響結合量の精度を向上するために時間平滑化が行われる。スピーカ出力信号の周波数領域変換信号をX(Ω)、マイク受音信号の周波数領域変換信号をY(Ω)とした場合、音響結合量A(Ω)は式(2)により求められる。
A(Ω)=E{|Y(Ω)|/|X(Ω)|} 式(2)
ただし、E{・}は平均値を取ることを表し、|・|は絶対値をとることを表す。
周波数帯域ごとに設けられたエコーレベル推定部106〜106は、音響結合量推定部105〜105で求められた音響結合量A(Ω)と、スピーカ出力信号の周波数領域変換部103の出力X(Ω)からマイク受音信号に含まれるエコーのレベルを推定する。部屋の反響を無視した場合、エコーレベルは、受話信号の周波数ベクトル|X(Ω)|に音響結合量A(Ω)を乗じることで推定可能できる。しかし、実際には部屋の音響が存在するため、反響成分も含めてエコーを推定する必要がある。通常、部屋の音響成分は時間とともに指数減衰するので、以下の式(3)により、エコーレベルR(Ω)の推定を行う。
R(Ω)=A(Ω)・P(Ω)
P(Ω)=|X(Ω)| for P'(Ω)≦|X(Ω)|
P(Ω)=u・P'(Ω)+(l-u)・|X(Ω)| for P'(Ω)>|X(Ω)| 式(3)
ただし、P(Ω)は反響に相当する時間平滑を行ったあとのスピーカ出力信号であり、P’(Ω)は1フレーム前のP(Ω)であり、uは反響の長さ(残響時間)の想定値を調整するための係数でありあらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
周波数帯域ごとに設けられたマイクレベル推定部107〜107は、マイク受音信号の第1周波数領域変換部101の出力Y(Ω)からマイク受音信号のレベル(マイクレベル)S(Ω)を推定する。マイクレベルS(Ω)はY(Ω)の絶対値で求められる。これは、式(4)で表される。
S(Ω)=|Y(Ω)| 式(4)
もしくは、Y(Ω)の絶対値を時間平滑化して求めても良い。これは例えば式(5)で表される。
S(Ω)=w・S'(Ω)+(l-w)・|Y(Ω)| 式(5)
ただし、S'(Ω)は1フレーム前のマイクレベルであり、wは時間平滑化の係数であり、例えば0≦w<1の値をとる。wが1に近いほど長い時間での平滑化となり、0に近いほど短い時間での時間平滑化となる。
周波数帯域ごとに設けられたゲイン制御108〜108は、エコーレベル推定部106〜106で推定されたエコーレベルR(Ω)と、マイクレベル推定部107〜107で推定されたマイクレベルS(Ω)から、マイク受音信号に与える帯域ごとのゲインを制御する。ゲイン制御は、マイク受音信号にエコー成分が多く含まれる場合はエコーを抑圧し、これ以外の場合には近端話者音声を通過させるように行われる。
まず、マイク受音信号にエコー成分が多く含まれている場合、推定エコーレベルR(Ω)と推定マイクレベルS(Ω)が近い値をとるので、推定エコーレベルR(Ω)に予め設定した固定値、例えば1以上の固定係数Cを乗じた値より、推定マイクレベルS(Ω)が小さい場合に、エコー成分が多く含まれる期間として検出する。この条件は式(6)で表される。
S(Ω)≦C・R(Ω) 式(6)
エコー成分が多く含まれる期間として検出されたら、その帯域の瞬時利得係数g(Ω)を、あらかじめ固定値で設定したエコー抑圧量Dに設定する。ただし、エコー抑圧量Dは例えば0≦D<1の値をとり、小さい値にするほどエコー抑圧量が増加するが、ダブルトーク時の近端話者音声の劣化が増加する。次に、エコー成分が多く含まれる期間として検出されなかった場合は、エコー成分が小さいので、瞬時利得係数g(Ω)を予め設定した固定値、例えば1に設定し、マイク受音信号をそのまま通過させる。このゲイン制御を式で表せば式(7)となる。
g(Ω)=D for S(Ω)≦C・R(Ω)
g(Ω)=1 for S(Ω)>C・R(Ω)
次に、瞬時利得係数g(Ω)を時間平滑化して、ゲイン乗算部104〜104
出力するゲインG(Ω)を求める。時間平滑化することでゲインの急激な変化による音質劣化を抑えることができる。時間平滑化は、例えば式(8)のように行われる。
G(Ω)=a・G'(Ω)+(l-a)・g(Ω) for g(Ω)≦G'(Ω)
G(Ω)=b・G'(Ω)+(l-b)・g(Ω) for g(Ω)>G'(Ω) 式(8)
ただし、G'(Ω)は1フレーム前のゲインG(Ω)である。aはゲイン下降時の平滑化係数、bはゲイン上昇時の平滑化係数であり、あらかじめ固定値で設定される。aとbは0から1の間の値をとり、1に近いほど長い時間での平滑化となり、0に近いほど短い時間での時間平滑化となる。
更に、ゲイン制御部108〜108で、複数のエコー抑圧量を設定することもできる。この場合のゲイン制御は、マイク受音信号にエコー成分が多く含まれるほど、エコー抑圧量を増加させるように行われ、エコー成分が含まれない場合は近端話者音声を通過させるように行われる。具体的な例としては、エコー成分が多く含まれる期間を検出するために固定係数CをK個のC〜Cとし、推定エコーレベルR(Ω)にこれらの係数C〜Cを乗じた値と、推定マイクレベルS(Ω)の値を比較して、エコー抑圧量D〜Dを設定する。すなわち、式(9)により、瞬時利得係数g(Ω)を設定する。
g(Ω)=DK for S(Ω)≦CK・R(Ω)
g(Ω)=DK-1 for CK・R(Ω)<S(Ω)≦CK-1・R(Ω)
: :
g(Ω)=D1 for C2・R(Ω)<S(Ω)≦C1・R(Ω)
g(Ω)=1 for S(Ω)>C1・R(Ω) 式(9)
ただし、固定係数C〜Cは、それぞれ予め定めた固定値、例えば1以上の値をとり、係数の大小関係はC>C>…>Cとなるように、あらかじめ固定値を設定する。エコー抑圧量D〜Dは、それぞれ0≦D≦1の値をとり、その大小関係はD>D>…>Dとなるようにあらかじめ固定値を設定する。次に、瞬時利得係数g(Ω)を時間平滑化してゲイン乗算部104〜104で用いるゲインG(Ω)を求める。時間平滑化は、前述と同様に例えば式(8)により行われる。このように、複数のエコー抑圧量を設定することで、マイク受音信号に含まれるエコー成分の割合により、エコー抑圧量を変えることができ、抑圧量を従来技術のように1段階で設定するよりもエコー抑圧量を上げても、ダブルトーク時の通話品質を保つことが可能となる。
周波数帯域ごとに設けられたゲイン乗算部104〜104は、ゲイン制御部108〜108で計算された周波数帯域ごとの時間平滑化後のゲインG(Ω)を、周波数領域後のマイク受音信号Y(Ω)に、周波数帯域ごとで乗算する。
逆周波数領域変換部102は、ゲイン乗算部104〜104の出力信号を逆周波数領域変換して、送話信号として出力する。
以上の処理により、本実施例のエコー抑圧装置はマイク受音信号にエコー成分が多く含まれる周波数帯域成分を抑圧し、エコーを抑圧することができる。また、周波数帯域ごとで抑圧するか通過させるかの判定を行っているので、従来のエコー抑圧装置よりも受話音声と近端話者音声が同時に存在するダブルトーク時の近端話者の音声の劣化が小さい。
図6A、図6B、図6Cに示すダブルトーク時のマイク受音信号と送話音声の周波数スペクトル図から、本発明の効果を説明する。図6Aはエコー抑圧前のマイク受音信号の周波数スペクトルであり、図6Bは、従来のエコー抑圧装置通過後の送話音声の周波数スペクトルである。従来のエコー抑圧装置では、フルバンドでロスを挿入するため、図6Bに示すように、近端話者の音声成分とエコー成分を両方同じだけ抑圧してしまう。このため、ダブルトーク時にエコー抑圧すると送話信号に含まれる近端話者の音声が小さくなり聞き取りづらいレベルになってしまう。これに対し、図6Cに示す本発明のエコー抑圧装置通過後の送話音声の周波数スペクトルでは、エコー成分のレベルが高い周波数成分のみ抑圧され、近端話者音声成分のレベルが高い周波数成分はそのまま出力される。これにより、近端話者音声レベルの減少は、従来のエコー抑圧装置に比べ小さくなる。
また、本実施例においてマイク受音信号の第1周波数領域変換部101と、逆周波数領域変換部102と、スピーカ出力信号の第2周波数領域変換部103を削除して、周波数領域変換を行わずに帯域一括でゲイン制御することもできる。この場合、式(9)で示したように複数段のエコー抑圧量を設定することで、マイク受音信号に含まれるエコー成分の割合により、エコー抑圧量を変えることができ、従来のエコー抑圧装置のように抑圧量を1段階で設定するのに比べ、エコー抑圧量を上げてもダブルトーク時の通話品質を保つことができる。
以上示したように、本発明の第1の実施例によれば、受話音声と近端話者音声が両方存在するダブルトークの場合でも、エコーを抑圧し、かつ音声の切断感の少ない高品質な双方向通信を実現できる。
図2は、本発明の第2の実施例であるエコー抑圧装置200のブロック図である。本実施例のエコー抑圧装置200は、本発明の第1の実施例に、マイク雑音レベル推定部201〜201と、受話雑音レベル202〜202を追加した構成である。本実施例は、雑音レベルを推定することで、エコー抑圧に加えて雑音の抑圧を行うことができる。
周波数帯域ごとに設けられたマイク雑音レベル推定部201〜201は、マイク受音信号の第1周波数領域変換部101の出力信号から、マイク受音信号に含まれる雑音レベルN(Ω)を推定する。ここで推定する雑音は、空調やファンの音など時間的なレベル変動が少ない定常雑音である。雑音レベルの推定は、信号レベルの時間変化の谷を保持するディップホールド処理により行われる。このディップホールドは、推定の雑音レベルよりも信号レベルが大きい場合には長い時間の時定数での平滑化を行い、推定の雑音レベルよりも信号レベルが小さい場合には短い時間の時定数での平滑化を行うことにより実現される。例えば、式(10)によりマイク受音信号の推定雑音レベルN(Ω)が計算される。
NS(Ω)=p・NS'(Ω)+(l-p)・S(Ω) for NS'(Ω)≧S(Ω)
NS(Ω)=q・NS'(Ω)+(l-q)・S(Ω) for NS'(Ω)<S(Ω) 式(10)
ただし、N'S(Ω)は1フレーム前のマイク受音信号の推定雑音レベルであり、pは推定雑音レベル減少時の平滑化係数であり、qは推定雑音レベル増加時の平滑化係数であり、それぞれ例えば0≦p<1、0≦q<1の値をあらかじめ固定値として設定する。またp<<qとなるように設定し、推定雑音レベル増加時に非常に緩やかな値の上昇とすることで信号をディップホールドして雑音レベルを推定する。
周波数帯域ごとに設けられた受話雑音レベル推定部202〜202は、マイク雑音レベル推定部201〜202と同様の処理により、スピーカ出力信号の第2周波数領域変換部103の出力信号から、スピーカ出力信号に含まれる雑音である受話雑音レベルNを推定する。
周波数帯域ごとに設けられたエコーレーベル推定部106〜106は、音響結合量推定部105〜105で求められた音響結合量A(Ω)と、スピーカ出力信号の第2周波数領域変換部103の出力X(Ω)と、受話雑音レベル推定部202〜202で推定された受話雑音レベルN(Ω)からマイク受音信号に含まれるエコーのレベルを推定する。ただし、本実施例で推定するエコーレベルは定常雑音成分を除いたエコーレベルである。
受話信号の周波数スペクトル|X(Ω)|から雑音レベルN(Ω)を減算してから、音響結合量A(Ω)を乗じてエコーレベルR(Ω)を推定する。式(11)により、エコーレベルR(Ω)の推定を行う。
R(Ω)=A(Ω)・P(Ω)
P(Ω)=u・P'(Ω) for {|X(Ω)|-r・NR(Ω)}<0
P(Ω)=|X(Ω)| for P'(Ω)≦ {|X(Ω)|-r・NR(Ω)}≧0
P(Ω)=u・P'(Ω)+(l-u)・{|X(Ω)|-r・NR(Ω)} for P'(Ω)> {|X(Ω)|-r・NR(Ω)}≧0
式(11)
ただし、rは雑音レベルの減算係数であり、あらかじめ固定的に与えられる。標準的には例えばr=1と設定し、より雑音レベルを減算したい場合は1以上の値に設定し、雑音レベルの減算を少なめにしたい場合には1以下に設定する。この他の記号は、本発明の第1の実施例と同様であり、以下のように定義される。P(Ω)は反響に相当する時間平滑を行ったあとのスピーカ出力信号であり、P’(Ω)は1フレーム前のP(Ω)であり、uは反響の長さ(反響時間)の想定値を調整するための係数であり、あらかじめ固定値が設定される。uは例えば0≦u<1の値をとり、1に近いほど残響時間の長い環境が模擬され、0に近いほど残響時間の短い環境が模擬される。
周波数帯域ごとに設けられたゲイン制御部108〜108は、エコーレベル推定部106〜106で推定されたエコーレベルR(Ω)と、マイクレベル推定部107〜107で推定されたマイクレベルS(Ω)と、マイク雑音レベル推定部201〜201で推定されたマイク雑音レベルN(Ω)から、マイク受音信号に与える帯域ごとのゲインを制御する。ゲイン制御は、マイク受音信号にエコー成分が多く含まれる場合はエコーを抑圧し、雑音が主に含まれる場合は雑音を抑圧し、これ以外の場合には近端話者音声を通過させるように行われる。
まず、マイク受音信号にエコー成分が多く含まれる場合、推定エコーレベルR(Ω)と推定マイクレベルS(Ω)が近い値をとるので、推定エコーレベルR(Ω)に予め定めた固定値、例えば1以上の固定係数Cを乗じた値より、推定マイクレベルS(Ω)が小さい場合に、エコー成分が多く含まれる期間として検出する。この条件は式(12)で表される。
S(Ω)≦C・R(Ω) 式(12)
エコー成分が多く含まれる期間として検出されたら、その帯域の瞬時エコー抑圧ゲインg(Ω)を、あらかじめ固定値で設定したエコー抑圧量Dに設定する。ただし、エコー抑圧量Dは例えば0≦D≦1の値をとり、小さい値にするほどエコー抑圧量が増加するが、ダブルトーク時の近端話者音声の劣化が増加する。次に、エコー成分が多く含まれる期間として検出されなかった場合は、エコー成分が小さいので、瞬時エコー抑圧利得係数g(Ω)を例えば1に設定し、マイク受音信号をそのまま通過させる。このゲイン制御を式で表せば式(13)となる。
gE(Ω)=D for S(Ω)≦C・R(Ω)
gE(Ω)=1 for S(Ω)>C・R(Ω) 式(13)
次に、マイク受音信号に雑音成分が多く含まれる場合、推定雑音レベルN(Ω)と推定マイクレベルS(Ω)が近い値をとるので、推定雑音レベルN(Ω)に予め定めた固定値、例えば1以上の固定係数Cを乗じた値より、推定マイクレベルS(Ω)が小さい場合に、エコー成分が多く含まれる期間として検出する。この条件は式(14)で表される。
S(Ω)≦CN・NS(Ω) 式(14)
雑音成分が多く含まれる期間として検出されたら、その帯域の瞬時雑音抑圧利得係数g(Ω)を、あらかじめ固定値として設定した雑音抑圧量Dに設定する。ただし、雑音抑圧量Dは0≦D≦1の値をとり、小さい値にするほど雑音抑圧量が増加するが、近端話者音声の劣化が増大する。次に、雑音成分が多く含まれている期間として検出されなかった場合は、雑音成分が小さいので、瞬時雑音抑圧利得係数g(Ω)を予め定めた固定値、例えば1に設定し、マイク受音信号をそのまま通過させる。このゲイン制御を式で表せば式(15)となる。
gN(Ω)=DN for S(Ω)≦CN・NS(Ω)
gN(Ω)=1 for S(Ω)>CN・NS(Ω) 式(15)
以上により求められた瞬時エコー抑圧利得係数g(Ω)と瞬時雑音抑圧利得係数g(Ω)のうち小さい方を瞬時雑音利得係数g(Ω)に設定する。これは式(16)により表される。
g(Ω)=MIN{gE(Ω),gN(Ω)} 式(16)
ただし、MIN{A,B}はAの値とBの値のうち小さい方を選択するということを意味する。
次に、本発明の実施例1と同様にして、瞬時利得係数g(Ω)を時間平滑化して、ゲインG(Ω)を求める。
また、本発明の実施例1と同様にして、複数のエコー抑圧量と雑音抑圧量を設定することもできる。エコー成分が多く含まれる期間を検出するための固定係数CをK個のC〜Cとし、推定エコーレベルR(Ω)にこれらの係数C〜Cを乗じた値と、マイクレベルS(Ω)の値を比較して、エコー抑圧量D〜Dを、瞬時エコー抑圧利得係数g(Ω)に設定する。これを式で表せば式(17)となる。
gE(Ω)=DK for S(Ω)≦CK・R(Ω)
gE(Ω)=DK-1 for CK・R(Ω)<S(Ω)≦CK-1・R(Ω)
: :
gE(Ω)=D1 for C2・R(Ω)<S(Ω)≦C1・R(Ω)
gE(Ω)=1 1 for S(Ω)>C1・R(Ω) 式(17)
瞬時雑音抑圧利得係数gN(Ω)も同様に、雑音成分が多く含まれる期間を検出するための固定係数CをJ個の係数DN,1〜DN,Jを、瞬時エコー抑圧利得係数g(Ω)に設定する。これを式で表せば式(18)となる。
gN(Ω)=DN,J for S(Ω)≦CN,J・NS(Ω)
gN(Ω)=DN,J-1 for CN,J・NS(Ω)<S(Ω)≦CN,J-1・NS(Ω)
: :
gN(Ω)=DN,1 for CN,2・NS(Ω)<S(Ω)≦CN,1・NS(Ω)
gN(Ω)=1 for S(Ω)>CN,1・NS(Ω) 式(18)
だたし、固定係数C1〜CKおよびCN,1〜CN,Jは、それぞれ1以上の値をとり、係数の大小関係はC1>C>…>CまたはCN,1>CN,2>…>CN,Jとなるように、あらかじめ固定値を設定する。エコー抑圧量D1〜DKと雑音抑圧量DN,1〜DN,Jは、それぞれ0≦D≦1、0≦DN,J≦1の値をとり、その大小関係はD1>D>…>DまたはDN,1>DN,2>…>DN,Jとなるようにあらかじめ固定値を設定する。次に、瞬時エコー抑圧利得係数g(Ω)のうち小さい方を選択し瞬時利得係数g(Ω)とし、この瞬時利得係数g(Ω)を時間平均化してゲインG(Ω)を求める。時間平滑化は、第1の実施例と同様にして行われる。このように、複数のエコー抑圧量と雑音抑圧量を設定することで、マイク受音信号に含まれるエコー成分や雑音成分の割合により、エコーまたは雑音抑圧量を変えることができ、抑圧量を従来技術のように1段階で設定するよりもエコーや雑音抑圧量を上げても、通話品質を保つことが可能となる。
これら以外の部分については、本発明の実施例1と同様であるので説明を省略する。
以上示したように、本実施例2によれば、本発明の第1実施例の効果に加えて、空調やファンの音などの定常的な雑音を抑圧することができる。
図3は、本発明の第3の実施例であるエコー抑圧装置300のブロック図である。
本実施例のエコー抑圧装置300は、本発明の第1または第2の実施例に、周波数特性平滑部301を追加した構成である。本実施例は、ゲインの周波数特性を周波数軸で平滑化することで、不連続な周波数特性を軽減し、より自然な音質を実現する。
周波数特性平滑部は、ゲイン制御部1081〜108で設定されたゲインG(Ω)を周波数軸で平滑化する。平滑化は例えば式(19)により行われる。
G'(ωi)=α・G'(ωj-1)+(1-α)・G(ωj) 式(19)
ただし、G'(ωj)は、平滑化後のゲインであり、αは平滑係数で、あらかじめ固定値が設定される。αは例えば0≦α<1の値をとり、1に近いほど、より強い平滑化となる。
この周波数特性の平滑化により、音質の不自然さの原因となるゲインの不連続な周波数特性を軽減し、音質を向上させることができる。
これ以外の部分に関しては本発明の第1または第2の実施例と同様であるので説明を省略する。
以上、示したように本実施例3によれば、本発明の第1または第2の実施例の効果に加えて、不連続な周波数特性を軽減し、より自然な音質を実現することができる。
図4は、本発明の第4の実施例であるエコー抑圧装置400のブロック図である。本発明の第4の実施例は、本発明の第1〜3の実施例にマイク受音信号の第1帯域分割変換部401と、スピーカ出力信号の帯域分割変換部402と、ゲインの帯域数変換部403が新たに設けられ、音響結合量推定部105〜105N’と、エコーレベル推定部106〜106N’と、マイクレベル推定部107〜107N’と、ゲイン制御部108〜108N’と、マイク雑音レベル推定部201〜201N’と、受話雑音レベル推定部202〜202N’の個数が、変換後の帯域分割数N’となった構成である。
マイク受音信号の帯域分割変換部401は、マイク受音信号の第1周波数領域変換部101の出力信号である周波数領域変換後のマイク受音信号Y(Ω)の帯域分割数をNからN’に変換する。ただし、N’はN未満の整数であり、変換後のY(Ω)をY’(Ω’)とする。
変換は、変換前の複数の帯域を1つの帯域にまとめることにより行われ、例えばΩ=ωn,…,ωmの範囲のI個の帯域を、1つの帯域Ω’に変換するときには、変換前の複数の帯域の振幅の平均値を、変換後の振幅とする。平均値は、式(20)または式(21)により計算される。
Figure 0004413205
スピーカ出力信号の帯域分割数変換部402は、マイク受音信号の帯域分割数変換部401と同様の処理により、スピーカ出力信号の第2周波数領域変換部103の出力信号である周波数領域変換後のスピーカ出力信号X(Ω)の帯域分割数をNからN’に変換する。
音響結合量推定部105〜105N’と、エコーレベル推定部106〜106N’と、マイクレベル推定部107〜107N’と、ゲイン制御部108〜108N’と、マイク雑音レベル推定部201〜201N’と、受話雑音レベル推定部202〜202N’は、変換後の帯域分割数N’と同数あり、それぞれ帯域分割数変換後の信号を入力として、本発明の第1〜3の実施例と同様の処理を行う。
ゲインの帯域分割数変換部403は、ゲイン制御部108〜108N’の出力であるN’帯域のゲインを周波数領域変換部の帯域分割数Nのゲインに変換する。変換は変換前の1つの帯域を複数の帯域に分割するようにして行われる。例えば帯域Ω’を、Ω=ωn,…,ωmのI個の帯域に分割する場合、変換前の帯域Ω’のゲイン値を、変換後のI個の帯域Ω=ωn,…,ωmのゲイン値とする。
周波数特性平滑化部301を有さない実施例に適用する場合には、ゲイン乗算部104〜104とは、ゲインの帯域分割数変換部403により帯域分割数が変換されたゲイン値を入力とし、本発明の第1〜3の実施例と同様の処理を行う。
周波数特性平滑化部301を有する実施例に適用する場合には、周波数特性平滑化部301は、ゲインの帯域分割数変換部403により帯域分割数が変換されたゲイン値を入力とし、本発明の第1〜3の実施例と同様の処理を行う。
これら以外の部分については、本発明の第1〜3の実施例と同様であるので、説明を省略する。
以上示したように、本実施例によれば、本発明の第1〜3の実施例の効果に加えて、帯域分割数を一部の処理で少なくすることで、演算量の削減を行うことができる。
図5は、本発明の第5の実施例であるエコー抑圧装置のエコーレベル推定部を示す図である。
本実施例のエコー抑圧装置は、本発明の第1〜第4の実施例に含まれるエコーレベル推定部106(i=1,…,N)が、図5に示すような複数個の残響時間に対応したエコーレベル計算部106i,1〜106i,Mから構成されることを特徴とする。複数個の残響時間を想定して、複数のエコーレベルR(Ω)〜R(Ω)を推定することで、残響時間に応じたエコー抑圧量を設定することができる。
エコーレベル推定部106(i=1,…,N)は本発明の第1〜第4の実施例のエコーレベル推定部106〜106と同様にしてエコーレベルを推定する。ただし、反響の長さ(残響時間)の想定値を調整するための係数uの値をM個(u〜u)設定し、各エコーレベル計算部106i,1〜106i,Mで、各残響時間を想定した場合のエコーレベルR(Ω)〜R(Ω)を計算する。
周波数帯域ごとに設けられたゲイン制御部108〜108は、エコーレベル推定部106〜106で推定されたエコーレベルR(Ω)〜R(Ω)と、マイクレベル推定部107〜107で推定されたマイクレベルS(Ω)と、マイク雑音レベル推定部で201〜201で推定されたマイク雑音レベルN(Ω)から、マイクレベル受音信号に与える帯域ごとのゲインを制御する。瞬時雑音抑圧利得係数g(Ω)は、本発明の第1〜第4の実施例と同様にして求められる。瞬時エコー抑圧利得係数も本発明の第1〜第4の実施例と同様にして求められるが、複数の残響時間を想定した複数の推定エコーレベルR(Ω)〜R(Ω)の、各々に対して瞬時エコー抑圧利得係数gE,1(Ω)〜gE,M(Ω)が求められる。これらの瞬時エコー抑圧利得係数と瞬時雑音抑圧利得係数のうち最も利得値が小さいものを最小利得選択部108−1で選択し、選択した利得係数を瞬時抑圧利得係数g(Ω)とし、この瞬時抑圧利得係数g(Ω)を(実施例1〜4と同様に)時間平滑部108−2で時間平滑し、ゲイン乗算部104〜104に出力する。
ここで、エコー抑圧量の設定値D,D〜Dは、想定残響時間ごとに設定される。一般にエコーの大きさは、部屋の残響特性により時間とともに指数関数的に減衰する。このことから、想定残響時間が短いものほど、高いエコー抑圧量を設定し、残響時間がながいほどエコー抑圧量を減らすことで、残響に対して一定の残響エコーレベルとすることができる。これにより、エコーの過度な消去をなくし、近端話者の音声の劣化を最小限とすることができる。
また、本実施例においてマイク受音信号の第1周波数領域変換部101と、逆周波数領域変換部102と、スピーカ出力信号の第2周波数領域変換部103を削除して、周波数領域変換を行わずに全帯域一括してゲイン制御することもできる。この場合も実施例1と同様に、式(9)で示したように複数のエコー抑圧量を設定することで、マイク受音信号に含まれるエコー成分の割合により、エコー抑圧量を変えることができ、従来のエコー抑圧装置のように抑圧量を1段階で設定でするのに比べ、エコー抑圧量を上げてもダブルトーク時の通話品質を保つことができる。
これら以外の部分については、本発明の第1〜第4の実施例と同様であるので説明を省略する。
以上示したように、本実施例5によれば、本発明の第1〜第4の実施例の効果に加えて、残響時間の長い環境においても、十分なエコー抑圧をしながら、近端話者の音声劣化を最小限とすることができる。
以上各実施例で説明した本発明によるエコー抑圧装置はコンピュータが解読可能なプログラム言語によって記述されたエコー抑圧プログラムをコンピュータにインストールし、コンピュータに備えられたCPUに解読させることにより上述したエコー抑圧装置として機能し、本発明によるエコー抑圧方法が実行される。
本発明によるエコー抑圧プログラムはコンピュータが読み取り可能な例えば磁気ディスク或いはCD−ROM、半導体メモリ等の記録媒体に記録される。コンピュータにはこれらの記録媒体からインストールするか、又は通信回線を通じてインストールすることができる。
本発明によるエコー抑圧方法、装置はテレビ会議システム或いは音声会議システムのようなハンズフリー通信の分野で活用される。
本発明の第1の実施例であるエコー抑圧装置を説明するためのブロック図。 本発明の第2の実施例であるエコー抑圧装置を説明するためのブロック図。 本発明の第3の実施例であるエコー抑圧装置を説明するためのブロック図。 本発明の第4の実施例であるエコー抑圧装置を説明するためのブロック図。 本発明の第5の実施例であるエコー抑圧装置を説明するためのブロック図。 Aはエコー抑圧装置通過前の挿受話音声スペクトルを示す図、Bは従来のエコー抑圧装置通過後の送話音声スペクトルを示す図、Cは本発明のエコー抑圧装置通過後の送話音声スペクトルを示す図である。 本発明によるエコー抑圧装置の使い方を説明するための図。 従来のエコー抑圧装置を説明するためのブロック図。
符号の説明
101 第1周波数領域変換部
102 逆周波数領域変換部
103 第2周波数領域変換部
104〜104 ゲイン乗算部
105〜105 音響結合量推定部
106〜106 エコーレベル推定部
107〜107 マイクレベル推定部
108〜108 ゲイン制御部
201〜201 マイク雑音レベル推定部
202〜202 受話雑音レベル推定部
301 周波数特性平滑化部
401〜403 帯域分割数変換部

Claims (16)

  1. マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換処理と、
    スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換処理と、
    前記周波数領域信号に変換されたマイク受音信号と、前記周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達関数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定処理と、
    前記周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに前記音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定処理と、
    前記周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定処理と、
    前記推定エコーレベルと、前記推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御処理と、
    前記周波数領域信号に変換されたマイク受音信号に前記ゲイン制御処理で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算処理と、
    前記ゲイン乗算処理で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換処理と、
    を含むことを特徴とするエコー抑圧方法。
  2. 請求項1記載のエコー抑圧方法において、前記周波数帯域毎に施される前記ゲイン制御処理は、前記推定エコーレベルに予め設定した固定係数を乗じて求めた閾値と、前記推定マイクレベルとを比較し、前記推定マイクレベルが前記閾値より小さい場合は予め設定したエコー抑圧ゲインを瞬時利得係数値とし、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これらの瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧方法。
  3. 請求項1に記載のエコー抑圧方法において、前記推定エコーレベルに予め設定した固定係数を乗じて求めた複数の閾値と、前記推定マイクレベルとをそれぞれ比較し、前記推定マイクレベルが何れかの閾値よりも小さい場合は、前記推定マイクレベル以上の値を持つ閾値のうち最も前記推定マイクレベルに近い値を持つ閾値に対応する予め設定されたエコー抑圧ゲインを瞬時利得係数値と定め、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これら瞬時利得係数値を時間平滑した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧方法。
  4. 請求項1乃至3の何れかに記載のエコー抑圧方法において、前記周波数領域信号に変換されたマイク受音信号から、マイク受音信号に含まれる定常雑音のレベルを周波数領域毎に推定するマイク雑音レベル推定処理と、
    前記周波数領域信号に変換されたスピーカ出力信号から、スピーカ出力信号に含まれる定常雑音のレベルを周波数帯域毎に推定する受話雑音レベル推定処理と、
    前記周波数領域信号に変換されたスピーカ出力信号から前記スピーカ出力信号に含まれる定常雑音レベルを減じた信号の時間平滑レベルに前記音響結合量を乗じて、マイク受音信号に含まれるエコー成分の推定エコーレベルを周波数帯域毎に推定するエコーレベル推定処理と、
    前記推定エコーレベルに予め設定した固定係数を乗じた値と、前記推定マイクレベルとを比較し、推定エコーレベルが大きい場合は予め設定したエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合は、予め設定した固定値を瞬時エコー抑圧利得係数値とし、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合は予め設定した雑音抑圧ゲイン瞬時雑音抑圧利得係数値とし、これ以外の場合は予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記瞬時エコー抑圧利得係数値と、前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧方法。
  5. 請求項1乃至の何れかに記載のエコー抑圧方法において、前記周波数帯域毎に施されるゲイン制御処理の出力となるゲイン値を周波数軸で平滑化する周波数特性平滑化処理を付加し、前記周波数帯域毎に施されるゲイン乗算処理は、前記周波数領域に変換されたマイク受音信号に前記周波数特性平滑化処理において平滑化後のゲイン値を、周波数帯域毎に乗算することを特徴とするエコー抑圧方法。
  6. 請求項1乃至4の何れかに記載のエコー抑圧方法において、前記スピーカ出力信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のスピーカ信号を、2以上でN未満のN’個の周波数成分のスピーカ出力信号に変換するスピーカ出力信号の帯域分割数変換処理と、
    前記マイク受音信号の周波数領域変換処理で周波数領域信号に変換されたN個の周波数成分のマイク受音信号をN’個の周波数成分のマイク受音信号に変換するマイク受音信号の帯域分割数変換処理と、
    前記ゲイン制御処理の出力であるN’個の周波数帯域のゲイン値をN個の周波数帯域のゲイン値に変換するゲインの帯域分割数変換処理を付加し、
    前記N個の周波数帯域毎に施されていた処理を、帯域分割数変換後のN’の周波数帯域毎とすることを特徴とするエコー抑圧方法。
  7. 請求項1乃至6の何れかに記載のエコー抑圧方法において、前記エコーレベル推定処理は、予め設定したM個の残響時間に対応した時定数で時間平滑化してエコーレベルを計算する2以上のM個のエコーレベル計算処理部を有し、
    前記周波数帯域ごとに設けられたゲイン制御処理は、前記M個の残響時間に対応した推定エコーレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを各々比較し、推定エコーレベルが大きい場合はあらかじめ残響時間ごとに設定されたエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時エコー抑圧利得係数値としてM個の瞬時エコー抑圧利得係数を求め、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合はあらかじめ設定した雑音抑圧ゲインを瞬時雑音抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記M個の瞬時エコー抑圧利得係数値と前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域ごとに設定することを特徴とするエコー抑圧方法。
  8. マイク受音信号を2以上のN個の周波数成分から成る周波数領域信号に変換する第1周波数領域変換部と、
    スピーカ出力信号をN個の周波数領域成分から成る周波数領域信号に変換する第2周波数領域変換部と、
    前記周波数領域信号に変換されたマイク受音信号と、前記周波数領域信号に変換されたスピーカ出力信号との比から、スピーカとマイクロホン間の伝達関数の振幅値である音響結合量を周波数領域毎に推定する音響結合量推定部と、
    前記周波数領域信号に変換されたスピーカ出力信号を予め設定した残響時間に対応した時定数で平滑化して時間平滑レベルを求め、この時間平滑レベルに前記音響結合量を乗じてマイク受音信号に含まれるエコー成分のレベルを周波数帯域毎に推定するエコーレベル推定部と、
    前記周波数領域信号に変換されたマイク受音信号の時間平滑レベルを計算して周波数帯域毎にマイクレベルを推定するマイクレベル推定部と、
    前記推定エコーレベルと、前記推定マイクレベルとを比較し、推定エコーレベルが大きい程抑圧量の大きいゲイン値を設定し、推定エコーレベルが充分小さい場合には予め設定した固定ゲイン値を周波数帯域毎に設定するゲイン制御部と、
    前記周波数領域信号に変換されたマイク受音信号に前記ゲイン制御部で設定したゲイン値を周波数帯域毎に乗算するゲイン乗算部と、
    前記ゲイン乗算部で乗算処理された出力信号を逆周波数領域変換し、送話信号として出力する逆周波数領域変換部と、
    によって構成することを特徴とするエコー抑圧装置。
  9. 請求項8記載のエコー抑圧装置において、前記周波数帯域毎に設けられた前記ゲイン制御部は、前記推定エコーレベルに予め設定した固定係数を乗じて求めた閾値と、前記推定マイクレベルとを比較し、前記推定マイクレベルが前記閾値より小さい場合は予め設定したエコー抑圧ゲインを瞬時利得係数値とし、これ以外の場合には予め設定した固定値を瞬時利得係数値とし、これらの瞬時利得係数値を時間平滑化した値を前記ゲイン乗算部で用いられるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧装置。
  10. 請求項8に記載のエコー抑圧装置において、前記推定エコーレベルに予め設定した値が予め設定した固定値以上の複数個の係数を乗じて求めた複数の閾値と、前記推定マイクレベルとをそれぞれ比較し、前記推定マイクレベルが何れかの閾値よりも小さい場合は、前記推定マイクレベル以上の値を持つ閾値のうち最も前記推定マイクレベルに近い値を持つ閾値に対応する予め設定されたエコー抑圧ゲインを瞬時利得係数と定め、これ以外の場合には予め設定した固定値を瞬時利得係数とし、これら瞬時利得係数を時間平滑した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧装置。
  11. 請求項8乃至10の何れかに記載のエコー抑圧装置において、前記周波数領域信号に変換されたマイク受音信号から、マイク受音信号に含まれる定常雑音のレベルを周波数領域毎に推定するマイク雑音レベル推定部と、
    前記周波数領域信号に変換されたスピーカ出力信号から、スピーカ出力信号に含まれる定常雑音のレベルを周波数帯域毎に推定する受話雑音レベル推定部と、
    前記周波数領域信号に変換されたスピーカ出力信号から前記スピーカ出力信号に含まれる定常雑音レベルを減じた信号の時間平滑レベルに前記音響結合量を乗じて、マイク受音信号に含まれるエコー成分の推定エコーレベルを周波数帯域毎に推定するエコーレベル推定部と、
    前記推定エコーレベルに予め設定した固定係数を乗じた値と、前記推定マイクレベルとを比較し、推定エコーレベルが大きい場合は予め設定したエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合は、予め設定した固定値を瞬時エコー抑圧利得係数値とし、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合は予め設定した雑音抑圧ゲイン瞬時雑音抑圧利得係数とし、これ以外の場合は予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記瞬時エコー抑圧利得係数値と、前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算処理で用いるゲイン値として周波数帯域毎に設定することを特徴とするエコー抑圧装置。
  12. 請求項8乃至11の何れかに記載のエコー抑圧装置において、前記周波数帯域毎に設けられるゲイン制御部の出力となるゲイン値を周波数軸で平滑化する周波数特性平滑化部を付加し、前記周波数帯域毎に設けられたゲイン乗算部は、前記周波数領域信号に変換されたマイク受音信号に前記周波数特性平滑化部において平滑化後のゲイン値を、周波数帯域毎に乗算することを特徴とするエコー抑圧装置。
  13. 請求項8乃至12の何れかに記載のエコー抑圧装置において、前記スピーカ出力信号の周波数領域変換部で周波数領域信号に変換されたN個の周波数成分のスピーカ信号を、2以上でN未満のN’個の周波数成分のスピーカ出力信号に変換するスピーカ出力信号の帯域分割数変換部と、
    前記マイク受音信号の周波数領域変換部で周波数領域信号に変換されたN個の周波数成分のマイク受音信号をN’個の周波数成分のマイク受音信号に変換するマイク受音信号の帯域分割数変換部と、
    前記ゲイン制御部の出力であるN’個の周波数帯域のゲイン値をN個の周波数帯域のゲイン値に変換するゲインの帯域分割数変換部を付加し、
    前記N個の周波数帯域毎に施されていた処理を、帯域分割数変換後のN’の周波数帯域毎とすることを特徴とするエコー抑圧装置。
  14. 請求項8乃至13の何れかに記載のエコー抑圧装置において、前記エコーレベル推定部は、予め設定したM個の残響時間に対応した時定数で時間平滑化してエコーレベルを計算する2以上のM個のエコーレベル計算部を有し、
    前記周波数帯域ごとに設けられたゲイン制御部は、前記M個の残響時間に対応した推定エコーレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを各々比較し、推定エコーレベルが大きい場合はあらかじめ残響時間ごとに設定されたエコー抑圧ゲインを瞬時エコー抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時エコー抑圧利得係数値としてM個の瞬時エコー抑圧利得係数を求め、前記マイク受音信号に含まれる定常雑音のレベルに予め設定した固定係数を乗じた値と前記推定マイクレベルとを比較し、雑音レベルが大きい場合はあらかじめ設定した雑音抑圧ゲインを瞬時雑音抑圧利得係数値とし、これ以外の場合には予め設定した固定値を瞬時雑音抑圧利得係数値とし、前記M個の瞬時エコー抑圧利得係数値と前記瞬時雑音抑圧利得係数値のうち最も小さい値を瞬時利得係数値とし、この瞬時利得係数値を時間平滑化した値を前記ゲイン乗算部で用いるゲイン値として周波数帯域ごとに設定することを特徴とするエコー抑圧装置。
  15. コンピュータが解読可能なプログラム言語によって記述され、コンピュータに請求項1乃至7記載のエコー抑圧方法を実行させるエコー抑圧プログラム。
  16. コンピュータが読み取り可能な記録媒体によって構成され、この記録媒体に請求項15記載のエコー抑圧プログラムを記録した記録媒体。
JP2006171045A 2006-06-21 2006-06-21 エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体 Active JP4413205B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006171045A JP4413205B2 (ja) 2006-06-21 2006-06-21 エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006171045A JP4413205B2 (ja) 2006-06-21 2006-06-21 エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体

Publications (2)

Publication Number Publication Date
JP2008005094A JP2008005094A (ja) 2008-01-10
JP4413205B2 true JP4413205B2 (ja) 2010-02-10

Family

ID=39009147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006171045A Active JP4413205B2 (ja) 2006-06-21 2006-06-21 エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP4413205B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5347794B2 (ja) * 2009-07-21 2013-11-20 ヤマハ株式会社 エコー抑圧方法およびその装置
JP5325134B2 (ja) * 2010-02-04 2013-10-23 日本電信電話株式会社 反響消去方法、反響消去装置、そのプログラムおよび記録媒体
JP6369189B2 (ja) * 2014-07-17 2018-08-08 沖電気工業株式会社 エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末
JP6537997B2 (ja) * 2016-04-12 2019-07-03 日本電信電話株式会社 エコー抑圧装置、その方法、プログラム、及び記録媒体
JP7264594B2 (ja) * 2018-02-23 2023-04-25 リオン株式会社 残響抑制装置及び補聴器

Also Published As

Publication number Publication date
JP2008005094A (ja) 2008-01-10

Similar Documents

Publication Publication Date Title
JP4954334B2 (ja) エコー抑制のためのフィルタ係数を演算する装置および方法
JP5671147B2 (ja) 後期残響成分のモデリングを含むエコー抑制
US8594320B2 (en) Hybrid echo and noise suppression method and device in a multi-channel audio signal
EP1855457B1 (en) Multi channel echo compensation using a decorrelation stage
JP3727258B2 (ja) エコー抑制処理システム
US7742592B2 (en) Method and device for removing echo in an audio signal
JP3568922B2 (ja) エコー処理装置
JP5036874B2 (ja) エコー消去装置
JP4957810B2 (ja) 音処理装置、音処理方法及び音処理プログラム
JP5391103B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体
JP2012501152A (ja) 前白色化を伴うlmsアルゴリズムによって適応させられる適応フィルタの更新済みフィルタ係数を決定する方法
JPWO2006046293A1 (ja) 雑音抑圧装置
EP2987314B1 (en) Echo suppression
KR101182017B1 (ko) 휴대 단말기에서 복수의 마이크들로 입력된 신호들의잡음을 제거하는 방법 및 장치
JP3607625B2 (ja) 多チャネル反響抑圧方法、その装置、そのプログラム及びその記録媒体
JP4413205B2 (ja) エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体
JP5662232B2 (ja) エコー消去装置、その方法及びプログラム
JP5469564B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置及びそのプログラム
US8804981B2 (en) Processing audio signals
US8406430B2 (en) Simulated background noise enabled echo canceller
JP3756839B2 (ja) 反響低減方法、反響低減装置、反響低減プログラム
JP4700673B2 (ja) エコー消去方法、装置、プログラム、および記録媒体
JP3756828B2 (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP4383416B2 (ja) ハウリング防止方法、装置、プログラム、及びこのプログラムを記録した記録媒体
JP4478045B2 (ja) エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090612

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091117

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4413205

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131127

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350