JP4478071B2 - エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体 - Google Patents

エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体 Download PDF

Info

Publication number
JP4478071B2
JP4478071B2 JP2005164332A JP2005164332A JP4478071B2 JP 4478071 B2 JP4478071 B2 JP 4478071B2 JP 2005164332 A JP2005164332 A JP 2005164332A JP 2005164332 A JP2005164332 A JP 2005164332A JP 4478071 B2 JP4478071 B2 JP 4478071B2
Authority
JP
Japan
Prior art keywords
amplitude spectrum
frequency
signal
signal amplitude
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005164332A
Other languages
English (en)
Other versions
JP2006340189A (ja
Inventor
勝宏 福井
末廣 島内
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005164332A priority Critical patent/JP4478071B2/ja
Publication of JP2006340189A publication Critical patent/JP2006340189A/ja
Application granted granted Critical
Publication of JP4478071B2 publication Critical patent/JP4478071B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Description

この発明は、例えばモノラル、もしくは多チャネル音響再生系を有する通信会議システムに適用され、ハウリングの原因及び聴覚上の障害となる音響エコーを抑圧するエコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体に関する。
図18に示すように、従来のN(≧1の整数)チャンネルエコー抑圧方法は、Nチャンネルの再生信号x(k)〜x(k)がスピーカ1〜1からマイクロホン2へ回り込むエコーを抑圧(エコーの抑圧とは、エコーを必要十分に低減すること、あるいは消去することをいう。)した出力信号e(k)を、マイクロホン2で収音した収音信号y(k)から、スピーカ1〜1とマイクロホン2間のエコー経路のインパルス応答を要素として持つ長さ(即ちタップ数)Lのベクトルh〜hの疑似特性h^(k)〜h^(k)を保持する疑似エコー経路を実現する適応フィルタ3〜3によって出力した擬似エコー信号d^(k)〜d^(k)を除去することで得ていた(非特許文献1参照)。ここで、再生信号x(k)〜x(k)、収音信号y(k)、擬似エコー信号d^(k)〜d^(k)、出力信号e(k)はいずれも適宜に公知のサンプリング処理や量子化処理のされたディジタル信号であり、kは、所定間隔の離散的な時刻を指す数(サンプル点の番号)である。サンプリングとは、アナログの音声信号をディジタル信号に変換するために変数のある区間の値を1つの代表する値に置き換えることで、例えばサンプリング周波数16kHz(1秒間に16000回)で行われる。なお、スピーカ1〜1に与える入力信号、マイクロホン2で受音された受音信号はアナログ信号であるから、ディジタル信号への変換(入力信号から再生信号への変換、受音信号から収音信号への変換)のためにD/A変換器が必要となるが、図18では示していない。
つまり、適応フィルタ3〜3は、再生信号x(k)〜x(k)と疑似特性h^(k)〜h^(k)との畳み込み演算によって疑似エコー信号d^(k)〜d^(k)を生成し、信号合成器4は、実際のエコー信号を含むマイクロホン2の収音信号(「エコー抑圧前信号」とも呼ぶ。)y(k)から疑似エコー信号d^(k)〜d^(k)を減算することで、エコー抑圧装置の出力信号(「エコー抑圧信号」とも呼ぶ。)e(k)を出力する。また、この従来のエコー抑圧装置では、再生信号x(k)〜x(k)と出力信号e(k)とを用いて、疑似特性h^(k)〜h^(k)の特性を随時更新し、適応フィルタ3〜3に設定している。
適応フィルタ3〜3において、例えば学習同定アルゴリズムを用いた場合の疑似特性h^(k)〜h^(k)の推定は、式(1)で表される。
Figure 0004478071
ここで、チャンネルnは1〜Nの間の自然数、x(k)=[x(k),x(k−1),…,x(k―L+1)](Tは転置行列であることを表す。)、ψは係数の更新幅を与えるステップサイズであり、0〜2の間の値をとる実数である。δは分母が0になることを防止するための微小な定数である。式(1)が示すように、前回の疑似特性h^(k−1)に対し更新量を加えて今回の疑似特性h^(k)を得る。
藤井哲郎、島田正治、"多チャンネル適応ディジタルフィルタ、"電子通信学会論文誌’86/10、Vol.J69−A No.10.
従来のエコー抑圧方法では、式(1)によって再生信号x(k)〜x(k)のチャンネル数と同数の疑似特性h^(k)〜h^(k)を随時更新しているため、演算量が飛躍的に増大するという問題点があった。また、適応フィルタ3〜3における擬似特性推定の収束には一定時間を要するため、学習途中において推定誤差が起こり、エコー推定精度が劣化するという問題点もあった。さらに適応フィルタの擬似特性の学習後も音響結合量(マイクロホンおよびスピーカ間の系の伝達関数の振幅によって定義され、各再生信号の振幅スペクトルと収音信号の振幅スペクトルとの比で表すことができる。)の急激な変化が生じた場合、受話シングルトーク中でさえもエコー抑圧精度が大きく劣化する問題点もあった。
本発明が解決しようとする課題は、上記の問題点に鑑み、演算量を低減し、短時間でエコー抑圧を行うエコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体を提供することである。
上記課題を解決するために、本発明は、再生信号および収音信号をそれぞれ周波数分析し、ローカルピークにおける再生信号の周波数とローカルピークにおける収音信号の周波数との差が所定範囲内にあるときの各信号の周波数成分の振幅比から補正量を求め、次いで、再生信号の振幅スペクトルを補正量で補正したものと収音信号の振幅スペクトルとの大小判定に基づいて選択的に抑圧された収音信号の周波数成分(エコー抑圧信号の周波数成分)を時間領域に変換して出力信号を得る。
また、本発明では、上記の再生信号を、複数チャンネルの各再生信号を加算したものとすることでもよい。あるいは、再生信号の周波数成分を、複数チャンネルの各再生信号の周波数成分を加算したものとすることでもよい。さらに、再生信号の周波数成分を、エコーを考慮して平滑化したものとすることでもよい。
さらに、本発明では、ローカルピークにおける再生信号の周波数とローカルピークにおける収音信号の周波数との差が所定範囲内にあるときの各信号の周波数成分の振幅比を暫定補正量とし、ダブルトーク状態の判定に基づき、ダブルトーク状態の場合およびダブルトーク状態ではない場合に分けて、暫定補正量を平滑化したものを補正量とすることでもよい。
さらに、本発明では、再生信号の振幅スペクトルを補正量で補正したものと収音信号の振幅スペクトルとの大小判定に基づいて選択的に抑圧された収音信号の周波数成分に所定割合で収音信号の周波数成分を付加して、これを時間領域に変換して出力信号を得るとしてもよい。
さらに、本発明では、再生信号の振幅スペクトルを補正量で補正したものと収音信号の振幅スペクトルとの大小判定に基づいて選択的に抑圧された収音信号の周波数成分を候補スペクトルとし、また、抑圧されなかったときの周波数(フラグ周波数)に対して所定の指標を設定し、過去のフレーム(周波数領域に変換する信号の時間長)に対する周波数領域におけるフラグ周波数ないしフラグ周波数を含む所定帯域の各周波数について指標設定の有無を判定し、この判定に基づいて選択的に抑圧された候補スペクトルを時間領域に変換して出力信号を得るとしてもよい。
また、本発明のエコー抑圧装置をコンピュータ上で機能させるエコー抑圧プログラムによって、コンピュータをエコー抑圧装置として作動処理させることができる。そして、このエコー抑圧プログラムを記録した、コンピュータ読み取り可能なプログラム記録媒体によって、他のコンピュータをエコー抑圧装置として機能させることや、エコー抑圧プログラムを流通させることなどが可能になる。
この発明によれば、再生信号および収音信号をそれぞれ周波数分析し、ローカルピークにおける再生信号の周波数とローカルピークにおける収音信号の周波数との差が所定範囲内にあるときの各信号の周波数成分の振幅比から補正量を求め、次いで、再生信号の振幅スペクトルを補正量で補正したものと収音信号の振幅スペクトルとの大小判定に基づいてエコー抑圧信号の周波数成分を算出するので、従来技術における適応フィルタを用いた演算に比較して演算量を十分低減でき、また、短時間でエコー抑圧を行うことができる。
さらに本発明の一面においては、ダブルトーク状態とそれ以外とで状態に応じた補正量を求めることで、シングルトーク状態に音響結合量が急激に変化したとしても頑健なエコー抑圧を実現できるという効果をも有する。
以下にこの発明の実施形態を、図面を参照しながら説明するが、各図中の対応する部分は同一参照番号を付けて重複説明を省略する。
下記の各実施形態においては、説明の便宜から、本発明のエコー抑圧装置・方法が話者Cおよび話者Dによる双方向音声通信に用いられた場合を例示して説明する。従って、下記の説明および図面における「収音信号」とは、話者Cの話し声などの音声が音響信号収音手段であるマイクロホンによって収音されて得られるアナログ信号がディジタル信号に変換されたものを表し、「出力信号」とは、収音信号が後述の処理を受けて得られるディジタル信号(アナログ信号に変換されて話者D側へ送られることになるとする。)を表し、「再生信号」とは、話者D側から話者C側へ送られてきたアナログ信号をディジタル信号に変換した信号を表すものとする。また、いずれの信号も適宜に公知のサンプリング処理や量子化処理のされたディジタル信号(時間領域)であるとし、収音信号へのA/D変換や出力信号に対するD/A変換などを実行するために必要となる構成要素(手段)は、いずれも公知技術の常套手段によって達成されるから、説明および図示を略する。
なお、話者2名(話者Cおよび話者D)による双方方向音声通信に限定されるものではなく、例えば音声会議やテレビ会議などのように、双方に複数名が存在する環境下における双方方向音声通信でもよい。また、マイクロホンで受音する音は、人の話し声などの音声に限定されず、楽音、雑音など一切の音を含む。
下記の各実施形態では、N(≧2)チャンネル音響再生系における再生信号がN個の場合を例にしている。これは、単チャンネル音響再生系として1個の再生信号の場合を排除するものではなく、この場合については適宜説明を加える。
下記の各実施形態においては、本発明のエコー抑圧装置の一例として、それがコンピュータによって実現されるとして説明する。もちろん、本発明のエコー抑圧装置は、いわゆる汎用コンピュータによって実現されるものとしての限定を受けない。例えば、本発明における処理主体となりえるDSP(Digital Signal Processor)やCPU(Central Processing Unit)、本発明における処理を実行するためのプログラムを保存したメモリなどの記憶装置、マイクロホン、スピーカなどを備えたハンズフリー通話装置として実現することも可能であり、また好適でもある。また、本発明のエコー抑圧方法を実装したハンズフリー通話装置は、後述の各実施形態において説明するコンピュータによって実施する場合とおよそ同様の構成によって実現可能であるから、ハンズフリー通話装置としての実施形態は、後述の各実施形態の説明によって明らかになる。
<第1の実施形態>
まず、本発明のエコー抑圧装置・方法の第1の実施形態を説明する。
図1は、第1の実施形態に係わるエコー抑圧装置100のハードウェア構成を例示した構成ブロック図である。
図2は、第1の実施形態に係わるエコー抑圧装置100におけるエコー抑圧の処理機能を例示する機能ブロック図である。
図3は、第1の実施形態に係わるエコー抑圧装置100におけるエコー抑圧処理を示すフローチャートである。
図1に例示するように、第1の実施形態に係わるエコー抑圧装置100は、キーボードなどが接続可能な入力部11、液晶ディスプレイなどが接続可能な出力部12〔これらは、上記のハンズフリー通話装置の場合には必ずしも必要ではない。〕、エコー抑圧装置100の外部に通信可能な通信装置(例えばモデム)が接続可能な通信部13、DSP14〔CPUでも良い。またキャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(Random Access Memory)15、ROM(Read Only Memory)16やハードディスクである外部記憶装置17並びにこれらの入力部11、出力部12、通信部13、DSP14、RAM15、ROM16、外部記憶装置17間のデータのやり取りが可能なように接続するバス18などを備えている。また必要に応じて、エコー抑圧装置100に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい〔外部記録媒体に対する読み書き装置は、上記のハンズフリー通話装置の場合には通常不要となる。〕。
さらにエコー抑圧装置100には、例えば音声、音楽、雑音などの音を受音する音響信号収音手段(例えばマイクロホン)を接続可能であって、マイクロホンによって得られた(アナログ)信号の入力を受ける信号入力部、および、再生信号を音として出力する音響出力装置(例えばスピーカ)を接続可能であって、スピーカに入力する信号(再生信号をD/A変換したもの)を出力するための信号出力部を設ける〔上記のハンズフリー通話装置の場合には、通常、マイクロホンおよびスピーカが必要的に備わる。〕。信号入力部にはマイクロホンが接続され、信号出力部にはスピーカが接続する。
エコー抑圧装置100の外部記憶装置17には、エコー抑圧のためのプログラムおよびこのプログラムの処理において必要となるデータなどが保存記憶されている〔外部記憶装置の無いハンズフリー通話装置の場合には、例えばプログラムを読み出し専用記憶装置であるROMに保存記憶させておけばよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMなどに適宜に保存記憶される。
より具体的には、外部記憶装置17には、N個の再生信号の加算をする総和部4Aを実現するためのプログラム、N個の再生信号が加算された信号(以下、「加算再生信号」という。)を周波数領域に変換して振幅スペクトル(以下、「再生信号振幅スペクトル」という。)を求める再生信号周波数分析部101を実現するためのプログラム、収音信号を周波数領域に変換して振幅スペクトル(以下、「収音信号振幅スペクトル」という。)および位相スペクトル(以下、「収音信号位相スペクトル」という。)を求める収音信号周波数分析部102を実現するためのプログラム、収音信号およびN個の再生信号からダブルトーク状態であるか否かを判定するダブルトーク検出部106を実現するためのプログラム、後述する補正量を求める補正量算出部107を実現するためのプログラム、再生信号の振幅スペクトルを補正量で補正したものと収音信号の振幅スペクトルとの大小判定から選択的に抑圧された収音信号振幅スペクトル(以下、「エコー抑圧信号振幅スペクトル」という。)を求める目的成分選択出力部104を実現するためのプログラム、エコー抑圧信号振幅スペクトルと収音信号位相スペクトルとを合成し、さらに時間領域に変換して出力信号を得るエコー抑圧信号出力部105を実現するためのプログラム、が保存記憶されている。その他、これらのプログラムに基づく処理を制御するための制御プログラムも適宜に保存しておく。
第1の実施形態に係るエコー抑圧装置100では、外部記憶装置17〔あるいはROMなど〕に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAM15に読み込まれて、DSP14で解釈実行・処理される。その結果、DSP14が所定の機能(総和部、再生信号周波数分析部、収音信号周波数分析部、ダブルトーク検出部、補正量算出部、目的成分選出力部、エコー抑圧信号出力部)を実現することで、エコーの防止が実現される。
そこで次に、図2および図3を参照して、エコー抑圧装置100におけるエコー抑圧処理の流れを順次説明する。
第1の実施形態のエコー抑圧装置100は、総和部4A、再生信号周波数分析部101、収音信号周波数分析部102、目的成分選択出力部104、エコー抑圧信号出力部105、ダブルトーク検出部106および補正量算出部107から構成される。
総和部4Aは、N個のチャンネルの再生信号x(k)〜x(k)を入力とし、各チャンネルの再生信号x(k)〜x(k)をサンプル点ごとに加算した加算再生信号x(k)=Σ n=1(k)を出力する(ステップS1)。ここで、kは、所定間隔の離散的な時刻を指す数(サンプル点の番号)である。サンプリングは、例えばサンプリング周波数16kHz(1秒間に16000回)で行われる。
再生信号周波数分析部101は、加算再生信号x(k)を入力として、この加算再生信号x(k)を所定の時間長(以下、「フレーム」という。)で短時間フーリエ変換し、所定の周波数領域(例えば、周波数ω=1,・・・,Ωとする。Ωは、短時間フーリエ変換における周波数の上限である。換言すれば周波数ωは所定の周波数間隔で求めた振幅スペクトルの周波数成分の番号を示す数ということができる。)における振幅スペクトルを求め、これを再生信号振幅スペクトル|X ω|として出力する(ステップS2)。
例えば、16kHzでサンプリングした512個の加算再生信号x(k−511),…,x(k)を1フレームとし、加算再生信号x(k)をフレーム単位で、8kHzまでの周波数帯域をサンプル点数256で表した再生信号振幅スペクトル|X ω|(ω=1,…,256)へ変換する。
なお、上記の短時間フーリエ変換は、より正確には短時間離散フーリエ変換である。また、短時間(離散)フーリエ変換の実行処理は、例えば公知の高速フーリエ変換などの手法を用いることができる。さらに、短時間(離散)フーリエ変換においては、ハニング窓、ハミング窓などの公知の窓関数を用いることができる。以後、これらのことを踏まえて、単に短時間フーリエ変換ということにする。
再生信号が1つの場合、即ち、単チャンネル音響再生系の場合では、上記総和部4Aは不要である。また、再生信号周波数分析部101は、この1個の再生信号を短時間フーリエ変換して振幅スペクトルを求め、これを再生信号振幅スペクトル|X ω|として出力する。
収音信号周波数分析部102は、収音信号y(k)を入力として、この収音信号y(k)を所定のフレームで短時間フーリエ変換し、所定の周波数領域における振幅スペクトルおよび位相スペクトル、つまり収音信号振幅スペクトル|Yω|および収音信号位相スペクトルarg(Yω)を出力する(ステップS3)。kおよびωは上記の説明と同じである。なお、arg(Yω)は0以上2π未満の実数である。
ダブルトーク検出部106は、各再生信号x(k)〜x(k)(あるいは加算再生信号x(k))および収音信号y(k)から、ダブルトーク状態であるか否かを判定し、このダブルトーク状態判定結果を出力する(ステップS4)。ダブルトーク状態の判定は、公知の方法(例えば各信号のレベルを測定する。)によって実現される。
補正量算出部107は、ダブルトーク検出部106によるダブルトーク状態判定結果に基づき、以下の処理を実行するので、場合わけして叙述する。
≪ダブルトーク状態ではないと判定された場合≫
補正量算出部107は、まず、再生信号振幅スペクトル|X ω|のローカルピーク(再生信号振幅スペクトルにおける極大値であり、一般的には複数ある。)のうち、所定の閾値以上の値(振幅スペクトルの大きさであり、一般的にはデシベルdBの単位で表される。)を持つローカルピークを与える周波数を求め、これらの周波数を再生信号ローカルピーク周波数fx(1)、・・・、fx(P)(Pは2以上の整数)として出力する(ステップS5a)。所定の閾値とは、エコー抑圧装置100を使用する環境の雑音などによって異なり、音として認識できる程度の値(例えば、60dB、1000など)とする。この所定の閾値は、予め所定のプログラムに組み込まれて記述されるとしても、あるいは、入力部11によってエコー抑圧装置100に与えられるとしてもよい。
次に、補正量算出部107は、収音信号振幅スペクトル|Yω|のローカルピークのうち、所定の閾値(例えば、60dB、1000など。但し、ステップS5aにおけるのと異なる値であってもよい。)以上の値を持つローカルピークを与える周波数を求め、これらの周波数を収音信号ローカルピーク周波数fy(1)、・・・、fy(Q)(Qは2以上の整数)として出力する(ステップS6a)。なお、ここでの所定の閾値についても、エコー抑圧装置100を使用する環境の雑音などによって異なり、音として認識できる程度の値とする。また、この所定の閾値は、予め所定のプログラムに組み込まれて記述されるとしても、あるいは、入力部11によってエコー抑圧装置100に与えられるとしてもよい。
ステップS5aおよびステップS6aの処理は、処理順序が逆でもよい。
次いで、補正量算出部107は、再生信号ローカルピーク周波数fx(1)、・・・、fx(P)および収音信号ローカルピーク周波数fy(1)、・・・、fy(Q)のうち、例えばfx(p)(ローカルピーク番号pはP以下の自然数)とfy(q)(ローカルピーク番号qはQ以下の自然数)との差が所定の範囲内である(例えばfy(q)−2<fx(p)<fy(q)+2とする。)ときのローカルピーク補正量Lfx(p)を式(2)によって求めて出力する。
Figure 0004478071
勿論、例えばfx(p)−2<fy(q)<fx(p)+2であるときのローカルピーク補正量Lfy(q)を式(3)によって求めてもよい。
Figure 0004478071
ここでrは自然数であり、ローカルピーク補正量のローカルピーク番号を意味する。fl(r)はローカルピーク補正量を求めたときの周波数(以下、「ローカルピーク補正量周波数」という。)である。このようにして全ての再生信号ローカルピーク周波数fx(1)〜fx(P)と収音信号ローカルピーク周波数fy(1)〜fy(Q)とを比較して、全てのローカルピーク補正量を求めて出力する(ステップS7a)。要するに、再生信号振幅スペクトル|X ω|のローカルピークが存在する周波数と収音信号振幅スペクトル|Yω|のローカルピークが存在する周波数とが所定の帯域内に存在する場合にはいずれか一方の周波数を、一致する場合にはそのときの周波数をローカルピーク補正量周波数fl(r)として、このローカルピーク補正量周波数fl(r)におけるローカルピーク補正量Lfl(r)を求めるのである。
なお、上記の所定の範囲は適宜に変更可能であり、上記例示した所定の範囲であるfy(q)−2<fx(p)<fy(q)+2における「−2」「+2」を「前差分量」「後差分量」と呼ぶことにすると、この前差分量と後差分量の絶対値は同じにする必要は無く、例えば、fy(q)−3<fx(p)<fy(q)+1やfy(q)<fx(p)<fy(q)+4のように異なる差分量とすることもできる。そして、前差分量と後差分量は、予め所定のプログラムに組み込まれて記述されるとしても、あるいは、入力部11によってエコー抑圧装置100に与えられるとしてもよい。
次いで、補正量算出部107は、周波数ωとローカルピーク補正量周波数fl(r)との関係がfl(r−1)<ω≦fl(r)となる範囲の暫定補正量zωを、上記ローカルピーク補正量Lfl(r)を用いて、式(4)によって求めて出力する。
Figure 0004478071
このようにして、周波数領域の全ての周波数ωについて各周波数に対応する暫定補正量zωを求めて出力する(ステップS8a)。なお、暫定補正量zωは、例えば上記のようにフレームに対応する周波数領域におけるローカルピークではない周波数成分に近接する周波数成分のローカルピークから求められれば他の方法でもよい。
また、この実施形態では、周波数ωとローカルピーク補正量周波数fl(r)との関係がfl(r−1)<ω≦fl(r)となる範囲の暫定補正量zωを上記の如く求めたが、この関係に限定されるものではない。要は、ローカルピーク補正量周波数fl(r)を含む帯域で暫定補正量zωを求めればよく、例えば、ローカルピーク補正量周波数fl(r−1)、fl(r)、f(r+1)について、μ=(fl(r−1)+fl(r))/2、τ=(fl(r)+fl(r+1))/2とすると、μ<ω≦τとなる周波数範囲の暫定補正量zωを、上記ローカルピーク補正量Lfl(r)を用いて、zω=Lfl(r)としてもよい。
次いで、補正量算出部107は、周波数領域の全ての周波数ωについて各周波数に対応する補正量cωを式(5)によって求めて出力する(ステップS9)。
Figure 0004478071
ここで、ω−1は周波数ωの1つ前の周波数を表し、νは周波数領域において(つまり、周波数軸方向)で平滑化する重み係数(例えば0.4)を表す。重み係数は、予め所定のプログラムに組み込まれて記述されるとしても、あるいは、入力部11によってエコー抑圧装置100に与えられるとしてもよい。
≪ダブルトーク状態ではないと判定された場合≫
補正量算出部107は、ステップS5b〜ステップS8bの処理を実行する。ステップS5b〜ステップS8bの処理は、上記ステップS5a〜ステップS8aと同じ処理である(この実施形態では、ダブルトーク状態判定結果で処理系列が異なることを分かりやすくするため、ステップの表示記号をaとbとに振り分けた)。
なお、ステップS5a〜ステップS8aの処理およびステップS5b〜ステップS8bの処理は、ステップS4の処理の後に実行されるとしなければならないものではない。例えば、ステップS5a〜ステップS8aの処理(ステップS5b〜ステップS8bの処理)をステップS4の処理の前に実行するとしてもよい。
ステップS8bの処理が実行された後、補正量算出部107は、条件A「暫定補正量zωと1つ前のフレームにおける補正量c’ωとの差が予め定めた範囲以内(例えば、0.5・c’ω<zω<2・c’ω)である。」を満たすか否かの判定(以下、「補正量判定」という。)をし、この補正量判定結果を出力する(ステップS10)。なお、短時間フーリエ変換おける各フレームをg、g、・・・、gi−1、g、gi+1、・・・とすると、現在のフレームがgである場合、gi−1が1つ前のフレームである(1フレーム前ともいう。)。また、条件Aにおける所定の範囲は、適宜に変更可能であり、予め所定のプログラムに組み込まれて記述されるとしても、あるいは、入力部11によってエコー抑圧装置100に与えられるとしてもよい。また、条件Aにおいて差を求めるときのフレームは、1つ前のフレームではなく、例えば2つ前のフレームなどとすることでもよいし、あるいは、例えば「1つ前のフレームにおける補正量との差が所定範囲内であり、且つ、2つ前のフレームにおける補正量との差が所定範囲内である」というように複合的条件とすることでもよい。
ここで、上記の範囲を定めるのは、本発明では各チャンネル間の位相差を検出(計算)しないため、2つ以上の音が強めあう場合や弱めあう場合があるが、このような特定の周波数での誤動作、および近端話者(マイクロホン2に対する話者)が話した場合に、話者の音声の周波数成分によって補正量cωが大きくなりすぎたり小さくなりすぎたりすることを防止するためである。
次いで、補正量算出部107は、補正量判定結果が条件Aを満たすと判定されたものである場合、ステップS11の処理を、補正量判定結果が条件Aを満たさないと判定されたものである場合、ステップS12の処理を行う。
即ち、補正量算出部107は、補正量判定結果が条件Aを満たすと判定されたものである場合、1フレーム前に算出された補正量c’ωを用いて、周波数領域の全ての周波数ωについて各周波数に対応する補正量cωを式(6)によって求めて出力する(ステップS11)。
Figure 0004478071
ここで、λは時間軸(つまり、短時間フーリエ変換における各フレームを定める時刻の進行方向)で平滑化する重み係数(例えば0.8)である。なお、過去のフレームにおける補正量が未算出の場合、1フレーム前の補正量c’ωは全ての周波数について例えば1とする。また、ここでの重み係数は、予め所定のプログラムに組み込まれて記述されるとしても、あるいは、入力部11によってエコー抑圧装置100に与えられるとしてもよい。
また、補正量算出部107は、補正量判定結果が条件Aを満たさないと判定されたものである場合、周波数領域の全ての周波数ωについて各周波数に対応する補正量cωを式(7)によって求めて出力する(ステップS12)。
Figure 0004478071
なお、以上では、ダブルトーク検出部106によるダブルトーク状態判定結果に基づいて補正量cωを求めたが、エコー抑圧装置100がダブルトーク検出部106を備えない場合は、上記の暫定補正量zωを補正量cωとして出力すればよい。
次に、エコー振幅スペクトル算出部104は、再生信号振幅スペクトル|X ω|に補正量cωおよび補正係数β(後述する。)を乗じたβ・cω・|X ω|と収音信号振幅スペクトル|Yω|との大小判定を周波数ωごとに行い、式(8)に従って、エコー抑圧信号振幅スペクトル|Eω|を求めて出力する(ステップS14)。
Figure 0004478071
つまり、目的成分選択出力部104は、周波数ωごとにβ・cω・|X ω|と収音信号振幅スペクトル|Yω|との大小判定をし、β・cω・|X ω|<|Yω|が成立しない場合の周波数ωに対する収音信号振幅スペクトル|Yω|の大きさをεにする(大小判定によって選択的に収音信号振幅スペクトル|Yω|が抑圧される。)。この結果、周波数領域の全ての周波数ωについて大小判定がなされて選択的に抑圧された収音信号振幅スペクトル|Yω|が、エコー抑圧信号振幅スペクトル|Eω|として出力される。なお、大小判定は、β・cω・|X ω|≦|Yω|でもよい。
この実施形態では、抑圧された収音信号振幅スペクトル|Yω|の大きさ(抑圧レベル)をεとした。このεは、通常0または0に近い値である。ε=0の場合、エコーは消去されることになる。
補正係数βはcω・|X ω|を実際より小さく推定することによって生じる誤動作を軽減するために予め設定された値であり、この値は1よりやや大きく設定するのがよい(例えば、β=2.5)。なお、βの値は、予め所定のプログラムに組み込まれて設定されるとしても、あるいは、入力部11によってエコー抑圧装置100に与えられるとしてもよい。もちろん、誤動作軽減が必要でなければβ=1(つまり、cω・|X ω|<|Yω|の大小判定をする。)とすればよい。
エコー抑圧信号出力部105は、ステップS14で出力された(周波数領域の全ての周波数ωに対応する)エコー抑圧信号振幅スペクトル|Eω|およびステップS3で出力された収音信号位相スペクトルarg(Yω)から周波数領域における信号を合成し、この信号を時間領域に短時間(離散)逆フーリエ変換して出力信号e(k)を出力する(ステップS15)。
上記の説明では、目的成分選択出力部104が、再生信号振幅スペクトル|X ω|に補正量cωおよび(必要に応じて)補正係数βを乗じたβ・cω・|X ω|(以下、「推定エコー振幅スペクトル」という。)を求めて大小判定をするとしたが、目的成分選択出力部104ではなく、後述するエコー振幅スペクトル算出部103が推定エコー振幅スペクトルを求めて出力するようにしてもよい。このことを図4および図5を参照して説明するが、上記と同じ処理内容のステップには上記各ステップ番号と同一の符号を与え、異なる部分についてのみ説明する。
エコー抑圧装置100の外部記憶装置17には、推定エコー振幅スペクトルを求めるエコー振幅スペクトル算出部103を実現するためのプログラムも保存記憶される。このプログラムは、必要に応じてRAM15に読み込まれて、DSP14で解釈実行・処理される。その結果、DSP14がエコー振幅スペクトル算出部としての機能を実現する。
上記ステップS12に続いて、エコー振幅スペクトル算出部103は、再生信号振幅スペクトル|X ω|および補正量cωから、周波数領域の全ての周波数ωについて各周波数に対応する推定エコー振幅スペクトル|D^ω|を出力する(ステップS13)。
推定エコー振幅スペクトル|D^ω|は式(9)によって求められる。
Figure 0004478071
次に、目的成分選択出力部104は、式(10)に従って、エコー抑圧信号振幅スペクトル|Eω|を周波数ωごとに求めて出力する(ステップS14’)。
Figure 0004478071
ただし、ΔAωは、式(11)で与えられる。
Figure 0004478071
つまり、この変形例における目的成分選択出力部104は、周波数ωごとにΔAωと閾値1/βとの大小判定をし、ΔAω<1/βが成立しない場合の周波数ωに対する収音信号振幅スペクトル|Yω|の大きさをεにする(大小判定によって選択的に収音信号振幅スペクトル|Yω|が抑圧される。)。
<第2の実施形態>
次に、本発明のエコー抑圧装置・方法の第2の実施形態を説明する。
図6は、第2の実施形態における再生信号周波数分析部の処理機能を例示する機能ブロック図である。
図7は、第2の実施形態における再生信号周波数分析部の処理フローを示すフローチャートである。
なお、第2の実施形態に係わるエコー抑圧装置のハードウェア構成例は、第1の実施形態と同様であるから、図1を参照のこと。また、図6に示す第2の実施形態に係わる機能ブロック図のその他の部分については、第1の実施形態と同様であるから、例えば図2を参照のこと。
第1の実施形態では、再生信号振幅スペクトル|X ω|は、加算再生信号(単チャンネル音響再生系の場合は1個の再生信号である。)の振幅スペクトルであるとしたが、再生信号振幅スペクトル|X ω|は、当該振幅スペクトルをエコー経路の残響成分を考慮して平滑化を行った振幅スペクトルとすることもできる。この場合を第2の実施形態として、第1の実施形態と異なる部分について以下に説明する。
エコー抑圧装置100の外部記憶装置17には、N個の再生信号が加算された加算再生信号を周波数領域に変換して再生信号振幅スペクトルを求める再生信号周波数分析部101を実現するためのプログラムに替わり、暫定スペクトル出力部101aを実現するためのプログラムおよびスペクトル平滑化部101bを実現するためのプログラムが記憶保存される。
これらのプログラムは、必要に応じてRAM15に読み込まれて、DSP14で解釈実行・処理される。その結果、DSP14が所定の機能(暫定スペクトル出力部およびスペクトル平滑化部)を実現することになる。
第2の実施形態では、第1の実施形態における再生信号周波数分析部101が、図6に示すように、暫定スペクトル出力部101a、スペクトル平滑化部101bおよびメモリ101cによって置換された機能構成となっている。
まず、暫定スペクトル出力部101aは、加算再生信号x(k)〔単チャンネル音響再生系の場合は1個の再生信号である。〕を入力として(ステップS2a)、この加算再生信号x(k)を所定のフレームで短時間フーリエ変換し、所定の周波数領域における振幅スペクトルを求め、これを暫定再生信号振幅スペクトル|Xω|として出力する(ステップS2b)。
次に、スペクトル平滑化部101bは、上記暫定再生信号振幅スペクトル|Xω|を入力として、再生信号振幅スペクトル|X ω|を出力する(ステップS2c)。このステップS2cにおいて、再生信号振幅スペクトル|X ω|を出力する処理は、次のようにして実行される。
再生信号振幅スペクトル|X ω|は暫定再生信号振幅スペクトル|Xω|にエコー経路の残響成分を考慮させて平滑化を行ったスペクトルであり、式(12)によって算出する。
Figure 0004478071
ここで、|X−’ ω|は1フレーム前に算出された再生信号振幅スペクトルであり、メモリ101cに記憶保存されている。また、ξは、エコー抑圧装置100を使用する場所の残響時間を考慮して暫定再生信号振幅スペクトル|Xω|に1フレーム前の再生信号振幅スペクトル|X−’ ω|を付加する割合を表し、0〜1の範囲(例えば0.7)で値を設定する。このξの値は、予め所定のプログラムに組み込まれて設定されるとしても、あるいは、入力部11によってエコー抑圧装置100に与えられるとしてもよい。
つまり、スペクトル平滑化部101bは、暫定再生信号振幅スペクトル|Xω|の入力を受けると、メモリ101cに記憶保存されている1フレーム前に算出された再生信号振幅スペクトル|X−’ ω|を読み込んで、式(12)に従って再生信号振幅スペクトル|X ω|を求めて、これを出力するのである。なお、再生信号振幅スペクトル|X ω|の初期値は例えば0としておけばよい。
次に、スペクトル平滑化部101bは、ステップS2cで出力した再生信号振幅スペクトル|X ω|をメモリ101cに記憶保存する(ステップS2d)。このステップS2dでメモリ101cに記憶された再生信号振幅スペクトル|X ω|は、次のフレームにおいて、「1フレーム前の再生信号振幅スペクトル|X−’ ω|」として用いられることになる。
<第3の実施形態>
次に、本発明のエコー抑圧装置・方法の第3の実施形態を説明する。
図8は、第3の実施形態に係わるエコー抑圧装置100’におけるエコー抑圧の処理機能を例示する機能ブロック図である。
図9は、第3の実施形態に係わるエコー抑圧装置100’におけるエコー抑圧処理を示すフローチャートである。
なお、第3の実施形態に係わるエコー抑圧装置100’のハードウェア構成例は、第1の実施形態と同様であるから、図1を参照のこと。
第1の実施形態では複数の再生信号x(k)〜x(k)を加算した後に再生信号振幅スペクトル|Xω|を算出したが、第3の実施形態では、各再生信号x(k)〜x(k)の振幅スペクトル(以下、「チャンネル再生信号振幅スペクトル」という。)を算出した後に、周波数成分ωごとにチャンネル再生信号振幅スペクトルを加算する点が異なる。このように先に再生信号ごとのチャンネル再生信号振幅スペクトルを求めることで、チャンネル再生信号振幅スペクトルを算出するための再生信号周波数分析部101〜101(後述する。)の数は多くなるが、各再生信号間の位相差による強めあいや弱めあいの影響を避けることができる。
第1の実施形態と異なる点のみについて、以下に説明する。
エコー抑圧装置100’の外部記憶装置には、N個の再生信号の加算をする総和部4Aを実現するためのプログラムおよび、N個の再生信号が加算された加算再生信号を周波数領域に変換して再生信号振幅スペクトルを求める再生信号周波数分析部101を実現するためのプログラムに替わり、N個の再生信号周波数分析部101〜101を実現するためのプログラムおよび、総和部4Bを実現するためのプログラムが記憶保存される。
これらのプログラムは、必要に応じてRAM15に読み込まれて、DSP14で解釈実行・処理される。その結果、DSP14が所定の機能(再生信号周波数分析部、総和部)を実現することになる。
第3の実施形態では、第1の実施形態における総和部4Aおよび再生信号周波数分析部101が、複数(N個)の再生信号周波数分析部101〜101および総和部4Bによって置換された機能構成となっている(図8参照)。N個の再生信号周波数分析部101〜101それぞれは、再生信号x(k)〜x(k)を所定のフレームで短時間フーリエ変換して、所定の周波数領域におけるチャンネル再生信号振幅スペクトル|X1ω|〜|XNω|を得る(ステップS1’)。なお、N個の再生信号周波数分析部101〜101それぞれの処理機能自体は同じであるから、1つの再生信号周波数分析部が、N回の繰り返し処理によってN個の再生信号x(k)〜x(k)からN個のチャンネル再生信号振幅スペクトル|X1ω|〜|XNω|を得るようにしてもよい。
総和部4Bは、上記チャンネル再生信号振幅スペクトル|X1ω|〜|XNω|を入力として、周波数ωごとにチャンネル再生信号振幅スペクトル|X1ω|〜|XNω|を加算し、再生信号振幅スペクトル|X ω|を式(13)によって求めて出力する(ステップS2’)。残りの処理は、第1の実施形態と同じである。
Figure 0004478071
なお、単チャンネル音響再生系の場合は1個の再生信号であるから、総和部4Bは不要であり、さらには結局のところ第1の実施形態で説明した単チャンネル音響再生系の場合に相当することになるから、説明を省略する。
<第4の実施形態>
次に、本発明のエコー抑圧装置・方法の第4の実施形態を説明する。
図10は、第4の実施形態における総和部の処理機能を例示する機能ブロック図である。
図11は、第4の実施形態における総和部の処理フローを示すフローチャートである。
なお、第4の実施形態に係わるエコー抑圧装置のハードウェア構成例は、第1の実施形態と同様であるから、図1を参照のこと。また、図10に示す第4の実施形態に係わる機能ブロック図のその他の部分については、第3の実施形態と同様であるから、例えば図8を参照のこと。
第3の実施形態では、再生信号振幅スペクトル|X ω|は、チャンネル再生信号振幅スペクトル|X1ω|〜|XNω|が加算された振幅スペクトルであるとしたが、再生信号振幅スペクトル|X ω|は、当該振幅スペクトルをエコー経路の残響成分を考慮して平滑化を行った振幅スペクトルとすることもできる。この場合を第4の実施形態として、第3の実施形態と異なる部分について以下に説明する。
エコー抑圧装置100’の外部記憶装置には、総和部4Bを実現するためのプログラムに替わり、チャンネル加算部4Baを実現するためのプログラムおよび総和スペクトル平滑化部4Bbを実現するためのプログラムが記憶保存される。
これらのプログラムは、必要に応じてRAM15に読み込まれて、DSP14で解釈実行・処理される。その結果、DSP14が所定の機能(チャンネル加算部および総和スペクトル平滑化部)を実現することになる。
第4の実施形態では、第3の実施形態における総和部4Bが、図10に示すように、チャンネル加算部4Ba、総和スペクトル平滑化部4Bbおよびメモリ4Bcによって置換された機能構成となっている。
まず、チャンネル加算部4Baは、各チャンネル再生信号振幅スペクトル|X1ω|〜|XNω|を入力として(ステップS2’a)、この各チャンネル再生信号振幅スペクトル|X1ω|〜|XNω|を周波数ωごとに加算して、これを暫定再生信号振幅スペクトル|Xω|として出力する(ステップS2’b)。
次に、総和スペクトル平滑化部4Bbは、上記暫定再生信号振幅スペクトル|Xω|を入力として、再生信号振幅スペクトル|X ω|を出力する(ステップS2’c)。このステップS2’cにおいて、再生信号振幅スペクトル|X ω|を出力する処理は、次のようにして実行される。
再生信号振幅スペクトル|X ω|は暫定再生信号振幅スペクトル|Xω|にエコー経路の残響成分を考慮させて平滑化を行ったスペクトルであり、式(14)によって算出する。
Figure 0004478071
ここで、|X−’ ω|は1フレーム前に算出された再生信号振幅スペクトルであり、メモリ4Bcに記憶保存されている。また、ξは、第4の実施形態に係わるエコー抑圧装置100’を使用する場所の残響時間を考慮して暫定再生信号振幅スペクトル|Xω|に1フレーム前の再生信号振幅スペクトル|X−’ ω|を付加する割合を表し、0〜1の範囲(例えば0.7)で値を設定する。このξの値は、予め所定のプログラムに組み込まれて設定されるとしても、あるいは、入力部によってエコー抑圧装置100’に与えられるとしてもよい。
つまり、総和スペクトル平滑化部4Bbは、暫定再生信号振幅スペクトル|Xω|の入力を受けると、メモリ4Bcに記憶保存されている1フレーム前に算出された再生信号振幅スペクトル|X−’ ω|を読み込んで、式(14)に従って再生信号振幅スペクトル|X ω|を求めて、これを出力するのである。なお、再生信号振幅スペクトル|X ω|の初期値は例えば0としておけばよい。
次に、総和スペクトル平滑化部4Bbは、ステップS2’cで出力した再生信号振幅スペクトル|X ω|をメモリ4Bcに記憶保存する(ステップS2’d)。このステップS2’dでメモリ4Bcに記憶された再生信号振幅スペクトル|X ω|は、次のフレームにおいて、「1フレーム前の再生信号振幅スペクトル|X−’ ω|」として用いられることになる。
<第5の実施形態>
次に、本発明のエコー抑圧装置・方法の第5の実施形態を説明する。
図12は、第5の実施形態に係わるエコー抑圧装置におけるエコー抑圧の処理機能を例示する機能ブロック図(部分図)である。
図13は、第5の実施形態に係わるエコー抑圧装置におけるエコー抑圧処理を示すフローチャートである。
なお、第5の実施形態に係わるエコー抑圧装置のハードウェア構成例は、第1の実施形態と同様であるから、図1を参照のこと。また、図12に部分図として示す第4の実施形態に係わる機能ブロック図のその他の部分については、第1の実施形態ないし第4の実施形態と同様であるから、例えば図2を参照のこと。
わずかな推定誤差が含まれることによってもミュージカルノイズや近端話者の音がこもるなどの問題が発生する。そこで、第5の実施形態では、このような問題を解決するために、エコー抑圧信号振幅スペクトルに収音信号振幅スペクトルを付加する。この付加の方法は、第1の実施形態から第4の実施形態までのいずれの実施形態と組み合わせることができるが、図13には第1の実施形態と組み合わせた処理フローを示す。
ここでは第1の実施形態と異なる点のみについて、以下に説明する。
第5の実施形態に係わるエコー抑圧装置100の外部記憶装置17には、第1の実施形態において記憶保存されるプログラムなどに加え、第1積算部5Bを実現するためのプログラム、第2積算部5Aを実現するためのプログラム、加算部6を実現するためのプログラムを実現するためのプログラムも保存記憶される。
これらのプログラムは、必要に応じてRAM15に読み込まれて、DSP14で解釈実行・処理される。その結果、DSP14が所定の機能(第1積算部、第2積算部、加算部)を実現することになる。
エコー抑圧装置は、第1の実施形態のエコー抑圧装置100における各処理部(収音信号周波数分析部や補正量算出部など)に加え、第1積算部5B、第2積算部5A、加算部6を備えている(図12参照)。
第2積算部5Aは、収音信号振幅スペクトル|Yω|に(1−α)を積算して出力する(ステップS21)。ここで、αはエコー抑圧信号振幅スペクトル|Eω|と収音信号振幅スペクトル|Yω|との比を予め定める値であり、例えば、α=0.99などの値である。なお、αの値は、予め所定のプログラムに組み込まれて設定されるとしても、あるいは、入力部11によってエコー抑圧装置100に与えられるとしてもよい。
第1積算部5Bは、ステップS14(第1の実施形態を参照のこと。)で出力されたエコー抑圧信号振幅スペクトル|Eω|にαを積算する(ステップS20)。
加算部6は、第2積算部5Aによる出力と第1積算部5Bによる出力とを加算して、これを加算スペクトルとして出力する(ステップS22)。
エコー抑圧信号出力部105は、ステップS22で出力された加算スペクトル|Eω|およびステップS3で出力された収音信号位相スペクトルarg(Yω)から周波数領域における信号を合成し、この信号を時間領域に短時間(離散)逆フーリエ変換して出力信号e(k)を出力する(ステップS15’)。
以上の他の処理は、第1の実施形態〜第4の実施形態と同じである。
<第6の実施形態>
次に、本発明のエコー抑圧装置・方法の第6の実施形態を説明する。
図14は、第6の実施形態に係わる目的成分選択出力部における処理フローを示すフローチャートである。
なお、第6の実施形態に係わるエコー抑圧装置のハードウェア構成例は、第1の実施形態と同様であるから、図1を参照のこと。
上記各実施形態における目的成分選択出力部104において、cω・|X ω|の誤推定によって目的成分選択誤差が生じ、ミュージカルノイズが発生する場合がある。第6の実施形態は、数フレーム前までの特徴量を用いて突発的な音響変化をミュージカルノイズとして抑圧する実施形態である。このミュージカルノイズ抑圧方法は、第1の実施形態から第5の実施形態までのいずれの実施形態とも組み合わせることができる。
ここでは第1の実施形態と異なる点のみについて、以下に説明する。
以下においては、周波数領域における周波数ωがω=1,2,・・・,Ωであるとして説明する。
まず、目的成分選択出力部104は、ω=1の場合について(ステップS30)、第1の実施形態で説明したβ・cω・|X ω|と収音信号振幅スペクトル|Yω|との大小判定をする(ステップS31)。
ステップS31の大小判定結果が「β・cω・|X ω|<|Yω|が成立しない」という場合には、目的成分選択出力部104は、このときの周波数(ω=1)における収音信号振幅スペクトルの大きさをεにして抑圧する(式(15)参照)(ステップS32)。
ステップS31の大小判定結果が「β・cω・|X ω|<|Yω|が成立する」という場合には、目的成分選択出力部104は、このときの周波数(ω=1)における収音信号振幅スペクトルは抑圧せず(式(15)参照)、周波数ごとの指標fgωに所定の値を設定する(ステップS33)。
Figure 0004478071
この実施形態では、所定の値を一律に1とする(式(16)参照)。また、全ての周波数に対する指標fgωの初期値を一律0としておく。なお、指標fgωに設定する所定の値は、論理判断の処理を行うときの「目印」としての役割を担うにすぎないものであるから、いかなる値でもよいし、特定の1つの値に固定されるものではない。例えば、全ての周波数に対する指標fgωの初期値を一律0としたならば、設定する値を0以外の値とすることもできる。さらには、いわゆる数字に限定されず、コンピュータにおいて論理判断の処理が可能なものであればアルファベットでもよい(例えば、文字列を変数として論理判断の処理を実行するようにプログラムを記述すればよい。)。
Figure 0004478071
次に、目的成分選択出力部104は、周波数ωが周波数領域の上限周波数Ωであるか否かを判定する(ステップS34)。この判定結果が「偽」である場合には、目的成分選択出力部104は、周波数ωに1を加え(ステップS35)、ステップS31〜ステップS34の処理を繰り返す。この段階では周波数ω=1なので、この周波数ωに1を加えた次の周波数ω=2について、ステップS31〜ステップS34の処理を繰り返す。こうして、ステップS34における判定結果が「真」となった場合には、周波数領域の各周波数について選択的に抑圧された収音信号振幅スペクトル|Yω|(以下、「候補スペクトル|Jω|」という。)が得られたことになり(ステップS36)、また、収音信号振幅スペクトル|Yω|が抑圧されなかったときの全ての周波数について指標fgωに1が設定されたことになる。
続いて、目的成分選択出力部104は、周波数領域の各周波数について、下記の3つの条件を満たすか否かを判定する。各条件の判定結果が「偽」の場合には、このときの周波数に対する候補スペクトル|Jω|の大きさを抑圧する。
条件1:「指標fgω=1である。」
条件2:「1フレーム前の指標fg(1) ω=1、もしくは指標fg(1) ω−1=1、も
しくは指標fg(1) ω+1=1である。」
条件3:「2フレーム前の指標fg(2) ω=1、もしくは指標fg(2) ω−1=1、も
しくは指標fg(2) ω+1=1である。」
(なお、条件2および条件3の「もしくは」は論理和の判定である。)
ここで、各条件における指標fg(Z) ωは、Zフレーム前の指標を表す。また、各条件における指標fg(Z) ω−1は周波数ω−1におけるZフレーム前の指標を、指標fg(Z) ω+1は周波数ω+1におけるZフレーム前の指標を表す。
また、ここでの条件の個数は2フレーム前までの3つであるとしたが、2フレーム前までに限定するものではなく、より一般的にF(≧1)フレーム前までと拡張する(条件数はF+1個)ことが可能である。また、上記の各条件では、周波数ωの両隣の周波数ω−1、周波数ω+1についてもその指標に設定される値について判定しているが、このように両隣の周波数における指標についても判定することに限定されるものではない。例えば、両隣を越えて広く周波数ω−i、周波数ω−i+1、・・・、周波数ω+j−1、周波数ω+jまでの範囲で各周波数における指標に設定される値ついて判定するとしてもよい(ここでのi、jは、整数とし、i=jでも、i≠jでもよい。)。さらに、周波数ωを跨ぐ範囲にも限らず、例えば、周波数ω−i、周波数ω−i+1、・・・、周波数ω−1、周波数ωまでの範囲で各周波数における指標に設定される値ついて判定するとしてもよい。
つまり、目的成分選択出力部104は、まずω=1の場合について(ステップS37)、条件1の判定をする(ステップS38)。この条件1の判定結果が「偽」の場合は、目的成分選択出力部104は、このときの周波数に対する候補スペクトル|Jω|の大きさをεにして抑圧する(ステップS41)。
ステップS38における判定結果が「真」の場合は、目的成分選択出力部104は、条件2の判定をする(ステップS39)。この条件2の判定結果が「偽」の場合は、目的成分選択出力部104は、このときの周波数に対する候補スペクトル|Jω|の大きさをεにして抑圧する(ステップS41)。
ステップS39における判定結果が「真」の場合は、目的成分選択出力部104は、条件3の判定をする(ステップS40)。この条件3の判定結果が「偽」の場合は、目的成分選択出力部104は、このときの周波数に対する候補スペクトル|Jω|の大きさをεにして抑圧する(ステップS41)。
ステップS40における判定結果が「真」の場合、あるいは、ステップS41の処理の実行後は、目的成分選択出力部104は、周波数ωが周波数領域の上限周波数Ωであるか否かを判定する(ステップS42)。この判定結果が「偽」である場合には、目的成分選択出力部104は、周波数ωに1を加え(ステップS43)、ステップS38〜ステップS42の処理を繰り返す。この段階では周波数ω=1なので、この周波数ωに1を加えた次の周波数ω=2について、ステップS38〜ステップS42の処理を繰り返す。こうして、ステップS42における判定結果が「真」となった場合には、周波数領域の各周波数について選択的に抑圧された候補スペクトル|Jω|が得られたことになり、このときの候補スペクトルが、目的成分選択出力部104の出力するエコー抑圧信号振幅スペクトル|Eω|になる(ステップS44)。
なお、上記の説明では、目的成分選択出力部104は、ステップS38における判定結果が「偽」の場合にステップS41の処理を実行すると説明した。しかし、この実施形態では、指標fgωに設定する所定の値を一律に1とし、全ての周波数に対する指標fgωの初期値を一律0としたのであるから、ステップS38の条件1の判定において判定結果が指標fgω=1ではない場合、このときの周波数に対する候補スペクトル|Jω|の大きさはステップS32において既にεに抑圧されたものとなっており、ステップS41の処理は冗長と言える。そこで、このような場合には、ステップS41の処理を実行せず、ステップS42の処理を実行するとしてもよい。
さらに、上記の説明では、まず、周波数領域の各周波数について候補スペクトル|Jω|を求めるとともに指標fgωの値を設定し、次いで、周波数領域の各周波数について条件1〜3の判定をして選択的に候補スペクトル|Jω|を抑圧すると説明したが、周波数領域の周波数ごとに、各種の判定を行って選択的に収音信号振幅スペクトルを抑圧してエコー抑圧信号振幅スペクトル|Eω|を得ることもできる。このことを図15を参照して説明するが、上記と同じ処理内容のステップには上記各ステップ番号と同一の符号を与え、異なる部分についてのみ説明する。
目的成分選択出力部104は、ステップS32の処理を実行すると、ステップS34ではなく、ステップS35の処理を実行する。また、目的成分選択出力部104は、ステップS33の処理を実行すると、ステップS34の処理ではなく、ステップS39の処理を実行する(ステップS38の処理は省略できる。)。目的成分選択出力部104は、ステップS39およびステップS40の判定結果が「偽」の場合、ステップS41ではなく、ステップS50の処理を実行する。ステップS50の処理の内容はステップS32と同じである。目的成分選択出力部104は、ステップS40の判定結果が「真」の場合、ステップS34(ステップS42と処理内容は同じ)の処理を実行する。このステップS34の判定結果が「偽」の場合、目的成分選択出力部104は、ステップS35の処理を実行する。ステップS34の判定結果が「真」の場合には、選択的に抑圧された収音信号振幅スペクトル|Eω|が出力されたことになる。
<第7の実施形態>
第7の実施形態は、上述した振幅スペクトルの抑圧レベルεが0の場合、エコー抑圧信号出力部105において、この抑圧レベルε=0で抑圧された周波数におけるエコー抑圧信号振幅スペクトル(大きさはε=0である。)と収音信号周波数分析部102によって出力された収音信号位相スペクトルarg(Yω)とを合成しても0になることを考慮したものである。
ここでは第1の実施形態を例にとって、第7の実施形態を説明する。図16は、第7の実施形態に係わるエコー抑圧装置におけるエコー抑圧の処理機能を例示する図である。また、第1の実施形態と異なる部分についてのみ説明をする。
第7の実施形態では、第1の実施形態に周波数領域変換部102aが付加された機能構成となっている。
周波数領域変換部102aは、収音信号y(k)を入力として、この収音信号y(k)を所定のフレームで所定の周波数領域に短時間フーリエ変換した周波数領域収音信号Yωを出力する。収音信号周波数分析部102は、周波数領域収音信号Yωを入力として、この周波数領域収音信号Yωの振幅スペクトル|Yω|を出力する。目的成分選択出力部104は、式(8)ではなく、式(17)に従って、周波数領域エコー抑圧信号Eωを周波数ωごとに求めて出力する。
Figure 0004478071
つまり、目的成分選択出力部104は、周波数ωごとにβ・cω・|X ω|と収音信号振幅スペクトル|Yω|との大小判定との大小判定をし、β・cω・|X ω|<|Yω|が成立しない場合の周波数ωに対する周波数領域収音信号Yωを0にする(大小判定によって選択的に周波数領域収音信号Yωが抑圧される。)。なお、周波数領域収音信号Yωは複素数で与えられるので、実数部と虚数部の値をともに0にすればよい。この結果、周波数領域の全ての周波数ωについて大小判定がなされて選択的に抑圧された周波数領域収音信号Yωが、周波数領域エコー抑圧信号Eωとして出力される。
エコー抑圧信号出力部105は、上記周波数領域エコー抑圧信号Eωを時間領域に短時間(離散)逆フーリエ変換して出力信号e(k)を出力する。
以上の各実施形態の他、本発明であるエコー抑圧装置・方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記エコー抑圧装置・方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。さらに、上記説明の式(5)、式(6)、式(12)、式(14)で示した補正量や振幅スペクトルの平滑化も、各式に基づく平滑化に限定する趣旨のものではなく、適宜に他の平滑化手法によることが可能である。
また、上記エコー抑圧装置における処理機能をコンピュータによって実現する場合、エコー抑圧装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記エコー抑圧装置における処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、エコー抑圧装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本発明者らは、本発明のエコー抑圧装置・方法の検証実験を行った。実験では、第4の実施形態に第5の実施形態と第6の実施形態を適用したエコー抑圧装置を用いて従来法との違いを確認した。なお、サンプリング周波数は16kHzとし、残響時間200msの部屋で実測したインパルス応答を2048点で打ち切って与えた。本発明のエコー抑圧装置では、周波数分析点数を512点と設定した。なお、適応フィルタはステップサイズ0.5、タップ数2048の学習アルゴリズムとした。送話音声存在区間は既知とし、適応フィルタでは、送話音声存在区間で適応を停止させた。図17(a)〜(d)に各信号の時間波形を示す。図17(a)はエコー信号を、図17(b)は送話(収音)信号を、図17(c)は適応フィルタによるエコー抑圧信号を、図17(d)は本発明のエコー抑圧方法によるエコー抑圧信号を示している。区間Aは受話シングルトーク状態、区間Bは送話シングルトーク状態、区間Cはダブルトーク状態、区間Dはステレオ信号の相関による適応フィルタの誤収束の影響を確認するために左右の再生信号を入れ換えた受話シングルトーク状態である。なお、再生信号を入れ換えた際に音響結合量が急激に大きくなるような信号とインパルス応答の組合せを用いた。図17(a)〜(d)から、区間Aにおいて、適応フィルタではエコーの消し残りが区間の初期に多い事が分かる。これに対し、本発明によるエコー抑圧方法ではエコーを瞬時に抑圧できることを確認した。区間Bでは、出力信号の波形が送話信号の波形とほぼ同じであり、送話音声に悪影響がないことを確認できる。区間Cでは、本発明のエコー抑圧方法は送話信号の波形をほぼ復元していることが分かる。また、内観聴取からミュージカルノイズがほとんど無いことも確認した。区間Dでは、適応フィルタの場合、エコー経路の変動や急激な音響結合量の変化によってエコーの消し残りが増えることが分かる。これに対し、本発明のエコー抑圧方法では瞬時にエコーを抑圧し、エコー経路の変動及び音響結合量の急激な変化に頑健であることを確認した。このように、本発明のエコー抑圧方法を用いる事で、使用する部屋の環境の変化などにも即応でき、送話音声パワーを保持したままでエコーを瞬時に抑圧できることが分かった。
本発明は、ハンズフリー通話、ハンズフリー音声認識などへの適用が可能である。
第1の実施形態に係わるエコー抑圧装置100のハードウェア構成を例示した構成ブロック図。 第1の実施形態に係わるエコー抑圧装置100におけるエコー抑圧の処理機能を例示する機能ブロック図。 第1の実施形態に係わるエコー抑圧装置100におけるエコー抑圧処理を示すフローチャート。 第1の実施形態の変形例に係わるエコー抑圧装置におけるエコー抑圧の処理機能を例示する機能ブロック図。 第1の実施形態の変形例に係わるエコー抑圧装置におけるエコー抑圧処理を示すフローチャート。 第2の実施形態における再生信号周波数分析部の処理機能を例示する機能ブロック図。 第2の実施形態における再生信号周波数分析部の処理フローを示すフローチャート。 第3の実施形態に係わるエコー抑圧装置100’におけるエコー抑圧の処理機能を例示する機能ブロック図。 第3の実施形態に係わるエコー抑圧装置100’におけるエコー抑圧処理を示すフローチャート。 第4の実施形態における総和部の処理機能を例示する機能ブロック図。 第4の実施形態における総和部の処理フローを示すフローチャート。 第5の実施形態に係わるエコー抑圧装置におけるエコー抑圧の処理機能を例示する機能ブロック図(部分図)。 第5の実施形態に係わるエコー抑圧装置におけるエコー抑圧処理を示すフローチャート。 第6の実施形態に係わる目的成分選択出力部における処理フローを示すフローチャート。 第6の実施形態に係わる目的成分選択出力部における処理フローの変形例を示すフローチャート(図14)。 第7の実施形態に係わるエコー抑圧装置におけるエコー抑圧の処理機能を例示する図。 (a)は、検証実験におけるエコー信号の時間波形。(b)は、検証実験における送話信号の時間波形。(c)は、検証実験における適応フィルタによるエコー抑圧信号の時間波形。(d)は、検証実験における本発明のエコー抑圧方法によるエコー信号の時間波形。 従来の多チャンネルエコー抑圧装置の処理機能を例示する機能ブロック図。
符号の説明
4A 総和部
101 再生信号周波数分析部
102 収音信号周波数分析部
104 目的成分選択出力部
105 エコー抑圧信号出力部
106 ダブルトーク検出部
107 補正量算出部

Claims (18)

  1. 入力された再生信号を所定の時間長(以下、「フレーム」という。)で周波数領域に変換して、再生信号の振幅スペクトル(以下、「再生信号振幅スペクトル」という。)を出力する再生信号周波数分析手段と、
    入力された収音信号を所定のフレームで周波数領域に変換して、収音信号の振幅スペクトル(以下、「収音信号振幅スペクトル」という。)および位相スペクトル(以下、「収音信号位相スペクトル」という。)を出力する収音信号周波数分析手段と、
    前記再生信号振幅スペクトルおよび前記収音信号振幅スペクトルから、再生信号振幅スペクトルのローカルピークにおける周波数と収音信号振幅スペクトルのローカルピークにおける周波数との差が所定の範囲内であるときの振幅比をそれぞれ求め、この各振幅比を、それぞれの振幅比が求められたときの周波数を含む周波数帯域の各周波数に対応する補正量として出力する補正量算出手段と、
    前記再生信号振幅スペクトルを補正量算出手段によって出力された補正量で補正して、この補正された再生信号振幅スペクトルと前記収音信号振幅スペクトルとの大小判定を周波数領域の各周波数について行い、補正された再生信号振幅スペクトルが収音信号振幅スペクトルよりも大きいと判定されたときの周波数に対する収音信号振幅スペクトルの大きさを抑圧した収音信号振幅スペクトル(以下、「エコー抑圧信号振幅スペクトル」という。)を出力する目的成分選択出力手段と、
    前記エコー抑圧信号振幅スペクトルおよび収音信号周波数分析手段によって出力された収音信号位相スペクトルから周波数領域における信号を合成し、当該信号を時間領域に変換して出力信号を出力するエコー抑圧信号出力手段と
    を備えたことを特徴とするエコー抑圧装置。
  2. 入力された複数チャンネルの再生信号を加算し、加算再生信号を出力する総和手段
    を備え、
    再生信号周波数分析手段は、
    総和手段によって出力された加算再生信号を所定の時間長で周波数領域に変換して、加算再生信号の振幅スペクトルを再生信号振幅スペクトルとして出力するものである
    ことを特徴とする請求項1に記載のエコー抑圧装置。
  3. 再生信号周波数分析手段は、
    入力された再生信号/総和手段によって出力された加算再生信号を所定の時間長(以下、「フレーム」という。)で周波数領域に変換して、再生信号/加算再生信号の振幅スペクトル(以下、「暫定再生信号振幅スペクトル」という。)を出力する暫定スペクトル出力手段と、
    上記再生信号振幅スペクトルを出力するスペクトル平滑化手段と、
    スペクトル平滑化手段によって出力された再生信号振幅スペクトルを記憶する記憶手段と
    から構成され、
    上記スペクトル平滑化手段は、
    暫定スペクトル出力手段によって出力された暫定再生信号振幅スペクトルを、記憶手段に記憶される過去のフレームにおける再生信号振幅スペクトルに基づいて平滑化したものを、再生信号振幅スペクトルとして出力するものである
    ことを特徴とする請求項1または請求項2に記載のエコー抑圧装置。
  4. 再生信号周波数分析手段は、
    入力された複数チャンネルの再生信号をチャンネルごとに所定の時間長で周波数領域に変換して、各再生信号の振幅スペクトル(以下、「チャンネル再生信号振幅スペクトル」という。)を出力するものであり
    記再生信号周波数分析手段によって出力された再生信号ごとのチャンネル再生信号振幅スペクトルを加算したものを、再生信号振幅スペクトルとして出力する総和手段をさらに備える
    ことを特徴とする請求項に記載のエコー抑圧装置。
  5. 総和手段は、
    上記再生信号周波数分析手段によって出力された再生信号ごとのチャンネル再生信号振幅スペクトルを加算して暫定再生信号振幅スペクトルを出力するチャンネル加算手段と、
    生信号振幅スペクトルを出力する総和スペクトル平滑化手段と、
    前記総和スペクトル平滑化手段によって出力された再生信号振幅スペクトルを記憶する格納手段と
    から構成され、
    上記総和スペクトル平滑化手段は、
    チャンネル加算手段によって出力された暫定再生信号振幅スペクトルを、格納手段に記憶される過去のフレームにおける再生信号振幅スペクトルに基づいて平滑化したものを、再生信号振幅スペクトルとして出力するものである
    ことを特徴とする請求項4に記載のエコー抑圧装置。
  6. 各再生信号および収音信号からダブルトーク状態であるか否かを判定するダブルトーク検出手段を備え、
    補正量算出手段は、
    再生信号周波数分析手段によって出力された再生信号振幅スペクトルおよび収音信号周波数分析手段によって出力された収音信号振幅スペクトルから、再生信号振幅スペクトルのローカルピークにおける周波数と収音信号振幅スペクトルのローカルピークにおける周波数との差が所定の範囲内であるときの振幅比をそれぞれ求め、この各振幅比を、それぞれの振幅比が求められたときの周波数を含む周波数帯域の各周波数に対応する暫定補正量とし、
    ダブルトーク検出手段によってダブルトーク状態ではないと判定された場合には、各暫定補正量を周波数領域において平滑化したものを、周波数領域の各周波数に対応する補正量として出力し、
    ダブルトーク検出手段によってダブルトーク状態であると判定された場合には、周波数領域の各周波数について、
    暫定補正量と過去のフレームにおける補正量との差が所定の範囲内であるか否かを判定し(以下、「補正量判定」という。)、
    補正量判定に合格した場合には、暫定補正量を過去のフレームにおける補正量に基づいて平滑化したものを、当該周波数に対応する補正量として出力し、
    補正量判定に合格しなかった場合には、過去のフレームにおける補正量と同じ補正量を、当該周波数に対応する補正量として出力するものである
    ことを特徴とする請求項1ないし請求項5のいずれかに記載のエコー抑圧装置。
  7. 目的成分選択出力手段によって出力されたエコー抑圧信号振幅スペクトルに所定の係数を乗じて出力する第1積算手段と、
    収音信号周波数分析手段によって出力された収音信号振幅スペクトルに所定の係数を乗じて出力する第2積算手段と、
    第1積算手段による出力と第2積算手段による出力とを加算した加算振幅スペクトルを出力する加算手段と
    を備え、
    エコー抑圧信号出力手段は、
    加算手段によって出力された加算振幅スペクトルおよび収音信号周波数分析手段によって出力された収音信号位相スペクトルから周波数領域における信号を合成し、当該信号を時間領域に変換して出力信号を出力するものである
    ことを特徴とする請求項1ないし請求項6のいずれかに記載のエコー抑圧装置。
  8. 目的成分選択出力手段は、
    再生信号周波数分析手段によって出力された再生信号振幅スペクトルを補正量算出手段によって出力された補正量で補正して、この補正された再生信号振幅スペクトルと収音信号周波数分析手段によって出力された収音信号振幅スペクトルとの大小判定(以下、「閾値判定」という。)を周波数領域の各周波数について行い、
    閾値判定において補正された再生信号振幅スペクトルが収音信号振幅スペクトルよりも大きくないと判定されたときの周波数に対する指標に所定の値(以下、「フラグ値」という。)を設定するとともに、閾値判定において補正された再生信号振幅スペクトルが収音信号振幅スペクトルよりも大きいと判定されたときの周波数に対する収音信号振幅スペクトルの大きさを抑圧した収音信号振幅スペクトルを候補スペクトルとし、
    指標にフラグ値が設定された周波数(以下、「フラグ周波数」という。)について、S個の過去のフレームに対する周波数領域R(但し、R=1,2,・・・,とし、は1以上の整数とする。)におけるフラグ周波数またはフラグ周波数を含む所定帯域の各周波数に対する指標にフラグ値が設定されているか否かを判定し(以下、「フラグ判定」という。)、フラグ判定においてフラグ値が設定されていないと判定された場合があるときのフラグ周波数に対する候補スペクトルの大きさを抑圧した候補スペクトルをエコー抑圧信号振幅スペクトルとして出力するものである
    ことを特徴とする請求項1ないし請求項7のいずれかに記載のエコー抑圧装置。
  9. エコー抑圧装置の再生信号周波数分析手段が、エコー抑圧装置に入力された再生信号を所定の時間長(以下、「フレーム」という。)で周波数領域に変換して、再生信号の振幅スペクトル(以下、「再生信号振幅スペクトル」という。)を出力する再生信号周波数分析ステップと、
    エコー抑圧装置の収音信号周波数分析手段が、エコー抑圧装置に入力された収音信号を所定のフレームで周波数領域に変換して、収音信号の振幅スペクトル(以下、「収音信号振幅スペクトル」という。)および位相スペクトル(以下、「収音信号位相スペクトル」という。)を出力する収音信号周波数分析ステップと、
    エコー抑圧装置の補正量算出手段が、前記再生信号振幅スペクトルおよび前記収音信号振幅スペクトルから、再生信号振幅スペクトルのローカルピークにおける周波数と収音信号振幅スペクトルのローカルピークにおける周波数との差が所定の範囲内であるときの振幅比をそれぞれ求め、この各振幅比を、それぞれの振幅比が求められたときの周波数を含む周波数帯域の各周波数に対応する補正量として出力する補正量算出ステップと、
    エコー抑圧装置の目的成分選択出力手段が、前記再生信号振幅スペクトルを補正量算出ステップにおいて出力された補正量で補正して、この補正された再生信号振幅スペクトルと前記収音信号振幅スペクトルとの大小判定を周波数領域の各周波数について行い、補正された再生信号振幅スペクトルが収音信号振幅スペクトルよりも大きいと判定されたときの周波数に対する収音信号振幅スペクトルの大きさを抑圧した収音信号振幅スペクトル(以下、「エコー抑圧信号振幅スペクトル」という。)を出力する目的成分選択出力ステップと、
    エコー抑圧装置のエコー抑圧信号出力手段が、前記エコー抑圧信号振幅スペクトルおよび収音信号周波数分析ステップにおいて出力された収音信号位相スペクトルから周波数領域における信号を合成し、当該信号を時間領域に変換して出力信号を出力するエコー抑圧信号出力ステップと
    を有することを特徴とするエコー抑圧方法。
  10. エコー抑圧装置の総和手段が、エコー抑圧装置に入力された複数チャンネルの再生信号を加算し、加算再生信号を出力する総和ステップ
    を有し、
    再生信号周波数分析ステップは、
    総和ステップにおいて出力された加算再生信号を所定の時間長で周波数領域に変換して、加算再生信号の振幅スペクトルを再生信号振幅スペクトルとして出力するものである
    ことを特徴とする請求項9に記載のエコー抑圧方法。
  11. 再生信号周波数分析ステップは、
    エコー抑圧装置のスペクトル平滑化手段が、エコー抑圧装置に入力された再生信号/総和ステップにおいて出力された加算再生信号を所定の時間長(以下、「フレーム」という。)で周波数領域に変換して、再生信号/加算再生信号の振幅スペクトル(以下、「暫定再生信号振幅スペクトル」という。)を出力する暫定スペクトル出力ステップと、
    エコー抑圧装置のスペクトル平滑化手段が、上記再生信号振幅スペクトルを出力するスペクトル平滑化ステップと、
    エコー抑圧装置の記憶手段が、スペクトル平滑化ステップにおいて出力された再生信号振幅スペクトルを記憶する記憶ステップと
    からなり、
    上記スペクトル平滑化ステップは、
    暫定スペクトル出力ステップにおいて出力された暫定再生信号振幅スペクトルを、記憶手段に記憶される過去のフレームにおける再生信号振幅スペクトルに基づいて平滑化したものを、再生信号振幅スペクトルとして出力するものである
    ことを特徴とする請求項9または請求項10に記載のエコー抑圧方法。
  12. 再生信号周波数分析ステップは、
    エコー抑圧装置の再生信号周波数分析手段が、エコー抑圧装置に入力された複数チャンネルの再生信号をチャンネルごとに所定の時間長で周波数領域に変換して、各再生信号の振幅スペクトル(以下、「チャンネル再生信号振幅スペクトル」という。)を出力するものであり
    記再生信号周波数分析ステップにおいて出力された再生信号ごとのチャンネル再生信号振幅スペクトルを加算したものを、再生信号振幅スペクトルとして出力する総和ステップをさらに有する
    ことを特徴とする請求項に記載のエコー抑圧方法。
  13. 総和ステップは、
    エコー抑圧装置のチャンネル加算手段が、上記再生信号周波数分析ステップにおいて出力された再生信号ごとのチャンネル再生信号振幅スペクトルを加算して暫定再生信号振幅スペクトルを出力するチャンネル加算ステップと、
    エコー抑圧装置の総和スペクトル平滑化手段が、再生信号振幅スペクトルを出力する総和スペクトル平滑化ステップと、
    エコー抑圧装置の格納手段が、前記総和スペクトル平滑化ステップにおいて出力された再生信号振幅スペクトルを記憶する格納ステップと
    からなり、
    上記総和スペクトル平滑化ステップは、
    チャンネル加算ステップにおいて出力された暫定再生信号振幅スペクトルを、格納手段に記憶される過去のフレームにおける再生信号振幅スペクトルに基づいて平滑化したものを、再生信号振幅スペクトルとして出力するものである
    ことを特徴とする請求項12に記載のエコー抑圧方法。
  14. エコー抑圧装置のダブルトーク検出手段が、各再生信号および収音信号からダブルトーク状態であるか否かを判定するダブルトーク検出ステップを有し、
    補正量算出ステップは、
    再生信号周波数分析ステップにおいて出力された再生信号振幅スペクトルおよび収音信号周波数分析ステップにおいて出力された収音信号振幅スペクトルから、再生信号振幅スペクトルのローカルピークにおける周波数と収音信号振幅スペクトルのローカルピークにおける周波数との差が所定の範囲内であるときの振幅比をそれぞれ求め、この各振幅比を、それぞれの振幅比が求められたときの周波数を含む周波数帯域の各周波数に対応する暫定補正量とし、
    ダブルトーク検出ステップにおいてダブルトーク状態ではないと判定された場合には、各暫定補正量を周波数領域において平滑化したものを、周波数領域の各周波数に対応する補正量として出力し、
    ダブルトーク検出ステップにおいてダブルトーク状態であると判定された場合には、周波数領域の各周波数について、
    暫定補正量と過去のフレームにおける補正量との差が所定の範囲内であるか否かを判定し(以下、「補正量判定」という。)、
    補正量判定に合格した場合には、暫定補正量を過去のフレームにおける補正量に基づいて平滑化したものを、当該周波数に対応する補正量として出力し、
    補正量判定に合格しなかった場合には、過去のフレームにおける補正量と同じ補正量を、当該周波数に対応する補正量として出力するものである
    ことを特徴とする請求項9ないし請求項13のいずれかに記載のエコー抑圧方法。
  15. エコー抑圧装置の第1積算手段が、目的成分選択出力ステップにおいて出力されたエコー抑圧信号振幅スペクトルに所定の係数を乗じて出力する第1積算ステップと、
    エコー抑圧装置の第2積算手段が、収音信号周波数分析ステップにおいて出力された収音信号振幅スペクトルに所定の係数を乗じて出力する第2積算ステップと、
    エコー抑圧装置の加算手段が、第1積算ステップにおける出力と第2積算ステップにおける出力とを加算した加算振幅スペクトルを出力する加算ステップと
    を有し、
    エコー抑圧信号出力ステップは、
    加算ステップにおいて出力された加算振幅スペクトルおよび収音信号周波数分析ステップにおいて出力された収音信号位相スペクトルから周波数領域における信号を合成し、当該信号を時間領域に変換して出力信号を出力するものである
    ことを特徴とする請求項9ないし請求項14のいずれかに記載のエコー抑圧方法。
  16. 目的成分選択出力ステップは、
    再生信号周波数分析ステップにおいて出力された再生信号振幅スペクトルを補正量算出ステップにおいて出力された補正量で補正して、この補正された再生信号振幅スペクトルと収音信号周波数分析ステップにおいて出力された収音信号振幅スペクトルとの大小判定(以下、「閾値判定」という。)を周波数領域の各周波数について行い、
    閾値判定において補正された再生信号振幅スペクトルが収音信号振幅スペクトルよりも大きくないと判定されたときの周波数に対する指標に所定の値(以下、「フラグ値」という。)を設定するとともに、閾値判定において補正された再生信号振幅スペクトルが収音信号振幅スペクトルよりも大きいと判定されたときの周波数に対する収音信号振幅スペクトルの大きさを抑圧した収音信号振幅スペクトルを候補スペクトルとし、
    指標にフラグ値が設定された周波数(以下、「フラグ周波数」という。)について、S個の過去のフレームに対する周波数領域R(但し、R=1,2,・・・,とし、は1以上の整数とする。)におけるフラグ周波数またはフラグ周波数を含む所定帯域の各周波数に対する指標にフラグ値が設定されているか否かを判定し(以下、「フラグ判定」という。)、フラグ判定においてフラグ値が設定されていないと判定された場合があるときのフラグ周波数に対する候補スペクトルの大きさを抑圧した候補スペクトルをエコー抑圧信号振幅スペクトルとして出力するものである
    ことを特徴とする請求項9ないし請求項15のいずれかに記載のエコー抑圧方法。
  17. 請求項1から請求項8のいずれかに記載されたエコー抑圧装置としてコンピュータを機能させるためのエコー抑圧プログラム。
  18. 請求項17に記載のエコー抑圧プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005164332A 2005-06-03 2005-06-03 エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体 Expired - Fee Related JP4478071B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005164332A JP4478071B2 (ja) 2005-06-03 2005-06-03 エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005164332A JP4478071B2 (ja) 2005-06-03 2005-06-03 エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体

Publications (2)

Publication Number Publication Date
JP2006340189A JP2006340189A (ja) 2006-12-14
JP4478071B2 true JP4478071B2 (ja) 2010-06-09

Family

ID=37560312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005164332A Expired - Fee Related JP4478071B2 (ja) 2005-06-03 2005-06-03 エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体

Country Status (1)

Country Link
JP (1) JP4478071B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5160113B2 (ja) * 2007-03-22 2013-03-13 株式会社日立メディコ 磁気共鳴イメージング装置

Also Published As

Publication number Publication date
JP2006340189A (ja) 2006-12-14

Similar Documents

Publication Publication Date Title
JP4973873B2 (ja) 残響抑圧の方法、装置及び残響抑圧用プログラム
US6377637B1 (en) Sub-band exponential smoothing noise canceling system
JP5435204B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP5791092B2 (ja) 雑音抑圧の方法、装置、及びプログラム
US11587575B2 (en) Hybrid noise suppression
US8244547B2 (en) Signal bandwidth extension apparatus
WO2009110578A1 (ja) 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体
CN104637491A (zh) 用于内部mmse计算的基于外部估计的snr的修改器
JP2011166484A (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体
Van Waterschoot et al. Adaptive feedback cancellation for audio applications
EP2579255B1 (en) Audio signal processing
JP5016581B2 (ja) エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラム、記録媒体
JP4757775B2 (ja) 雑音抑圧装置
JP5161157B2 (ja) 周波数領域エコー除去装置、周波数領域エコー除去方法、プログラム
US20140249809A1 (en) Audio signal noise attenuation
JP4478071B2 (ja) エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラムおよびその記録媒体
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP5889224B2 (ja) エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム
JP6537997B2 (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
JP5044594B2 (ja) 多チャネルエコー消去装置とその方法、そのプログラム
JP6542705B2 (ja) 発話検出装置、発話検出方法、プログラム、記録媒体
JP4478045B2 (ja) エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体
JP2019090930A (ja) 音源強調装置、音源強調学習装置、音源強調方法、プログラム
JP7235117B2 (ja) エコー消去装置、エコー消去方法、プログラム
JP4094523B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100312

R150 Certificate of patent or registration of utility model

Ref document number: 4478071

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees