JP2008288718A - 音響エコーキャンセラ - Google Patents

音響エコーキャンセラ Download PDF

Info

Publication number
JP2008288718A
JP2008288718A JP2007129645A JP2007129645A JP2008288718A JP 2008288718 A JP2008288718 A JP 2008288718A JP 2007129645 A JP2007129645 A JP 2007129645A JP 2007129645 A JP2007129645 A JP 2007129645A JP 2008288718 A JP2008288718 A JP 2008288718A
Authority
JP
Japan
Prior art keywords
audio signal
acoustic
filter
sound
filter coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007129645A
Other languages
English (en)
Other versions
JP4872794B2 (ja
Inventor
Katsuichi Osakabe
勝一 刑部
Makoto Tanaka
田中  良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007129645A priority Critical patent/JP4872794B2/ja
Publication of JP2008288718A publication Critical patent/JP2008288718A/ja
Application granted granted Critical
Publication of JP4872794B2 publication Critical patent/JP4872794B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】音響エコーキャンセラが設置された音響空間の残響特性に基づいた最適なパラメータを設定でき、エコーキャンセル処理を簡易に且つ最適に行うことを可能にする音響エコーキャンセラを提供する。
【解決手段】ユーザにより発言がなされる前に、電源立ち上げ音などの音で音響エコーキャンセラ27が設置された音響空間においてフィルタ係数を更新する処理を複数のタップ数について行い、フィルタ係数が予め定められた閾値以下に収束する最も短いタップ数を決定する。そしてエコーサプレッサ12は、決定されたタップ数と対応付けられたパラメータを用いて音響処理を行う。
【選択図】図2

Description

本発明は、音響エコーキャンセラに関する。
近年、拡声通話と呼ばれる通話形態の利用が広がりつつある。従来の電話では、ハンドセット(送受話器)を手に持って通話するのに対し、拡声通話では卓上に設置されたスピーカとマイクロホンにより通話を行う。
拡声通話を実現する際に最も問題となるのが音響エコーである。音響エコーは、自分の声が相手側のスピーカから放音されて相手側のマイクロホンに入り、自分の側に戻ってスピーカから放音され、その結果自分の声が発声に遅れて知覚される現象である。音響エコーの程度によっては、不快感のために話し続けるのが困難になったり、ハウリングを引き起こしたりして通話不能となったりする。
上記音響エコーの制御方法にはさまざまな手法があるが、その中でも適応フィルタを用いた音響エコーキャンセラは最も有効な方法である。音響エコーキャンセラにおいては、スピーカからマイクロホンへ至るエコーの伝達経路を同定し、フィルタとリファレンス信号を畳み込むことで擬似エコーを生成し、該擬似エコーをマイクロホンが生成した信号から差し引くことにより音響エコーを制御する。
上記のフィルタは、音響エコーキャンセラが設置された音響空間ごとに特有の最適な設定にして使用する必要がある。従って、端末が設置された空間の音響特性に基づいてフィルタを設定することが必要である。
特許文献1では、FIR(Finite Impulse Response)フィルタを用いた音響エコーキャンセラとして、長いタップ長で且つフィルタ係数の収束時間が早い音響エコーキャンセラに関する技術が開示されている。
特開2006−157498号公報
しかしながら、特許文献1に示された技術においては、部屋の残響特性に応じたフィルタのタップ長の選択しかなされておらず、その方法ではダブルトーク特性を初めとしたエコーキャンセル処理の最適化を行うことはできない。またフィルタ係数の設定は会話の音声で行うため、会話開始直後にはフィルタ係数が収束しておらず動作が不安定になるという問題点があった。
本発明は上記課題に鑑みて為されたものであり、音響エコーキャンセラが設置された音響空間の残響特性に基づいた最適なパラメータを設定でき、エコーキャンセル処理を簡易に且つ最適に行うことを可能にする技術を提供することを目的としている。
本発明に係る音響エコーキャンセラの構成は、通信網から第1の音声信号を受信する受信手段と、電子音データを記憶する記憶手段と、前記受信手段が受信した第1の音声信号および前記記憶手段に記憶された電子音データを再生する再生手段と、音を収音し、該音に対応する第2の音声信号を生成する入力手段と、前記受信手段が受信した第1の音声信号をフィルタ係数を用いてフィルタリングし、前記第1の音声信号から第3の音声信号を生成するフィルタと、前記入力手段が生成した第2の音声信号と前記フィルタが生成した第3の音声信号との差分が最小となるように前記フィルタ係数を設定するフィルタ係数設定手段と、前記入力手段によって生成された前記第2の音声信号から前記第3の音声信号を減算して第4の音声信号を生成する減算手段と、前記減算手段が生成した第4の音声信号に対して、パラメータに基づいて音響処理を施し第5の音声信号を生成する音響処理手段と、前記音響処理手段が生成した第5の音声信号を前記通信網に出力する出力手段と、室内の音響特性を測定する測定手段と、前記フィルタのタップ数および前記音響処理手段のパラメータとが、室内の音響特性と対応付けて書き込まれたテーブルを記憶する第2の記憶手段と、前記第2の記憶手段に記憶されたテーブルにおいて、前記測定手段により測定された室内の音響特性と対応するタップ数を前記フィルタに設定すると共に、前記測定手段により測定された室内の音響特性と対応するパラメータを前記音響処理手段に設定する設定手段とを有することを特徴とする。
なお、上記の構成において、前記測定手段は、前記室内の残響時間を測定しても良い。
また、上記いずれかの構成において、前記パラメータは、周波数に対して利得(ゲイン)が対応付けられたゲインスペクトルであり、前記音響処理手段は、前記第4の音声信号を周波数領域の信号に変換すると共に、該変換された周波数領域の信号の各周波数成分に対し、前記ゲインスペクトルにおいて対応する周波数と対応付けられた利得を乗算しても良い。
また、上記いずれかの構成において、前記再生手段は、前記受信手段が前記第1の音声信号を受信していない時に前記電子音データを再生しても良い。
また、本発明に係る音響エコーキャンセラの別の構成は、通信網から第1の音声信号を受信する受信手段と、電子音データを記憶する記憶手段と、前記受信手段が受信した第1の音声信号および前記記憶手段に記憶された電子音データを再生する再生手段と、音を収音し、該音に対応する第2の音声信号を生成する入力手段と、前記受信手段が受信した第1の音声信号をフィルタ係数を用いてフィルタリングし、前記第1の音声信号から第3の音声信号を生成するフィルタと、前記入力手段が生成した第2の音声信号と前記フィルタが生成した第3の音声信号との差分が最小となるように前記フィルタ係数を設定するフィルタ係数設定手段と、前記入力手段によって生成された前記第2の音声信号から前記第3の音声信号を減算して第4の音声信号を生成する減算手段と、前記減算手段が生成した第4の音声信号に対して、パラメータに基づいて音響処理を施し第5の音声信号を生成する音響処理手段と、前記音響処理手段が生成した第5の音声信号を前記通信網に出力する出力手段と、前記フィルタのタップ数と前記音響処理手段のパラメータとが対応付けられて書き込まれたテーブルを記憶する第2の記憶手段と、前記フィルタのタップ数を選択する選択手段と、前記選択手段により選択されたタップ数を前記フィルタに設定するとともに、前記テーブルにおいて、前記選択手段により選択されたタップ数と対応するパラメータを前記音響処理手段に設定する設定手段とを有することを特徴とする。
本発明によれば、エコーキャンセラが設置された音響空間の残響特性に基づいた最適なパラメータを設定でき、エコーキャンセル処理を最適に行うことができる、といった効果を奏する。
本発明の説明に入る前に、音響エコーについて簡単に説明しておく。通信におけるエコーには、大きく分けて回線エコーと音響エコーの2種類がある。回線エコーとは、電気回路によって生じるエコーであり、インパルス応答は短く回線の接続が確立すると不変であると考えてよい。
一方音響エコーは、スピーカから放音された音がマイクロホンに回り込む音響帰還により生じる。スピーカからマイクロホンへのエコーの伝播には、直接伝播する経路以外に、室内の壁や話者で反射する経路がある。音響エコーは、継続時間が長く話者やスピーカやマイクロホンの移動など音響空間の変化により急激に特性が変化することが特徴である。
(A:構成)
以下、本発明の実施形態である音響エコーキャンセラが搭載された会議端末を用いて構成された会議システムについて説明する。
図1は、遠隔会議を行うための会議システムの構成を示した図である。同じ構成からなる会議端末100Aおよび100Bは、音響空間200Aおよび200Bに設置されており、両者はインターネットなどの通信網300により接続されている。
会議端末100Aは音響エコーキャンセラ27A、音響エコーキャンセラ27Aに接続されたスピーカ15Aおよびマイクロホン16Aを有し、会議端末100Bは音響エコーキャンセラ27B、音響エコーキャンセラ27Bに接続されたスピーカ15Bおよびマイクロホン16Bを有する。スピーカ15A、15Bは、受取った音声信号をアナログ信号に変換し、音声を放音する。マイクロホン16A、16Bは、収音した音声を表す音声信号を生成し、該音声信号をデジタル信号に変換し出力する。
なお、以下では会議端末100Aと100Bを区別する必要が無いときは、それらを会議端末100と呼ぶ。音響空間200Aと200Bも同様である。また、会議端末100の構成要素についても、それが会議端末100Aまたは100Bのいずれに属するかを示す必要が無いときには、例えばスピーカ15、マイクロホン16などのように符号にアルファベットを付けることなく表す。
次に、音響エコーキャンセラ27の構成について図2を参照して説明する。音響エコーキャンセラ27は、制御部20と記憶部30を有する。制御部20は、音響エコーキャンセラ27の各部の動作を制御する。記憶部30には、音響エコーキャンセラ27の処理を実行するための制御プログラム、パラメータテーブル、および電子音データが格納されている。
ここで、記憶部30に格納されたパラメータテーブルについて説明する。図3に示すように、パラメータテーブルには音響エコーの消去機能を最適化するためのパラメータがタップ数に対応付けて書き込まれている。本実施形態においては、音響エコーの消去機能を最適化するためのパラメータとして、ゲインスペクトルデータが対応付けられている。ゲインスペクトルデータは、エコーサプレッサ12が音響エコー成分を除去する際に用いるパラメータであり、その詳細は後述する。
以下、音響エコーキャンセラ27における音声信号の流れについて、図2を用いて説明する。相手側の会議端末100から通信網300を介して送信された音声信号(以下、リファレンス信号X)は、リファレンス信号入力端子1を介して受信される。受信されたリファレンス信号Xは、リファレンス信号出力端子2を介してスピーカ15に送られる。また、同リファレンス信号Xは、リファレンス信号入力端子1を介してリファレンス信号蓄積部5に送られる。リファレンス信号蓄積部5は、リファレンス信号Xを受取り記憶する。なお、リファレンス信号蓄積部5は、新たにデータを受取ると古いデータを削除して新しいデータを書き込むため、常に最も新しい所定時間分のリファレンス信号Xを蓄積する。
フィルタ係数蓄積部6は、リファレンス信号Xから擬似エコーZを生成するためにフィルタ処理部7が用いるフィルタ係数を蓄積している。フィルタ処理部7は、リファレンス信号蓄積部5に蓄積されたリファレンス信号Xを、フィルタ係数蓄積部6に蓄積されたフィルタ係数によりフィルタリングすることにより擬似エコーZを生成し、生成した擬似エコーZを第1の誤差計算処理部8および第2の誤差計算処理部10へ出力する。上記フィルタ処理部7による擬似エコーZの生成方法については後述する。
さて、マイクロホン16から送話信号入力端子3を介して入力された音声信号は、第1の誤差計算処理部8へ送られる。また、同音声信号は送話入力蓄積部9に送られる。送話入力蓄積部9は、受取った音声信号を記憶する。なお、送話入力蓄積部9は、新たにデータを受取った場合には、古いデータを削除して新しいデータを書き込むため、常に最も新しい所定時間分の音声信号を蓄積する。第2の誤差計算処理部10は、送話入力蓄積部9から音声信号を受取り、フィルタ処理部7から受取った擬似エコーZを差し引いて差分信号を生成し、フィルタ係数更新部11へ出力する。フィルタ係数更新部11は、第2の誤差計算処理部10から受取った差分信号に基づき新たなフィルタ係数を生成し、フィルタ係数蓄積部6に書き込まれているフィルタ係数を更新する。
第1の誤差計算処理部8は、送話信号入力端子3を介して受取った音声信号から、フィルタ処理部7から受取った擬似エコーZを差し引いて、エコーサプレッサ12へ出力する。エコーサプレッサ12は、第1の誤差計算処理部8から受取った音声信号に対し、設定されたパラメータに従って音響処理を施して送話信号出力端子4に出力する。音声信号は、送話信号出力端子4を介して通信網300に向けて出力される。
次に、フィルタ処理部7が擬似エコーZを生成する方法について説明する。図4に示されるように、フィルタ処理部7は、適応FIRフィルタにより構成される。適応FIRフィルタは、破線で囲まれた構成単位(タップ)が複数個(タップ数をL個とする)組み合わされて成り、各タップは単位遅延素子Dおよび乗算器Wn(n=1、2、…、L)から成る。単位遅延素子Dは、リファレンス信号Xを1単位時間だけ遅延させる。各乗算器Wnには時変のフィルタ係数Wn(k)(括弧内は、時刻kであることを示す。以下同様)が設定されている。入力されたリファレンス信号Xは、適応FIRフィルタにて積和演算され、該演算結果が擬似エコーZとして生成される。すなわち、擬似エコーZ(k)は、時刻kおよび時刻kより前に入力されたリファレンス信号の各フィルタ係数による積和演算により生成される。
(B:動作)
次に音響エコーキャンセラ27の動作について説明する。
(B−1;初期設定処理)
本実施形態に係る音響エコーキャンセラ27は、会議を開始するにあたって、設置された音響空間200の残響特性を評価し各種パラメータの初期設定処理を行う。
図5は、音響エコーキャンセラ27が行う初期設定処理の流れを示したフローチャートである。ユーザにより音響エコーキャンセラ27に電源が投入されると、制御部20は、フィルタ処理部7が有する適応FIRフィルタのタップ数を所定の初期値(例えば、1024)に設定する(ステップSA100)。そして制御部20は、フィルタ係数蓄積部6において、各タップにおけるフィルタ係数を所定の初期値に設定する(ステップSA200)。
次に制御部20は、スピーカ15に対し、記憶部30に記憶された電子音データを、「電源立ち上げ音」として所定の時間再生させる(ステップSA300)。電源立ち上げ音として再生する音は高い周波数(例えば3kHz)が好適であるが、後述する残響特性の測定を行うのに適切な音響特性を有していれば良い。
該電源立ち上げ音は、音響空間200においてエコーを生じる。マイクロホン16は、該エコーを表す音声信号(以下、エコーY)を生成する。制御部20は、このエコーYを用いて、ステップSA200において設定されたフィルタ係数の更新を行う(ステップSA400)。簡単には、フィルタ処理部7は、リファレンス信号X(この場合、電源立ち上げ音を表す音声信号)とステップSA200において設定されたフィルタ係数とから擬似エコーZを生成する。第2の誤差計算処理部10は、生成された擬似エコーZとエコーYとの差分信号を生成する。フィルタ係数更新部11は、該差分信号に基づき所定のアルゴリズムに従ってフィルタ係数蓄積部6に蓄積されたフィルタ係数を更新する。
上記アルゴリズムには、LMS(Least Mean Square)法が用いられる。簡単には、第2の誤差計算処理部10により生成される差分信号が無音の音声信号に近づくように、すなわちフィルタ処理部7のフィルタ処理により生成される擬似エコーZがエコーYに最も近似するようにフィルタ係数更新部11はフィルタ係数を更新する。そのようにフィルタ係数を更新することにより、リファレンス信号XからエコーYを模した擬似エコーZを生成するために最適化されたフィルタ係数が定まる。なお、フィルタ係数更新部11に適用されるアルゴリズムはLMS法以外であっても良い。
さて図6に示すように、フィルタ係数は遅延時間の小さいリファレンス信号Xの処理を行うタップ(図4において左側に位置するタップ)において大きな値を示し、遅延時間が大きいタップにおけるフィルタ係数はより小さく、0に漸近するという傾向を示す。制御部20は、最も遅延が大きいタップ位置(図6の場合1024)において、フィルタ係数の絶対値が予め決められた値(破線)を下回るか否かを判定し(ステップSA500)、判定結果を各タップ数に対応付けて記憶部30に書き込む。
記憶部30には、初期値として設定された値(本実施形態においては、1024)の他にも複数のタップ数の値が記憶されている。制御部20は、ステップSA100ないしステップSA500の処理を終えると、記憶された複数のタップ数の全てについてフィルタ係数更新処理を実行したか否か判定する(ステップSA600)。この時点では、初期値として設定されたタップ数について処理を行った段階であるため、ステップSA600の判定結果は“No”となり、ステップSA700を行う。ステップSA700において、まだ試みられていないタップ数を選択し、該タップ数を用いてステップSA300ないし500の処理を行う。
最も遅延が大きいタップ位置におけるフィルタ係数の絶対値が所定の値を下回るか否かに関するデータを、全てのタップ数のフィルタについて得ると、ステップSA600における判定結果は“Yes”となり、ステップSA800に進む。
ステップSA800において、制御部20は、それぞれのタップ数におけるフィルタ係数の収束状況を比較し、最も遅延が大きいタップ位置におけるフィルタ係数の絶対値が所定の値を下回ったフィルタの中で最も小さいタップ数を選択する。また、制御部20は、該選択したタップ数において最適化されたフィルタ係数をフィルタ係数蓄積部6に蓄積する。
なお、上記最も遅延が大きいタップ位置におけるフィルタ係数の絶対値に代えて、最も遅延が大きいタップ位置から遅延の小さい側へ複数(例えば10)のタップ位置におけるフィルタ係数の絶対値の平均値を算出し、該平均値を上記所定の値と比較するなどしても良い。
次に制御部20は、記憶部30に記憶されたパラメータテーブルを参照することにより、ステップSA800において選択されたタップ数に対応するゲインスペクトルデータを選択する。そして制御部20は、選択されたゲインスペクトルデータが表すパラメータをエコーサプレッサ12に設定する(ステップSA900)。
以上に説明した態様で初期設定処理が行われることにより、以下のような効果を奏する。すなわち、音響空間200で生じる音響エコーを消去する必要最低限のタップ数がフィルタ処理部7に設定されることで、フィルタ係数の収束時間が早い音響エコーキャンセラを実現できる。また、上記初期設定処理を会議開始前に測定することで、エコー消去及びダブルトーク特性が最適になる。
(B−2;エコーキャンセリング処理)
以下では、上述した初期設定処理によって各種パラメータが最適化された音響エコーキャンセラ27により行われるエコーキャンセリング処理について説明する。
図7は、エコーキャンセリング処理の流れを示すフローチャートである。まず、相手側の会議端末100から音声信号(リファレンス信号X)が送信されてくると、リファレンス信号Xの表す音声はスピーカ15から音響空間200に向けて放音される。また、該リファレンス信号Xはリファレンス信号蓄積部5に蓄積される(ステップSB100)。
フィルタ処理部7は、フィルタ係数蓄積部6からフィルタ係数を読み出し、該フィルタ係数を用いてリファレンス信号蓄積部5に蓄積されているリファレンス信号Xから擬似エコーZを生成し(ステップSB200)、第1の誤差計算処理部8および第2の誤差計算処理部10に出力する。第1の誤差計算処理部8は、マイクロホン16から受取った音声信号からフィルタ処理部7が生成した擬似エコーZを差し引き(ステップSB300)、差し引いて生成した音声信号をエコーサプレッサ12へ出力する。
このとき、第1の誤差計算処理部8がマイクロホン16から受取った音声信号には、当該音響エコーキャンセラ27が搭載された会議端末100を利用するユーザの発言内容、およびリファレンス信号Xが音響空間200において放音された際に発生したエコーYが含まれている。従って、第1の誤差計算処理部8が、マイクロホン16から受取った音声信号からフィルタ処理部7が生成した擬似エコーZを差し引くことにより、ユーザの発言内容が抽出された音声信号が生成される。ただし、適応FIRフィルタによるフィルタリングによってエコーYと完全に一致する擬似エコーZを生成することは難しいことから、第1の誤差計算処理部8から出力される音声信号には、ユーザの発言内容に加え、エコーYと擬似エコーZの差分に対応する音声信号が含まれる。
エコーサプレッサ12は、第1の誤差計算処理部8から受取った音声信号についてエコーサプレッサ処理を行う(ステップSB400)。具体的には、エコーサプレッサ12は、受信した音声信号をFFT(Fast Fourier Transform)により周波数領域のスペクトルに変換する。その周波数スペクトルを周波数ごとにフィルタリングし、エコーに由来する成分のみを除去する。その際に用いるフィルタリング係数は、ステップSA900において設定されたゲインスペクトルが用いられる。
具体的には、ゲインスペクトルは、図8に示すように特定の周波数領域で定義される利得(ゲイン)のスペクトルである。該ゲインスペクトルにおいては、入力される信号に対して、通すべき信号(話者の発言)に由来する周波数成分については高い値が、除去すべき信号(エコーに由来する信号)については低い値が設定されている。エコーサプレッサ12は、FFT処理された音声信号(スペクトル)と設定されたゲインスペクトルを乗算して周波数特性を変化させる。
上記ゲインスペクトルの特性は、理論や実験などにより適宜使用者により設定される。例えば、会議端末100が送受信する音声信号が特定の周波数幅に限定されていることが予め予測ができる場合には、該周波数帯域以外の帯域については上記ゲインを0に設定したりしても良いし、会議端末100が特有の音響特性を有する音響空間200に設置される場合には、予めエコーに含まれる傾向の高い周波数を予測し、該周波数帯域におけるゲインを低く設定しておいても良い。
また、上記周波数領域におけるスペクトル同士の乗算に代えてまたは併せて、音圧レベルが所定の閾値を下回る周波数成分については該周波数成分をカットする処理を行っても良い。
なお、エコーサプレッサ12が行う音響処理は、上述した処理に限定されるものではなく、上述の適応FIRフィルタを用いたエコーキャンセリング処理により除去しきれない成分を除去するような音響処理であれば良い。他の音響処理を行う場合には、ゲインスペクトルに代えてまたは併せて、該処理に係るパラメータを記憶部30に記憶されたパラメータテーブルに対応付けておけば良い。
周波数特性が変換された周波数領域の信号は、逆FFTにより再び時間領域の信号に変換され、送話信号出力端子4に出力される。ステップSB500において、制御部20は、リファレンス信号蓄積部5に蓄積されたリファレンス信号Xの処理が全て終了したか否かを判定する。全ての処理が終了した場合には、ステップSB500の判定結果は“Yes”となり処理を終了する。一方、会議端末100がリファレンス信号Xを更に受信した場合には、リファレンス信号蓄積部5には新たなリファレンス信号Xが書き込まれているためステップSB500の判定結果は“No”となり、該リファレンス信号XについてステップSB100以降の処理が実行される。
(C:変形例)
以上、本発明の実施形態について説明したが、本発明は以下のように種々の態様で実施することができる。
(1)上記実施形態では、フィルタ係数の更新に係る処理を行う際、電子音データによる電源立ち上げ音を用いる場合について説明した。しかし、該音声は電源立ち上げ音ではなくても良い。例えば、相手側会議端末との通信の際に生じる発信音や着信音などでも良いし、フィルタ係数の更新のために、電子音以外の音を出すようにしても良い。
(2)上記実施形態では、通信網300には、会議端末100が2つ接続されている場合について説明したが、通信網300に接続されている会議端末100は3つ以上でもよい。
(3)上記実施形態では、一般的な音響エコーキャンセラに対して本発明を適用する場合について説明したが、本発明をその他の態様の音響エコーキャンセラに対して適用しても良い。以下にその一例を示す。
非常にエコーを生じやすい音響空間内に設置されたマイクロホンに向かって発声すると、音響空間において生じたエコーも該マイクロホンに対して吹き込まれるため、エコーを含んで聞き取りづらい音声信号が生成される。そのように、スピーカなどから放音された音声ではない音声によるエコーについても、本音響エコーキャンセラの構成を利用することでキャンセルすることができる。その場合、発声の前に予め記憶部30に記憶された電子音データを再生して、収音された電子音をリファレンス信号Xとして利用し、上記実施形態と同様の初期設定処理を行っておけば良い。
従って、会議端末100のように相互に音声を通信するような通信装置だけはなく、一方的に音声信号を送信する放送局、サーバ、音声信号配信装置などにも本発明は適用できる。なお、その場合音声信号を通信端末から受信する受信手段(リファレンス信号入力端子1)は不要である。また、音声信号の送受信を行わない、例えばレコーダーなどの音声信号生成装置にも同様に本発明は適用できるが、その場合には音声信号を通信網から受信する受信手段(リファレンス信号入力端子1)に加え、音声信号を通信網に出力する出力手段(送話信号出力端子4)も不要である。
(4)上記実施形態では、本発明に係る音響エコーキャンセラに特徴的な機能をソフトウェアモジュールで実現する場合について説明したが、ハードウェアモジュールで実現しても良い。また、上述した実施形態では、本発明に係る通信端末に特徴的な処理を制御部20に実行させるためのプログラムが記憶部30に予め記憶されている場合について説明したが、係るプログラムをCD−ROM(Compact Disk-Read Only Memory)などコンピュータ装置読取り可能な記録媒体に書き込んで配布するとしても良く、またインターネットなどの電気通信回線を介して配布するようにしても良い。
(5)上記実施形態では、会議端末100は有線の通信網300でネットワーク接続されている場合について説明したが、無線で各装置をつないでもよい。通信網300はインターネットの他、LAN(Local Area Network)などでも良い。
(6)上記実施形態では、初期設定処理においてフィルタ処理部7に設定されるタップ数を決定する際、最も遅延時間が大きいタップ位置におけるフィルタ係数の絶対値が所定値を下回るか否かを判定し、該判定結果が肯定的であったタップ数の中から適切なタップ数を選択した。しかし、以下のような方法でタップ数を選択しても良い。
タップ数は、会議端末100が設置された音響空間200の音響特性、特に残響時間に基づいて設定するのが好適である。具体的には、残響時間が長い場合により大きいタップ数が設定されれば良い。従って、所定の音(例えば、上記実施形態における電子音データ)を音響空間200において放音し、生じた音響エコーの残響時間を測定する残響時間測定手段を設け、該残響時間測定手段により測定された残響時間に応じたタップ数をフィルタ処理部7に設定するようにしても良い。その場合、長い残響時間に対して大きいタップ数を対応付けたテーブルを予め記憶部30に記憶させておけば良い。
なお、上記残響時間の測定において、音圧レベルの時間経過を示す残響曲線が所定の割合(例えば60dB)減衰するのに要する時間を測定しても良い。
また、上記残響時間の測定において、EDT(Early Decay Time)を測定しても良い。EDTとは、特に初期減衰を重視したパラメータであり、残響曲線のうち最初の10dB減衰した領域の回帰直線において60dB減衰するのに要する時間である。
また、所定のインパルス音などの音圧レベルが所定の閾値を下回るのに要する時間を用いても良い。
(7)上記実施形態では、初期設定処理においてフィルタ処理部7に設定されるタップ数を決定する際、最も遅延時間が大きいタップ位置におけるフィルタ係数の絶対値が所定の値を下回るか否かを判定した。
さて、各タップ位置におけるフィルタ係数をグラフ表示した場合、図6に示されるようにフィルタ係数は、タップ位置が大きくなるほどフィルタ係数が小さくなるという傾向に加え、隣接するタップ位置間で小さな変動が見られるのが一般的である。その結果、遅延が大きいタップ位置におけるフィルタ係数が0に漸近している場合でも、該小さな変動により、最も遅延が大きいタップ位置(例えば、1024)におけるフィルタ係数の絶対値が大きくなったり、遅延が大きいタップ位置におけるフィルタ係数が0に漸近していない場合でも、最も遅延が大きいタップ位置におけるフィルタ係数が偶然0に近似した値を示したりする可能性がある。そのような場合、最も遅延が大きいタップ位置におけるフィルタ係数のみに基づいて上記判定を行うと、フィルタ係数の収束状況について不適切な判定を下してしまう可能性がある。そこで、以下のような方法を用いても良い。
例えば、各タップ位置におけるフィルタ係数のグラフ(例えば、図6)に対してローパスフィルタをかけ、フィルタリングされた結果生成されたグラフにおいて最も遅延が大きいタップ位置におけるフィルタ係数について、上記の判定を行っても良い。
また、上記各タップ位置におけるフィルタ係数の値のグラフにおいて、エンベロープ(包絡線)を算出し、該エンベロープにおいて最も遅延が大きいタップ位置におけるフィルタ係数について、上記の判定を行っても良い。
以上のような処理を行うことにより、上記フィルタ係数の小さな変動によって不適切な判断をしてしまうことを抑制することができる。
(8)上記変形例(6)においては、音響空間200の残響特性が測定され、該測定された残響特性に基づいてタップ数やエコーサプレッサ12におけるパラメータが設定される場合について説明した。しかし、上記各種パラメータは、残響特性の他、各種の音響特性に基づいて設定されても良い。例えば、初期反射音と後続残響音のバランスであるC値およびD値を用いても良い。これらの値は明瞭性や残響感との関連が深いことから、一般的にホールや教室の音響性能の評価に用いられている。
C値(Clarity[dB])は、初期反射音と後期残響音のエネルギ比を表し、次式(1)で定義される。なお、p(t)は、インパルス応答波形を表す。
(式1)
Figure 2008288718
なお、式(1)において、tは初期反射音と後続残響音の境界を示す時間である。t=80msとしたときのC値はC80などと呼ばれ一般的に用いられているが、tの値は適宜設定して用いれば良い。
D値(Definition or Deutlichkeit[%])は、全体のエネルギに対する初期のエネルギ比を表し、次式(2)で定義される。
(式2)
Figure 2008288718
なお、式(2)においても、tは初期反射音と後続残響音の境界を示す時間である。t=50msとしたときのD値はD50などと呼ばれ一般的に用いられるが、tの値は適宜設定して用いれば良い。
また、上述のように音響空間において実際に音を発生させて音響特性を測定する方法の他に、音響空間の平均吸音率を算出して音響特性を見積もる方法がある。平均吸音率とは、音響空間の内装材の吸音率と該内装材が使用されている面積との積を、音響空間の内面(壁や天井、床など)全ての領域について足し合わせ、該足し合わせた値を音響空間の内表面積で除した値である。平均吸音率は、音響空間における残響時間と強い相関関係を有し、音響空間の響きの程度を見積もるパラメータとして利用されている。
以上に説明した各種音響特性に対して、タップ数およびエコーサプレッサ12のパラメータを対応付けるテーブルを記憶部30に記憶させておき、該テーブルにおいて、測定された音響特性と対応するタップ数およびパラメータが設定されるようにしても良い。
(9)上記実施形態では、音響空間200の残響特性に基づいて、各種パラメータが自動的に設定される場合について説明した。しかし、音響エコーキャンセラ27のユーザが、音響空間200の音響特性に基づいて、上記各種パラメータを設定(選択)するとしても良い。その場合の処理方法を以下に説明する。
音響エコーキャンセラ27は、適応FIRフィルタのタップ数とエコーサプレッサ12のパラメータとが、各種の音響特性と対応付けられて書き込まれたテーブルを記憶部30に記憶する。上記各種の音響特性としては、例えば、「ホール」、「無響室」、「会議室」など音響空間の種別でも良いし、残響の度合いが「高い」、「中程度」、「低い」など音響特性の記載でも良いし、上記適応FIRフィルタに設定されるタップ数の値そのものでも良い。音響エコーキャンセラ27は、該各種の音響特性に関する選択肢を表示する表示手段、および該表示手段に表示された選択肢をユーザが選択するための選択手段を更に有し、ユーザは、該表示手段に表示された選択肢から、音響空間200の音響特性を最も良く反映していると考えられる選択肢を選択する。そして、音響エコーキャンセラ27は、上記テーブルにおいて、ユーザにより選択された音響特性の選択肢と対応付けられたタップ数とパラメータとを、適応FIRフィルタおよびエコーサプレッサ12に設定しても良い。
なお、上記テーブルにおいて、適応FIRフィルタのタップ数とエコーサプレッサ12のパラメータとが関連付けられて書き込まれていても良い。その場合、ユーザがタップ数を選択することにより、選択されたタップ数が適応FIRフィルタに設定されると共に、テーブルにおいて、選択されたタップ数に対応するパラメータ値がエコーサプレッサ12に設定されるようにしても良い。
会議システムの構成を示した図である。 音響エコーキャンセラ27の構成を示すブロック図である。 パラメータテーブルの一例を示した図である。 擬似エコー信号の生成方法を示した図である。 初期設定処理の流れを示したフローチャートである。 フィルタ係数の収束状況を表すグラフである。 エコーキャンセリング処理の流れを示すフローチャートである。 ゲインスペクトルの一例を示す図である。
符号の説明
1…リファレンス信号入力端子、2…リファレンス信号出力端子、3…送話信号入力端子、4…送話信号出力端子、5…リファレンス信号蓄積部、6…フィルタ係数蓄積部、7…フィルタ処理部、8…第1の誤差計算処理部、9…送話入力蓄積部、10…第2の誤差計算処理部、11…フィルタ係数更新部、12…エコーサプレッサ、15…スピーカ、16…マイクロホン、20…制御部、27…音響エコーキャンセラ、30…記憶部、100…会議端末、200…音響空間、300…通信網

Claims (5)

  1. 通信網から第1の音声信号を受信する受信手段と、
    電子音データを記憶する記憶手段と、
    前記受信手段が受信した第1の音声信号および前記記憶手段に記憶された電子音データを再生する再生手段と、
    音を収音し、該音に対応する第2の音声信号を生成する入力手段と、
    前記受信手段が受信した第1の音声信号をフィルタ係数を用いてフィルタリングし、前記第1の音声信号から第3の音声信号を生成するフィルタと、
    前記入力手段が生成した第2の音声信号と前記フィルタが生成した第3の音声信号との差分が最小となるように前記フィルタ係数を設定するフィルタ係数設定手段と、
    前記入力手段によって生成された前記第2の音声信号から前記第3の音声信号を減算して第4の音声信号を生成する減算手段と、
    前記減算手段が生成した第4の音声信号に対して、パラメータに基づいて音響処理を施し第5の音声信号を生成する音響処理手段と、
    前記音響処理手段が生成した第5の音声信号を前記通信網に出力する出力手段と、
    室内の音響特性を測定する測定手段と、
    前記フィルタのタップ数および前記音響処理手段のパラメータとが、室内の音響特性と対応付けて書き込まれたテーブルを記憶する第2の記憶手段と、
    前記第2の記憶手段に記憶されたテーブルにおいて、前記測定手段により測定された室内の音響特性と対応するタップ数を前記フィルタに設定すると共に、前記測定手段により測定された室内の音響特性と対応するパラメータを前記音響処理手段に設定する設定手段と
    を有することを特徴とする音響エコーキャンセラ。
  2. 前記測定手段は、前記室内の残響時間を測定することを特徴とする請求項1に記載の音響エコーキャンセラ。
  3. 前記パラメータは、周波数に対して利得(ゲイン)が対応付けられたゲインスペクトルであり、
    前記音響処理手段は、前記第4の音声信号を周波数領域の信号に変換すると共に、該変換された周波数領域の信号の各周波数成分に対し、前記ゲインスペクトルにおいて対応する周波数と対応付けられた利得を乗算する
    ことを特徴とする請求項1または2に記載の音響エコーキャンセラ。
  4. 前記再生手段は、前記受信手段が前記第1の音声信号を受信していない時に前記電子音データを再生することを特徴とする請求項1ないし3のいずれかに記載の音響エコーキャンセラ。
  5. 通信網から第1の音声信号を受信する受信手段と、
    電子音データを記憶する記憶手段と、
    前記受信手段が受信した第1の音声信号および前記記憶手段に記憶された電子音データを再生する再生手段と、
    音を収音し、該音に対応する第2の音声信号を生成する入力手段と、
    前記受信手段が受信した第1の音声信号をフィルタ係数を用いてフィルタリングし、前記第1の音声信号から第3の音声信号を生成するフィルタと、
    前記入力手段が生成した第2の音声信号と前記フィルタが生成した第3の音声信号との差分が最小となるように前記フィルタ係数を設定するフィルタ係数設定手段と、
    前記入力手段によって生成された前記第2の音声信号から前記第3の音声信号を減算して第4の音声信号を生成する減算手段と、
    前記減算手段が生成した第4の音声信号に対して、パラメータに基づいて音響処理を施し第5の音声信号を生成する音響処理手段と、
    前記音響処理手段が生成した第5の音声信号を前記通信網に出力する出力手段と、
    前記フィルタのタップ数と前記音響処理手段のパラメータとが対応付けられて書き込まれたテーブルを記憶する第2の記憶手段と、
    前記フィルタのタップ数を選択する選択手段と、
    前記選択手段により選択されたタップ数を前記フィルタに設定するとともに、前記テーブルにおいて、前記選択手段により選択されたタップ数と対応するパラメータを前記音響処理手段に設定する設定手段と
    を有することを特徴とする音響エコーキャンセラ。
JP2007129645A 2007-05-15 2007-05-15 音響エコーキャンセラ Expired - Fee Related JP4872794B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007129645A JP4872794B2 (ja) 2007-05-15 2007-05-15 音響エコーキャンセラ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007129645A JP4872794B2 (ja) 2007-05-15 2007-05-15 音響エコーキャンセラ

Publications (2)

Publication Number Publication Date
JP2008288718A true JP2008288718A (ja) 2008-11-27
JP4872794B2 JP4872794B2 (ja) 2012-02-08

Family

ID=40148059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007129645A Expired - Fee Related JP4872794B2 (ja) 2007-05-15 2007-05-15 音響エコーキャンセラ

Country Status (1)

Country Link
JP (1) JP4872794B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013068809A (ja) * 2011-09-22 2013-04-18 Fujitsu Ltd 残響抑制装置および残響抑制方法並びに残響抑制プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62116026A (ja) * 1985-11-15 1987-05-27 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置
JPS6429094A (en) * 1987-07-24 1989-01-31 Nippon Telegraph & Telephone Echo erasing device
JPH10150343A (ja) * 1996-09-20 1998-06-02 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法および装置
JP2002084212A (ja) * 2000-09-08 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
JP2002152093A (ja) * 2000-11-07 2002-05-24 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置及び方法
JP2005286796A (ja) * 2004-03-30 2005-10-13 Matsushita Electric Works Ltd 拡声通話装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62116026A (ja) * 1985-11-15 1987-05-27 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置
JPS6429094A (en) * 1987-07-24 1989-01-31 Nippon Telegraph & Telephone Echo erasing device
JPH10150343A (ja) * 1996-09-20 1998-06-02 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法および装置
JP2002084212A (ja) * 2000-09-08 2002-03-22 Nippon Telegr & Teleph Corp <Ntt> 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
JP2002152093A (ja) * 2000-11-07 2002-05-24 Nippon Telegr & Teleph Corp <Ntt> 反響消去装置及び方法
JP2005286796A (ja) * 2004-03-30 2005-10-13 Matsushita Electric Works Ltd 拡声通話装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013068809A (ja) * 2011-09-22 2013-04-18 Fujitsu Ltd 残響抑制装置および残響抑制方法並びに残響抑制プログラム
US9093077B2 (en) 2011-09-22 2015-07-28 Fujitsu Limited Reverberation suppression device, reverberation suppression method, and computer-readable storage medium storing a reverberation suppression program

Also Published As

Publication number Publication date
JP4872794B2 (ja) 2012-02-08

Similar Documents

Publication Publication Date Title
KR101655003B1 (ko) 능동 노이즈 소거 적응형 필터를 위한 사전-성형 직렬 필터
US8311234B2 (en) Echo canceller and communication audio processing apparatus
JP4954334B2 (ja) エコー抑制のためのフィルタ係数を演算する装置および方法
JP6389232B2 (ja) パーソナルオーディオデバイスのための短待ち時間マルチドライバ適応雑音消去(anc)システム
KR101250124B1 (ko) 에코 억제 필터를 위한 제어 정보를 계산하는 장치 및 방법 및 지연 값을 계산하는 장치 및 방법
JP4913155B2 (ja) 音響エコーキャンセラ
US10115412B2 (en) Signal processor with side-tone noise reduction for a headset
JP5061853B2 (ja) エコーキャンセラ及びエコーキャンセルプログラム
KR102055701B1 (ko) 트랜듀서 임피던스에 기반한 비선형 음향 에코 소거
JP2003234679A (ja) 音響エコーの相殺および抑制を実行する利得制御方法
WO2010106820A1 (ja) ハウリングキャンセラ
US6385176B1 (en) Communication system based on echo canceler tap profile
JP3420705B2 (ja) エコー抑圧方法及び装置並びにエコー抑圧プログラムが記憶されたコンピュータに読取り可能な記憶媒体
JP2010081004A (ja) エコーキャンセル装置、通信装置、及びエコーキャンセル方法
KR20200112863A (ko) 선택가능한 샘플 레이트들을 갖는 능동 잡음 소거(anc) 시스템
US8804981B2 (en) Processing audio signals
US20200382649A1 (en) System and method for generating an improved reference signal for acoustic echo cancellation
JP4872794B2 (ja) 音響エコーキャンセラ
JP3403655B2 (ja) サブバンド適応フィルタを用いた未知システムの同定方法および装置
JP2007336132A (ja) エコー抑圧装置
JPH1023172A (ja) エコー除去装置
Szabolcs et al. Hands-Free VoIP Terminal with Gain Control Based on Neural Network
JP2013005106A (ja) 場内拡声装置、場内拡声方法、及びそのプログラム
JP2012244336A (ja) 音声信号処理装置、音声信号処理方法および音響再生装置
JP2002252577A (ja) 多チャネル音響エコー消去方法、その装置、そのプログラム及びその記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100315

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111025

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111107

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4872794

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees