JP5122042B2 - スペクトル分析による近端話者検出のためのシステムと方法 - Google Patents

スペクトル分析による近端話者検出のためのシステムと方法 Download PDF

Info

Publication number
JP5122042B2
JP5122042B2 JP2000619899A JP2000619899A JP5122042B2 JP 5122042 B2 JP5122042 B2 JP 5122042B2 JP 2000619899 A JP2000619899 A JP 2000619899A JP 2000619899 A JP2000619899 A JP 2000619899A JP 5122042 B2 JP5122042 B2 JP 5122042B2
Authority
JP
Japan
Prior art keywords
echo
energy
envelope
signal
end speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000619899A
Other languages
English (en)
Other versions
JP2003517751A (ja
Inventor
ヒュー, ジェイ. マックラフリン,
リンダ, ジェイ. キング,
タマラ, エル. ローガン,
Original Assignee
シスコ テクノロジー,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シスコ テクノロジー,インコーポレイテッド filed Critical シスコ テクノロジー,インコーポレイテッド
Publication of JP2003517751A publication Critical patent/JP2003517751A/ja
Application granted granted Critical
Publication of JP5122042B2 publication Critical patent/JP5122042B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)
  • Telephone Function (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

【0001】
【技術分野】
この発明は音声通信システムに関するものであり、該システムはスピーカーフォンを使って手を使わなくてもよい音声通信を可能とするものである。より詳しくは、この発明は、音響エコー相殺技術と全二重スピーカーフォン技術、に関するものであって、顕著なスイッチ損失または感応エコーなしに音声信号の同時受信送信を可能とするものである。
【0002】
【関連技術の説明】
全二重スピーカーフォンは音声端子であって、少なくとも1個のラウドスピーカーと少なくとも1個のマイクロフォンとからなり、手を使わないでよい音声通信を可能とするものである。全二重スピーカーフォンは音響エコー相殺(AEC)技術を使っており、感応エコーなしにスピーチを同時に受信送信することを可能とする。
【0003】
全二重スピーカーフォンシステムの基本的構成を図1に示す。全二重スピーカーフォン(FDS)システム10は減衰器12、デジタル−アナログ(D/A)変換器14、増幅器16およびラウドスピーカー18を有しており、これらは受信経路20上で直列に接続されている。システムはまたマイクロフォン22、第2の増幅器24、アナログ−デジタル変換器26、減算ユニット28および第2の減衰プロセッサー30とを有しており、これらは送信経路32上で直列に接続されている。
【0004】
送受信経路間には適応フィルター34が位置している。このフィルターと減算ユニットは音響エコー相殺器を構成している。システムはさらにそれぞれ受信または送信経路に接続された3個の測定プロセッサー36、38、40とアクティビティ検出制御(ADAC)モジュール42を有している。測定プロセッサー36は受信経路に接続され、測定プロセッサー40はA/D変換機と減算ユニット間で送信経路に接続され、測定プロセッサー38は減算ユニットと減衰プロセッサー30間で送信経路に接続されている。
【0005】
遠端呼出し者からの受信デジタル信号がシステム10により受信されると、受信信号は受信経路上の減衰器12を通って送られ、ついでD/A変換器14により変換され、増幅器16により増幅される。増幅アナログ信号はラウドスピーカー18により室内に放送される。
【0006】
室の音響特性に応じて、放送信号のエコーがエコー経路44、46などのラウドスピーカーからマイクロフォン22に至る種々のエコー経路を通して伝播される。エコーは近端呼出し者からのスピーチとともにマイクロフォンによって捕捉され、送信経路32を介して送信アナログ信号の形で送信される。送信信号はまず増幅器24により増幅され、ついでA/D変換器26によりでデジタル形式に変換される。
【0007】
適応フィルターは原受信デジタル信号をサンプルして包旋ステップを行う。つまりサンプルされた信号を基準として使って推測エコー反応の計算を行う。推測エコー反応とは特定の条件下で用いられたシステムの予測音響エコー反応である。現行のエコー反応推測値を用いて送信信号のエコー成分の減算を行う。
【0008】
エコー成分の減算または相殺は減算ユニット28が行う。減算の後、エコー相殺送信信号は誤り信号として適応フィルター34に戻される。該誤り信号はフィルター係数を動的に調整するのに用いられ、該フィルター係数はエコー相殺を行うためにフィルターによって使われる。エコー相殺送信信号は減衰プロセッサー30を介して遠端の呼出し者に送信される。通常は若干の残留エコーがあるので、減衰プロセッサーにより許容できるレベルまで残留エコーを低減する。減衰プロセッサーは一般に中央クリッパーとして知られている装置でよい。
【0009】
エコー相殺の質は、真エコー反応を正確にモデル化するのにフィルター14により用いられる適応アルゴリズムの能力いかん、に掛かっている。真エコー反応は適応処理により推測されるもので、該処理では誤り信号が適応アルゴリズムを駆動してモデルの係数を更新し、これにより誤り信号はゼロに向けて駆動される、つまりエコー相殺送信信号が検出可能なエコー残響を全く含まないようになる。
【0010】
しかし室の音響的反応は常に一定ではない。例えば人やマイクロフォンの室内での移動およびドアの開閉などがエコー経路を変える。エコー経路が変わると新たなエコー反応が出てきて、これは前に推測されたエコーモデルでは正確には表わされない。エコー相殺器が新たなエコー反応に適応するまでは、エコーのかなりの量が遠端の呼出し者に送信される。
【0011】
エコー相殺に加えて、システム10は信号アクティビティが4通りの状態(アイドル、遠端アクティブ、近端アクティブまたは二重会話)のいずれにあるかを決定する。遠端がアクティブならば、適応フィルター34はさらに適応可能となり、エコー相殺送信信号は減衰プロセッサー30により抑制されなければならない。しかしエコー相殺送信信号が全んど有効な近端話者スピーチからなる場合には、アクティビティ状態は近端アクティブまたは二重会話になる。
【0012】
そのような状態では、適応フィルターは不能となり、送信経路減衰は単一に閉じる。アクティビティ状態のかかる決定はADACモジュール42により行われる。このモジュールは受信信号、原送信信号および測定プロセッサー36、38、40を介してのエコー相殺送信信号を審査して、エコー相殺送信信号の構成を決定する。
【0013】
一般に、近端話者スピーチと残留エコーの差をとるためにADACモジュール42により利用される従来の検出アルゴリズムは特定問題検出技術に基づいている。最新のやり方では受信信号と誤り信号、つまりエコー相殺送信信号との間の相関尺度が計算される。この相関尺度は時間ドメイン相関または周波数ドメイン相関である。
【0014】
相関アルゴリズムは、誤り信号がラウドスピーカーにより放送される受信信号とどの程度合致するか、を決定しようとする。誤り信号が受信信号と実質的に同じに見えた場合には、送信信号は全んど残留エコーから構成されると考えられ、遠端アクティビティのみが宣言される。しかし誤り信号が受信信号と顕著に異なると見えた場合には、送信信号は実質的な近端話者スピーチからなると考えられ、二重会話状態が宣言される。
【0015】
実際には、受信信号に対して誤り信号を比較するのに相関尺度を適用するのは難しい。一般に音響エコーは観測ウインドーよりかなり長く続き、しかもラウドスピーカーとマイクロフォンとの間の伝送機能は非常に複雑である。事実エコー信号は受信信号とはかなり違って見える。室の音響反応に起因する信号歪みに加えて、適応フィルター34はある周波数には収斂するが他の周波数には同様には収斂しないという事実により、相関は一段と複雑になる。加えて、ある種のスピーカーフォンシステムにおいては、ラウドスピーカーの伝送機能があまり正確には知られていないのである。
【0016】
これらの難しさにも拘わらず、適応フィルターが完全にエコーを相殺した場合には、エコー相殺送信信号内の有効近端話者スピーチの信号成分を表示するのは比較的容易である。しかし実際には、音響エコー経路は適応フィルター34が再適応できるよりもかなり速く変化する。適応フィルターが再適応できるまで、送信信号にはかなりの量の残留エコーが持ち込まれる。この残留エコーが有効近端話者スピーチと誤認された場合には、遠端聞き手はかなりの量のエコーを感じることになり、より悪くは適応フィルターが適応することを禁じられることもある。
【0017】
潜在的には、残留エコーはシステムによって有効近端話者スピーチと誤認されるので、適応フィルターが不能になると言う事態にシステムが入ってしまう。この結果、遠端スピーチのケースと同時に起きる反復近端スピーチのケースを最終的に制御アルゴリズムが検出するまで、さらなる誤りがシステムにより形成され続ける。この間、遠端聞き手にはかなりの量の好ましくないエコーが送信されて、音声通信の品質を低下させる。
【0018】
サブバンドまたは周波数ドメイン適応フィルターを利用して二重会話状態を検出する公知の方法がある。これらの技術においては、受信信号を多数のサブバンドまたは離散フーリエ変換(DFT)ビンとして分析する。これらの各サブバンドまたはDFTビンについて適応または回旋が行われる。一般にこの公知の方法では、適応フィルターからの情報に基づいて、各サブバンドまたはビンについて近似信号ゲイン(ラウドスピーカーからマイクロフォンへの接続)を決定して、各サブバンドまたはビンについて近似信号ゲイン測定値を形成する。
【0019】
各サブバンドまたはビンについてのゲインが与えられたら、各サブバンドまたはビンについての二重会話状態の有無が決定される。二重会話状態の検出の後、ついで(1)通常中央クリッピングにより各サブバンドまたはビンについて抑制を行う、および(2)各サブバンドまたはビン当りの適応を禁止するステップが実行される。
【0020】
これらの試みの関心は、各サブバンドまたはビンについてのゲイン推測がミリ秒の単位で劇的に変化する、ことにある。例えば、人がマイクロフォンの傍を歩いて既知のエコー経路を歪めると、ゲインはゼロスペクトルからピークスペクトルまで急速に変化する。ゲインが劇的に変化すると、検出アルゴリズムは猛然と活動して、実際にはそのサブバンドに顕著な残留エコーがあるのに、誤った二重会話状態を報告し続ける。
【0021】
アメリカ特許第5732134号に開示された「二重会話」検出装置は、受信信号と原マイクロフォン信号とをDFTビンに分析して、二重会話を検出する。受信信号とマイクロフォン信号とをビンからビンへと比較し、各ビンについてノイズフローの影響を除去することにより、該特許の装置は全バンドについて「二重会話」状態を検出する。該装置は非相殺原マイクロフォン信号上にDFTを行うが、該信号は適応フィルターによってはフィルターされてない。加えて、スペクトルノイズ推測値も同じ非相殺マイクロフォン信号から引き出される。この装置の関心は、残響エコーの持続性に関係なく、受信信号DFTスペクトルの単純なブロック毎の計算を行う点である。
【0022】
この問題を回避すべく、システムと方法に望まれるのは、送信信号が全んど近端話者信号から構成されているかまたは受信信号エコーから構成されているかを信頼性を持って決定できることであり、これにより適切な対処を行って、二重会話決定に頼ることなく、きれいな音声通信を保証することである。
【0023】
【発明の要約】
全二重スピーカーフォンシステムおよび送信信号中の有効近端話者成分を検出する方法は近端話者推測器を用い、該推測器はスペクトル分析により近端話者エネルギー推測値を形成する。この近端話者エネルギー推測値は送信信号中の有効近端話者成分の量を示している。近端話者エネルギー推測値によっては、システムは送信信号および/または受信信号を減衰し、システムの適応フィルターにより実行されるフィルター処理を調整して、接続された者間にきれいな音声通信を提供する。
【0024】
好ましき実施例においては、近端話者推測器は少なくとも1個の処理ユニットと協働して、システムの音響エコー相殺器によりエコーをフィルターまたは「相殺された」送信信号をサンプルする。該推測器は受信信号もサンプルする。サンプルされた受信信号およびエコー相殺送信信号は3通りのエネルギースペクトルを引き出すのに使われる。第1のエネルギースペクトルはエコー相殺送信信号のエネルギースペクトルであり、第2のエネルギースペクトルは推測されたノイズフローのエネルギースペクトルであってエコー相殺送信信号のエネルギースペクトルに基づいており、第3のエネルギースペクトルは受信信号に基づいたエコーエネルギーエンベロープである。
【0025】
このエコーエネルギーエンベロープはしきい値を提供して、ノイズまたは残留エコーに代えてエコー相殺送信信号のある部分が近端話者に属するか否かを適宜な確実性で決定する。近端話者推測器はそれら3通りのエネルギースペクトルおよび前の近端話者エネルギー推測値の計算されたスペクトルを審査して、現行の近端話者エネルギー推測値を形成する。
【0026】
送信信号中の有効近端話者成分を検出する方法にあっては、エコーエネルギーエンベロープ、エコー相殺送信信号のエネルギースペクトルおよびノイズフローエネルギースペクトルを並行に発生する。これらのスペクトルはさらに近端話者推測器により処理されて、近端話者エネルギー推測値を計算する。
【0027】
エコーエネルギーエンベロープを発生させるステップにおいては、システムの第1の処理ユニットにより受信信号がサンプルされたデータブロックにセグメント化される。このサンプル期間は6〜20ミリ秒として、サンプルウインドーが代表的なスピーチ音素の一部に亙るようにする。ついで各データブロックについて、高速フーリエ変換(FFT)の種々の変形のひとつに応じて、第1の処理ユニットにより離散フーリエ変換(DFT)が実行される。これに代えてセグメント化およびDFTはシステムの適応フィルターの副産物として実行されてもよい。DFTステップの後、近端話者推測器のウインドーユニットにより計算されたDFT成分にハニングウインドー機能が適用される。
【0028】
ついで近端話者推測器のパワー計算器により各DFTビンについてパワーが計算される。この明細書では「パワー」と「エネルギー」とは同じ観念で用いられている。これらのパワー値には付重を施して、残留エコーの多い周波数は少ない周波数よりもより多く付重されるようにしてもよい。付重の結果は近端話者推測器のエンベロープモデルフィルターに通すが、該推測器は所定のモデルを用いて可能性ある反射エコーについてエンベロープを形成する。
【0029】
各ビンについて、モデルは最悪のエコー反射のためにエンベロープを形成する。ビンの結果はついで近端話者推測器の先入れ先出し(FIFO)バッファーに送信されて、エンベロープモデルフィルターからのビン結果を遅延させる。つぎに、FIFOバッファー中の各要素を査定することにより、各ビンについての最大値が選択される。FIFOバッファーからの結果は乗算ユニットに送信されて、つぎのファクターを乗算される。(1)既知または既測定外部ゲイン(ラウドスピーカーとマイクロフォンとの間の名目的な結合ゲイン)および受信信号とエコー相殺送信信号との間の基準点、(2)エコー相殺反射損失拡張(一般にERLEとして知られている)についての既測定値および(3)不確実性ファクター。
【0030】
不確実性ファクターは経験的に決定されたファクターであってもよく、このファクターは低誤表示でよい近端話者推測値を結果する。最も簡単な装備では、これらのファクターはスカラーである。しかしこの概念は単一のスカラー値からベクトルに容易に展開されて、ビンに亙って既知の挙動の変動がある場合には、かなりの程度の最適化を達成する。乗算ユニットから結果されるベクトルはエコーエネルギーエンベロープを示している。
【0031】
エコー相殺送信信号のエネルギースペクトルおよびノイズフローエネルギースペクトルを発生するステップに際しては、エコー相殺送信信号をサンプルデータブロックにセグメント化して、第2の処理ユニットによりDFTを行う。ついで第2のウインドーユニットによりハニングウインドーが計算されたDFT成分に適用されて、DFTビン間のスペクトル遺漏を抑制する。ついで第2のパワー計算器により各DFTビンについてパワーが計算される。
【0032】
これらの計算されたパワー値はエコー相殺送信信号のエネルギースペクトルを示している。第2のパワー計算器からの計算パワー値はさらに処理されて、ノイズフローエネルギースペクトルを引き出す。送信信号パワースペクトルのビンパワーベクトルはまず各周波数ビンについて近端話者推測器の平均化ユニットにより平均化される。つぎに従来のノイズフロー推測技術により近端話者推測器のノイズフロー推測器によりノイズフローパワー推測値が計算される。
【0033】
エコーエネルギーエンベロープ、エコー相殺送信信号のエネルギースペクトルおよびノイズフローエネルギースペクトルの計算後は近端話者エネルギー推測値の計算に入る。3通りのエネルギースペクトルのビン値は近端話者推測値の比較器に送信される。比較器はつぎの値から各ビンについて最大値を出力する。(1)ノイズフローパワー推測値、(2)減衰近端話者パワー推測値および(3)送信信号パワーマイナスエコーエネルギーエンベローププラスノイズフローパワー推測値。
【0034】
一実施例においては、ビンのこれらの最大値は近端話者推測器のパワー合計ユニットにより合計される。合計値はついでトラックアップアベレージダウンフィルターによりフィルターされて、単一の近端話者パワー推測値を出力する。この推測値はついでシステムのアクティビティ検出制御(ADAC)モジュールに送信されて、ADACモジュールは近端話者パワー推測値に応じて適宜な行動をとる。
【0035】
近端話者パワー推測値は残留エコーのレベルと比較される。残留エコーは、システムの適応フィルターのエコー相殺挙動を予測すること、により推測される。近端話者パワー推測値が残留エコー推測値より実質的に大きい場合には、ADACモジュールは送信経路上の減衰プロセッサーに指示して、エコー相殺送信信号をして少または無減衰で通過させる。しかし残留エコー推測値が近端話者推測値と同じかより大の場合には、ADACモジュールは適応フィルターの動作を禁止するかその用いるステップサイズを低減させる。
【0036】
加えてADACモジュールは送信経路上の減衰プロセッサーに指示して、エコー相殺送信信号を実質的に抑制して、遠端にいる人が可聴エコーを感受しないようにする。加えて、ADACモジュールは受信経路上の減衰器に指示して受信信号を抑制させて、送信信号内に持ち込まれるエコーの量を低減する。
【0037】
変化実施例にあっては、単一総近端話者パワー推測値に代えて、多数の推測値を引き出すように方法とシステムを構成してもよい。一例としては、異なる不確実性ファクターを用いて複数のエコーエネルギーエンベロープを計算してもよい。各エコーエネルギーエンベロープについて、独特な近端話者パワー推測値が形成される。これらの近端話者推測値は推測器の信頼性に応じて変動する。
【0038】
他の実施例にあっては、近端話者パワー推測値はビンの特定のサブセットについて引き出されてもよい。例えば低周波数については第1の推測値を、高周波数については第2の推測値をである。高低周波数の異なるマスキング特性を利用して挙動の最適化を達成できる。これら多数の推測値はADACモジュールが用いて、遠端者に送信される最終的な送信信号を制御する。
【0039】
【詳細な説明】
図2に示すのは、近端話者推測器50と付設された処理ユニット52、54を有した、この発明の全二重スピーカーフォンシステム48である。該システムはさらに、近端話者推測器に作用的に接続されたアクティビティ検出制御(ADAC)モジュール56、を有している。システムの他の要素は例えば図1に示したような従来の全二重スピーカーフォンシステムに設けられている公知の要素である。したがってそれらについては図1と同様な参照番号を用いる。
【0040】
システム48は受信経路20上に直列に接続された、減衰器12、デジタル−アナログ(D/A)変換器14、増幅器16およびラウドスピーカー18を有している。またシステムは送信経路32上に直列に接続された、マイクロフォン22、第2の増幅器24、アナログ−デジタル(A/D)変換器26、減算ユニット28および減衰プロセッサー30を有している。さらにシステムは適応フィルター34および測定プロセッサー36、38、40を有している。適応フィルターと減算ユニットとはシステム48の音響エコー相殺器を構成している。
【0041】
推測器50を有していることによりシステム48は、近端話者信号またはマイクロフォン22により捕捉された受信信号のエコーをエコー相殺送信信号が全んど含んでいるか否か、を決定できる。推測器はスペクトル分析を利用して近端話者信号のエネルギーまたはパワーを推測する。この推測値はついでADACモジュール56に送信されてADACにより計算された残留エコー推測値と比較される。
【0042】
この比較の結果に基づいて、システムは適当な行動により清声通信を提供する。近端話者推測値が残留エコー推測値より実質的に大きい場合には、ADACモジュールは送信経路32上の減衰プロセッサー30に指示して、僅少または無減衰でエコー相殺送信信号を通過させる。しかし残留エコー推測値の方が大きいか等しい場合には、ADACモジュールは適応フィルター34の適応を禁じるか、適応フィルターが使用するステップサイズを増加させる。
【0043】
加えてADACモジュールは減衰プロセッサー30に指示してエコー相殺送信信号を実質的に抑制して、遠端にいる人が可聴エコーを感じないようにする。加えてADACモジュールは受信経路の減衰器12に指示して受信信号を抑制させて、ラウドスピーカー18とマイクロフォン22との間の信号結合により送信信号中に持ち込まれるエコーの量を低減する。
【0044】
図3のグラフによりシステム48の近端話者推測器50により行われるスペクトル分析を説明する。図3は与えられた時間についてパワーおよび周波数に対するスペクトル分布曲線58、60、62、64を示したものである。曲線58はノイズフロー推測値を、曲線60は減衰近端話者推測値を、それぞれ示している。一般に減衰近端話者推測値は近端話者の既推測値の小部分である。曲線62はシステム48の適応フィルター34と減算ユニット28とによりエコー相殺されかつマイクロフォンにより捕捉された送信信号を示す。曲線64は受信信号に基づいたエコーエンベロープを示す。
【0045】
このエコーエンベロープは上限またはしきい値を与えて、送信信号が近端話者成分を含んでいるか否かを決定する。送信信号がエコーエンベロープより小さい場合には、送信信号が近端話者成分を含んでいないものと仮定する。しかし送信信号がエコーエンベロープより大きい場合には、送信信号が近端話者成分を含んでいるものと仮定する。図3のグラフにおいて送信信号エネルギー曲線62は2個のピーク66、68を有している。第1のピーク66はエコーエンベロープの下側に位置している。したがってこのピークは近端話者成分の結果でないと無視される。しかし第2のピーク68はエコーエンベロープの上に上がっている。したがってこのピークの部分は近端話者推測値を計算するのに使われる。
【0046】
一実施例にあっては、近端話者推測器50が分析されている全スペクトルについて単一の近端話者推測値を発生する。この実施例では、近端話者推測器が異なる信号を審査して、図3中のハッチングを施した領域である単一の近端話者推測値を審査する。図3のグラフはセクションA、B、C、Dに分割して、いかにして近端話者推測器が単一の近端話者推測値を計算するか、を示している。
【0047】
セクションAでは、送信信号曲線62はエコーエンベロープ曲線64の下側にある。かかる状態では、近端話者推測値計算のためにはノイズフロー推測曲線58のみが考慮に入れられる。
【0048】
セクションBでは、送信信号曲線もまたエコーエンベロープ曲線の下にある。しかし減衰近端話者推測曲線60はノイズフロー推測曲線の上にある。かかる状態では、近端話者推測値には減衰近端話者推測曲線が考慮に入れられる。
【0049】
セクションCでは、送信信号曲線はエコーエンベロープ曲線の上にある。かかる状態では、近端話者推測値のために、エコーエンベロープおよびノイズフロー推測値より大なる送信信号の部分が考慮に入れられる。
【0050】
図3のグラフでは、送信信号とエコーエンベロープとの差が減衰近端話者推測値とノイズフロー推測値との差より大きい点において、セクションCが始まることに注意されたい。これは近端話者推測器はエコーエンベロープより大なるとき、すなわち送信信号とエコーエンベロープとの差が減衰近端話者推測値とノイズフロー推測値との差より大なるときに、送信信号を考慮するという事実、によるものである。
【0051】
単一の近端話者推測値に貢献しなければならないパワーの量に関しては、セクションDはセクションAと同じである。ハッチングを施した領域は、単一近端話者エネルギー推測値を計算するために近端話者推測器により合計されるノイズフロー推測値、減衰近端話者推測値および/または送信信号の部分、である。
【0052】
図5の流れ線図により、この発明によって全二重スピーカーフォンシステム48においてエコー相殺送信信号内の有効近端話者成分を検出する方法、を示す。この方法は主として近端話者推測器50により実行される。したがって該方法は図4の近端話者推測器の要素に関連して説明する。
【0053】
近端話者推測器はウインドーユニット70Aとパワー計算器72Aと第2のウインドーユニット70Bと第2のパワー計算器72Bとを有している。第1のパワー計算器は所定の周波数スペクトル(例えば0〜4キロヘルツ)について受信経路20上の受信信号のエネルギーを計算し、第2のパワー計算器は所定の周波数スペクトルについてエコー相殺送信信号のエネルギーを計算する。
【0054】
近端話者推測器はまた付重モジュール74とエンベロープモデルフィルター76と先入れ先出し(FIFO)バッファー78と最大値発見器79と乗算ユニット80とを有しており、該乗算ユニットはウインドーユニット70Aおよびパワー計算機72Aと協働して、所定の周波数スペクトルについてエコーエネルギーエンベロープを計算する。
【0055】
加えて近端話者推測器は平均化ユニット82とノイズフロー推測器84とを有しており、該推測器は第2のウインドーユニット70Bおよび第2のパワー計算器70Bと協働して所定の周波数スペクトルについてノイズフローパワー推測値を発生する。
【0056】
近端話者推測器のその他の要素としては、比較器86、パワー合計ユニット88およびトラックアップアベレージダウンフィルター90があり、該フィルターは計算された送信信号のエネルギーおよびノイズフロー推測値およびエコーエネルギーエンベロープおよび減衰近端話者推測値から単一の近端話者パワー推測値を引き出す。
【0057】
図5においてはステップ92において、エコー相殺送信信号内の有効近端話者成分を検出する方法が始まるが、このステップにおいて受信経路20上の受信信号が、システム48の処理ユニット52により、サンプルデータブロックにセグメント化される。サンプリング期間は6〜20ミリ秒として、サンプルウインドーが代表的なスピーチ音素の部分に亙るようにする。
【0058】
ついでステップ94において、高速フーリエ変換(FFT)の公知の変動数に応じて各データブロックについて、処理ユニット52により離散フーリエ変換(DFT)が実行される。変化実施例においては、セグメント化とDFTとは適応フィルター34により実行してもよい。そのような場合には、システム48は処理ユニット52を必要としない。
【0059】
ステップ96においては、近端話者推測器50のウインドーユニット70Aによりウインドー機能が計算されたDFT成分に適用されて、DFTビン間のスペクトル遺漏が抑制される。しかし遺漏が少ない場合には、ウインドー化ステップ96は省いてもよい。例えば代表的なサブバンドフィルターバンク設計については遺漏は少なくなければならない。スペクトル結果がサブバンドフィルターバンクからである場合には、ウインドー化ステップを省くことができる。
【0060】
このウインドー機能はハニングウインドー機能であることが望ましい。多くのDFT方式の場合には、これは係数(0.25、0.5、0.25)を用いた三点移動平均を行うことからなる。DFTによっては、代わりの係数(−0.25、0.5、−0.25)を必要とする。この周波数ドメインウインドー化技術は、タイムドメイン中でウインドー機能を実行する場合と同じく有効である。非常に低い周波数ビン(DCビンを含む)および非常に高い周波数ビンを除くことにより、メモリーの挙動をロスのないものとすることができる。
【0061】
ステップ96の後、ステップ98においてパワー計算器72Aにより下記の数式で各DFTについてパワーが計算される。ここでビンは複素数(X+iY)で表わされる。なお用語「パワー」と「エネルギー」とはこの明細書では入れ換えても使われる。
【0062】
【数1】
Figure 0005122042
【0063】
選択的なステップ100において、受信信号パワー計算の結果に付重が行われる。この際残留エコーの多い周波数はより重く付重され、残留エコーの少ない周波数はより軽く付重される。ラウドスピーカー18とマイクロフォン22との間の送信機能が既知である場合、またはエコーに関してある周波数(例えば非常に低い周波数)が問題となることが知られている場合に、上記したような選択的なステップ100は適用されるのである。
【0064】
ステップ102において、付重結果がエンベロープモデルフィルター76に通されて、予設定モデルを用いてあるかもしれない反射エコーについてのエンベロープが形成される。ラウドスピーカー18が受信信号を放送している室において残響するので、このモデルはエコーの実質的な持続性を示している。各ビンについて、最悪のエコー反射についてモデルがエンベロープを形成する。
【0065】
一般に、反射エコーは、(1)ラウドスピーカーからマイクロフォンへの直接エコーおよび(2)実質的に室内の壁などの表面に起因する間接エコー、から構成されている。反射エコーが全んど間接エコーからなると知られている場合には、直接エコー経路をモデル化する必要はない。しかし一般には、典型的な室については間接エコーの減衰はほんの10ミリ秒毎約1dBであるので、間接エコー経路をモデル化しなければならない。減衰エコーがモデル化されない場合には、残響が有効近端スピーチに間違われることがある。
【0066】
つぎに数2によりC言語翻訳言語を用いて直接および間接エコーの集団をモデル化する有効な方法を説明する。ここでRDirect[i]は直接エコーエンベロープであり、RIndirect[i]は間接エコーエンベロープであり、REnv[i]は集団エコーエンベロープであり、Aは集団エコーエンベロープを構成する直接エコーの部分であり、Bは集団エコーエンベロープを構成する間接エコーの部分である。
【0067】
【数2】
Figure 0005122042
【0068】
関数TrackUpAveDownを数3で示す。
【0069】
【数3】
Figure 0005122042
【0070】
関数TrackUpAveDownは単純非線型フィルターであって、入力が登る時に入力をトラックし、入力が降るときには入力を平均する。
【0071】
ラウドスピーカー22に対するマイクロフォン18の位置が不正確である場合には、エンベロープに遅れ概念を形成する必要があり、この不正確さに対処する。これにはFIFOバッファー中のビン結果を遅延させる。したがってステップ104において、ビン結果はFIFOバッファー78中に記憶されて、エンベロープモデルフィルター76からのビン結果を遅延させる。つぎにステップ106において、最大値発見器79によりFIFOバッファー中の各ベクトルについて同じインデックスの各ビンを査定することにより、各ビンについての最大値を選択する。
【0072】
ステップ108において、FIFOバッファーの結果が乗算ユニットに送信され、つぎのファクターを乗算される。(1)受信信号とエコー相殺送信信号との間の基準点を有した既知または従来測定された外部ゲイン(ラウドスピーカー18とマイクロフォン22との間の名目上の結合ゲイン)。(2)エコー相殺器反射損失拡張(一般にERLEとして知られている)についての従来測定値であって、単一よりは通常少ない数であるが、常に真であると実務上保証された最小値に限定される。(3)不確実性ファクター。
【0073】
不確実性ファクターは経験的に決められたファクターであってよく、誤り表示の可能性が低いよい近端話者推測値をもたらす。この不確実性ファクターは通常単一より大である。結果として得られたベクトルはエコーエネルギーエンベロープを示し、かつ比較器86に送信される。これらのファクターはスカラー数として記載されたが、これは単一スカラー値からベクトルに展開されて、ある程度の最適化を達成するもので、ビンを横切っての挙動にある程度の既知の変動がある。
【0074】
ステップ92〜108と並行に実行されて、エコー相殺送信信号はステップ110〜120において処理されて、送信信号パワースペクトルとノイズフローパワー推測値とを引き出す。受信信号の処理と同様に、送信経路上のエコー相殺送信信号はサンプルデータブロックにセグメント化されて、ステップ110と112において、処理ユニット54によりDFTを用いて変換される。
【0075】
ついでステップ114において、近端話者推測器50のウインドーユニット70Bによってウインドー機能が計算されたDFT成分に適用されて、DFTビン間のスペクトル遺漏が抑制される。ウインドー機能はハニングウインドー機能であることが好ましい。
【0076】
ステップ116において、パワー計算器72Bにより各DFTビンについてパワーが計算される。これらの計算されたパワー値は送信信号パワースペクトルを示している。送信信号パワースペクトルは比較器86に送信されて、計算されたエコーエネルギーエンベロープと一緒に処理される。
【0077】
比較器に送信されるのに加えて、送信信号パワースペクトルは近端話者推測器50の平均化ユニット82に送信されて、さらに処理されてノイズフローパワー推測値を引き出す。
【0078】
ステップ118において、送信信号パワースペクトルのビンパワーベクトルは平均化ユニット82により各周波数ビンについて平均化される。
【0079】
ついでステップ120において、従来のノイズフロー推測手法を用いて、ノイズフロー推測器によりノイズフローパワー推測値が計算される。一例として、各ビンについてのノイズフロー推測値はつぎの翻訳コード発生器により計算されてもよい。
【0080】
【数4】
Figure 0005122042
【0081】
この処理において、入力パワーが現行のノイズ推測値より大きな場合には、ノイズレベル推測値は緩く浮き上がる。しかし入力パワーが現行のノイズレベル推測値より少ない場合には、推測値は非常に速く降下し、連続して低いパワーが報告されるとき、入力パワーのレベルをほぼトラックする。計算されたノイズフロー推測値は比較器86へ送信される。すると比較器は各ビンについて近端話者推測値を計算できる準備が整う。
【0082】
ステップ122において、比較器86は下記の値から各ビンについて最大値を出力する。(1)ノイズフローパワー推測値、(2)減衰近端話者パワー推測値および(3)送信信号パワーマイナスエコーエネルギーエンベローププラスノイズフローパワー推測値。
【0083】
ついでステップ124において、ビンの最大値はパワー合計ユニット88により合計される。合計値はついでトラックアップアベレージダウンフィルター90によりフィルターされ、ステップ126において単一近端話者パワー推測値を出力する。
【0084】
近端話者パワー推測値はADACモジュール56に送られて、そこで該値に反応してADACモジュールが適切な行動をとる。ステップ128において、近端話者パワー推測値は残留エコーのレベルと比較される。この残留エコーは、適応フィルター34のエコー相殺挙動を予測すること、によって推測される。近端話者パワー推測値が残留エコー推測値より実質的に大なる場合には、ADACモジュールは減衰プロセッサー30に指示して、エコー相殺送信信号を少減衰または無減衰で通過させる。
【0085】
しかし残留エコー推測値が近端話者推測値と比肩するかまたは実質的により大である場合には、ADACモジュールは適応フィルターの適応を禁止するか、または適応フィルターにより使用されるステップサイズを低減する。加えて、ADACモジュールは送信経路上の減衰プロセッサー30に指示して、エコー相殺送信信号を実質的に抑制して、遠隔地の人が可聴エコーを受信しないようにする。さらにADACモジュールは受信経路上の減衰器12に指示して、受信信号を抑制し、送信信号中に持ち込まれるエコーの量を低減する。
【0086】
変化実施例においては、方法とシステムとは単一の総近端話者パワー推測値の代わりに多数の推測値を引き出してもよい。例えば、異なる不確実性ファクターを用いて複数のエコーエネルギーエンベロープを計算することもできる。各エコーエネルギーエンベロープについて、独特な近端話者パワー推測値が生成されるだろう。これらの近端話者推測値は推測の信頼度において異なるだろう。
【0087】
他の例では、近端話者パワー推測値はビンの特定のサブセットについて引き出される。第1の推測値は低周波数についてのものであり、第2の推測値は高周波数についてのものである。低または高周波数の異なるマスキング性を利用することにより、挙動の最適化が達成できる。これらの複数の推測値はADACモジュールにより使われて、遠端側に送信される最終的な送信信号を制御する。
【図面の簡単な説明】
【図1】 従来の全二重スピーカーフォンシステムブロック線図である。
【図2】 この発明の近端話者推測器を有した全二重スピーカーフォンシステムのブロック線図である。
【図3】 近端話者パワー推測値を計算するために図2のシステムにより使用される異なるパワースペクトルのグラフである。
【図4】 この発明の近端話者推測器の要素のブロック線図である。
【図5】 この発明によりエコー相殺送信信号信号内の有効近端話者成分を検出する方法の流れ線図である。

Claims (20)

  1. 音響エコー相殺器システム中のエコー相殺送信信号内の近端話者成分を検知する方法であって、
    遠端源からの受信信号を受信し、
    近端源からの初期送信信号を送信し、
    前記初期送信信号内の前記受信信号のエコーを適応フィルターして前記エコー相殺送信信号を発生し、
    所定の周波数スペクトルについて前記エコー相殺送信信号および前記受信信号のフーリエ変換を行うことにより、前記近端源から発信された前記エコー相殺送信信号内の前記近端話者成分の量を推測することからなり、
    該推測は、
    前記所定の周波数スペクトルにおける複数の異なる周波数について前記受信信号に基づいたエコーエンベロープのエネルギー値を計算し、
    前記所定の周波数スペクトルにおける複数の異なる周波数について前記エコー相殺送信信号のエネルギー値を計算し、
    前記所定の周波数スペクトルにおける複数の異なる周波数についてノイズフロアのエネルギーを推測し、
    前記所定の周波数スペクトルにおける複数の異なる周波数について、前記ノイズフロアのエネルギー値、または前記エコー相殺送信信号のエネルギー値から前記エコーエンベロープのエネルギー値を引いて前記ノイズフロアのエネルギー値を加えた値の最大値から、前記エコー相殺送信信号内の前記近端話者成分についてエネルギー推測値を選択し、
    前記エネルギー推測値は、前記近端源から発信された前記エコー相殺送信信号内の前記近端話者成分の量に対応することを特徴とする音響エコー相殺器システム中のエコー相殺送信信号内の近端話者成分を検知する方法。
  2. 前記エコーエンベロープのエネルギー値を計算するに際して、前記受信信号をモデル化して、前記エコー相殺送信信号に含まれる潜在的反射エコーのための前記エコーエンベロープを生成するとともに、残響に起因する前記潜在的反射エコーの音響成分を考慮に入れることを特徴とする請求項1に記載の方法。
  3. 前記エコーエンベロープのエネルギー値の計算に際して、前記受信信号のモデル化により引き出された前記エコーエンベロープを遅延させて、前記エコーエンベロープによる前記受信信号の潜在的遅延反射エコーの取入れを確実にすることを特徴とする請求項2に記載の方法。
  4. 前記エコーエンベロープの遅延に際して、前記エコーエンベロープのモデル化された値を先入れ先出しバッファーに記憶し、前記エコーエンベロープおよび少なくとも他の計算されたエコーエンベロープから対応するモデル化された値を評価することにより、各モデル化値について最大値を選択することを特徴とする請求項3に記載の方法。
  5. 前記エコーエンベロープのエネルギー値の計算に際して、前記音響エコー相殺器システムの外部ゲインを取入れ、該外部ゲインが前記受信信号と前記初期送信信号とが基準として用いられている前記近端源にあるスピーカーとマイクロフォンとの間の接続ゲインであることを特徴とする請求項1に記載の方法。
  6. 前記エコーエンベロープのエネルギー値の計算に際して、前記音響エコー相殺器システムの測定エコー相殺器反射損失拡張を取り入れることを特徴とする請求項1に記載の方法。
  7. 前記近端話者成分の量を推測するに際して、多数の前記エネルギー推測値を合計して、前記エコー相殺送信信号内の前記近端話者成分について単一のエネルギー推測値を引き出すことを特徴とする請求項1に記載の方法。
  8. 前記近端話者成分についての前記単一のエネルギー推測値を残留エコー推測値と比較し、該残留エコー推測値が前記音響エコー相殺器システムの予測エコー相殺挙動から引き出されることを特徴とする請求項7に記載の方法。
  9. 前記近端話者成分の量を推測するに際して、前記所定の周波数スペクトル内の選択された周波数範囲について周波数セグメントの最大値を合計して、前記エコー相殺送信信号内の前記近端話者成分について多数のエネルギー推測値を引き出すことを特徴とする請求項1に記載の方法。
  10. 遠端源からの受信信号を受信するべく接続された受信経路と、
    近端源からの初期送信信号を送信するべく接続された送信経路と、
    前記送受信経路に作用的に結合されて前記初期送信信号内の前記受信信号のエコーを適応的にフィルターしてエコー相殺信号を発生するエコー相殺手段と、
    前記近端源から発生された前記エコー相殺信号内の近端話者成分のエネルギー推測値を生成する、前記送受信経路に接続された近端話者推測器と、
    前記近端話者推測器と前記エコー相殺手段とに作用的に結合された前記エネルギー推測値に応答して送信するために前記エコー相殺信号を調整する制御手段とを含んでなり、
    前記近端話者推測器が、
    前記受信信号に基づいたエコーエンベロープを生成する手段と、
    ノイズフロアのエネルギーを推測する手段と、
    前記エコー相殺信号のエネルギーを計算する手段と、
    前記エコーエンベロープを生成する手段、前記ノイズフロアのエネルギーを推測する手段及び前記エコー相殺信号のエネルギーを計算する手段に作用的に接続された処理ユニットとを含んでなり、
    前記近端話者推測器が、前記エコーエンベロープを用いて、前記エコー相殺信号のエネルギー分布を比較して、前記近端話者成分に属し得る前記エコー相殺信号の部分を決定し、前記ノイズフロアの推測値と前記エコー相殺信号の計算されたエネルギーを用いて、前記エコー相殺信号内の前記近端話者成分のエネルギー推測値を引き出し、
    前記処理ユニットが、前記ノイズフロアの推測値または前記エコー相殺信号のエネルギーに前記ノイズフロアの推測値を加えて前記エコーエンベロープのエネルギー値を引いた値を選択することによって、所定のスペクトル範囲について前記エコー相殺信号内の前記近端話者成分のエネルギー推測値を決定するように構成されていることを特徴とする音響エコー相殺器システム。
  11. 前記エコーエンベロープを生成する手段が前記エコー相殺信号に含まれる潜在的反射エコーのための前記エコーエンベロープを生成すべく前記受信信号をモデル化する手段を有しており、該モデル化手段が残響に起因する前記潜在的反射エコーの音響成分を取り入れるべく構成されていることを特徴とする請求項10に記載のシステム。
  12. 前記エコーエンベロープを生成する手段が前記受信信号をモデル化する手段から引き出された前記エコーエンベロープを遅延させる手段を有しており、該前記エコーエンベロープを遅延させる手段が、前記エコーエンベロープおよび少なくとも他の計算されたエコーエンベロープから対応するモデル化された値を評価することにより、前記エコーエンベロープの各モデル化値について最大値を選択すべく、構成されていることを特徴とする請求項11に記載のシステム。
  13. 前記エコーエンベロープを生成する手段が選択されたファクターを取り入れて前記エコーエンベロープを引き出す多重化要素を有していることを特徴とする請求項10に記載のシステム。
  14. 前記多重化要素が前記音響エコー相殺器システムの外部ゲインを因数分解すべく構成されており、前記外部ゲインが前記送受信経路間の接続ゲインであり、前記受信信号と前記初期送信信号とが基準として用いられることを特徴とする請求項13に記載のシステム。
  15. 前記多重化要素が測定エコー相殺器反射損失拡張を因数分解して、前記エコーエンベロープを引き出すべく構成されていることを特徴とする請求項13に記載のシステム。
  16. 音響エコー相殺器システム中のエコー相殺送信信号内の近端話者成分の量を推測する方法であって、
    前記音響エコー相殺器システムの受信経路上の受信信号をサンプリングし、
    近端源から初期送信信号を発生し、
    前記初期送信信号内の前記受信信号のエコーを順応的に相殺してエコー相殺送信信号を発生し、
    スペクトル分析を用いて前記エコー相殺送信信号の離散フーリエ変換を実行することによりエネルギー分布を生成し、
    スペクトル分析を用いて所定の周波数スペクトルについてのサンプルされた前記受信信号に基づいたエコーエンベロープのエネルギー分布を生成して、該エネルギー分布の前記近端話者成分に属し得る部分を決定し、
    少なくとも部分的にエネルギー分布のスペクトル分析に基づいて、離散フーリエ変換を利用して、前記所定の周波数スペクトルの各周波数セグメントについて、前記近端話者成分のエネルギー推測値を計算し、
    前記受信信号から引き出された前記所定の周波数スペクトルにおける複数の異なる周波数について、前記エコーエンベロープのエコーエンベロープエネルギー値を計算し、
    前記所定の周波数スペクトルにおける複数の異なる周波数について、エコー相殺送信信号から引き出されたノイズフロアの推測エネルギーを計算し、この計算に際して、前記ノイズフロアの推測エネルギー、減衰した計算済みの前記近端話者成分のエネルギー推測値、及び前記エコー相殺送信信号の前記エネルギー分布に前記ノイズフロアの推測エネルギーを加えて前記エコーエンベロープのエネルギー分布を引いた値から最大値を選択し、
    前記エネルギー推測値が特定の周波数セグメントについての前記エコー相殺送信信号内の前記近端話者成分の量を表わすことを特徴とする音響エコー相殺器システム中のエコー相殺送信信号内の近端話者成分の量を推測する方法。
  17. 前記スペクトル分析を用いて前記エコーエンベロープの前記エネルギー分布を生成するに際して、前記受信信号をモデル化して前記エコー相殺送信信号中に含まれる潜在的反射エコーのための前記エコーエンベロープを生成し、この際に残響に起因する前記潜在反射エコーの音響成分を取り入れることを特徴とする請求項16に記載の方法。
  18. 前記スペクトル分析を用いて前記エコーエンベロープの前記エネルギー分布を生成するに際して、前記エコーエンベロープのモデル化値を遅延し、前記エコーエンベロープおよび少なくとも他の計算されたエコーエンベロープからの対応するモデル化値を評価することにより、各モデル化値について最大値を選択することを特徴とする請求項17に記載の方法。
  19. 前記スペクトル分析を用いて前記エコーエンベロープの前記エネルギー分布を生成するに際して、前記音響エコー相殺器システムの外部ゲインにより前記エコーエンベロープを増加することを特徴とする請求項16に記載の方法。
  20. 前記スペクトル分析を用いて前記エコーエンベロープのエネルギー分布を生成するに際して、前記音響エコー相殺器システムの測定エコー相殺器反射損失拡張により前記エコーエンベロープを増加することを特徴とする請求項16に記載の方法。
JP2000619899A 1999-05-20 2000-05-18 スペクトル分析による近端話者検出のためのシステムと方法 Expired - Lifetime JP5122042B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/315,774 1999-05-20
US09/315,774 US6269161B1 (en) 1999-05-20 1999-05-20 System and method for near-end talker detection by spectrum analysis
PCT/US2000/013884 WO2000072556A1 (en) 1999-05-20 2000-05-18 System and method for near-end talker detection by spectrum analysis

Publications (2)

Publication Number Publication Date
JP2003517751A JP2003517751A (ja) 2003-05-27
JP5122042B2 true JP5122042B2 (ja) 2013-01-16

Family

ID=23226000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000619899A Expired - Lifetime JP5122042B2 (ja) 1999-05-20 2000-05-18 スペクトル分析による近端話者検出のためのシステムと方法

Country Status (7)

Country Link
US (1) US6269161B1 (ja)
EP (1) EP1183848B1 (ja)
JP (1) JP5122042B2 (ja)
AT (1) ATE313211T1 (ja)
AU (1) AU5148000A (ja)
DE (1) DE60024815T2 (ja)
WO (1) WO2000072556A1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2260336A1 (en) * 1999-02-15 2000-08-15 Robert Inkol Modulation recognition system
US7164659B2 (en) * 1999-12-09 2007-01-16 Broadcom Corporation Adaptive gain control based on echo canceller performance information
US6650701B1 (en) * 2000-01-14 2003-11-18 Vtel Corporation Apparatus and method for controlling an acoustic echo canceler
US6744884B1 (en) * 2000-09-29 2004-06-01 Skyworks Solutions, Inc. Speaker-phone system change and double-talk detection
US6799062B1 (en) * 2000-10-19 2004-09-28 Motorola Inc. Full-duplex hands-free transparency circuit and method therefor
US20020191779A1 (en) * 2001-03-23 2002-12-19 Tien Pham System for convolutional echo cancellation by iterative autocorrelation
US7221659B1 (en) 2001-12-31 2007-05-22 Cisco Technology, Inc. Method and system for managing erroneous attenuation of signal
DE10342307B4 (de) * 2003-09-12 2005-08-04 Siemens Ag Verfahren zur Entstörung übermittelter Audiosignale zwischen Telekommunikationsendgeräten
US7599483B2 (en) * 2003-12-12 2009-10-06 Temic Automotive Of North America, Inc. Echo canceler circuit and method
WO2005076663A1 (en) * 2004-01-07 2005-08-18 Koninklijke Philips Electronics N.V. Audio system having reverberation reducing filter
US7450528B1 (en) * 2004-02-17 2008-11-11 Dialogic Corporation Method and apparatus for performing echo suppression
US7113580B1 (en) * 2004-02-17 2006-09-26 Excel Switching Corporation Method and apparatus for performing conferencing services and echo suppression
US7654230B2 (en) * 2004-06-07 2010-02-02 Kroll Family Trust Domestic animal telephone
US20070116300A1 (en) * 2004-12-22 2007-05-24 Broadcom Corporation Channel decoding for wireless telephones with multiple microphones and multiple description transmission
US20060147063A1 (en) * 2004-12-22 2006-07-06 Broadcom Corporation Echo cancellation in telephones with multiple microphones
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US7983720B2 (en) * 2004-12-22 2011-07-19 Broadcom Corporation Wireless telephone with adaptive microphone array
WO2006077005A2 (fr) * 2005-01-19 2006-07-27 France Telecom Dispositif d'annulation d'echo acoustique, procede et programme d'ordinateur correspondants
WO2007003579A1 (fr) * 2005-07-01 2007-01-11 France Telecom Dispositif d'annulation d'un écho électrique ou acoustique, procédé et programme d'ordinateur correspondants
US8107616B2 (en) 2005-10-21 2012-01-31 Koninklijke Philips Electronics N.V. Acoustic echo canceller
DE112006004193A5 (de) * 2006-11-15 2009-10-22 Siemens Aktiengesellschaft Verfahren und Anordnung zum adaptiven Filtern von Signalen
JP4456622B2 (ja) * 2007-07-25 2010-04-28 沖電気工業株式会社 ダブルトーク検出器、ダブルトーク検出方法及びエコーキャンセラ
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
JP5061976B2 (ja) * 2008-03-12 2012-10-31 沖電気工業株式会社 エコーキャンセラ、エコーキャンセル方法及びプログラム
US9225842B2 (en) * 2008-12-22 2015-12-29 Koninklijke Philips N.V. Determining an acoustic coupling between a far-end talker signal and a combined signal
US9343073B1 (en) * 2010-04-20 2016-05-17 Knowles Electronics, Llc Robust noise suppression system in adverse echo conditions
US9307321B1 (en) 2011-06-09 2016-04-05 Audience, Inc. Speaker distortion reduction
JP5923994B2 (ja) * 2012-01-23 2016-05-25 富士通株式会社 音声処理装置及び音声処理方法
GB2525051B (en) * 2014-09-30 2016-04-13 Imagination Tech Ltd Detection of acoustic echo cancellation
JP6387786B2 (ja) * 2014-10-22 2018-09-12 株式会社デンソー 超音波式物体検知装置
CN114566176B (zh) * 2022-02-23 2024-07-09 宁波蛙声科技有限公司 基于深度神经网络的残余回声消除方法及系统

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8601604A (nl) 1986-06-20 1988-01-18 Philips Nv Frequentie-domein blok-adaptief digitaal filter.
WO1988003341A1 (en) 1986-10-30 1988-05-05 Fujitsu Limited Echo canceller with short processing delay and decreased multiplication number
NL8701633A (nl) 1987-07-10 1989-02-01 Philips Nv Digitale echocompensator.
US4979163A (en) * 1988-12-28 1990-12-18 At&T Bell Laboratories Echo suppression arrangement for an adaptive speakerphone
US5305307A (en) 1991-01-04 1994-04-19 Picturetel Corporation Adaptive acoustic echo canceller having means for reducing or eliminating echo in a plurality of signal bandwidths
US5263019A (en) 1991-01-04 1993-11-16 Picturetel Corporation Method and apparatus for estimating the level of acoustic feedback between a loudspeaker and microphone
US5164727A (en) * 1991-04-30 1992-11-17 Regents Of The Unversity Of California Optimal decoding method and apparatus for data acquisition applications of sigma delta modulators
US5365583A (en) * 1992-07-02 1994-11-15 Polycom, Inc. Method for fail-safe operation in a speaker phone system
US5307405A (en) * 1992-09-25 1994-04-26 Qualcomm Incorporated Network echo canceller
JPH06338829A (ja) 1993-05-28 1994-12-06 American Teleph & Telegr Co <Att> 通信システム内の反響除去方法と装置
US5327496A (en) * 1993-06-30 1994-07-05 Iowa State University Research Foundation, Inc. Communication device, apparatus, and method utilizing pseudonoise signal for acoustical echo cancellation
ZA95599B (en) 1994-02-28 1996-02-06 Qualcomm Inc Doubletalk detection by means of spectral content
US5668871A (en) * 1994-04-29 1997-09-16 Motorola, Inc. Audio signal processor and method therefor for substantially reducing audio feedback in a cummunication unit
JPH0832494A (ja) * 1994-07-13 1996-02-02 Mitsubishi Electric Corp ハンズフリー通話装置
US5526426A (en) 1994-11-08 1996-06-11 Signalworks System and method for an efficiently constrained frequency-domain adaptive filter
FR2729804B1 (fr) * 1995-01-24 1997-04-04 Matra Communication Annuleur d'echo acoustique a filtre adaptatif et passage dans le domaine frequentiel
US5937060A (en) * 1996-02-09 1999-08-10 Texas Instruments Incorporated Residual echo suppression
JP3386327B2 (ja) * 1996-04-25 2003-03-17 三菱電機株式会社 エコーキャンセラ
FR2758677B1 (fr) * 1997-01-21 1999-04-02 Matra Communication Procede d'annulation d'echo et annuleur d'echo mettant en oeuvre un tel procede
DE19729521B4 (de) * 1997-07-10 2004-04-01 Deutsche Telekom Ag Verfahren und Vorrichtung zur Störgeräusch- und Echounterdrückung

Also Published As

Publication number Publication date
EP1183848A4 (en) 2003-02-12
EP1183848A1 (en) 2002-03-06
DE60024815T2 (de) 2006-08-10
JP2003517751A (ja) 2003-05-27
WO2000072556A1 (en) 2000-11-30
DE60024815D1 (de) 2006-01-19
EP1183848B1 (en) 2005-12-14
ATE313211T1 (de) 2005-12-15
US6269161B1 (en) 2001-07-31
WO2000072556A9 (en) 2001-03-08
AU5148000A (en) 2000-12-12

Similar Documents

Publication Publication Date Title
JP5122042B2 (ja) スペクトル分析による近端話者検出のためのシステムと方法
US6792107B2 (en) Double-talk detector suitable for a telephone-enabled PC
US5598468A (en) Method and apparatus for echo removal in a communication system
KR100989266B1 (ko) 스펙트럼 음향 특성에 기초한 더블 토크 검출 방법
Cho et al. An objective technique for evaluating doubletalk detectors in acoustic echo cancelers
US6804203B1 (en) Double talk detector for echo cancellation in a speech communication system
JP4463981B2 (ja) 信号処理装置及びエコー抑圧装置
US6212273B1 (en) Full-duplex speakerphone circuit including a control interface
JP3228940B2 (ja) 音声通信ネットワークにおける残留遠端エコーを低減するための方法と装置
JP4257113B2 (ja) 音響エコーの相殺および抑制を実行する利得制御方法
US6282176B1 (en) Full-duplex speakerphone circuit including a supplementary echo suppressor
US8014519B2 (en) Cross-correlation based echo canceller controllers
US6434110B1 (en) Full-duplex speakerphone circuit including a double-talk detector
US5848151A (en) Acoustical echo canceller having an adaptive filter with passage into the frequency domain
JP4204754B2 (ja) 通信システムにおける適応信号利得制御のための方法及び装置
US6449361B1 (en) Control method and device for echo canceller
IL112797A (en) Visible bee multiplication using spectral content
CN109716743A (zh) 全双工语音通信系统和方法
KR100423472B1 (ko) 적응성필터의수렴도측정
US8019075B2 (en) Hybrid echo canceller controllers
US7792281B1 (en) Delay estimation and audio signal identification using perceptually matched spectral evolution
US20080240414A1 (en) Hybrid echo canceller controllers
CN113196733B (zh) 使用低频近端语音检测的声学回声消除
JP2006279191A (ja) エコーキャンセラ
US7023986B2 (en) Echo canceller in a communication system at a terminal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070517

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090409

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090626

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090703

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090810

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090909

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20091002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20091002

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20091116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100712

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121024

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151102

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5122042

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term