JP2010527181A - マルチチャネル音声通信システムにおいて音響エコーを低減するための方法およびシステム - Google Patents

マルチチャネル音声通信システムにおいて音響エコーを低減するための方法およびシステム Download PDF

Info

Publication number
JP2010527181A
JP2010527181A JP2010506328A JP2010506328A JP2010527181A JP 2010527181 A JP2010527181 A JP 2010527181A JP 2010506328 A JP2010506328 A JP 2010506328A JP 2010506328 A JP2010506328 A JP 2010506328A JP 2010527181 A JP2010527181 A JP 2010527181A
Authority
JP
Japan
Prior art keywords
impulse response
vector
location
approximate
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010506328A
Other languages
English (en)
Other versions
JP4897921B2 (ja
Inventor
フォズンバル・マジド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of JP2010527181A publication Critical patent/JP2010527181A/ja
Application granted granted Critical
Publication of JP4897921B2 publication Critical patent/JP4897921B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】本願は、適応リアルタイム音響エコーキャンセル方法およびシステムを対象とする。
【解決手段】本方法は、複数のスピーカ604、及び、第1の場所において生成される音及び該複数のスピーカによって生成される音響エコーを含む複数のマイクロフォンデジタル信号のうちの1つを生成する複数のマイクロフォン606を備えた第1の場所102から第2の場所104に伝送されるマイクロフォンデジタル信号において音響エコーを低減することを対象とする。本方法は、それぞれマイクロフォンとスピーカとの間の1つのエコーパス702に対応する複数の近似インパルス応答を求めることと、それぞれスピーカのうちの1つによって再生されるデジタル信号を多数の近似インパルス応答で畳み込むことに対応する複数の近似音響エコーを求めることとを含み、マイクロフォンデジタル信号のうちの少なくとも1つにおける音響エコーが、対応する近似音響エコーに基づいて低減される。
【選択図】図6

Description

本発明は音響エコーキャンセルに関し、詳細には、マルチチャネル音声通信システムにおいて音響エコーを低減するための方法およびシステムに関する。
インターネット、電子プレゼンテーション、ボイスメールおよび音声会議通信システムのような通信媒体への関心が高まりつつあることによって、高忠実度の音声技術および通信技術に対する要求が増大している。
現在、個人および企業が、これらの通信媒体を用いて効率性および生産性を高め、同時にコストおよび複雑性を低減している。
たとえば、音声会議通信システムによれば、ヘッドセットを装着することなく、またはハンドヘルド通信デバイスを使用することなく、第1の場所にいる一人または複数人の個人が、全二重通信線を通じて概ねリアルタイムに、他の場所にいる一人または複数人の個人と同時に会話できるようになる。
多くの音声会議通信システムにおいて、音声信号が大量のデータを搬送し、広範囲の周波数を利用する。
最新の音声会議通信システムは、感知可能な歪み、背景雑音および他の望ましくない音声アーティファクト(artifact)を含まない、「モノチャネル」とも呼ばれる単一のチャネルを介して音声信号の明瞭な伝送を提供しようと試みる。
1つの一般的なタイプの望ましくない音声アーティファクトは音響エコーである。
音響エコーは、1つの場所においてマイクロフォンおよびスピーカが結合することに起因して、伝送された音声信号が音声会議通信システムを通じてループするときに生じる可能性がある。
図1は、1つの例示的な2地点間モノチャネル音声会議通信システム100の概略図を示す。
音声会議通信システム100は、近い部屋102および遠い部屋104を含む。
近い部屋102において生成される声のような音がマイクロフォン106によって検出され、遠い部屋104において生成される音がマイクロフォン108によって検出される。
マイクロフォン106および108はそれぞれ、音をx(t)およびy(t)によって表される信号に変換する。
ただし、tは時間を表す。
マイクロフォン106は、近い部屋102において生成される多くの異なる音を検出する可能性があり、その中にはスピーカ114によって出力される音が含まれる。
マイクロフォン106によって生成されるアナログ信号は以下の式によって表される。
y(t)=s(t)+f(x(t))+ν(t)
ただし、
s(t)は、近い部屋102において生成される音を表すアナログ信号であり、
ν(t)は、マイクロフォンまたは通信チャネル110において外乱によって引き起こされる雑音または外来信号を表すアナログ信号であり、たとえば、それはスピーカ116から出力される耳障りなブーンといううなり音を生成する場合があり、
f(x(t))は、音響エコーを表すアナログ信号である。
音響エコーf(x(t))は、近い部屋102における音響的な伝搬遅延、並びに通信チャネル110および112を介するアナログ信号x(t)のラウンドトリップ伝送遅延の両方に起因する。
アナログ信号y(t)によって生成される音は、遠い部屋104内のスピーカ116から出力される。
信号y(t)の振幅における増幅または利得、および音響エコーf(x(t))の大きさによっては、遠い部屋104においてマイクロフォン108に話しかけている人が、信号s(t)によって搬送される音のほかに、音響エコーf(x(t))によって生成される音の結果としてスピーカ116から生じるエコーまたは耳障りな高ピッチのハウリング音を聞く場合がある。
音声会議通信システムの設計者および製造者は、種々の方法で音響エコーを補償しようと試みてきた。
1つの補償技法は、音響エコーを低減するフィルタリングシステムを利用する。
典型的には、フィルタリングシステムは、音声信号受信場所における条件変化に適応する適応フィルタを利用する。
近年になって、音声会議の使用感を向上させることを目指して、マルチチャネル音声通信システムを開発することへの関心が高まってきた。
これらのシステムは、第1の場所および第2の場所において、複数のマイクロフォンおよびスピーカを用いる。
しかしながら、それぞれの場所において複数のマイクロフォンおよびスピーカを用いることによって、数百ミリ秒の通信時間だけ隔てて音響エコーが引き起こされ、それが、マルチチャネル音声会議通信システムを開発することへの障害になっている。
たとえば、設計者および製造者は、スピーカを励振する前に、無相関の励振信号に対して非線形関数を利用する方法を開発した。
しかしながら、この非線形性は最終的に、空間的な音声使用感を劣化させる。
音声会議通信システムの設計者、製造者および使用者は、リアルタイムに音声信号から音響エコーを確実に除去することができ、且つ音声信号受信場所における条件変化に迅速的に適応することができるマルチチャネル音声会議通信方法およびシステムが必要であることを認識している。
本発明の種々の実施形態は、適応リアルタイム音響エコーキャンセル方法およびシステムを対象とする。
本発明の1つの方法実施の形態は、第1の場所から第2の場所に伝送される複数のマイクロフォンデジタル信号において音響エコーを低減することを対象とする。
第1の場所は、複数のスピーカおよび複数のマイクロフォンを備え、該複数のマイクロフォンのそれぞれは、第1の場所において生成される音および該複数のスピーカによって生成される音響エコーを含む、複数のマイクロフォンデジタル信号のうちの1つを生成する。
本方法は、近似インパルス応答を求めることを含み、各近似インパルス応答は、複数のマイクロフォンのそれぞれと複数のスピーカのそれぞれとの間の1つのエコーパスに対応する。
本方法は、複数の近似音響エコーを求めることも含み、各近似音響エコーは、複数のスピーカのうちの1つによって再生されるデジタル信号を多数の近似インパルス応答で畳み込むことに対応する。
マイクロフォンデジタル信号のうちの少なくとも1つにおける音響エコーが、対応する近似音響エコーに基づいて低減される。
1つの例示的な2地点間音声会議通信システムの概略図である。 アナログ信号からデジタル信号への変換を示す図である。 アナログ信号からデジタル信号への変換を示す図である。 アナログ信号からデジタル信号への変換を示す図である。 スピーカのインパルス励振のプロット、およびそのインパルス励振に応答して結果としてマイクロフォンの出力において生じる部屋全体のインパルス応答のプロットを示す図である。 入力デジタル信号をマイクロフォンインパルス応答で畳み込むことによってマイクロフォンから出力されるデジタル信号を求める例を示す図である。 入力デジタル信号をマイクロフォンインパルス応答で畳み込むことによってマイクロフォンから出力されるデジタル信号を求める例を示す図である。 入力デジタル信号をマイクロフォンインパルス応答で畳み込むことによってマイクロフォンから出力されるデジタル信号を求める例を示す図である。 入力デジタル信号をマイクロフォンインパルス応答で畳み込むことによってマイクロフォンから出力されるデジタル信号を求める例を示す図である。 畳み込み済みデジタル信号を得るために、デジタル信号を5成分インパルス応答で畳み込むことを示す図である。 本発明の一実施形態を表す混合マルチチャネル音声通信システムのブロック図である。 本発明の一実施形態による、図6に示されるスピーカとマイクロフォンとの間の音響結合を示す図である。 本発明の一実施形態による、マルチチャネルエコー制御ユニットによって実行される音響エコーキャンセルのブロック図である。 本発明の一実施形態による、近似インパルス応答ベクトルに関連付けられる決定期間および決定エポックのプロットを示す図である。 第1の場所から第2の場所に伝送される複数の音声信号において音響エコーを低減するための本発明の一実施形態を表す制御フロー図である。 本発明の一実施形態を表す、図10のステップ1008において呼び出されるルーチン「制御状態を求める」のための制御フロー図である。 本発明の一実施形態を表す、図10のステップ1008において呼び出されるルーチン「制御状態を求める」のための制御フロー図である。 本発明の一実施形態を表す、図10のステップ1008において呼び出されるルーチン「制御状態を求める」のための制御フロー図である。 本発明の一実施形態を表す、図10のステップ1009において呼び出されるルーチン「残留エコー抑圧」ための制御フロー図である。 本発明の一実施形態を表す、図10のステップ1015において呼び出されるルーチン「
Figure 2010527181
を求める」のための制御フロー図である。
本発明の一実施形態を表す、4つのタイプの制御状態の場合の増幅エネルギー対時間の1つのプロットを示す図である。 本発明の一実施形態を表す、4つのタイプの制御状態の場合の増幅エネルギー対時間の1つのプロットを示す図である。 本発明の一実施形態を表す、図14のステップ1304において呼び出されるルーチン「
Figure 2010527181
を計算する」のための制御フロー図である。
本発明の一実施形態を表す、探索空間内に配置される超楕円領域の2次元の図である。 本発明の一実施形態を表す、図14のステップ1404において呼び出されるルーチン「
Figure 2010527181
を求める」のための制御フロー図である。
本発明の一実施形態を表す、図14のステップ1406において呼び出されるルーチン「μij,mを求める」のための制御フロー図である。 本発明の一実施形態を表す、図14のステップ1407において呼び出されるルーチン「γij,mを求める」のための制御フロー図である。
本発明の種々の実施形態は、マルチチャネル音声通信システムにおけるリアルタイム適応音響エコーキャンセル方法を対象とする。
詳細には、これらの方法は、マルチチャネル音声通信システムを介して第1の場所と第2の場所との間で伝送される複数の音声信号内の音響エコーを低減する。
本発明の通信システム実施形態は、電子プレゼンテーション、ボイスメール、音声会議通信システム、または第1の場所と第2の場所との間で音声信号を伝送することができる任意の他のタイプの通信システムとすることができる。
第1の場所および第2の場所において、複数のマイクロフォンおよびスピーカが用いられる。
本発明の方法実施形態は、マイクロフォンとスピーカとの間の音響結合毎に制御状態を計算する。
その制御状態は、以下の4つのタイプの通信、(1)第1の場所からのみ音が伝送される;(2)第2の場所からのみ音が伝送される;(3)第1の場所と第2の場所との間で同時に音が伝送される;および(4)第1の場所と第2の場所との間で音が伝送されない、のうちの1つのタイプを特徴付ける。
その後、その方法は、第1の場所に配置されるマイクロフォンによって検出される信号毎に、制御状態に基づいて近似音響エコーを計算する。
その方法は、第2の場所から第1の場所に伝送されるデジタル信号のそれぞれから、対応する計算された近似音響エコーを減算し、それらの信号が第1の場所において出力される前に、これらの信号の利得を調整する。
本発明の実施形態は本来は数学的であり、このため、多数の式およびグラフ表示を参照しながら下記で説明される。
音響エコーキャンセルの技術分野の熟練者にとっては、本発明の実施形態を十分に説明すると共に特徴付けるのに数式だけで十分であるかもしれないが、以下の論考に含まれる、さらに図式的で問題志向の例、および制御フロー図による手法は、本発明が種々の経歴を有する読者にとって理解しやすいように、本発明の多くの実施形態のうちの1つだけを例示するように意図される。
本発明の種々の実施形態の説明を理解するのを助けるために、最初のサブセクションにおいて、デジタル信号、インパルス応答および畳み込みの概説が提供される。
第2のサブセクションにおいて、本発明の実施形態が提供される。
デジタル信号、インパルス応答および畳み込みの概説:
このセクションは、モノチャネル音声伝送システムにおけるデジタル信号、インパルス応答および畳み込みの概括的な説明を提供するように意図される。
その後、このサブセクションにおいて導入される概念を用いて、次のサブセクションにおいて下記で説明されるマルチチャネル音響エコー実施形態における音声チャネルのそれぞれが説明される。用語「マイクロフォン」は、音を信号に変換する変換器または任意の適切なデバイスを指している。
「スピーカ」は、信号を音に変換することができる任意の適切なデバイスを指している。
マイクロフォンによって受信される音は、時間依存性の、絶えず変化する電圧を含むアナログ信号に変換される。
デジタルコンピュータを用いてアナログ信号を処理するために、そのアナログ信号は最初に、アナログ信号に含まれる不可欠な情報を最小限に変更したデジタル信号に変換される。
デジタル信号は、電子的に、磁気的に、または光学的に格納することができ、コンピュータプログラム内に符号化される論理演算を用いて処理することができる。
図2A〜図2Cは、アナログ信号のデジタル信号への変換を示す。
図2Aおよび図2Bでは、横軸202のような横軸は時間を表し、縦軸204のような縦軸は、ボルト単位のアナログ信号振幅を表す。
図2Aは、時間依存性の、絶えず変化するアナログ信号x(t)206のプロットである。
アナログ信号x(t)206は最初に、離散的なサンプリング時刻において、アナログ信号x(t)の振幅を測定することによってサンプリングされる。
アナログ信号に含まれる不可欠な情報が失われるのを防ぐために、サンプリング時刻間の持続時間は一般的に、連続したサンプリング時刻間でアナログ信号がほとんど変化しないほど十分に短くなるように選択される。
図2Bは、図2A内のアナログ信号206をサンプリングすることによって得られるサンプリング済み信号208のプロットである。
サンプリング時間は数十分の1秒であり、サンプリング済み信号208は、サンプリング時刻間で一定の信号振幅を仮定することによって、ステップ関数として近似される。
たとえば、定振幅領域210は、サンプリング時刻0.2秒と0.3秒との間で−1.9ボルトの一定値を表す。
効率的に、且つ都合よくデジタル信号を処理するために、時間および大きさの両方の値が整数であることが望ましい。
それゆえ、ステップ関数内の各ステップの振幅およびサンプリング時刻を表す整数値を生成するために、各定振幅領域の値に第1の定数を乗算することによって、且つサンプリング時刻に第2の定数を乗算することによって、整数符号化されたデジタル信号が生成される。
整数値化されたサンプリング時刻は「時刻サンプル」と呼ばれ、整数値化された振幅は「デジタル振幅」と呼ばれる。
結果として生成されたデジタル信号は、x[n]によって関数で表すことができる。
ただし、nは独立変数であり、時刻サンプル領域を表す。
図2Cは、図2B内のサンプリング済み信号208から得られるデジタル信号のプロットである。
図2Cでは、横軸212は、時刻サンプル領域であり、縦軸214は、デジタル信号軸である。
グラフ内の各点は、スケールされたサンプリング時刻におけるデジタル信号のスケールされた振幅を表す量子化された値を表す。
たとえば、座標(2,−19)の点x[2]216は、図2Bのステップ210を表す。
デジタル信号x[n]は、一般的に、一連のインパルスと見なすことができ、各インパルスは固有の成分に対応する。
表記x[n]は、デジタル信号の「成分」と呼ばれるデジタル信号の単一のインパルスを表すために用いることもできる。
ただし、nは特定の時刻サンプルを表す。
各成分は、単一の時刻サンプルにおける振幅を表す単一の値を除いて全て0のサンプル値を含む信号であり、それは数学的には以下の式によって表される。
x[n]=dδ[n−p]
ただし、
dはインパルスの振幅、すなわち強さを表す整数倍率であり、
pは時刻サンプルであり、
δは以下の式によって定義されるδ関数である。
Figure 2010527181
たとえば、図2Cでは、成分x[0]218は10δ[p]に等しく、成分x[2]216は−19δ[2−p]に等しい。
言い換えると、デルタ関数δ[n−p]内のpは時刻サンプルシフトを表し、n−pは時刻サンプルnに対する時刻サンプルを表す。
デジタルインパルス応答h[n]は、マイクロフォンへの入力が単位インパルスδ[n]であるときにマイクロフォンから出力されるデジタル信号である。
ただし、pは「0」であり、dは「1」に等しい。
マイクロフォンのインパルス応答は、非常に持続時間が短い音のインパルスをマイクロフォンに加えて、マイクロフォンによって出力される信号を測定することによって求めることができる。
マイクロフォンのインパルス応答は、以下のようにベクトルによって表すこともできる。
Figure 2010527181
ただし、
[・]はインパルス応答成分であり、
Lはインパルス応答を構成する成分の数である。
図3は、インパルスx[n]のプロット、およびインパルスx[n]に応答して生成される部屋全体のインパルス応答h[n]のプロットである。
インパルス応答h[n]は、スピーカによって生成される音インパルス、および室内で反射され、マイクロフォンによって受信されるインパルスの音を含む。
図3において、インパルスプロット302は、仮想的なマイクロフォン304に入力されるインパルスx[n]を表す。
インパルスx[n]302は、n=0における単一の0でない点306を除いて全て0を含み、それはdδ[n−p]によって表される。
この場合、dは「1」に等しく、pは「0」に等しいので、インパルスはδ[n]によって表すことができる。
インパルス302に応答して、マイクロフォン304は、インパルス応答プロット308によって表されるインパルス応答h[n]を出力する。
インパルス応答308は、点310〜312によって表される3つの0でないデジタル信号を除いて全て0を含む。
1つのインパルスへの実際のデジタルインパルス応答は典型的には、図3に示されるように、そのインパルス内に含まれる数よりも多くの数の0でない成分を含む。
インパルス応答308は、3成分ベクトルによって表すことができる。
Figure 2010527181
典型的には、インパルス応答を求めるために用いられるインパルスは、スピーカによって部屋の中に出力され、マイクロフォンによって検出される。
スピーカ、部屋およびマイクロフォンは「システム」と呼ばれ、関連付けられるインパルス応答は「システムインパルス応答」と呼ぶことができる。
システムのスピーカによって生成されるデジタル信号は、スピーカによって生成される音を表すデジタル信号x[n]をシステムのインパルス応答h[n]で畳み込むことによって求められる。
畳み込み済みのデジタル信号はx[n]によって表される。
図4A〜図4Dは、システムから出力されるデジタル信号x[n]を生成するために、仮想的なスピーカによって生成される3成分デジタル信号x[n]をインパルス応答h[n]で畳み込む一実施例をグラフで与える。
図4Aは、仮想的なシステムによって生成される2成分インパルス応答例h[n]402のプロットである。
インパルス応答h[n]は、時間と共に変化しないものと仮定される。
図4Bは、時刻サンプル「0」におけるデジタル信号x[n]の第1の成分のプロットである。
第1の成分は、スケールされたインパルス2δ[0]404によって表される。
システムは、インパルス2δ[n]404に応答して、時刻サンプル「0」において第1の成分406を含むインパルス応答h[n]を出力し、後の時刻サンプル「1」において第2の成分408を出力する。
インパルス2δ[n]404に対するインパルス応答は基本的に、インパルス倍率「2」を乗算した成分を有する、図4Aのインパルス応答である。
図4Cは、後の時刻サンプル「1」においてシステムに入力されるデジタル信号x[n]の第2の成分のプロットである。
第2の成分は、インパルスδ[n−1]410によって表される。
システムは、インパルスδ[n−1]410に応答して、時刻サンプル「1」において第3の成分412を含むインパルス応答を出力し、後の時刻サンプル「2」において第4の成分414を出力する。
インパルスδ[n−1]410に対するインパルス応答は基本的に、「1」倍だけシフトした成分時刻サンプルを有する、図4Aのインパルス応答である。
第2の成分408および第3の成分412は同じ時刻サンプル「1」において生じるので、時刻サンプル「1」における出力である第5の成分416を得るために、成分408および412の振幅は加算される。
図4Dは、時刻サンプル「2」においてシステムに入力されるデジタル信号x[n]の第3の成分のプロットである。
第2の成分は、インパルス−2δ[n−2]418によって表される。
システムは、インパルス−2δ[n−2]に応答して、時刻サンプル「2」において第6の成分420を含むインパルス応答を出力し、後の時刻サンプル「3」において第7の成分422を出力する。
インパルス−2δ[n−2]418に対するインパルス応答は基本的に、倍率「−2」を乗算した成分、および「2」倍だけシフトした成分時刻サンプルを有する、図4Aのインパルス応答である。
第5の成分414および第6の成分420は同じ時刻サンプル「2」において生じるので、時刻サンプル「2」における出力である第8の成分424を与えるために、成分414および420の振幅は加算される。
3成分入力デジタル信号x[n]を2成分インパルス応答h[n]で畳み込むことによって、4成分デジタル信号x[n]が出力されることに留意されたい。
一般的に、N成分入力デジタル信号x[n]をL成分インパルス応答h[n]で畳み込むことによって、N+L−1成分の畳み込み済みデジタル信号x[n]が与えられる。
図4Dにおける畳み込み済みデジタル信号x[n]426の成分は、インパルス応答の2成分ベクトル表現と、以下の式によって与えられるデジタル信号x[n]の各成分に対応する2成分ベクトルとのスカラー積またはドット積を計算することによって求めることもできる。
Figure 2010527181
列ベクトル
Figure 2010527181
および
Figure 2010527181
内の成分の順序は、時間順序において互いに逆である。
たとえば、列ベクトル
Figure 2010527181
において、第1の成分h[0]が第2の成分h[1]よりも時間的に前に現れ、一方、列ベクトル
Figure 2010527181
において、第1の成分x[n]が第2の成分x[n−1]よりも時間的に後に現れる。
負の値を有する時刻サンプルに対応するベクトル
Figure 2010527181
の成分は値「0」を割り当てられることに留意されたい。
たとえば、図4Dの第1の成分406は、以下の式によって計算される。
Figure 2010527181
ただし、成分x[−1]は値「0」を割り当てられ、上付き文字Tは、行列の転置演算を特定する。
第2の成分416、第3の成分424および第4の成分422は以下のように計算される。
Figure 2010527181
一般的に、畳み込み済みデジタル信号の成分x[n]は数学的に以下の式によって求められる。
Figure 2010527181
ただし、「」は畳み込みを表す記号であり、
Figure 2010527181
である。
畳み込み済み信号成分x[n]を計算するために、デジタル信号x[n]の成分のうちの先行して得られたL個のデジタル信号成分が用いられ、負の値を有する時刻サンプルに対応するベクトル
Figure 2010527181
の成分は値「0」を割り当てられる。
畳み込みは以下のように表すこともできる。
Figure 2010527181
図5は、プロット504内に表示される畳み込み済みデジタル信号を得るために、プロット502内に表示されるデジタル信号を5成分インパルス応答で畳み込むことを示す。
プロット502および504において、横軸506のような横軸は時刻サンプル軸であり、縦軸508のような縦軸はデジタル数軸である。
プロット504内の畳み込み済みデジタル信号サンプル510は、図5に示されるように得られ、数学的には以下の式によって表される。
Figure 2010527181
上述した畳み込みの例では、インパルス応答は、時間領域内の各時刻サンプルにおいて一定のままであるものと仮定される。
しかしながら、実際には、システムのインパルス応答は多くの場合に、部屋の条件に依存する。
言い換えると、システムのインパルス応答は、部屋の条件が変化するのに応じて、経時的に変化する場合がある。
たとえば、部屋内で音が生成されていないシステムのインパルス応答は、後に部屋内で音が生成される時点の同じシステムのインパルス応答とは異なる。
本発明の実施形態:
本発明の種々の実施形態は、第1の場所と第2の場所との間で伝送される複数の音声信号において音響エコーを低減するための、適応的で、リアルタイムの音響エコーキャンセル方法およびシステムを対象とする。
音響エコーキャンセル方法およびシステムの実施形態の概説が最初に説明され、その後、本発明の多くの実施形態のうちの1つが説明される。
本発明の実施形態は、多数のブロック図、制御フロー図、数式およびグラフ表示を参照しながら説明される。
1.混合マルチチャネル音声通信システムにおける音響エコーキャンセルの概説:
図6は、本発明の一実施形態を表す、混合マルチチャネル音声通信システム600のブロック図を示す。
混合マルチチャネル音声通信システム600は、マルチチャネルエコー制御ユニット(「MECU」)602と、近い部屋102内に配置されるI個のスピーカ604およびJ個のマイクロフォン606とを備える。
ただし、IおよびJはそれぞれ、スピーカの全数およびマイクロフォンの全数を表す自然数である。
遠い部屋104において生成されるデジタル信号x[n],...,x[n]がMECU602に伝送され、近い部屋102内に配置されるスピーカ604を通じて同時に再生される。
マイクロフォン606が、近い部屋102内に位置する人々、音声デバイスおよび他の雑音発生源によって生成された音を検出し、且つスピーカ604から生じる音によって生成される残響音またはエコーを検出する。
スピーカ604とマイクロフォン606との間の音響結合が、図7を参照しながら下記で説明される。
マイクロフォン606によって検出された音は、J個のマイクロフォンデジタル信号y[n],...,y[n]の形でMECU602に伝送される。
図8を参照しながら下記でさらに詳細に説明されるMECU602は、J個の処理済みデジタル信号r[n],...,r[n]を得るために、マイクロフォンデジタル信号y[n],...,y[n]を処理する。
それらの処理済みデジタル信号は、音響エコーおよび背景雑音が概ねない信号であり、遠い部屋104に伝送される。
本発明の以下の説明では、表記{・}は、N個のデジタル信号から成る集合を表す簡潔な方法として導入される。
ただし、Nは集合内の要素の数である。
たとえば、デジタル信号x[n],...,x[n]は、代わりに、{x[n]}によって表すこともできる。
任意の所与の時刻サンプルnにおいて、近い部屋102内に配置される各スピーカと各マイクロフォンとの間に結合が存在する場合がある。
この結合は、「エコーパス」と呼ばれ、第iのスピーカおよび第jのマイクロフォンの音響結合毎に、時間と共に変化する実数値インパルス応答ベクトル
Figure 2010527181
が存在する。
ただし、i∈{1,...,I}はスピーカのインデックス (index)であり、j∈{1,...,J}はマイクロフォンのインデックスである。
図7は、本発明の一実施形態を表す、図6に示される、スピーカ604とマイクロフォン606との間の音響結合を示す。
図7に示されるように、スピーカおよびマイクロフォンを結合するエコーパスのうちの16個が線によって表されており、これらの16個のエコーパスのうちの4個が対応するインパルス応答ベクトル
Figure 2010527181
をラベル付けされている。
たとえば、時刻サンプルnにおいて、第2のスピーカ704と第1のマイクロフォン706との間のエコーパス702に関連付けられるインパルス応答ベクトルは
Figure 2010527181
である。
第iのスピーカを通じて再生され、第jのマイクロフォンによって検出される特定のデジタル信号x[n]の残響バージョンまたはエコーは、
Figure 2010527181
によって表される。
第jのマイクロフォンによって検出されるデジタル信号{x[n]}に関連付けられる全エコーは以下の式によって与えられる。
Figure 2010527181
図6および図7に示されるように、マイクロフォン606はJ個のマイクロフォンデジタル信号{x[n]}をMECU602に伝送する。
ただし、各マイクロフォンデジタル信号は以下の式によって特徴付けられ、
[n]=s[n]+e[n]
[n]は、近い部屋102内に位置する人々、音声デバイスおよび他の雑音発生源によって生成された局所音源信号を表す。
本発明の方法およびシステム実施形態は、マイクロフォンデジタル信号毎に、局所音源信号{s[n]}に対して大きな歪みを引き起こすことなく、対応するマイクロフォンデジタル信号{y[n]}から、音響エコー{e[n]}を概ねキャンセルすることを対象とする。
図8は、本発明の一実施形態を表す、図6に示されるMECU602によって実行される音響エコーキャンセルのブロック図を示す。
MECU602は、入力チャネル804〜806およびマイクロフォンチャネル810〜808を推定および追跡ブロック802に接続する矢印によって示されるように、デジタル信号{x[n]}およびマイクロフォンデジタル信号{y[n]}を受信する推定および追跡ブロック802を含む。
推定および追跡ブロック802は、近似インパルス応答ベクトルを生成して、
Figure 2010527181
を生成し、それに応じて、それらは、J個の適応フィルタにおいてマイクロフォンデジタル信号{y[n]}から減算され、それらのフィルタのうちの3つが破線の枠812〜814によって表される。
しかしながら、時刻サンプルn毎に近似インパルス応答ベクトル
Figure 2010527181
を生成するのではなく、本発明の方法実施形態は、インパルス応答ベクトル
Figure 2010527181
が、「コヒーレンス時間」と呼ばれる多数の時刻サンプルNにわたってほとんど変化しないという仮定に基づく。
言い換えると、インパルス応答ベクトル毎に、N個の時刻サンプルにわたる最大偏差は、以下の式によって制限される。
Figure 2010527181
ただし、Eは、インパルスに応答してマイクロフォンによって生成される最大増幅エネルギーまたは利得を表す。
結果として、本発明の方法は、時刻サンプルn毎に近似インパルス応答ベクトルの集合
Figure 2010527181
を求める代わりに、N個の時刻サンプル毎の開始時点において、
Figure 2010527181
によって表される近似インパルス応答ベクトルの集合を計算する。
ただし、N<<Nであり、mは正の整数である。
個の時刻サンプルに伴う時間間隔は「決定期間」と呼ばれ、決定期間の開始時点は「決定エポック」と呼ばれる。
図9は、本発明の実施形態を表す、近似インパルス応答ベクトルに関連付けられる決定期間および決定エポックのプロットを示す。
図9において、横軸902は時間軸を表し、構造904〜907はデジタル信号を表しており、エコーパスのためのインパルス応答を近似する。
縦方向の各線分は時刻サンプルに関連付けられるデジタル信号またはインパルス応答を表す。
詳細には、構造904内の縦方向の線分は、n+1個の連続したインパルス応答ベクトル
Figure 2010527181
を表し、構造905内の縦方向の線分は、n+1個のマイクロフォンデジタル信号y[n]を表し、構造906内の縦方向の線分は、n+1個のデジタル信号x[n]を表す。
図8において、決定期間は6時刻サンプルから構成され、それぞれの開始時点は破線908〜910のうちの1つによって特定される。
本発明の方法実施形態によれば、推定および追跡ブロック802は、各決定期間の開始時点において、近似インパルス応答ベクトルの新たな集合
Figure 2010527181
を生成する。
たとえば、決定期間912中に、推定および追跡ブロック802が、決定期間912のための残響デジタル信号
Figure 2010527181
を求めるために用いられる近似インパルス応答ベクトル
Figure 2010527181
を生成するものと仮定する。
次の決定期間914の開始時点908において、推定および追跡ブロック802は、新たな近似インパルス応答ベクトル
Figure 2010527181
を生成し、その後、その新たな近似インパルス応答ベクトルを用いて、決定期間914の次のN個の時刻サンプルのための残響デジタル信号
Figure 2010527181
が求められる。
一般的に、決定期間mNの開始時点において、近似インパルス応答ベクトルの集合
Figure 2010527181
が、時間間隔[mN,(m+1)N−1]内の時刻サンプルn毎の近似インパルス応答ベクトルとして計算される。
図8に戻ると、適応フィルタ812〜814は、J個の適応フィルタのうちの最初の2つおよび最後のフィルタを表しており、該フィルタのそれぞれは、近似的な残響デジタル信号
Figure 2010527181
を得るために、デジタル信号{x[n]}を推定および追跡ブロック802によって生成される対応する近似インパルス応答ベクトル
Figure 2010527181
で畳み込むことを表す。
たとえば、適応フィルタ812は、デジタル信号{x[n]}を、近似インパルス応答ベクトル
Figure 2010527181
でそれぞれ畳み込むことを表しており、それは、近似的な残響デジタル信号
Figure 2010527181
を与える。
一般的に、第jの適応フィルタは、近似的な残響デジタル信号
Figure 2010527181
を得るために、デジタル信号{x[n]}を近似インパルス応答ベクトル
Figure 2010527181
でそれぞれ畳み込むことを表す。
J個の適応フィルタのそれぞれに関連付けられる残響デジタル信号を加算することによって、J個の近似音響エコーから成る集合
Figure 2010527181
が生成される。
ただし、各ベクトルは以下の式によって与えられる。
Figure 2010527181
J個の近似音響エコー
Figure 2010527181
は、生成されるのに応じて、加算接合部816〜818のような加算接合部においてマイクロフォンデジタル信号{y[n]}のそれぞれから減算され、結果として、J個の制御済みデジタル信号
Figure 2010527181
が生成され、それらの信号の各要素は以下の式によって与えられる。
Figure 2010527181
その差
Figure 2010527181
は「残留エコー」と呼ばれる。
推定および追跡ブロック802によって実行される本発明の方法実施形態は、残留エコーを低減することを対象とする。
また、推定および追跡ブロック802は、制御済みデジタル信号
Figure 2010527181
のそれぞれの非線形処理も制御する。
たとえば、マイクロフォンチャネル808〜810内に非線形処理ブロック(「NPB」)820〜822が配置されており、それらは、推定および追跡ブロック802によって実行されるJ個の非線形処理のうちの3つを表す。
NPBは、J個の処理済みデジタル信号{r[n]}を生成するために、対応する制御済みデジタル信号によって搬送される背景雑音および任意の残留エコーを減衰させる。
図6を参照しながら上述したように、MECU602はJ個の処理済みデジタル信号{r[n]}を生成し、それらは、音響エコーおよび背景雑音が概ねない遠い部屋104に伝送される。
図6に示されるように、MECU602は、近い部屋102の外に配置することができる。
実際に、本発明の特定の実施形態では、MECU602は、隣の部屋に、同じ建物内の一室に、または近い部屋102から数十、さらには数千マイルも離れて位置する部屋内に配置することができる。
本発明の他の実施形態では、MECU602は、近い部屋102内に配置することができる。
本発明の他の実施形態では、遠い部屋104から近い部屋102に伝送されるデジタル信号{x[n]}内の音響エコーをキャンセルするために、第2のMECUを備えることができる。
II.実施態様:
推定および追跡ブロック802は、近い部屋102と推定および追跡ブロック802との間で伝送される信号のための直流(「DC」)オフセット除去も含む場合がある。
DCオフセットは、電気的な干渉によって引き起こされることが多い低周波の歪みである。
この電気的な干渉は、一定の電圧を生成し、それにより、スピーカから出力される音の中にクリック音およびポップ音を引き起こす可能性がある。
DCオフセット除去は、以下のように、遠い部屋104において生成されるデジタル信号{x[n]}のそれぞれにおけるDCオフセットを補正し、
[n]=ax[n−1]+.5(1+a)(xi,rec[n]−xi,rec[n−1])
以下のように、近い部屋102において生成されるマイクロフォンデジタル信号{y[n]}のそれぞれにおけるDCオフセットを補正する。
[n]=ay[n−1]+.5(1+a)(yj,mic[n]−yj,mic[n−1])
ただし、aは約0.9〜0.9999の範囲の定数である。
図10〜図16および以下の論考において示される制御フロー図は、マイクロフォンデジタル信号{y[n]}内の音響エコーを低減すると共に、関連付けられる処理済みデジタル信号{r[n]}を生成するための多くの方法実施形態のうちの1つの実施形態の説明を提供する。
図10は、近い部屋102から遠い部屋104まで伝送される複数の音声信号内の音響エコーを低減するための本発明の一実施形態を表す制御フロー図を示す。
図10のステップ1001では、下記で記述される式において用いられるパラメータが初期化される。
表1〜表3は、或る特定の用途において用いられる場合があるこれらのパラメータおよび関連付けられる初期値例を示す。
表1〜表3において示される値は、部屋の構成に依存し、それゆえ、変わることがあることに留意されたい。
表1は、本発明の方法実施形態の動作中に典型的には変更されないままである定数を示す。
また、表1は、定数のそれぞれに関連付けられる値例も含む。
Figure 2010527181
表1において示されるパラメータに関連付けられる値は、近い部屋および遠い部屋の種々の条件、および部屋の構成に基づいて調整できることに留意されたい。
パラメータPは、図10のステップ1004を参照しながら下記で説明されるデジタル信号ベクトル
Figure 2010527181
内のデジタル信号y (m)[n]の数である。
パラメータNは、周波数領域ベクトル
Figure 2010527181
および
Figure 2010527181
内のデジタル信号の数である。
パラメータβ、η、λ、KおよびKは、図10〜図14を参照しながら下記で説明される式の項に相対的重要度または重みを割り当てるために用いられる値である。
パラメータGmaxおよびGminは、J個のマイクロフォンのそれぞれに関連付けられる最大利得および最小利得である。
パラメータMは、図10を参照しながら下記で説明されるダブルトーク中に用いられる。
表2は、図11〜図12を参照しながら下記で説明される方法の反復中に変化する可変パラメータのための初期値を示す。
Figure 2010527181
パラメータ
Figure 2010527181
および
Figure 2010527181
はそれぞれ、デジタル信号x (m)[n]およびy (m)[n]に関連付けられる短期エネルギー分散(variance)である。
パラメータ
Figure 2010527181
は制御済みデジタル信号
Figure 2010527181
内のエネルギーに関連付けられる短期エネルギー分散である。
パラメータ
Figure 2010527181
および
Figure 2010527181
はそれぞれ、デジタル信号x (m)[n]およびy (m)[n]に関連付けられる長期エネルギー分散である。
パラメータ
Figure 2010527181
は雑音に関連付けられる長期エネルギー分散である。
パラメータMi,x 2(0)およびMj,y 2(0)は、デジタル信号x (m)[n]およびy (m)[n]に関連付けられる最大二乗エネルギーである。
パラメータG(0)は、図12を参照しながら下記で説明される初期利得適応値である。
表3は、図13〜図14を参照しながら下記で説明される方法の反復中に変化するベクトル
Figure 2010527181
および
Figure 2010527181
の成分のための初期値を示す。
Figure 2010527181
ベクトル
Figure 2010527181
はベクトル
Figure 2010527181
に関連付けられる初期平均スペクトルであり、ベクトル
Figure 2010527181
はベクトル
Figure 2010527181
に関連付けられる初期平均スペクトルであり、それらは、図14Aのステップ1402を参照しながら下記で説明される。
ベクトル
Figure 2010527181
は図14Aのステップ1405を参照しながら下記で説明される発展信頼領域(evolving trust region)を定義する。
ベクトル
Figure 2010527181
は図14Aのステップ1408を参照しながら下記で説明される初期シャドーインパルス応答ベクトルである。
ベクトル
Figure 2010527181
は図14Aのステップ1409を参照しながら下記で説明される初期近似インパルス応答ベクトルである。
ステップ1002においてforループが始まると、ステップ1003〜1015が決定エポックm毎に繰り返される。
ステップ1003においてforループが始まると、時刻サンプルn毎にステップ1004〜1012が繰り返される。
ステップ1004では、推定および追跡ユニット802が遠い部屋104から出力されるI個のデジタル信号{x (m)[n]}、および近い部屋102から出力されるJ個のデジタル信号{y (m)[n]}を受信する。
ステップ1005では、デジタル信号ベクトルの集合
Figure 2010527181
が形成される。
ただし、各デジタル信号ベクトルは、デジタル信号x (m)[n]およびL+P−1個の先行するデジタル信号x (m)[n]から形成される(L+P)成分デジタル信号ベクトル
Figure 2010527181
である。
またステップ1005では、マイクロフォンデジタル信号ベクトルの集合
Figure 2010527181
が形成される。
ただし、各マイクロフォンデジタル信号ベクトルは、マイクロフォンデジタル信号y (m)[n]およびP−1個の先行するデジタル信号y (m)[n]から形成されるP成分マイクロフォンデジタル信号ベクトル
Figure 2010527181
である。
ステップ1006では、集合
Figure 2010527181
および
Figure 2010527181
内の各ベクトルに高速フーリエ変換(「FFT」)が適用され、それによって対応する周波数領域ベクトルの集合
Figure 2010527181
および
Figure 2010527181
が得られる。
ただし、ベクトル要素は以下の式によって与えられる。
Figure 2010527181
FFTおよび対応する逆高速フーリエ変換(「IFFT」)は、時刻サンプル領域において畳み込みを実行するのを避けるために用いられることが多いタイプのフーリエ変換である。
FFTおよびIFFTを用いることは、時刻サンプル領域においてデジタル信号を畳み込むことよりも数百倍、さらには数千倍速くなり得る。
デジタル信号処理の分野のための多くの参考文献のうちの1つにすぎないが、多数の異なるFFT方法およびIFFT方法が、A. Oppenhiemer、R. SchaferおよびJ. Buck著「Discrete-Time Signal Processing(第2版)」(Prentice Hall, Inc.,(1999-2000))において記述される。
上記で参照された書籍から、またはこの分野における多くの他の教本、論文および雑誌記事から、さらなる詳細を入手することができる。
ステップ1007では、制御済みデジタル信号ベクトルの集合
Figure 2010527181
が計算される。
ただし、各制御済みデジタル信号ベクトルは以下のように計算される。
Figure 2010527181
ただし、
Figure 2010527181
は長さNの打切り演算子であり、
Figure 2010527181
」は2つのベクトルの成分毎の乗算を表し、
Figure 2010527181
であり、
Figure 2010527181
は第jのマイクロフォンデジタル信号内の周波数領域音響エコーを表す。
3つ組(1,2,3)および(3,1,2)の成分毎の乗算は以下のように表される。
Figure 2010527181
ステップ1008では、ルーチン「制御状態を求める」が呼び出され、該ルーチンは、近い部屋102と遠い部屋104との間に存在する可能性がある4つのタイプの音声信号伝送を特定する。
4つのタイプの音声信号伝送は、「制御状態」(「CS」)と呼ばれ、以下のように特定される:(1)近端の部屋102からのみ音声信号が出力され、SNEOによって表される;(2)遠端の部屋104からのみ音声信号が出力され、SFEOによって表される;(3)近端の部屋102および遠端の部屋104の両方から同時に音声信号が出力され、「ダブルトーク」呼ばれ、SDTよって表される;(4)近端の部屋102および遠端の部屋104から音声信号が出力されず、SNSによって表される。
ステップ1009では、J個の利得補正された処理済みデジタル信号{r (m)[n]}を計算するために、ルーチン「残留エコー抑圧」が呼び出される。
ステップ1010では、処理済みデジタル信号{r (m)[n]}が遠い部屋104に伝送される。
ステップ1011では、nが(m+1)N−1以下であるとき、制御がステップ1012に移り、そうでない場合には、制御はステップ1013に移る。
ステップ1012では、時刻サンプルnが「1」だけインクリメントされ、ステップ1004〜1011が繰り返される。
言い換えると、N決定期間中に、近似インパルス応答ベクトル
Figure 2010527181
は更新されない。
ステップ1013では、別の決定エポックmが入手可能であるとき、制御がステップ1014に移り、そうでない場合には、ルーチン「{r[n]}を求める」が終了される。
ステップ1014では、決定エポックmが「1」だけインクリメントされる。ステップ1015では、ルーチン「
Figure 2010527181
を求める」が呼び出される。
言い換えると、N個の決定エポックを有する新たな決定期間が開始され、近似インパルス応答ベクトルが更新される。
図11A〜図11Cは、本発明の一実施形態を表す、図10のステップ1008において呼び出されるルーチン「制御状態を求める」のための制御フロー図を示す。
図11Aのステップ1101においてforループが始まると、インデックスi∈{1,...,I}毎にステップ1102〜1114が繰り返される。
ステップ1102では、ベクトル
Figure 2010527181
に関連付けられる平均二乗エネルギーが以下のように計算され、
Figure 2010527181
その平均二乗エネルギーに関して長期エネルギー分散が以下の式によって再帰的に求められる。
Figure 2010527181
ステップ1103〜1107では、デジタル信号ベクトル
Figure 2010527181
に関連付けられる最大二乗エネルギーMi,x 2(m)が求められる。
ステップ1103では、最大二乗エネルギーMi,x 2(m−1)が平均二乗エネルギーEi,x 2(m)未満である場合には、制御がステップ1104に移り、そうでない場合には、制御はステップ1105に移る。
ステップ1104では、最大二乗エネルギーは以下の式によって計算され、
Figure 2010527181
制御はステップ1108に移る。
ステップ1105では、平均二乗エネルギーEi,x 2(m)が0.1Mi,x 2(m−1)よりも大きいとき、制御がステップ1106に移り、そうでない場合には、制御はステップ1107に移る。
ステップ1106では、最大二乗エネルギーが以下の式によって計算され、
Figure 2010527181
制御はステップ1108に移る。
ステップ1107では、最大二乗エネルギーMi,x 2(m)が、先行する決定期間からのMi,x 2(m−1)の値を割り当てられる。
ステップ1108〜1113では、ブール論理値「真」および「偽」がブール変数T1、T2に割り当てられる。
ステップ1108では、長期分散
Figure 2010527181
が0.01Mi,x 2(m)以上であるとき、制御がステップ1109に移り、T1が「真」に設定され、そうでない場合には、制御はステップ1110に移り、T1は「偽」に設定される。
ステップ1111では、平均二乗エネルギーEi,x 2(m)が0.01Mi,x 2(m)以上であるとき、制御がステップ1112に移り、T2が「真」に設定され、そうでない場合には、制御はステップ1114に移り、T2は「偽」に設定される。
ステップ1114では、iがIよりも大きい場合には、制御が図11Bのステップ1116に移り、そうでない場合には、制御はステップ1115に移る。
ステップ1115では、iが「1」だけインクリメントされ、ステップ1102〜1114が繰り返される。
図11Bのステップ1116においてforループが始まると、インデックスj∈{1,...,J}毎にステップ1117〜1131が繰り返される。
ステップ1116では、以下のように、
Figure 2010527181
およびシャドーエラーベクトル
Figure 2010527181
に関して平均エネルギーが計算され、
Figure 2010527181
以下の式によって、それらの平均二乗エネルギーに関して長期エネルギー分散が再帰的に求められる。
Figure 2010527181
ステップ1118〜1122では、デジタル信号ベクトル
Figure 2010527181
に関連付けられる最大二乗エネルギーMi,y 2(m)が求められる。
ステップ1118では、最大二乗エネルギーMi,y 2(m−1)が平均二乗エネルギーEi,y 2(m)未満であるとき、制御がステップ1119に移り、そうでない場合には、制御はステップ1120に移る。
ステップ1119では、最大二乗エネルギーが、以下の式によって計算され、
i,y 2(m)=min{Ei,y 2(m),10Mi,y 2(m−1)}
制御がステップ1123に移る。
ステップ1120では、平均二乗エネルギーEi,y 2(m)が0.1Mi,y 2(m−1)よりも大きいときに、制御がステップ1121に移り、そうでない場合には、制御はステップ1121に移る。
ステップ1121では、最大二乗エネルギーが以下の式によって計算され、
i,y 2(m)=0.999Mi,y 2(m−1)+0.001Ei,y 2(m)
制御がステップ1123に移る。
ステップ1123〜1128では、ブール論理値「真」および「偽」が、ブール変数T3、T4に割り当てられる。
ステップ1123では、平均二乗エネルギー
Figure 2010527181
が、
Figure 2010527181
以上であるとき、制御がステップ1124に移り、T3が「真」に設定され、そうでない場合には、制御はステップ1125に移り、T3は「偽」に設定される。
ステップ1126では、長期分散
Figure 2010527181
が0.01Mi,y 2(m)以上であるときに、制御がステップ1127に移り、T4が「真」に設定され、そうでない場合には、制御はステップ1128に移り、T4は「偽」に設定される。
ステップ1129では、以下の式に従って、エコーリターンロスエンハンスメント値(「ERLE」)が計算される。
Figure 2010527181
ただし、
Figure 2010527181
は平均二乗エネルギーEi,x 2(m)および
Figure 2010527181
にそれぞれ関連付けられる短期分散である。
ERLEを用いて、システムが状態SFEOにあるときに音響エコーキャンセルの性能を測定することができ、システムが図13Aのステップ1309において下記で説明されるダブルトークにあるときに近似インパルス応答ベクトルを求めることができる。
ステップ1130では、jがJよりも大きいとき、制御が図11Cのステップ1132に移り、そうでない場合には、制御はステップ1131に移る。
ステップ1131では、jが「1」だけインクリメントされ、ステップ1117〜1130が繰り返される。
図11Cのステップ1132においてforループが始まると、j∈{1,...,J}毎にステップ1133〜1145が繰り返される。
ステップ1133においてforループが始まると、i∈{1,...,I}毎にステップ1134〜1143が繰り返される。
ステップ1134〜1141では、図11Aのステップ1108〜1113および図11Bのステップ1123〜1128において求められたブール論理値を用いて、エコーパス毎の制御状態CSijが求められる。
ステップ1134では、T1およびT3が「真」であり、且つT2およびT4が「偽」であるときに、制御がステップ1135に移り、CSijがSNEOを割り当てられ、そうでない場合には、制御はステップ1136に移る。
ステップ1136では、T1およびT4が「真」であり、且つT2が「偽」である場合には、制御がステップ1137に移り、CSijがSNSを割り当てられ、そうでない場合には、制御はステップ1138に移る。
ステップ1138では、T2が「真」であり、且つT1、T3およびT4が「偽」である場合には、制御がステップ1139に移り、CSijがSFEOを割り当てられ、そうでない場合には、制御はステップ1140に移る。
ステップ1140では、T2およびT3が「真」であり、且つT1およびT4が「偽」である場合には、制御がステップ1141に移り、CSijがSDTを割り当てられ、そうでない場合には、制御はステップ1142に移る。
ステップ1142では、iがIよりも大きいとき、制御がステップ1144に移り、そうでない場合には、制御はステップ1143に移る。
ステップ1143では、iが「1」だけインクリメントされ、ステップ1134〜1142が繰り返される。
ステップ1144において、jがJよりも大きいとき、{CSijIJおよび{ERLE (m)が返され、そうでない場合には、ステップ1145において、jが「1」だけインクリメントされ、ステップ1133〜1144が繰り返される。
図12は、本発明の一実施形態を表す、図10のステップ1009において呼び出されるルーチン「残留エコー抑圧」のための制御フロー図である。
ステップ1201においてforループが始まると、インデックスj毎にステップ1202〜1207が繰り返される。
音声伝送の制御状態を用いて、処理済みデジタル信号{r (m)[n]}のそれぞれにおける利得が補正される。
たとえば、ダブルトーク中に、または近い部屋102においてのみ音声信号が生成されるとき、制御済みデジタル信号
Figure 2010527181
によって得られる利得は、遠い部屋104においてのみ音声信号が生成されるとき、または音声信号が全く伝送されないときよりも大きい。
制御済みデジタル信号が得ることができる利得の最大量および最小量はそれぞれ、定数GmaxおよびGminによって表される。
ステップ1202〜1205は、各処理済みデジタル信号{r (m)[n]}のそれぞれにおける利得を調整する。
ステップ1202において、ダブルトークであるとき、または近い部屋102においてのみ音が生成されるとき、制御がステップ1203に移り、そうでない場合には、制御はステップ1204に移る。
ステップ1203では、以下のように、利得が計算される。
(m)=K(m−1)+(1−K)Gmax
ただし、Kは、G(m−1)に対して、最大利得Gmaxよりも低い相対的重要度を割り当てる重みである。
ステップ1204では、その利得は以下のように計算される。
(m)=K(m−1)+(1−K)Gmin
ただし、Kは、G(m−1)に対して、最小利得Gminよりも相対的に高い重要度を割り当てる重みである。
ステップ1205において、第jの処理済みデジタル信号は以下の式によって求められる。
Figure 2010527181
ステップ1206では、jがJ以下であるとき、制御がステップ1207に移り、jが「1」だけインクリメントされ、そうでない場合には、処理済みデジタル信号{r (m)[n]}が返される。
図13Aは、本発明の一実施形態を表す、図10のステップ1015において呼び出されるルーチン「
Figure 2010527181
を求める」のための制御フロー図である。
ステップ1302においてforループが始まると、i∈{1,...,I}毎にステップ1302〜1313が繰り返される。
ステップ1302においてforループが始まると、j∈{1,...,J}毎にステップ1303〜1311が繰り返される。
ステップ1303では、CSijがSFEOであるとき、制御がステップ1304に移り、そうでない場合には、制御はステップ1305に移る。
ステップ1304では、ルーチン「
Figure 2010527181
を計算する」が呼び出され、近似インパルス応答ベクトル
Figure 2010527181
が計算される。
ステップ1305において、CSijがSNEOまたはSNSであるとき、制御がステップ1306に移り、そうでない場合には、制御はステップ1307に移る。
ステップ1306では、先行するインパルス応答
Figure 2010527181
内の対応する値にベクトル
Figure 2010527181
内の要素を割り当てることによって、インパルス応答ベクトルが更新され、先行する決定期間からのシャドーインパルス応答ベクトル
Figure 2010527181
内の対応する要素にシャドーインパルス応答ベクトル
Figure 2010527181
内の要素を割り当てることによってシャドーインパルス応答ベクトルが更新される。
ステップ1307、1308および1309を用いて、図13B〜図13Cを参照しながら下記で説明されるように、ダブルトークの存在を誤って解釈するのを防ぐ。
ステップ1307において、「カウント」が「0」に等しくないとき、制御がステップ1307に移り、そうでない場合には、制御はステップ1309に移る。
ステップ1308では、「カウント」が「1」だけデクリメントされ、制御がステップ1306に移る。
ステップ1309では、集合
Figure 2010527181
によって表されるインパルス応答データ構造から、ダブルトークのための近似インパルス応答ベクトル
Figure 2010527181
が選択される。
ステップ1310では、「カウント」が値Mを割り当てられる。
値Mは10、12、15、18または任意の他の適切な値とすることができる。
ステップ1310では、jがJよりも大きいとき、制御がステップ1312に移り、そうでない場合には、制御はステップ1311に移る。
ステップ1311では、iが「1」だけインクリメントされ、ステップ1302〜1310が繰り返される。
ステップ1312では、iがIよりも大きい場合には、近似インパルス応答ベクトルの集合
Figure 2010527181
が返され、そうでない場合には、制御はステップ1313に移り、jが「1」だけインクリメントされる。
I×J個のインパルス応答データ構造が存在し、異なるエコーパス毎に1つのインパルス応答データ構造が存在することに留意されたい。
各データ構造は、最も高い信号対雑音比を有する、K個の最新の近似インパルス応答を含む。
決定エポックmの下付き文字は、インパルス応答ベクトルがデータ構造に追加された順序に対応する。
たとえば、ステップ1309のデータ構造では、インパルス応答ベクトル
Figure 2010527181
は、そのデータ構造内に最も長く存在しており、インパルス応答ベクトル
Figure 2010527181
は、そのデータ構造に直前に追加された。
ダブルトーク中に信号対雑音比は急激に劣化するので、ダブルトーク中に近似インパルス応答ベクトルは更新されないことに留意されたい。
雑音が増加すると、近似インパルス応答ベクトルが歪む。
この歪みを回避するために、近似インパルス応答ベクトル
Figure 2010527181
は、対応するインパルス応答データ構造から選択される。
本発明の種々の実施形態において、近似インパルス応答ベクトルは、任意の数の異なる判定基準に基づいて選択することができる。
たとえば、本発明の一実施形態では、ステップ1309において、いずれのインパルス応答ベクトルが最も大きな対応する
Figure 2010527181
を有するかに従って、1つの近似インパルス応答ベクトルを選択することができる。
本発明の別の実施形態では、ステップ1309において、いずれの近似インパルス応答ベクトルがデータ構造内で最も長く存在しているかに基づいて、対応するデータ構造から近似インパルス応答ベクトルを選択することができ、その近似インパルス応答ベクトルは
Figure 2010527181
である。
図13Aの制御フロー図において、対応するエコーパスにおいて伝送される雑音を誤ってSDTと解釈するのを防ぐために、ステップ1307、1308および1306がM回にわたって繰り返される。
図13B〜図13Cは、本発明の一実施形態を表す、4つのタイプの制御状態のための増幅エネルギー対時間の2つのプロットを示す。
図13B〜図13Cにおいて、縦軸1314のような縦軸は、近い部屋102と遠い部屋104との間で伝送される信号に関連付けられる増幅エネルギーを表し、横軸1315のような横軸は時刻を表し、破線1316のような水平な破線は、ダブルトークしきい値エネルギーEthに対応する。
曲線1318および1320は、近い部屋102と遠い部屋104との間で伝送される信号に関連付けられる増幅エネルギーを表す。
ダブルトークしきい値エネルギーEthより低い増幅エネルギーは、SFEO、SNEOまたはSNS制御状態に対応する。
ピーク1322はダブルトークから生じる増幅エネルギーに対応し、それはダブルトークしきい値Ethよりも大きい。
しかしながら、ピーク1324は、近い部屋102または遠い部屋104において生成されるエコーパス雑音に対応する。
ダブルトークが実際には発生していない場合であっても、増幅エネルギーがダブルトークしきい値エネルギーEthを超えているので、この雑音が発生した当初には、ダブルトークが発生したかのように見える。
短い持続時間の雑音をダブルトークと誤って解釈するのを防ぐために、時刻1326において、ステップ1306、1307および1305を参照しながら説明された変数「カウント」でカウントダウンが始まり、ダブルトークがM回繰り返されたことが確認されるまで、ステップ1308においてデータ構造
Figure 2010527181
から近似インパルス応答ベクトルを選択するのを防ぐ。
言い換えると、本発明の方法は、M回の決定期間にわたってダブルトークが生じなかったかのように動作し続ける。
図13Bの時刻1328において示されるように、M回繰り返した後に増幅エネルギーが減少している場合には、ダブルトークのための近似インパルス応答ベクトルを不適切に選択するのが回避されている。
言い換えると、図13Cの時刻1330における曲線1320において示されるように、M回繰り返した後に、増幅エネルギーが増加している場合には、ステップ1309において、ダブルトークのための近似インパルス応答ベクトルが選択される。
図14〜図17を参照しながらここで説明される方法はエコーパス毎に繰り返される。
図14Aは、本発明の一実施形態を表す、図14のステップ1304において呼び出されるルーチン「
Figure 2010527181
を計算する」のための制御フロー図である。
ステップ1401では、周波数領域依存ベクトルを得るために、シャドーインパルス応答ベクトル
Figure 2010527181
にFFTが適用される。
Figure 2010527181
ステップ1402では、周波数領域シャドーエラーベクトルが以下のように計算される。
Figure 2010527181
ただし、Trは長さPの打切り演算子であり、
Figure 2010527181
である。
ステップ1403では、シャドーエラーベクトルを得るために、周波数領域シャドーエラーベクトルにIFFTが適用される。
Figure 2010527181
ステップ1404では、シャドーミスマッチベクトル
Figure 2010527181
を計算するために、ルーチン「
Figure 2010527181
を求める」が呼び出される。
ステップ1405では、以下の再帰式に従って、発展信頼領域ベクトルが求められる。
Figure 2010527181
パラメータηは重み係数である。
信頼領域ベクトル
Figure 2010527181
を用いて、ステップ1406において呼び出されるルーチン「μij,mを求める」においてシャドー更新ステップサイズμij,mが計算される。
また、信頼領域ベクトル
Figure 2010527181
を用いて、ステップ1407において呼び出されるルーチン「γij,mを求める」において適応ステップサイズγij,mが計算される。
ステップ1408では、ステップ1404において求められたシャドーミスマッチベクトル
Figure 2010527181
およびステップ1406において求められたシャドー更新ステップサイズμij,mを用いて、シャドーインパルス応答ベクトルが再帰的に計算される。
Figure 2010527181
ステップ1409では、ステップ1407において求められた適応ステップサイズγij,mを用いて、以下のように、近似インパルス応答ベクトルが再帰的に計算される。
Figure 2010527181
パラメータγij,mは重み係数として用いられる。
ステップ1410では、ERLE (m)がしきい値Cよりも大きいとき、制御がステップ1411に移る。
しきい値Cは、10、12、15または近似インパルス応答ベクトル
Figure 2010527181
を重み付けするための任意の他の適切な値とすることができる。
ステップ1411では、図13Aのステップ1309を参照しながら上記で説明されたインパルス応答データ構造
Figure 2010527181
が更新される。
インパルス応答ベクトルは、インパルス応答データ構造内に、m>m>...>mK−1>mのように決定エポック値が大きくなる順序に配列される。
ただし、決定エポックmは、最も長い時間にわたってデータ構造内に存在している近似インパルス応答ベクトルに対応し、決定エポックmは、直前にデータ構造に追加された近似インパルス応答ベクトルに対応する。
本発明の一実施形態では、データ構造からインパルス応答ベクトル
Figure 2010527181
を除去し、ステップ1409において計算されたデータ構造に、直前に計算されたインパルス応答ベクトル
Figure 2010527181
を追加することによって、ステップ1411においてデータ構造を更新することができ、それにより以下のインパルス応答データ構造が与えられる。
Figure 2010527181
本発明の他の実施形態では、ステップ1411において、各近似インパルス応答ベクトルに関連付けられるERLE値の大きさに従ってデータ構造を更新することができる。
ステップ1409において計算された、直前に計算された近似インパルス応答ベクトルの追加に対応すると共に、ステップ1410においてERLEがしきい値条件を満たすようにするために、たとえば、関連するERLE値が最も小さな近似インパルス応答ベクトルが、そのデータ構造から除去される。
ステップ1406において呼び出されるルーチン「μij,mを求める」によって求められるシャドー更新ステップサイズμij,mは、ステップ1408において求められたシャドーインパルス応答ベクトル
Figure 2010527181
が、L次元探索空間(search space)U内にある発展「信頼領域」内に存在するのを概ね確実にする。
シャドーインパルス応答ベクトル
Figure 2010527181
毎に、探索空間U内にある1つの別個の信頼領域が存在する。
その信頼領域は、探索空間U内にある、超円領域、超楕円領域、超立方領域、または任意の他の超次元領域のような多くの異なる超次元形状を有することができる。
図14Bを参照しながら説明される本発明の一実施形態では、信頼領域は、探索空間U内に存在する超楕円領域であると仮定される。
図14Bは、本発明の一実施形態を表す、探索空間U1422内に位置する超楕円領域1420の2次元表示を提供する。
図14Bにおいて、領域1420および1422は2次元において表されるが、実際には、これらの領域は、実際
Figure 2010527181
のL次元ベクトル部分空間であり、
Figure 2010527181
の原点を中心にして配置される。
超楕円領域1420の形状は、ステップ1405において計算される信頼領域ベクトル
Figure 2010527181
によって決定され、この例では、そのベクトルは超楕円領域1420の形状を定義する超楕円ベクトルである。
言い換えると、図14Bに示されるように、点によって表される予め求められた6つのシャドーインパルス応答ベクトルが、ベクトル
Figure 2010527181
に関連付けられる超楕円領域1420内に存在する。
後続の超楕円体規定ベクトル
Figure 2010527181
が求められるとき、関連する領域は探索空間U1422内で向きを変えるが、この新たな向きの楕円領域も概ね楕円形状を保持するので、この超楕円領域1420は「発展する」超楕円領域と呼ばれる。
図15を参照しながら下記で説明されるように、シャドー更新ステップサイズμij,mは超楕円体規定ベクトル
Figure 2010527181
の関数であるので、再帰式
Figure 2010527181
に従って計算された、新たに計算されたシャドーインパルス応答ベクトル
Figure 2010527181
は新たな向きの超楕円領域内に入る。
図14Bに示されるように、ベクトル1424によって示されるように、シャドーミスマッチベクトル
Figure 2010527181
の大きさおよび方向が大きいとき、ベクトル1426によって示されるように、シャドー更新ステップサイズμij,mがシャドーミスマッチベクトル
Figure 2010527181
を小さくし、その方向を変更する。
結果として、シャドーインパルス応答ベクトル
Figure 2010527181
は新たな向きの超楕円領域1428内に入る。
本発明の他の実施形態では、シャドーインパルス応答ベクトルを更新するために、単一のシャドー更新ステップサイズμij,mを計算するのではなく、結果として生成されるシャドーインパルス応答ベクトルが信頼領域内に入るように、シャドーインパルス応答ベクトル
Figure 2010527181
に加えられる第2のベクトルを計算することによって、シャドーインパルス応答ベクトルの大きさを変更して信頼領域内に入るようにすることができることに留意されたい。
図15は、本発明の一実施形態を表す、図14のステップ1404において呼び出されるルーチン「
Figure 2010527181
を求める」のための制御フロー図である。
ステップ1501では、周波数領域ベクトル
Figure 2010527181
の平均スペクトルが以下のように計算され、
Figure 2010527181
周波数領域シャドーエラーベクトル
Figure 2010527181
の平均スペクトルが以下のように計算される。
Figure 2010527181
ただし、以下の式が成り立つ。
Figure 2010527181
パラメータβは重み係数である。
ステップ1502では、図11において計算される最大エネルギーを用いて、以下の値が求められる。
Figure 2010527181
ステップ1503〜1506では、N成分周波数領域プレコンディショニングベクトル
Figure 2010527181
の要素が求められる。
ステップ1503においてforループが始まると、周波数領域のインデックスk毎にステップ1504〜1506が繰り返される。
ステップ1504では、プレコンディショニングベクトル
Figure 2010527181
の要素が以下のように計算される。
Figure 2010527181
ただし、kは0〜N−1の範囲にある。
ステップ1505では、kがN−1未満であるとき、制御がステップ1506に移り、そうでない場合には、制御はステップ1507に移る。
ステップ1506では、インデックスkが値「1」だけインクリメントされる。
ステップ1507では、ベクトル
Figure 2010527181
が以下のように計算される。
Figure 2010527181
ただし、TrはサイズLの打切り演算子であり、
Figure 2010527181
である。
図16は、本発明の一実施形態を表す、図14のステップ1406において呼び出されるルーチン「μij,mを求める」のための制御フロー図である。
ステップ1601では、パラメータ
Figure 2010527181
が以下のように計算される。
Figure 2010527181
ステップ1602では、
Figure 2010527181
が値「1」よりも大きいとき、制御がステップ1603に移り、そうでない場合には、制御はステップ1604に移る。
ステップ1603では、μij,mが値
Figure 2010527181
を割り当てられる。
ステップ1604では、μij,mが値「0.2」を割り当てられる。
図17は、本発明の一実施形態を表す、図14のステップ1407において呼び出されるルーチン「γij,mを求める」のための制御フロー図である。
ステップ1701では、パラメータγ_scaleij (m)が以下のように計算される。
Figure 2010527181
ステップ1702では、
Figure 2010527181
であるとき、且つM個の時刻サンプル後に、制御がステップ1703に移り、そうでない場合には、制御はステップ1704に移る。
ステップ1703では、パラメータcij,mが以下のように再帰的に計算される。
ij,m=max{=cij,m−1−4000,400}
ステップ1704では、パラメータcij,mが以下のように再帰的に計算される。
ij,m=max{=cij,m−1+1,40000}
ステップ1705では、以下の式に従って、γij,mが値を割り当てられる。
Figure 2010527181
ただし、νij,mは図15のステップ1502において計算される。
ステップ1706では、γ_scaleij (m)が「1」より大きいとき、制御がステップ1707に移る。
ステップ1707では、γij,mが以下の値を割り当てられる。
Figure 2010527181
本発明が1つの実施形態に関して説明されてきたが、本発明の方法はこの実施形態には限定されない。
たとえば、本発明の他の実施形態では、音響エコーキャンセルは、マイクロフォンデジタル信号の一部にのみ適用される場合がある。
詳細には、本発明の音響エコーキャンセル方法は、全てのマイクロフォンデジタル信号に適用するのではなく、振幅が或る所定のしきい値よりも高いマイクロフォンデジタル信号にのみ適用することができる。
これまでの説明は、本発明の完全な理解を提供するために、説明の目的上、特殊な用語を使用した。
しかしながら、本発明を実施するのに、具体的な細部が不要であることは当業者には明らかになるであろう。
本発明の特定の実施形態のこれまでの説明は、例示および説明の目的のために提示された。
それらの実施形態は、本発明を包括的に述べることも、本発明を開示されるのと全く同じ形態に限定することも意図していない。
上記の教示に鑑みて、多くの変更および変形が可能であることは明らかである。
それらの実施形態は、本発明の原理およびその実用的な用途を最もよく説明し、それにより、当業者が、意図される特定の用途に合わせるように種々の変更を加えて、本発明および種々の実施形態を最大限に利用できるようにするために、図示および説明される。
本発明の範囲は、以下の特許請求の範囲およびそれらの均等物によって規定されることが意図されている。
100・・・2地点間モノチャネル音声会議通信システム,
102・・・近い部屋,
104・・・遠い部屋,
106,108・・・マイクロフォン,
110,112・・・通信チャネル,
114・・・スピーカ、
600・・・混合マルチチャネル音声通信システム,
602・・・マルチチャネルエコー制御ユニット(MECU),
604・・・スピーカ,
606・・・マイクロフォン,

Claims (10)

  1. 第1の場所(102)から第2の場所(104)に伝送される複数のマイクロフォンデジタル信号において音響エコーを低減する方法であって、
    前記第1の場所に配置される複数のスピーカ(604)、および、それぞれ前記第1の場所において生成される音および該複数のスピーカによって生成される音響エコーを含む前記複数のマイクロフォンデジタル信号のうちの1つを生成する複数のマイクロフォン(606)を設けることと、
    前記複数のマイクロフォンのそれぞれと前記複数のスピーカのそれぞれとの間の1つのエコーパス(702)に対応する近似インパルス応答を求めることと、
    それぞれ前記複数のスピーカのうちの1つによって再生されるデジタル信号を多数の前記近似インパルス応答で畳み込むことに対応する複数の近似音響エコーを求めることと、
    前記対応する近似音響エコーに基づいて、前記マイクロフォンデジタル信号のうちの少なくとも1つにおいて前記音響エコーを低減することと
    を含む音響エコーを低減する方法。
  2. 前記近似インパルス応答を求めることは、
    前記第1の場所においてのみ音声信号が生成されるタイプと、
    前記第2の場所においてのみ音声信号が生成されるタイプと、
    前記第1の場所および前記第2の場所において同時に音声信号が生成されるタイプと、
    前記第1の場所または前記第2の場所のいずれにおいても音声信号が生成されないタイプのうちの1つとして、各前記エコーパスに関連付けられる音声伝送のタイプを特定することと
    をさらに含む請求項1に記載の方法。
  3. 前記各マイクロフォンデジタル信号のそれぞれにおいて前記音響エコーを低減することは、以下のように、制御済みデジタル信号を求めることであって、
    Figure 2010527181
    ただし、
    j∈{1,K J}はマイクロフォンのインデックス(index)であり、
    i∈{1,K I}はスピーカのインデックスであり、
    TrNdは決定期間長Nの打切り演算子であり、
    IFFTは逆高速フーリエ変換であり、

    Figure 2010527181
    」は2つのベクトルの成分毎の乗算であり、
    Figure 2010527181
    は周波数領域マイクロフォンデジタル信号であり、
    Figure 2010527181
    は周波数領域デジタル信号であり、
    Figure 2010527181
    は周波数領域近似インパルス応答ベクトルであり、
    Figure 2010527181
    は周波数領域近似音響エコーである
    制御済みデジタル信号を求めること
    をさらに含む請求項1に記載の方法。
  4. 前記周波数領域近似インパルス応答ベクトルを求めることは、
    Figure 2010527181
    を計算することであって、ただし、
    FFTは高速フーリエ変換であり、
    Figure 2010527181
    は音声伝送の前記タイプに依存する近似インパルス応答ベクトルである、計算することをさらに含む、請求項3に記載の方法。
  5. 前記近似インパルス応答ベクトル
    Figure 2010527181
    を計算することは、
    前記第1の場所と前記第2の場所との間で信号が伝送されないとき、または前記第1の場所から前記第2の場所に信号が伝送されるときに、
    Figure 2010527181
    を割り当てることであって、ただし、
    Figure 2010527181
    はm−1によって特定される先行する決定期間に関連付けられる近似インパルス応答ベクトルである割り当てることと、
    前記第1の場所と前記第2の場所との間で信号が同時に伝送されるときに、最も高い信号対雑音比を有するK個の最新の近似インパルス応答
    Figure 2010527181
    を有するインパルス応答データ構造から前記近似インパルス応答ベクトル
    Figure 2010527181
    を選択することと、
    前記第2の場所から前記第1の場所にのみ信号が伝送されるときに、
    Figure 2010527181
    によって与えられる再帰式を利用することであって、ただし、
    Figure 2010527181
    はmによって特定される決定期間に関連付けられるシャドーインパルス応答ベクトルであり、
    Figure 2010527181
    はm−1によって特定される先行する決定期間に関連付けられる近似インパルス応答ベクトルであり、
    γij,mはインパルス応答ステップサイズである、利用することと
    をさらに含む、請求項4に記載の方法。
  6. 前記インパルス応答ステップサイズγij,mは、
    Figure 2010527181
    を計算することであって、ただし、
    Figure 2010527181
    であり、
    M回の決定期間にわたって、
    Figure 2010527181
    の場合に、
    ij,m=max{=cij,m−1−4000,400}
    であり、そうでない場合には、
    ij,m=max{=cij,m−1+1,40000}
    である
    計算すること
    をさらに含む請求項5に記載の方法。
  7. 前記インパルス応答ステップサイズγij,mは、γ_scaleij (m)が「1」より大きいときに、
    Figure 2010527181
    を設定することであって、ただし、
    Figure 2010527181
    であり、
    Figure 2010527181
    はシャドーインパルスベクトル
    Figure 2010527181
    の第nの要素であり、Λij (m)[n]は信頼領域ベクトル
    Figure 2010527181
    の第nの要素である
    設定すること
    をさらに含む請求項6に記載の方法。
  8. 前記シャドーインパルス応答ベクトルを再帰的に計算することは、
    Figure 2010527181
    によって与えられる再帰式を利用することであって、ただし、
    Figure 2010527181
    はシャドーミスマッチベクトルであり、
    Figure 2010527181
    はm−1によって特定される先行する決定期間に関連付けられるシャドーインパルス応答ベクトルであり、
    μij,mはシャドー更新ステップサイズである
    利用すること
    をさらに含む請求項5に記載の方法。
  9. 前記シャドーミスマッチベクトルを計算することは、
    Figure 2010527181
    によって与えられる再帰式を利用することであって、
    ただし、
    mは決定期間に関連付けられる整数であり、
    Lはベクトル成分の数であり、
    IFFTは逆フーリエ変換演算子であり、
    TrはサイズLの打切り演算子であり、
    Figure 2010527181
    は音声信号に対応する周波数領域ベクトルであり、
    Figure 2010527181
    は周波数領域シャドーエラーベクトルであり、
    Figure 2010527181
    であり、ここで以下のことが成り立ち、
    Figure 2010527181

    Figure 2010527181
    によって与えられる周波数領域ベクトル
    Figure 2010527181
    の平均スペクトルの成分であり、
    Figure 2010527181

    Figure 2010527181
    によって与えられる周波数領域シャドーエラーベクトル
    Figure 2010527181
    の平均スペクトルの成分であり、
    λは安定化定数であり、
    Figure 2010527181
    であり、
    i,x 2(m)は前記デジタル信号に関連付けられる最大エネルギーであり、
    j,y 2(m)は前記マイクロフォンデジタル信号に関連付けられる最大エネルギーである
    利用することをさらに含む請求項8に記載の方法。
  10. 前記シャドー更新ステップサイズμij,mは、μ_scaleij (m)が>1であるときに、
    μij,m=0.2を設定し、
    そうでない場合には、
    Figure 2010527181
    を設定することであって、ただし、
    Figure 2010527181
    であり、
    Figure 2010527181
    は前記シャドーミスマッチベクトル
    Figure 2010527181
    の第nの要素であり、Λij (m)[n]は信頼領域ベクトル
    Figure 2010527181
    の第nの要素であり、
    Figure 2010527181
    である
    設定すること
    をさらに含む請求項8に記載の方法。
JP2010506328A 2007-04-30 2008-04-30 マルチチャネル音声通信システムにおいて音響エコーを低減するための方法およびシステム Expired - Fee Related JP4897921B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/799,266 US8204249B2 (en) 2007-04-30 2007-04-30 Methods and systems for reducing acoustic echoes in multichannel audio-communication systems
US11/799,266 2007-04-30
PCT/US2008/005662 WO2008137059A2 (en) 2007-04-30 2008-04-30 Methods and systems for reducing acoustic echoes in multichannel audio-communication systems

Publications (2)

Publication Number Publication Date
JP2010527181A true JP2010527181A (ja) 2010-08-05
JP4897921B2 JP4897921B2 (ja) 2012-03-14

Family

ID=39887006

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010506328A Expired - Fee Related JP4897921B2 (ja) 2007-04-30 2008-04-30 マルチチャネル音声通信システムにおいて音響エコーを低減するための方法およびシステム

Country Status (5)

Country Link
US (1) US8204249B2 (ja)
EP (1) EP2130298A4 (ja)
JP (1) JP4897921B2 (ja)
KR (1) KR20100016119A (ja)
WO (1) WO2008137059A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019168730A (ja) * 2013-12-05 2019-10-03 マイクロソフト テクノロジー ライセンシング,エルエルシー 音響エコーキャンセルのための室内インパルス応答の推定

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8204249B2 (en) * 2007-04-30 2012-06-19 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in multichannel audio-communication systems
US8208649B2 (en) * 2009-04-28 2012-06-26 Hewlett-Packard Development Company, L.P. Methods and systems for robust approximations of impulse responses in multichannel audio-communication systems
US9215327B2 (en) * 2011-06-11 2015-12-15 Clearone Communications, Inc. Methods and apparatuses for multi-channel acoustic echo cancelation
CN105513596B (zh) * 2013-05-29 2020-03-27 华为技术有限公司 一种语音控制方法和控制设备
GB201309781D0 (en) 2013-05-31 2013-07-17 Microsoft Corp Echo cancellation
GB201414352D0 (en) * 2014-08-13 2014-09-24 Microsoft Corp Reversed echo canceller

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2691186B2 (ja) * 1988-09-26 1997-12-17 日本電信電話株式会社 多地点会議用反響消去装置
US5796819A (en) 1996-07-24 1998-08-18 Ericsson Inc. Echo canceller for non-linear circuits
DE69908463T2 (de) * 1998-03-05 2004-05-13 Nippon Telegraph And Telephone Corp. Verfahren und Einrichtung zur mehrkanaligen Kompensation eines akustischen Echos
KR100272131B1 (ko) 1998-04-15 2000-11-15 윤종용 계층적 구조의 적응반향 제거장치
JP4734714B2 (ja) * 2000-12-22 2011-07-27 ヤマハ株式会社 収音再生方法およびその装置
JP3506138B2 (ja) 2001-07-11 2004-03-15 ヤマハ株式会社 複数チャンネルエコーキャンセル方法、複数チャンネル音声伝送方法、ステレオエコーキャンセラ、ステレオ音声伝送装置および伝達関数演算装置
JP4591685B2 (ja) * 2004-03-31 2010-12-01 ヤマハ株式会社 ダブルトーク状態判定方法、エコーキャンセル方法、ダブルトーク状態判定装置、エコーキャンセル装置およびプログラム
JP4504782B2 (ja) 2004-10-25 2010-07-14 日本電信電話株式会社 エコー消去方法、この方法を実施する装置、プログラムおよびその記録媒体
US8204249B2 (en) * 2007-04-30 2012-06-19 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in multichannel audio-communication systems

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019168730A (ja) * 2013-12-05 2019-10-03 マイクロソフト テクノロジー ライセンシング,エルエルシー 音響エコーキャンセルのための室内インパルス応答の推定

Also Published As

Publication number Publication date
US20080267420A1 (en) 2008-10-30
EP2130298A4 (en) 2010-04-07
JP4897921B2 (ja) 2012-03-14
KR20100016119A (ko) 2010-02-12
WO2008137059A2 (en) 2008-11-13
US8204249B2 (en) 2012-06-19
EP2130298A2 (en) 2009-12-09
WO2008137059A3 (en) 2008-12-31

Similar Documents

Publication Publication Date Title
JP5288723B2 (ja) マルチチャネルの反響補償
US11297178B2 (en) Method, apparatus, and computer-readable media utilizing residual echo estimate information to derive secondary echo reduction parameters
KR101250124B1 (ko) 에코 억제 필터를 위한 제어 정보를 계산하는 장치 및 방법 및 지연 값을 계산하는 장치 및 방법
US9800734B2 (en) Echo cancellation
KR101676393B1 (ko) 어쿠스틱 다중―채널 캔슬레이션
TWI682672B (zh) 減少殘餘回聲的回聲消除系統和方法
US8000482B2 (en) Microphone array processing system for noisy multipath environments
JP4897921B2 (ja) マルチチャネル音声通信システムにおいて音響エコーを低減するための方法およびシステム
JP4104659B2 (ja) 入力信号の妨害成分を抑圧するための装置
CA2574713A1 (en) Separation of target acoustic signals in a multi-transducer arrangement
US8320574B2 (en) Methods and systems for reducing acoustic echoes in communication systems
SE518039C2 (sv) Apparat och förfarande för ökning av förståeligheten av högtalarutmatning och för ekosläckning i telefoner
JP2004349806A (ja) 多チャネル音響エコー消去方法、その装置、そのプログラム及びその記録媒体
JP4544993B2 (ja) 単一チャンネルまたは多重チャンネル型の通信システム用エコー処理装置
KR100633213B1 (ko) 불가청 정보를 포함함으로써 적응형 필터 성능을개선시키는 방법 및 장치
CN109326297B (zh) 自适应后滤波
US20100272274A1 (en) Methods and systems for robust approximations of impulse reponses in multichannel audio-communication systems
US8045730B1 (en) Methods and systems for reducing acoustic echoes in communication systems
Kotte Performance Analysis of Adaptive Algorithms based on different parameters Implemented for Acoustic Echo Cancellation in Speech Signals
WO1997007624A1 (en) Echo cancelling using signal preprocessing in an acoustic environment
Nwe et al. Acoustic Echo Cancellation Using Adaptive Least Mean Square Algorithm
Isen Applied Adaptive Filtering

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110614

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111128

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111222

R150 Certificate of patent or registration of utility model

Ref document number: 4897921

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees