JP2019168730A - 音響エコーキャンセルのための室内インパルス応答の推定 - Google Patents

音響エコーキャンセルのための室内インパルス応答の推定 Download PDF

Info

Publication number
JP2019168730A
JP2019168730A JP2019126371A JP2019126371A JP2019168730A JP 2019168730 A JP2019168730 A JP 2019168730A JP 2019126371 A JP2019126371 A JP 2019126371A JP 2019126371 A JP2019126371 A JP 2019126371A JP 2019168730 A JP2019168730 A JP 2019168730A
Authority
JP
Japan
Prior art keywords
array
microphones
impulse response
microphone
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019126371A
Other languages
English (en)
Other versions
JP6837099B2 (ja
Inventor
フロレンシオ,ダイネイ
Florencio Dinei
イエレペディ,アツルヤ
Yellepeddi Atulya
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of JP2019168730A publication Critical patent/JP2019168730A/ja
Application granted granted Critical
Publication of JP6837099B2 publication Critical patent/JP6837099B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/002Damping circuit arrangements for transducers, e.g. motional feedback circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/002Applications of echo suppressors or cancellers in telephonic connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2227/00Details of public address [PA] systems covered by H04R27/00 but not provided for in any of its subgroups
    • H04R2227/007Electronic adaptation of audio signals to reverberation of the listening space for PA

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

【課題】オーディオソースとマイクロホンのアレイとの間の室内インパルス応答を推定する様々な方法及びシステムを提供する。【解決手段】一例において、方法は、マイクロホンのアレイのあるマイクロホンでオーディオ信号を受信することを含む。オーディオ信号は、マイクロホンのアレイに含まれる各マイクロホンに対応する。方法は、受信されたオーディオ信号に基づき、マイクロホンのアレイのジオメトリに適合するサブスペースにおける室内インパルス応答を決定することを更に含む。【選択図】図2

Description

音響エコーキャンセレーション(AEC;acoustic echo cancellation)は、マイクロホンによって捕捉された信号から、そのマイクロホンの近くに位置するラウドスピーカによって放射される信号を除去する問題である。AECは、電話会議システム、スピーカ電話、及び同様のものを含む双方向通信の重要な側面であった。標準の問題シナリオは、1つのラウドスピーカと1つのマイクロホンとを含み、従来の解決法は、ラウドスピーカフィードバックの現れを除去するよう適応フィルタをトレーニングすることである。問題の重要性により、収束速度の増大、収束状態の検出、計算複雑性の低減、などは、研究が進み続ける領域である。
第2のシナリオは、近年重要性が増している。すなわち、家庭及び自動車エンターテイメントシステムのためのボイスコントロールである。それらのシステムは、相当に高い再現度で動作するマルチチャネルオーディオ再生、例えば、ステレオ又は5.1サラウンドシステムを通常は備える。ユーザ(すなわち、所望のオーディオソース)は、マイクロホンから数メートル離れていることがあり、ノイズレベルは相当であり得る。
以下は、ここで記載される幾つかの態様の基本的理解を提供するために、簡単な要約を示す。この概要は、請求されている対象の広範囲に及ぶ概要ではない。この要約は、請求されている対象のキーとなる又は重要な要素を特定することを目的とせず、更には、請求されている対象の適用範囲を線引きするものでもない。この要約の唯一の目的は、以降で示されるより詳細な記載に対する前置きとして、請求されている対象の幾つかの概念を簡略化された形で示すことである。
実施形態は、オーディオソースとマイクロホンのアレイとの間の室内インパルス応答を推定する方法を提供する。方法は、マイクロホンのアレイのあるマイクロホンでオーディオ信号を受信することを含み、オーディオ信号は、アレイの各マイクロホンに対応する。方法は、受信されたオーディオ信号に基づき、マイクロホンのアレイのジオメトリに適合するサブスペースにおける室内インパルス応答を決定することを更に含む。
他の実施形態は、オーディオソースとマイクロホンのアレイとの間の室内インパルス応答を推定する方法を提供する。方法は、マイクロホンのアレイのあるマイクロホンでオーディオ信号を受信することを含み、オーディオ信号は、アレイの各マイクロホンに対応する。方法は、単ソース信号の組を、該単ソース信号が同時にマイクロホンのアレイの全マイクロホンに影響を与えるとして定義することを更に含み、単ソース信号の夫々は、異なる位置にある単一の実際の又は仮想のソースに対応する。更に、方法は、単ソース信号の組の重み付けされた組み合わせとして、受信されたオーディオ信号の近似を求めることを含む。方法は、オーディオソースからマイクロホンのアレイの各マイクロホンへの室内インパルス応答を推定することを含み、該インパルス応答は前記重み付けされた組み合わせに対応する。方法は、インパルス応答を用いて、受信されたオーディオ信号から音響エコーをキャンセルすることによって、完結する。
他の実施形態は、オーディオソース及びマイクロホンのアレイの配置において経験される可聴フィードバックの音響エコーキャンセレーションを実施するシステムを提供する。システムは、プロセッサ実行可能コードを実行するプロセッサと、マイクロホンのアレイと、プロセッサ実行可能コードを記憶する記憶デバイスとを有する。プロセッサ実行可能コードは、システムのプロセッサによって実行される場合に、該プロセッサに、マイクロホンのアレイのあるマイクロホンでオーディオ信号を受信させる。オーディオ信号は、アレイの各マイクロホンに対応する。プロセッサは、単ソース信号の組を、該単ソース信号が同時にマイクロホンのアレイの全マイクロホンに影響を与えるとして定義するよう構成され、単ソース信号の夫々は、異なる位置にある単一の実際の又は仮想のソースに対応する。プロセッサは、単ソース信号の重み付けされた組み合わせとして、受信されたオーディオ信号の近似を求めさせられる。プロセッサは、オーディオソースからマイクロホンのアレイの各マイクロホンへの室内インパルス応答を推定するよう構成され、インパルス応答は、前記重み付けされた組み合わせに対応する。プロセッサは、最後に、インパルス応答を用いて、受信されたオーディオ信号から音響エコーをキャンセルさせられる。
以下の詳細な説明は、添付の図面を参照することによって、より良く理解され得る。図面は、開示されている対象の多数の特徴の具体例を含む。
可聴信号反射が仮想イメージソースとしてモデル化される部屋の概略図である。
スパースアレイ信号処理を用いるAECのために使用され得るコンピューティングデバイスの例のブロック図である。
マイクロホンアレイ及びラウドスピーカ構成のシステムモデルを表す。
平面1−dアレイで到来する可聴信号の概略図である。
オーディオ信号を受信してインパルス応答を推定する例となる方法のプロセスフロー図である。
スパースアレイ信号処理を用いて音響エコーをキャンセルする例となる方法のプロセスフロー図である。
スパースアレイ信号処理を用いて音響エコーをキャンセルする命令を記憶することができる有形なコンピュータ可読記憶媒体を示すブロック図である。
マイクロホンアレイ及び1つ以上のラウドスピーカを有する残響環境での音響エコーキャンセレーションの問題が考えられる。エコーをキャンセルすることは、多数のラウドスピーカからマイクロホンのアレイ内の各マイクロホンへのインパルス応答を学習することを必要とする。これは、通常、各ラウドスピーカについて各マイクロホンで別々に行われてきた。しかし、アレイに到来する信号は共通の構造を共有する。このことは、インパルス応答推定を改善するために有効に使用され得る。
ここで示される実施形態は、較正信号に基づく初期室内伝達関数(RTF;room transfer function)推定に向けられている。ここで記載される技術は、適応AECフィルタのより複雑な問題にまで広げられ得るが、ほとんどの現在配備されているマイクロホンアレイは、フィルタを初期化し、後にフィルタ係数のサブセットを適応させるために、較正信号を使用する。目下の実施形態は、初期RTF推定のより関連した問題に向けられているが、それに制限されない。RTFのスパースネスはよく知られており、エコーキャンセレーションにおいて使用されてきた。J. Benesty, et al.,“Adaptive algorithms for the identification of sparse impulse responses”,Selected methods for acoustic echo and noise control,vol.5,pp.125-153,2006年を参照。ビームフォーミング(又は空間フィルタリング)とエコーキャンセレーションとの間のインタラクションも考えられてきた。W. Herbordt, et al.,“Joint optimization of acoustic echo cancellation and adaptive beamforming”,Topics in acoustic echo and noise control,pp.19-50,2006年を参照。しかし、それらの場合において、エコーキャンセレーションフィルタ推定は、それ自体がアレイ情報を利用しない。先の技術は、夫々のAECフィルタを別々に計算し、そして、本開示で詳述されているようにはアレイ構造を用いない。
前付として、図の幾つかは、機能、モジュール、機構、要素、などと呼ばれる1つ以上の構造コンポーネントに関連して概念を記載する。図に示されている様々なコンポーネントは、如何なる方法においても、例えば、ソフトウェア、ハードウェア(例えば、ディスクリートロジックコンポーネント、など)、ファームウェア、その他、又はそれらの実施の如何なる組み合わせによっても、実施され得る。幾つかの実施形態において、様々なコンポーネントは、実際の実施における対応するコンポーネントの使用を反映してよい。他の実施形態では、図に表されている如何なる単一コンポーネントも、複数の実際のコンポーネントによって実施されてよい。図におけるいずれか2つ以上の別個のコンポーネントの描写は、単一の実際のコンポーネントによって実行される異なった機能を反映してよい。
他の図は、フローチャート形式において概念を記載する。この形式では、特定の動作は、特定の順序で実行される個別ブロックを構成するものとして記載される。そのような実施は、例であり制限でない。ここで記載される特定のブロックは、まとめられて1つの動作において実行されてよく、特定のブロックは、複数のコンポーネントブロックに分けられてよく、特定のブロックは、ブロックを同時に実行することを含め、ここで表されているのとは異なる順序で実行されてよい。フローチャートにおいて示されるブロックは、ソフトウェア、ハードウェア、ファームウェア、手動処理、及び同様のもの、又はそれらの実施の如何なる組み合わせによっても、実施され得る。ここで使用されるように、ハードウェアは、コンピュータシステム、ディスクリートロジックコンポーネント(例えば、特定用途向け集積回路(ASIC;application specific integrated circuit))、及び同様のもの、並びにそれらの如何なる組み合わせも含んでよい。
用語に関して、「〜するよう構成される(configured to)」は、あらゆる種類の構造コンポーネントが特定されている動作を実行するよう組み立てられ得る如何なる方法も包含する。構造コンポーネントは、ソフトウェア、ハードウェア、ファームウェア及び同様のもの、又はそれらの如何なる組み合わせによっても動作を実行するよう構成され得る。
語「ロジック(logic)」は、タスクを実行する如何なる機能も包含する。例えば、フローチャートにおいて表されている夫々の動作は、その動作を実行するロジックに対応する。動作は、ソフトウェア、ハードウェア、ファームウェア、など、又はそれらの如何なる組み合わせによっても実行され得る。
ここで使用されるように、語「コンポーネント(component)」、「システム(system)」、「クライアント(client)」及び同様のものは、ハードウェア、(例えば、実行中の)ソフトウェア、及び/又はファームウェア、あるいは、それらの組み合わせのいずれかである、コンピュータに関連したエンティティに言及するよう意図される。例えば、コンポーネントは、プロセッサ、オブジェクト、実行ファイル、プログラム、関数、ライブラリ、サブルーチン、及び/又はコンピュータ若しくはソフトウェア及びハードウェアの組み合わせで実行されるプロセッサであることができる。例として、サーバで実行されるアプリケーション及びサーバは両方ともコンポーネントであることができる。1つ以上のコンポーネントは、プロセス内にあることができ、コンポーネントは、1つのコンピュータにおいてローカライズされ及び/又は2つ以上のコンピュータ間で分散され得る。
更に、請求される対象は、標準のプログラミング及び/又はエンジニアリング技術を用いてソフトウェア、ファームウェア、ハードウェア又はそれらの如何なる組み合わせも生成し、開示されている対象を実施するようコンピュータを制御する方法、装置、又は製品として実施されてよい。ここで使用される語「製品(article of manufacture)」は、如何なる有形なコンピュータ可読デバイス又は媒体からもアクセス可能なコンピュータプログラムを包含するよう意図される。
コンピュータ可読記憶媒体には、制限なしに、磁気記憶デバイス(例えば、とりわけ、ハードディスク、フロッピー(登録商標)ディスク、及び磁気ストリップ)、光ディスク(例えば、とりわけ、コンパクトディスク(CD;compact disc)、及びデジタルバーサタイルディスク(DVD;digital versatile disc))、スマートカード、及びフラッシュメモリデバイス(例えば、とりわけ、カード、スティック、及びキードライブ)が含まれ得る。その一方、コンピュータ可読媒体全般(すなわち、記憶媒体ではない。)には、無線信号及び同様のもののための伝送媒体のような通信媒体が更に含まれてよい。
ここで記載される技術の実施形態は、制限なしに、室内伝達関数推定に向けられている。目下の実施形態は、音響エコーキャンセレーションの所望の結果を達成するようエコーキャンセレーションフィルタの推定にアレイ情報を組み込むことを考えている。
図1は、可聴信号反射110が仮想イメージソース108としてモデル化される部屋100の概略図である。ラウドスピーカ102は全方向において音波104を発する。音波104は、部屋100の中で反響し、マイクロホンアレイ106で受信される前に壁及び他の面に反射する。夫々の反射110はイメージソース108に対応する。イメージソース108は、部屋100の中の音響効果をシミュレーションするために、ここで記載される例において使用される。マイクロホンアレイ106での受信信号は、信号を送信するラウドスピーカ102とマイクロホンアレイ106にある受信器との間の多数の経路に沿って受信される信号の重ね合わせである。
目下の技術の実施形態は、夫々のラウドスピーカ102とマイクロホン106との間のインパルス応答の推定を形成するために、アレイに到来する反射110のスパーシティとともに、マイクロホンアレイ構造106を利用するアルゴリズムを組み込む。アルゴリズムは、合成及び実データの両方において整合フィルタアルゴリズムに対して性能を改善すると見られる。実施形態は、夫々のマイクロホンでの室内伝達関数(RTF)推定を改善するために既知のマイクロホンアレイジオメトリを使用する。これは、全てのマイクロホンが同じ部屋にあり、同じラウドスピーカから信号を受信し且つ同じ障害から跳ね返るという事実によりRFTにおいて現れる規則性を利用することによって、達成される。マイクロホンアレイジオメトリが知られていると仮定する一方で、マイクロホンアレイ106のジオメトリは、ここで記載されるように信号を収集するより前に知られている必要はない点が留意されるべきである。言い換えれば、アレイの構成は受信信号を用いて推定され得るので、予めそれを知る必要はない。当業者であれば、アレイジオメトリを推定するために如何にして相関及び複数の受信信号を使用すべきか知っているであろう。
図2は、スパースアレイ信号処理を用いるAECのために使用され得るコンピューティングデバイス200の例のブロック図である。コンピューティングシステム200は、例えば、Microsoft(登録商標)によるXbox(登録商標) 360若しくはX box Oneプラットフォームとともに使用されるXbox Kinect(登録商標)、又は同様のオーディオキャプチャデバイスであることができる。幾つかの実施形態において、コンピューティングシステム200は、例えば、フィードバックを提供するためにレビュアーによって使用されるデスクトップコンピュータであってよい。他の実施形態では、コンピューティングシステム200は、多くのより新しい自動車におけるダッシュボードディスプレイ及びユーザインターフェイスに組み込まれ得る。コンピューティングシステム200は、記憶されている命令を実行するよう構成されるプロセッサ202と、プロセッサ202によって実行される命令を記憶するメモリデバイス204とを含むことができる。プロセッサ202は、シングルコアプロセッサ、マルチコアプロセッサ、コンピューティングクラスタ、又は多くの他の構成であることができる。メモリデバイス204は、ランダムアクセスメモリ(例えば、SRAM、DRAM、ゼロキャパシタRAM、SONOS、eDRAM、EDO RAM、DDR RAM、RRAM(登録商標)、PRAM、など)、リードオンリーメモリ(例えば、マスクROM、PROM、EPROM、EEPROM、など)、フラッシュメモリ、又は如何なる他の適切なメモリシステムも含むことができる。プロセッサ202によって実行される命令は、疎表現化されたアレイに基づく信号処理を用いる音響エコーキャンセレーションのために使用され得る。
プロセッサ202は、コンピューティングシステム200を1つ以上のI/Oデバイス210へ接続するよう構成される入出力(I/O)デバイスインターフェイス208へシステムバス206(例えば、プロプリエタリ・バス、PCI、ISA、PCI−Express、HyperTransport、NuBus、など)を通じて接続されてよい。I/Oデバイス210は、例えば、とりわけ、カメラ、ジェスチャ認識入力デバイス、キーボード、ポインティングデバイス、音声認識デバイス、及びネットワークでインターフェイスを含むことができる。ポインティングデバイスは、とりわけ、タッチパッド又はタッチスクリーンを含んでよい。本開示において、重要なI/Oデバイスは、コンピューティングシステム200へ接続されるマイクロホンアレイ106である。I/Oデバイス210は、コンピューティングシステム200の内蔵コンポーネントであることができ、あるいは、コンピューティングシステム200へ外部から接続されているデバイスであることができる。
プロセッサ202は、コンピューティングシステム200をディスプレイデバイス214へ接続するよう構成されるディスプレイデバイスインターフェイス212へもシステムバス206を通じてリンクされ得る。ディスプレイデバイス214は、コンピューティングシステム200の内蔵コンポーネントであるディスプレイスクリーンを含んでよい。ディスプレイデバイス214は、コンピューティングシステム200へ外部から接続されている、とりわけ、コンピュータモニタ、テレビ、又はプロジェクタも含むことができる。
ストレージ216は、バス206を通じてプロセッサ202へ結合され得る。ストレージ216は、ハードドライブ、ソリッドステートドライブ、光学ドライブ、USBフラッシュドライブ、ドライブのアレイ、又はそれらの如何なる組み合わせも含むことができる。ストレージ216は、ここで記載されるように、スパースアレイ信号処理を用いる音響エコーキャンセレーションを実施するよう構成される多数のモジュールを含むことができる。例えば、ストレージ216は、マイクロホンアレイ106の全てのマイクロホンでの受信信号110を単一の大きいベクトルに配置するよう構成される信号配置モジュール218を含むことができる。
ストレージ216は、マイクロホンアレイ106からのソース距離及びマイクロホンアレイ106への受信信号の角度を組み込む基底ベクトルを計算する基底ベクトルモジュール220を更に含むことができる。夫々の起こり得る角度及び距離として計算され得る夫々の起こり得る遅延時間について、基底ベクトルは、ラウドスピーカ信号が特定の角度及び遅延からアレイの中心へ届いている場合に、マイクロホンのアレイ106の各マイクロホンについて積み重ねられたラウドスピーカ信号として定義され得る。実施形態において、全ての起こり得る角度及び遅延は、マイクロホンアレイ106で経験される音響エコーをキャンセルするインパルス応答が生成され得る前に、離散化されてスパースソルバの対象となる。このように、受信信号は、基底ベクトルの少数の重み付けされた組み合わせになる(起こり得る角度及び遅延の数は、マイクロホンアレイ106で実際に受信される数よりもずっと大きいので、少数である。)。
ストレージ216には、スパースソルバモジュール222も含まれ得る。数百万の角度及び遅延が存在するという理由で、更には、それらの夫々は基底ベクトルによって表される必要があるので、基底行列の全体のサイズは非常に大きい。夫々のとり得る位置は、基底ベクトルによって表されるそれらの信号が真であろうと虚であろうと、表されるべきである。凸最適化プロシージャを通じて、スパースソルバモジュール222は、重み付けされた基底ベクトルを使用し、そして、特定の再構成エラーを満足する最小値の重みを決定する。最適化プロシージャは、例えば、スパース制約に伴う近似表現の問題を解くよく知られた方法であるBasis Pursuit Denoising(BPDN)であることができる。スパースソルバは、行列ベクトル演算に依存するSPGLソルバや、大規模なノルム1の正則化最小二乗のためのMatlab(登録商標)ソルバとしても、そのようなソルバを含むことができる。
インパルス応答モジュール224も、ストレージ216に含まれ得る。インパルス応答モジュール224は、スパースソルバモジュール222から決定された基底重みを用いて、ラウドスピーカ102からマイクロホンのアレイ106の各マイクロホンへのインパルス応答を推定するよう構成される。インパルス応答は、基底ベクトルモジュール220によって計算される基底ベクトルに対応する基底ベクトルを用いて推定され得る。対応する基底行列もインパルス応答モジュール224によって構成されてよく、この基底行列からのベクトルは、マイクロホンのアレイ106における各マイクロホンの順に積み重ねられたインパルス応答推定を含むことができる。ストレージ216は、マイクロホンのアレイ106で受信された音響エコーを無効にするためにインパルス応答推定を使用するエコーキャンセレーションモジュール226を更に含むことができる。エコーキャンセレーションモジュール226は、各マイクロホンでの受信信号にフィルタをかけ、AEC問題を解消する。
図2のブロック図は、コンピューティングシステム200が図2に示される全てのコンポーネントを含むべきであることを示すよう意図されない点が理解されるべきである。むしろ、コンピューティングシステム200は、図2で表されていない少数の又は更なるコンポーネント、例えば、追加のアプリケーション、追加のモジュール、追加のメモリデバイス、追加のネットワークインターフェイス(図示せず。)、及び同様のものを含むことができる。更に、コンピューティングシステム200は、それらの機能を実施するために使用されるコードの如何なる組み合わせも実施され得るので、図示されているモジュールに制限されない。
図3は、マイクロホンアレイ及びラウドスピーカ構成のシステムモデルを表す。較正フェーズの間、トレーニング信号l(t)がラウドスピーカ302で再生される。離散時間表記が使用され、時間インデックスとしてnが使用される。よって、l(t)の離散時間バージョンはl[n]と表される。例となる実施形態は複数のラウドスピーカを使用し、このプロシージャは夫々のラウドスピーカについて別々に繰り返される必要があり得る。ラウドスピーカ302からk番目のマイクロホン304までのRTFはh[n] 306と表され、時不変であると考えられるが、時間的に変化する特徴を追跡するために適応が実行され得る。よって、k番目のマイクロホン304で受信される信号は、式(1)によって表される:
Figure 2019168730
式(1)において、mは、和を計算するために使用されるダミー変数であり、d[n]は所望の信号であり、nは時間インデックスの従来表記であり、v[n]は干渉ノイズである。d[n]は、較正フェーズの間ゼロであると考えられる点に留意されたい。RTF h[n] 306が知られている場合に、エコーは、単に、受信信号から減じられ得る。代わりに、キャンセレーションフィルタ
[外1]
Figure 2019168730
は、計算されて、次の式:
Figure 2019168730
によって与えられる出力信号y[n]を計算することでエコーをx[n]から(部分的に)除くために使用される近似である。式(2)で、同じ変数は、式(1)で定義された変数と同じである。
1つのマイクロホン及び1つのラウドスピーカしか存在しない場合に、RTFの最小平均二乗誤差推定は“整合フィルタ”として知られる。これは、次のように計算され得る:
Figure 2019168730
式(3)で、
[外2]
Figure 2019168730
は、l[n]の重み付けされたバージョンを指し、
[外3]
Figure 2019168730
は、ラウドスピーカ信号l[n]を白色化するために使用される同じフィルタによってフィルタをかけられた後のx[n]である。統計的白色化(statistical whitening)プロシージャは有益にデータを変換する。故に、データは、全てのサンプルが統計的に独立している恒等共分散行列を有する。式(3)のキャンセレーションフィルタはベースライン計算であって、それと現在のエコーキャンセレーション技術が比較される。更に、マイクロホンのアレイで複数のマイクロホンを利用することによって推定器308で得られる各RTFの推定は、上記の最適条件よりも良いものであり得る。
図4は、平面アレイ400に届く可聴信号の概略図である。いずれか1つの経路に沿って、信号は、経路の長さに依存する、アレイの中心までの伝播遅延と、持ち込まれる反射110の性質に依存するゲイン(場合により、周波数に依存する。)とを有する。反射110が平面波としてアレイ106に届くとして、特定の経路に沿った受信信号の構造が図4において示されている。表記の簡単のために、図4において見られるように、マイクロホンの直線配列において、マイクロホンはz軸に沿って整列されており、位置(z,z,...z)にあるとする。線形配列106に作用する平面波について、原点402での連続時間信号がs(t)である場合に、zに位置するマイクロホンでの信号は、τ(z,θ)=−zcos(θ)/cであって且つcが音速であるとして、s(t−τ(z,θ))である。言い換えれば、平面波によって各マイクロホン106で生成される信号は、アレイジオメトリにのみ依存する遅延(τ)、及び到来方向(θ)404を除いて、同じである。
夫々の反射110は、図1に示される仮想イメージソース108に対応することができる。以下の式(4)は、最初に、波形が平面として近似され得るほどアレイ106の次元が十分に小さいと仮定し、更に、どの反射体もフラットフェージングであると仮定し、最後に、P個のソース(実又は虚)があれば到来信号の近似を提供するのに十分であると仮定する。次いで、それらの仮定の下で、マイクロホンのアレイ106のk番目のマイクロホンで受信される信号は、次のように記述され得る:
Figure 2019168730
式(4)で、T及びαは、夫々、波面pで生じた遅延及び減衰である(伝播損失並びにマイクロホン及びラウドスピーカの指向性を含む。)。更に、cは音速であり、
[外4]
Figure 2019168730
は、実際のノイズv[n]及び場合によりあらゆるモデル化されていない信号成分の両方を含み、θは、p番目の経路に沿って到来する信号がアレイの軸と成す角度である。Tはサンプリングインターバルであり、zは、上述されたように、z軸におけるk番目のマイクロホンの位置である。単ソース信号の組は、同時にマイクロホンのアレイの全マイクロホンに影響を及ぼす単ソース信号として定義され得る。単ソース信号の夫々は、異なる位置にある単一の実際の又は仮想のソースに対応する。
式(4)及び図4は、マイクロホンのアレイ106が一様であって直線に整列されているとする。しかし、この構成は、ほんの一例を提供するにすぎず、本開示を実施するために必要とされない。実際に、アレイは、一般に直線である必要はない。更に、式(4)は、ゲインが周波数に依存しないと暗黙的に仮定したが、これも必要とされず、ここで記載される技術の実施において当然と考えられる。
図5は、オーディオ信号を受信してインパルス応答を推定する例となる方法のプロセスフロー図である。方法500はブロック502から開始する。ブロック502で、オーディオ信号は、1つ以上のラウドスピーカで再生され、対応する信号は、場合により周囲ノイズによって汚染されて、マイクロホンのアレイのうちのあるマイクロホンで受信される。方法はブロック504でのステップを含む。このステップで、ラウドスピーカで再生される音響の結果としてマイクロホンに到達し得る一群の信号が推定される。方法は、受信されたオーディオ信号に基づく、マイクロホンのアレイのジオメトリに適合するサブスペースにおける室内インパルス応答のブロック506での決定を更に含む。
図5のプロセスフロー図は、方法500のステップが何らかの特定の順序において実行されるべきであること、又は方法500の全てのステップがあらゆる場合において含まれるべきであることを示すよう意図されない。更に、具体的な適用に応じて、方法500には、更なるステップがいくつでも含まれてよい。
図6は、スパースアレイ信号処理を用いて音響エコーキャンセレーションを実施する方法600の例のプロセスフロー図である。方法は、図2に関して記載されたコンピューティングデバイス200によって実施されてよい。方法600はブロック602から開始する。ブロック602で、オーディオ信号はマイクロホンアレイで受信される。受信された信号は、次いでブロック604でアレンジされて単一の大きい数学的ベクトルとして表される。ブロック606で、基底ベクトルは、多数の仮想ソースに対応する複数の聴取角度及び時間遅延についてラウドスピーカによって送信された信号を含むよう定義される。仮想ソース又はイメージソースは、マイクロホンアレイで受信される前に室内で反響し得る膨大な数の起こり得る信号反射の表現であることができる。全ての起こり得るベクトルがこのように解析されるわけではなく、重み付けされた構成が、より容易に計算可能なデータセットを提供するために課され得る。
方法は、よってブロック608で続く。ブロック608で、受信されたオーディオ信号は、仮想であろうと実際であろうと、多数の基底ベクトルの組み合わせの重み付け関数として解釈される。基底ベクトル及び対応する重みは、ある所望のエコー空間での観測ベクトルの最良の表現をもたらすよう最適化され得る。最適化は、次の式によりモデル化され得る:
Figure 2019168730
式(5)において、
[外5]
Figure 2019168730
は、計算された最良の重みベクトル(すなわち、(5)における式を最小化するベクトル)であり、Bは、所望のエコー空間を記述する大次元行列であって、個々の基底ベクトルの全てから成ることで形成され、xは観測ベクトルであり、σは、許容される再構成エラーである。例となる実施形態において、σは、モデル化されていない成分の標準偏差よりもわずかに大きい値に設定される。より具体的には、σの如何なる値も結果を生成するが、本例では、σは、あるβ>1について、σ=βσに設定される。なお、σはノイズ標準偏差であり、βは正の整数である。他の実施形態では、βは1.5に設定され得る。
可聴信号を表すことができる膨大なデータのために、行列Bは非常に大きい可能性が高く、信号空間の過完備基底を構成する可能性が高い。よって、過完備性を扱う有効な方法を見つけることに加えて、(5)を解く有効な方法を見つけることが必要になる。これは、スパーシティ制約((5)で示されるノルム1行列に埋め込まれる。)を課してスパースソルバを使用することによって、行われ得る。これは、Bにおけるデータが格納され、より容易にアクセスされることを可能にする。ブロック610で、スパースソルバは、特定の再構成エラーを満足する重みを決定するために用いられる。示されるように、この再構成エラーは、理想的には、モデル化されていない成分の標準偏差よりもわずかに大きくてよい。再構成エラーは、例えば、モデリングエラーにノイズを加えたものに近い数字であることができる。浄化プロシージャも、性能を更に改善するために実施され得る。浄化は、|x−Σθ,tθ,tθ,tの値を最小化することによって、非ゼロである(又は特定の閾値を上回る)と(5)において求められた全ての係数wθ,tを再計算する。bθ,tは、遅延tを有して角度θで到達する反射に対応する基底ベクトルであり、wθ,tは、基底ベクトルに関連する((5)において非ゼロと認められた)重みである。
ブロック612で、インパルス応答は、ラウドスピーカからマイクロホンのアレイの各マイクロホンまで推定される。インパルス応答は、ラウドスピーカによって生成された音響エコーの推定に対応し、そのようなエコーを、該エコーがマイクロホンアレイで受信される場合に無効にするために、有効に使用される。インパルス応答推定は、例えば、次のベクトルとして計算され得る:
Figure 2019168730
ブロック614で、式(6)のインパルス応答推定ベクトルは、マイクロホンのアレイの全マイクロホンで受信されるオーディオ信号の表現から音響エコーを除去するために使用され得る。
図6のプロセスフロー図は、方法600のステップが何らかの特定の順序において実行されるべきであること、又は方法600の全てのステップがあらゆる場合において含まれるべきであることを示すよう意図されない。更に、具体的な適用に応じて、方法600には、更なるステップがいくつでも含まれてよい。
図7は、スパースアレイ信号処理を用いてAECを実行するために使用され得る有形なコンピュータ可読記憶媒体700を示すブロック図である。有形なコンピュータ可読記憶媒体700は、コンピュータバス704を介してプロセッサ702によってアクセスされてよい。更に、有形なコンピュータ可読記憶媒体700は、ここで開示されている技術のステップを実行するようプロセッサ702に指示するコードを含んでよい。
有形なコンピュータ可読記憶媒体700は、マイクロホンアレイに到達するオーディオ信号を受信し処理するようプロセッサ702に指示するように構成されたコード706を含むことができる。更に、有形なコンピュータ可読記憶媒体700は、ベクトル配置を助けるようプロセッサ702に指示するように構成されたコード708を含むことができる。例えば、コードは、プロセッサ702に、受信されたオーディオ信号のとり得る表現の1つの単一大次元ベクトルを定義するよう指示してよい。コード710の他のブロックは、プロセッサ702に、仮想の及び実際のソース信号の組み合わせであることができる基底ベクトルを定義するよう指示することができる。コード712のブロックは、次いで、プロセッサ702に、表現データの量をより管理可能なサイズまで減らすために、基底ベクトルの値に対して重み付け関数を生成するよう指示することができる。有形なコンピュータ可読記憶媒体700は、プロセッサ702に、重み付けされた基底ベクトルによって定義される依然として非常に膨大なデータにスパーシティ制約を課すようスパースソルバ技術を実施するように指示するコード714を更に含むことができる。コード716のブロックは、次いで、プロセッサ702に、マイクロホンのアレイの各マイクロホンでのインパルス応答推定を計算するよう指示することができる。インパルス応答推定は、次いで、遅延された反射されたオーディオ信号を記録するマイクロホンを備えたオーディオシステムで通常生成される音響エコーを除去するために、コード718のブロックにより利用され得る。
具体的な適用に応じて、有形なコンピュータ可読記憶媒体700には、図7で示されていない追加のソフトウェアコンポーネントがいくつでも含まれてよい点が理解されるべきである。構造的特徴及び/又は方法に特有の言語において対象は記載されてきたが、添付の特許請求の範囲で定義される対象は、必ずしも上記の具体的な構造的特徴又は方法に制限されない点が理解されるべきである。むしろ、上記の具体的な構造的特徴及び方法は、特許請求の範囲を実施する例となる形態として開示されている。

Claims (9)

  1. オーディオソースとマイクロホンのアレイとの間の室内インパルス応答を推定する方法であって、
    マイクロホンのアレイのうちの夫々のマイクロホンで、当該マイクロホンに対応するオーディオ信号を受信することと、
    前記受信されたオーディオ信号に基づき、単ソース信号の組を、該単ソース信号が同時に前記マイクロホンのアレイの全マイクロホンに影響を与えるとして定義することであり、前記単ソース信号の夫々は、異なる位置にある単一の実際の又は仮想のソースに対応する、前記定義することと、
    前記単ソース信号の組の重み付けされた組み合わせを求め、該重み付けされた組み合わせを前記受信されたオーディオ信号の近似とすることと、
    前記室内インパルス応答を決定することであり、該インパルス応答は、前記重み付けされた組み合わせに対応する、前記推定することと
    を有する方法。
  2. 音響エコーキャンセレーションを初期化するために前記室内インパルス応答を使用することを更に有する
    請求項1に記載の方法。
  3. 前記単ソース信号の組を重み付けする重みが再構成エラーを満足するよう凸最適化技術を用いて最適化されるように、スパースソルバを使用することを更に有し、前記再構成エラーは、モデリングエラーにノイズを加えたものに対応する、
    請求項1又は2に記載の方法。
  4. 前記受信されたオーディオ信号は、基底ベクトルによって表され、該基底ベクトルは、前記オーディオソースから前記マイクロホンのアレイによって受信される実際の又は仮想のイメージ信号を表すよう構成される、
    請求項1乃至3のうちいずれか一項に記載の方法。
  5. 前記インパルス応答は、高速フーリエ変換アルゴリズムに依存する技術を用いて推定される、
    請求項1乃至4のうちいずれか一項に記載の方法。
  6. オーディオソース及びマイクロホンのアレイの配置において経験される可聴フィードバックの音響エコーキャンセレーションを実施するシステムであって、
    プロセッサ実行可能コードを実行するプロセッサと、
    マイクロホンのアレイと、
    プロセッサ実行可能コードを記憶する記憶デバイスと
    を有し、
    前記プロセッサ実行可能コードは、前記プロセッサによって実行される場合に、該プロセッサに、
    マイクロホンのアレイのうちの夫々のマイクロホンで、当該マイクロホンに対応するオーディオ信号を受信することと、
    前記受信されたオーディオ信号に基づき、単ソース信号の組を、該単ソース信号が同時に前記マイクロホンのアレイの全マイクロホンに影響を与えるとして定義することであって、前記単ソース信号の夫々は、異なる位置にある単一の実際の又は仮想のソースに対応する、前記定義することと、
    前記単ソース信号の組の重み付けされた組み合わせを求め、該重み付けされた重みを前記受信されたオーディオ信号の近似とすることと、
    前記オーディオソースから前記マイクロホンのアレイの各マイクロホンへの室内インパルス応答を推定することであって、該インパルス応答は、前記重み付けされた組み合わせに対応する、前記推定することと、
    前記インパルス応答を用いて、前記受信されたオーディオ信号から音響エコーをキャンセルすることと
    を実行させる、システム。
  7. 前記単ソース信号の組の前記重み付けされた組み合わせは、凸最適化技術を用いて最適化される、
    請求項6に記載のシステム。
  8. 前記インパルス応答は、高速フーリエ変換アルゴリズムに依存する技術を用いて推定される、
    請求項6又は7に記載のシステム。
  9. 前記プロセッサ実行可能コードは、前記プロセッサによって実行される場合に、該プロセッサに、
    前記オーディオソースから前記マイクロホンのアレイによって受信される実際の又は仮想のイメージ信号を表すよう構成される基底ベクトルによって、前記受信されたオーディオ信号を表すこと
    を実行させる、請求項6乃至8のうちいずれか一項に記載のシステム。
JP2019126371A 2013-12-05 2019-07-05 音響エコーキャンセルのための室内インパルス応答の推定 Active JP6837099B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/098,283 US9602923B2 (en) 2013-12-05 2013-12-05 Estimating a room impulse response
US14/098,283 2013-12-05

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016535694A Division JP2016539579A (ja) 2013-12-05 2014-11-28 音響エコーキャンセルのための室内インパルス応答の推定

Publications (2)

Publication Number Publication Date
JP2019168730A true JP2019168730A (ja) 2019-10-03
JP6837099B2 JP6837099B2 (ja) 2021-03-03

Family

ID=52146720

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016535694A Pending JP2016539579A (ja) 2013-12-05 2014-11-28 音響エコーキャンセルのための室内インパルス応答の推定
JP2019126371A Active JP6837099B2 (ja) 2013-12-05 2019-07-05 音響エコーキャンセルのための室内インパルス応答の推定

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2016535694A Pending JP2016539579A (ja) 2013-12-05 2014-11-28 音響エコーキャンセルのための室内インパルス応答の推定

Country Status (12)

Country Link
US (1) US9602923B2 (ja)
EP (1) EP3078210B1 (ja)
JP (2) JP2016539579A (ja)
KR (1) KR102223695B1 (ja)
CN (1) CN105794226B (ja)
AU (1) AU2014357488B2 (ja)
BR (1) BR112016012375B1 (ja)
CA (1) CA2932397C (ja)
ES (1) ES2664113T3 (ja)
MX (1) MX354432B (ja)
RU (1) RU2685053C2 (ja)
WO (1) WO2015084683A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10375501B2 (en) * 2015-03-17 2019-08-06 Universitat Zu Lubeck Method and device for quickly determining location-dependent pulse responses in signal transmission from or into a spatial volume
US9992570B2 (en) 2016-06-01 2018-06-05 Google Llc Auralization for multi-microphone devices
CN107705799B (zh) * 2017-11-24 2020-12-11 苏州狗尾草智能科技有限公司 聊天机器人回声消除方法及装置
CN109920444B (zh) * 2017-12-13 2021-04-27 中国电信股份有限公司 回声时延的检测方法、装置以及计算机可读存储介质
CN109975812B (zh) * 2017-12-27 2020-10-23 中国科学院声学研究所 一种爆炸声的声源深度和声源级的计算方法
US10764703B2 (en) * 2018-03-28 2020-09-01 Sony Corporation Acoustic metamaterial device, method and computer program
US10582299B1 (en) * 2018-12-11 2020-03-03 Amazon Technologies, Inc. Modeling room acoustics using acoustic waves
WO2021002862A1 (en) * 2019-07-03 2021-01-07 Hewlett-Packard Development Company, L.P. Acoustic echo cancellation
CN110849462B (zh) * 2019-12-05 2021-07-27 武汉科技大学 一种基于稀疏特征相似性的连轧机振动信号分离方法
US12089032B1 (en) * 2020-07-31 2024-09-10 Apple Inc. Estimating room acoustic material properties
US11830471B1 (en) * 2020-08-31 2023-11-28 Amazon Technologies, Inc. Surface augmented ray-based acoustic modeling
WO2022231338A1 (en) * 2021-04-28 2022-11-03 Samsung Electronics Co., Ltd. A portable receiving device of calibrating device configurations using room geometry and a system including the same

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005080124A (ja) * 2003-09-02 2005-03-24 Japan Science & Technology Agency リアルタイム音響再現システム
JP2010020294A (ja) * 2008-06-11 2010-01-28 Sony Corp 信号処理装置、および信号処理方法、並びにプログラム
JP2010527181A (ja) * 2007-04-30 2010-08-05 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. マルチチャネル音声通信システムにおいて音響エコーを低減するための方法およびシステム
JP2010206449A (ja) * 2009-03-03 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
WO2012105386A1 (ja) * 2011-02-01 2012-08-09 日本電気株式会社 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム
JP2013507796A (ja) * 2009-10-07 2013-03-04 ザ・ユニバーシティ・オブ・シドニー 記録された音場の再構築

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5548642A (en) 1994-12-23 1996-08-20 At&T Corp. Optimization of adaptive filter tap settings for subband acoustic echo cancelers in teleconferencing
US6563925B1 (en) 1999-04-07 2003-05-13 Ericsson Inc. Method and apparatus for space-time echo cancellation
JP3552967B2 (ja) 1999-11-15 2004-08-11 沖電気工業株式会社 エコーキャンセラ装置
JP3727258B2 (ja) 2001-08-13 2005-12-14 富士通株式会社 エコー抑制処理システム
US7069286B2 (en) * 2002-09-27 2006-06-27 Lucent Technologies Inc. Solution space principle component-based adaptive filter and method of operation thereof
US7003099B1 (en) 2002-11-15 2006-02-21 Fortmedia, Inc. Small array microphone for acoustic echo cancellation and noise suppression
DE10328335B4 (de) * 2003-06-24 2005-07-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wellenfeldsyntesevorrichtung und Verfahren zum Treiben eines Arrays von Lautsprechern
US7415117B2 (en) * 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
US20060147063A1 (en) 2004-12-22 2006-07-06 Broadcom Corporation Echo cancellation in telephones with multiple microphones
US7831035B2 (en) 2006-04-28 2010-11-09 Microsoft Corporation Integration of a microphone array with acoustic echo cancellation and center clipping
US8275120B2 (en) 2006-05-30 2012-09-25 Microsoft Corp. Adaptive acoustic echo cancellation
US8184801B1 (en) 2006-06-29 2012-05-22 Nokia Corporation Acoustic echo cancellation for time-varying microphone array beamsteering systems
US8126161B2 (en) 2006-11-02 2012-02-28 Hitachi, Ltd. Acoustic echo canceller system
US8208649B2 (en) * 2009-04-28 2012-06-26 Hewlett-Packard Development Company, L.P. Methods and systems for robust approximations of impulse responses in multichannel audio-communication systems
US8483398B2 (en) 2009-04-30 2013-07-09 Hewlett-Packard Development Company, L.P. Methods and systems for reducing acoustic echoes in multichannel communication systems by reducing the dimensionality of the space of impulse responses
US9094496B2 (en) * 2010-06-18 2015-07-28 Avaya Inc. System and method for stereophonic acoustic echo cancellation
US20110317522A1 (en) * 2010-06-28 2011-12-29 Microsoft Corporation Sound source localization based on reflections and room estimation
JP5172909B2 (ja) 2010-08-05 2013-03-27 日本電信電話株式会社 反射音情報推定装置、反射音情報推定方法、プログラム
JP5611119B2 (ja) 2011-05-19 2014-10-22 株式会社日立製作所 音響シミュレータ、音響コンサルティング装置及びそれらの処理方法
US9689959B2 (en) * 2011-10-17 2017-06-27 Foundation de l'Institut de Recherche Idiap Method, apparatus and computer program product for determining the location of a plurality of speech sources
US9099096B2 (en) * 2012-05-04 2015-08-04 Sony Computer Entertainment Inc. Source separation by independent component analysis with moving constraint
CN103258533B (zh) * 2013-05-27 2015-05-13 重庆邮电大学 远距离语音识别中的模型域补偿新方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005080124A (ja) * 2003-09-02 2005-03-24 Japan Science & Technology Agency リアルタイム音響再現システム
JP2010527181A (ja) * 2007-04-30 2010-08-05 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. マルチチャネル音声通信システムにおいて音響エコーを低減するための方法およびシステム
JP2010020294A (ja) * 2008-06-11 2010-01-28 Sony Corp 信号処理装置、および信号処理方法、並びにプログラム
JP2010206449A (ja) * 2009-03-03 2010-09-16 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2013507796A (ja) * 2009-10-07 2013-03-04 ザ・ユニバーシティ・オブ・シドニー 記録された音場の再構築
WO2012105386A1 (ja) * 2011-02-01 2012-08-09 日本電気株式会社 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム

Also Published As

Publication number Publication date
RU2016122040A (ru) 2017-12-08
WO2015084683A1 (en) 2015-06-11
KR102223695B1 (ko) 2021-03-04
US9602923B2 (en) 2017-03-21
CA2932397C (en) 2022-03-29
ES2664113T3 (es) 2018-04-18
US20150163593A1 (en) 2015-06-11
RU2016122040A3 (ja) 2018-06-26
BR112016012375A8 (pt) 2020-06-02
RU2685053C2 (ru) 2019-04-16
AU2014357488A1 (en) 2016-06-16
EP3078210B1 (en) 2018-01-17
AU2014357488B2 (en) 2018-07-19
KR20160095008A (ko) 2016-08-10
CN105794226A (zh) 2016-07-20
EP3078210A1 (en) 2016-10-12
BR112016012375A2 (ja) 2017-08-08
JP6837099B2 (ja) 2021-03-03
CN105794226B (zh) 2020-01-03
BR112016012375B1 (pt) 2022-07-12
MX354432B (es) 2018-03-05
CA2932397A1 (en) 2015-06-11
MX2016007152A (es) 2016-07-21
JP2016539579A (ja) 2016-12-15

Similar Documents

Publication Publication Date Title
JP6837099B2 (ja) 音響エコーキャンセルのための室内インパルス応答の推定
US9721583B2 (en) Integrated sensor-array processor
CN106537501B (zh) 混响估计器
JP4376902B2 (ja) 音声入力システム
CN108141691B (zh) 自适应混响消除系统
WO2015065682A1 (en) Selective audio source enhancement
US10049685B2 (en) Integrated sensor-array processor
Saqib et al. Estimation of acoustic echoes using expectation-maximization methods
US11830471B1 (en) Surface augmented ray-based acoustic modeling
Yellepeddi et al. Sparse array-based room transfer function estimation for echo cancellation
Sharma et al. Development of a speech separation system using frequency domain blind source separation technique
Kinoshita et al. A linear prediction-based microphone array for speech dereverberation in a realistic sound field
Tuna et al. Data-driven local average room transfer function estimation for multi-point equalization
US10204638B2 (en) Integrated sensor-array processor
Zeng et al. A tensor decomposition based multichannel linear prediction approach to speech dereverberation
Amerineni Multi Channel Sub Band Wiener Beamformer
Kumar et al. Effect of reverberation on different DOA estimation techniques using microphone array
Kavruk Two stage blind dereverberation based on stochastic models of speech and reverberation
WO2024126242A1 (fr) Obtention d&#39;une réponse impulsionnelle d&#39;une salle
Helwani Adaptive Identification of Acoustic Multichannel Systems Using Sparse Representations
Uppaluru Blind deconvolution and adaptive algorithms for de-reverberation
Fujii et al. Two-microphone system using linear prediction and noise reconstruction
Talmon et al. Identification of the relative transfer function between sensors in the short-time Fourier transform domain
Hsieh et al. Analysis of alternative methods for impulse response functions based on signal-to-noise ratio enhancement and completeness of source signal reconstruction using passive time reversal
Salvati et al. Cepstrum analysis and blind system identification for localization of pseudo-periodic sounds

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190705

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210208

R150 Certificate of patent or registration of utility model

Ref document number: 6837099

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250