JP2000512108A - 音源位置づけ方法と装置 - Google Patents

音源位置づけ方法と装置

Info

Publication number
JP2000512108A
JP2000512108A JP10501589A JP50158998A JP2000512108A JP 2000512108 A JP2000512108 A JP 2000512108A JP 10501589 A JP10501589 A JP 10501589A JP 50158998 A JP50158998 A JP 50158998A JP 2000512108 A JP2000512108 A JP 2000512108A
Authority
JP
Japan
Prior art keywords
signal
sound source
acoustic
captured
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10501589A
Other languages
English (en)
Other versions
JP2000512108A5 (ja
JP3672320B2 (ja
Inventor
ピーター エル チュー
ホン ウォン
Original Assignee
ピクチャーテル コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ピクチャーテル コーポレイション filed Critical ピクチャーテル コーポレイション
Publication of JP2000512108A publication Critical patent/JP2000512108A/ja
Publication of JP2000512108A5 publication Critical patent/JP2000512108A5/ja
Application granted granted Critical
Publication of JP3672320B2 publication Critical patent/JP3672320B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/403Linear arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/405Non-uniform arrays of transducers or a plurality of uniform arrays with different transducer spacing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 共通の音源(2)からのスピーチまたは他の音響信号の方向(80)または位置を得るために、一組の空間的に離れたマイクロホーン(10,11)を使用している、音響信号処理方法と装置が、開示されている。本発明は、個々の時間フレームの間に捕らえられた信号が、音源からの一連の音響信号の始まり(45)または初期を表すか、どうかを決定し、一連の信号を表す受信された音響信号を識別し、受信された音響信号に基づいて音源の方向(80)を決定することにより、音響信号を処理する方法と装置から成っている。本発明は、例えば、発言を始めた人の方向へビデオカメラを向けることにより、ビデオカメラを自動的に調節することが望ましいビデオ方式会議に適用される。

Description

【発明の詳細な説明】 音源位置づけ方法と装置 発明の背景 本発明は、一般に、音響信号処理に関し、詳細には、音源の方向およびま たは位置を識別する方法と装置に関する。 幾つかの知られている音響通信装置は、音響信号を捕らえる一つ以上のマ イクロホーン取り入れている。しかし、ある状況においては、音源の方向は変化 するか、または、予測することが出来ない。例えば、室内の多数の話者が一組の 話者マイクロホーンを使用する会議用装置では、異なる人が会議室内の異なる位 置から話すので、音の方向は変化する。さらに、話者は話している間動き回る。 それにもかかわらず、ビデオ方式会議などの環境では、話者の方向と位置を識別 することが望まれる。 発明の要約 本発明は、数組の間隔をおいて離れたマイクロホーンを使用して、共通の 音源からのスピーチの方向と他の音響信号を得る音響信号処理方法と装置を意図 している。本発明は、個々の時間フレームの間に捕らえた信号が、音源からの音 響信号の流れの始まりまたは初期を表しているか、いないかを決定し、データが その流れの初期を表すとき、信号の流れを表す受信された音響信号を識別し、受 信された音響信号に基づいた音源の方向を決定することにより、音響信号を処理 する方法と装置から構成している。 好適な実施態様において、音源からの音響信号の流れの始まりまたは初期 は、周波数毎をベースにして好適に検出される。好適に、次の二つの条件を満足 する捕らえた信号のこれらの周波数成分に関連したデータは、音源からの音響信 号の始まりにおいて発生する信号を表すと思われる。第一に、周波数成分の大き さは、その周波数の暗騒音のエネルギーより、少なくとも所定量だけ好適に大き くなければならない。第二に、周波数成分の大きさは、先行の時間フレームの所 定数の間に捕らえた対応する周波数成分の大きさより、少なくとも所定量だけ好 適に大きくなればならない。 二つの条件が個々の時間フレームの間において個々の周波数について満足 されるならば、始まりの条件がその周波数に関して満足されると考えられる。時 間フレーム中に一組のマイクロホーンにより捕らえられた音響信号の相互関係は 、この様な各周波数成分について生成され、各この周波数における騒音の相互関 係は差し引かれて、音源からの信号の流れを表す受信音響信号を識別する。好適 に、受信された音響信号は、所定の時間の間蓄積される。所定時間の終わりに、 少なくとも特定数の周波数の非ゼロ値が蓄積されたならば、蓄積された値は、一 組のマイクロホーンにおいて共通の音源から到達する信号の間の時間遅れを決定 するために使用される。次に、この情報は、マイクロホーンに対する音源の方向 または関係角度を決定するために使用することが出来る。マイクロホーンの配列 が、装置の能力を高めるために、ただ一組のマイクロホーンの代わりに有利に使 用することが出来る。 本発明は、ビデオ方式会議、ビデオ録画および放送などの用途に特に適し ており、その場合、動作カメラを水平回転し、傾斜し、スピーチを始めた個人ま たは数人のグループの方向に切り換えることなどにより、一組のカメラの中の一 台のビデオカメラを自動的に向けることは望まれる。 本発明の他の特徴と利点は、以降の詳細な説明と付属図面を読むと、さら にはっきりと理解されるであろう。 図面の簡単な説明 図1は、本発明による、音源の方向を位置付ける典型的装置を示す機能構 成図である。 図2A〜2Bは、本発明の方法のステップを示す流れ図を示す。 図3は、暗騒音を算定する一つの方法の流れ図である。 図4は、音源からの音響信号を受信する一組のマイクロホーンに関する関 係角度の幾何学的構成を示す。 図5は、本発明によるビデオ方式会議の装置を示す。 図6は、本発明によるビデオ方式会議装置に使用されるマイクロホーンの 配置を示す。 図7は、ビデオ方式会議装置のビデオカメラを指向する方法のステップを 示す流れ図である。 好適な実施態様の説明 図1は、本発明による、音源の方向を位置付ける典型的装置1を示す機能 構成図である。例えば、装置1は、反響する環境で発言する人などの音源2の方 向を決定するために使用される。従って、本発明は、例えば、発言中の人の方向 にビデオカメラを向けることが望まれるビデオ方式会議の環境の用途に特に適し ている。しかし、本発明は、録音および放送中に指向する普通のカメラなどの他 の環境にも使用出来ることが理解されるされるであろう。 図1の多くの機能モジュールは、例えば、読み出し専用メモリー(ROM )、ランダムアクセスメモリー(RAM)およびまたは他の形のメモリーなどの 適切にプログラムされたプロセッサにより、実行される。図1のモジュールの機 能を行う他の適切なプロセッサには、ミニコンピュータ、マイクロコントローラ 、プログラマブル論理アレイおよびアプリケーション特定集積回路がある。この 種のプロセッサのプログラミングと使用は、本技術においては周知であり、従っ て、ここではさらに詳細に説明しない。 図1は、本発明の方法によるステップの流れ図である図2A〜2Bに関連 して最もよく理解することが出来る。ステップ100により示されているように 、音響データの流れは、距離Dだけ間隔をおいて離れた一組のマイクロホーン1 0,11などの二つ以上のトランスデューサにより捕らえられる。音響データの 流れは、音源2から直接に受信された音響信号、および騒音と反響信号から成っ ている。一組のマイクロホーンから受信された信号は、アナログ/ディジタル( A/D)変換器12,13を経て、例えば、16KHzで動作する各サンプリン グモジュール14,15へ送られる。サンプリングモジュール14,15は、マ イクロホーン10,11から受信された各データの流れを、ステップ101,1 02によりそれぞれ示されているように、N個のサンプルの数値で表されたサン プリ ングフレームへ変換する。N個のサンプルの数は、例えば、512である。N個 のサンプルのブロックは、一般には、N/2のサンプルだけ重なり合う。各乗算 器18,19は、ステップ103,104により示されているように、サンプリ ングモジュール14,15からの出力された信号に、モジュール16,17によ り生成されたウィンドウ関数を掛ける。ウィンドウ関数モジュール16,17は 、例えば、従来のハミングウィンドウを生成する。しかし、この好適な実施態様 では、ウィンドウ関数モジュール16,17は、次式のような指数のウィンドウ 関数を使用する。 他のウィンドウ関数も使用することが出来る。乗算器18,19の出力に現れる 信号は、次式の形を有する。 ここで、s1m(i)とs2m(i)は、それぞれ、フレームmの間のマイクロホー ン10,11から受信された信号を表す。 次に、図2Aのステップ105,106により示されているように、乗算 器18,19の出力における信号は、ファーストフーリエ変換(FFT)などの 全体的変換を行う各モジュール20,21により各フレームについて処理される 。フーリエ変換された信号f1m(k)、f2m(k)は、jが−1の平方根である 計算を表す。kの値は、例えば、125Hz〜7.5kHzの範囲であるが、他 のkの範囲もまた可能である。次式のフーリエ変換された信号は、その後の処理 のために、各FFTモジュール20,21に関連した各メモリー22,23に格 納される。 現在のフレームのフーリエ変換された信号は、さらに処理するため他のモジュー ルへも送られる。例えば、フーリエ変換された信号は、米国出願No.08/4 34,798に記載されたピッチ検出器などのピッチ検出器90へ送られる。こ の出願は、参考に本明細書に取り入れられている。 本発明の原理により、一定の暗騒音エネルギーが、マイクロホーンの一つ 、例えば、マイクロホーン10から受信された信号の各周波数成分について別々 に算定される。ステップ110により示されているように、暗騒音エネルギーは 、暗騒音算定器35により算定される。騒音算定器35は、先行のSフレームの フーリエ変換された信号を使用して、先行Sフレームの信号が騒音だけであり、 ほぼ一定レベルの騒音があるならば、暗騒音を算定する。フレームSの数が、適 切に、例えば、100であってもよい。 図3は、暗騒音を算定する一つの方法のステップを示す流れ図である。図 3のステップ200により示されているように、適切な周波数スペクトルが、好 適に重なり合っていない周波数帯Lへ分割される。例えば、1KHzの帯域幅を それぞれ有する8個の周波数帯が、適切に使用される。次に、ステップ202に より示されているように、周波数帯毎のエネルギー算定器30は、現在のフレー ムのフーリエ成分から、各周波数帯について広帯域のエネルギー信号を発生する 。従って、例えば、各1KHz帯について32個の係数を仮定すると、各帯の平 均エネルギーは次式により計算される。 ここで、bm(r)は、周波数帯rとフレーム番号mの広帯域エネルギーである 。 次に、ステップ204により示されているように、各周波数帯の平均広 帯域エネルギー信号は、先行のMフレームの広帯域エネルギーから生成される。 従って、個々の周波数帯rの平均エネルギーは、次式により好適に計算される。 ここで、Mは、例えば、4に設定され、m’は現在のフレームの番号である。次 に、決定が、各周波数帯のエネルギーが先行のフレームに対し比較的一定のまま であったか、どうかに関して行われる。具体的には、決定は、206により示さ れているように、現在のフレームのすべての周波数帯が、その周波数帯の平均エ ネルギーより少なくとも所定量だけ大きいか、どうかに関して行われる。決定は また、すべての周波数帯が、その周波数帯の平均エネルギーより少なくとも所定 量だけ小さいか、どうかに関しても行われる。言い換えると、帯域毎エネルギー 算定器30は、次式のいずれであるかを決定する。 ここで、Tbは5に設定されている。Tbの高低値は、個々のアプリケーションに 従って使用される。式[6]のいずれかの決定が、一つ以上の周波数帯について 肯定的であるならば、エネルギー算定器30は、エネルギーがステップ208に より示された時間において変化していることを示す出力信号を発生する。暗騒音 算定器35のカウンタ36は、広域帯エネルギーレベルがほぼ一定になっている 連続フレームの番号を追跡して、ゼロへリセットされる。そうでなければ、ステ ップ210により示されているように、出力信号が送られて、現在のフレームの 広域帯エネルギーレベルが先行フレームに対しほぼ一定であることを示し、カウ ンタ36は一つだけ増分される。 時間に亘ったエネルギーの一定性の他の測定が、ステップ204,206 の代わりに使用することが出来る。例えば、一つの他の測定は次式のいずれかを 決定することである。 ここで、Mは同様に、例えば、4である。 いずれにしても、暗騒音算定器35は、広域帯エネルギーレベルが、21 2により示されているように、先行のS個のフレームに対し既にほぼ一定である か、どうかを決定する。これは、カウンタ36が少なくともSに等しいか、どう かを点検することにより、達成される。先行S個のフレームの広域帯エネルギー レベルが、ほぼ一定でなければ、ステップ213により示されているように、装 置1は次のフレームの処理を続ける。しかし、決定212が肯定的であるならば 、暗騒音算定器35は、ステップ214により示されているように、次式に従っ て暗騒音を好適に計算する。 ここで、f1(m-i) *は、f1(m-i)の複合結合であり、Sは、例えば、100に等 しい。このために、先行フレームのフーリエ変換された信号の周波数成分は、メ モリー22から暗騒音算定器35へ送られる。暗騒音算定器35により発生され た、暗騒音を表す出力信号は、以降に詳細に説明されているように、現在フレー ムの周波数成分が、音源2の方向及びまたは位置の計算に有用なデータであると 見なされることを決定するために使用される。 エネルギー算定器30により発生された信号は、暗騒音相互関係算定器 40へも送られる。先行S個のフレームの広域帯エネルギーレベルが既にほぼ一 定であることが決定されるならば、先行S個のフレームの信号の相互関係信号が 、ステップ115により示されているように、騒音算定器40により発生される 。暗騒音相互関係は、次式により好適に計算される。 ここで、f2(m-i) *はf2(m-i)の複合結合であり、N(K)は個々の周波数Kに おける騒音の相互関係を表す。このために、先行S個のフレームのフーリエ変換 された信号の周波数成分は、各メモリー22,23から暗騒音相互関係算定器4 0へ送られる。暗騒音相互関係算定器40により発生された、騒音の相互関係を 表す出力信号は、以降に詳細に説明されるように、装置1が音源2から発生した と決定する、受信された音響信号の相互関係の識別を支援するために使用される 。 本発明のこの好適な実施態様において、マイクロホーン10,11におい て捕らえられた音響データの周波数成分は、以降に詳細に説明されるように、二 つの条件が現在のフレームの個々の周波数成分について満足されるならば、音源 2の方向を決定するのに有用であると考えられる。第一に、図2Aの120によ り示されているように、比較器25は、マイクロホーン10から受信された信号 に関し、現在のフレームのどの周波数成分が、たとえ有するにしても、対応する 周波数成分の暗騒音b(k)の大きさより少なくとも所定量だけ大きい大きさを 有するかを決定する。第二に、121により示されているように、比較器24は 、現在のフレームのどの周波数成分が、有するにしても、先行のS個のフレーム の対応する周波数成分の大きさより少なくとも所定量だけ大きい大きさを有する かを決定する。ここで、例えば、pは4に設定することが出来る。数学的に、第 一条件は次式のように表される。 ここで、例えば、TNは4に設定される。第二条件は次式のように表される。 ここで、例えば、Toは4に設定される。TNとTOの高低値は、個々のアプリ ケーションに従って使用される。同様に、4以外の事前に指定されたpの値も、 使用することが出来る。第一条件は、音源2からの信号が存在していることを示 すのに役に立ち、第二条件は、音源2から受信された一連の音響信号の始まりま たは初期を示すのに役に立つ。周波数成分が、式[10]と[11]により示さ れた両方の条件を満足しなければ、装置は、ステップ122により示されている ように、音響データの次のフレームの処理を続ける。 式[10]と[11]により示された前述の条件の両方が、特定の周波数 kについて満足されるならば、二つの入力のANDゲート26は、両方の条件が 現在のフレームの周波数kについて満足されることを示す信号を発生する。次に 、ANDゲート26により発生した信号は、始まりの信号の相互関係算定器45 へ送られる。ANDゲート26からの信号に応答して、相互関係算定器45は、 ステップ130により示されているように、計算して、次式により特定周波数k の相互関係信号を発生する。 このために、相互関係算定器45は、各周波数成分信号をFFTモジュー ル20,21から受信する。次に、ステップ135により示されているように、 減算器50は、ステップ115において発生した暗騒音相互関係N(K)を、ス テップ130において発生した相互関係cm(K)から差し引く。この様にして 、フレームmの周波数kの出力信号am(K)は、次式に従って減算器50によ り発生される。 ステップ135から得られた出力信号は、音源2から受信された音響信号の流れ の初期または始まりに対応する受信された音響信号を表す。 減算器50により発生した信号は、複数の蓄積器60,・・・,61の対 応する蓄積器へ転送される。蓄積器のそれぞれは、4〜240の周波数kの一つ に対応する。ステップ140により示されているように、各蓄積器60,・・・ ,61は、減算器50から得られ、かつ、その特定の周波数に対応する結果を、 特定の時間期間について蓄積器60,・・・,61に格納された前の結果に加え る。従って、次式により表される。 ここで、am,old(k)は、周波数kの相互関係蓄積器に格納された前の値を表 し、am,new(k)は、周波数kの相互関係蓄積器に格納された新しい値を表す 。 例えば、2秒の特定の時間期間の終わりにおいて、145により示されて いるように、決定が、相互関係蓄積器60,・・・,61の所定数より多い蓄積 器は、非ゼロのエントリを有する。少なくとも指定された数の蓄積器60,・・ ・,61が、非ゼロのエントリを有していないならば、従って、更新されていな いならば、蓄積器60,・・・,61の値は、ステップ147により示されてい るように、ゼロへリセットされる。他方、ステップ150により示されているよ うに、決定145が肯定的であるならば、マイクロホーン10,11の音響信号 の到着時間の間の時間遅れt(n)を表す信号が発生される。この時間遅れは、 蓄積された相互関係信号から時間遅れ計算モジュール70により発生される。 この好適な実施態様において、モジュール70もまた、帯域毎のエネルギ ー算定器30から信号を受信して、現在のフレームが音源2からの信号の流れを 有することを確認する。本実施態様により、帯域毎のエネルギー算定器30から 受信された信号がまた、現在のフレームが音源2からの信号の流れを示すことを 単に示すならば、モジュール70は、時間遅れ信号t(n)を発生する。 時間遅れt(n)を発生するために、モジュール70は、蓄積器60,・ ・・,61に現在格納された相互関係値の大きさを好適に基準化する。従って、 エントリが非ゼロである、すなわち、言い換えると、更新されていない各周波数 蓄積器60,・・・,61について、大きさはゼロに設定される。数学的に表す と、 次に、蓄積された相互関係値の基準化された値に基づいて、モジュール70は、 フレームmの間に一組のマイクロホーン10,11に到着する音響信号の時間遅 れを表す信号を発生する。 一つの実施態様において、モジュール70は計算して、次式により逆のフ ーリエ変換を表す信号を発生する。 これは、フレームmの間に一組のマイクロホーン10,11に到着する音響信号 の時間遅れの値に相当する値を発生する。従って、例えば、t(n)の最大値は 遅れとして選択される。あるいは、補間法が、Iが相互関係の時間分解が増加さ れる整数であることにより、サンプルの端数の遅れを測定するために使用される 。従って、例えば、t(n’)の最大値は、遅れとして選択される。 さらに他の実施態様において、ゼロ値のサンプルが、逆変換の流れの実際のサン プル値の間に挿入される。次に、発生した流れは、時間遅れの値を得るために低 域フィルターにより濾過される。 他の実施態様において、一組のマイクロホーン10,11に到着する信号 の間の時間遅れは、米国特許No.5,058,419に述べられているヒスト グラム法などによりモジュール70により算定される。この特許はここに参考に 取り入れられている。従って、例えば、二つのマイクロホーン10,11に到着 する信号の間の位相差は、蓄積器60,・・・61に格納された相互関係値によ る上述のように、多数の周波数について測定される。各測定された位相差は、潜 在的時間遅れを内在している。最大発生数を有する時間遅れの範囲内にある潜在 的時間遅れの平均は、実際の時間遅れとして選択される。 音源2から到着する音響信号の反射経路が、直接経路より強くなりそうな 状況では、上述のヒストグラム法が、優先権をゼロの時間遅れに近い値を有する 大きい活性のあるピークへ優先権を与えることにより、修正される。ゼロの時間 遅れにより近いピークは、直接経路に一致しそうである。従って、例えば、時間 遅れの各範囲は、多数の発生を有し、かつ比較的にゼロにも近い範囲から発生す る平均時間遅れを選んで、実際の時間遅れの選択を偏倚するようにウエートを割 り付けられる。一般に、相対ウエートは、望まれる時間遅れの選択を偏倚するよ うに既知の情報を考慮しているすべての方法で割り当てられるが、小さい大きさ を有する時間遅れの範囲は、より大きい大きさを有する時間遅れの範囲より、よ り高い相対ウエートを割り当てられる。 時間遅れ信号tが発生すると、マイクロホーン10,11に対する音源 2の関係角度は、次式に従って方向または位置の位置づけ器80により決定され る。ここで、vは音の速度、tは時間遅れ、Dはマイクロホーン10,11の間の距 離である。音源2の方向を算定するこの方法は、音響信号が平坦波または平面波 の形でマイクロホーン10,11へ到達する考えられる場合の離れた領域近似法 に基づいている。図4は、音源Cから音響信号を受信する二つのマイクロホーン AとBに対する関係角度Θの幾何学的構成を示しており、この場合、マイクロホ ーンAとBは、距離Dだけ離れている。平面波の想定が個々のアプリケーション に適切でなければ、他の方法が、マイクロホーン10,11に対する音源2の方 向または位置を決定するために使用することが出来る。例えば、この様な方法に は、別のマイクロホーンを装置1に取り入れ、上述の方法に従って追加された組 のマイクロホーンにおける到着時間の差に相当する遅れを発生する方法がある。 次に、既知の方法に従って、多数の時間遅れが、音源2の方向または位置を決定 するために使用することが出来る。 本発明の一つの好適な実施態様は、図5に示された装置300などのビデ オ方式会議の環境に置かれている。ビデオ方式会議装置300は、相互に離れて 配置されている、AとBで表示された二つのステーションを有する。ステーショ ンAの参加者320と321は、ステーションBの参加者350と351と、音 声とビデオで通信している。各処理器または制御器301,302が、各ステー ションAとBに配置されて、音声とビデオのデータの処理と送信を送信装置31 0により制御する。送信装置310は、例えば、音声とビデオの信号を送信する ISDNまたはTl回線から構成している。 この通信を行うため、音響装置が、各ステーションにおいて音を検出する ために配置され、これらの音を表す音響信号を送信装置310によりステーショ ンの間に送信し、各ステーションで検出された音をその他のステーションにおい て再生する。音響装置は、ステーションAおいてマイクロホーン322とステレ オロードスピーカ331,332、ステーションBにおいてマイクロホーン35 2とロードスピーカ341,342から成っている。 ビデオ方式会議装置300には、ステーションAとBの参加者の間の双方 向ビデオ通信もある。しかし、表示を容易にするため、図5は、ステーションA からステーションBへのビデオ通信だけを示している。ステーションAからステ ーションBへのビデオ通信を行うため、ステーションAはさらに、以降に詳細に 説明するように、制御器301により制御されたビデオカメラ360を備えてい る。ビデオカメラ360は、カメラレンズ363を収容しているヘッド部分36 2を有し、ステーションBへ送るステーションAにおける画像を表す信号を発生 する。少なくとも二つのマイクロホーンを有するマイクロホーンの配列は、ビデ オカメラと関連づけられ、捕らえた音響データを制御器301へ送信する。制御 器301は、図1の点線内に示された装置1の、マイクロホーンの配列から受信 された音響データを処理する構成要素を好適に有する。ステーションBは、ステ ーションAから受信されたビデオ信号を表示するビデオディスプレイ361を有 する。 マイクロホーンの配列365の一つの配置が図6に示されており、これは 四つのマイクロホーン601,602,603,604から成っている。特に、 マイクロホーン配列365は、例えば、マイクロホーン601,602の間の距 離d1、マイクロホーン602,603の間の距離d2で、x方向へ一列に配置さ れたマイクロホーン601,602,603から好適に構成している。第四のマ イクロホーンは、y方向にマイクロホーン602からd3の距離に好適に配置さ れている。従って、マイクロホーン602が(x’,y’,z’)に位置付けら れているとすると、マイクロホーン601は(x’−d1,y’,z’)に位置 付けられ、マイクロホーン603は(x’+d2,y’,z’)に位置付けられ 、マイクロホーン604は(x’,y’+d3,z’)に位置付けられている。 制御器301は、既知の値d1,d2,d3、および、例えば、マイクロホーン6 02などのマイクロホーンの一つの位置に対するビデオカメラ360の位置(x ”,y”,z”)とにより事前にプログラムされている。 図5,6のビデオ方式会議装置の動作は、次の通りである。ステーショ ンAの参加者の一人が話し始めると、その参加者のスピーチにより発生した音響 信号が、マイクロホーン322により捕らえられ、制御器301へ送られ、そこ で、既知の形で処理され、送信装置310によりステーションBへ送られる。ス テーションBにおいて、受信された音響信号は、スピーカーで341,342再 生される。 発言している参加者により発生した音響信号は、マイクロホーン配列36 5のマイクロホーン601〜604によっても捕らえられる。捕捉された信号は 、制御器301へ送られ、そこで、数組のマイクロホーン601〜604からの 信号は、図1〜4に関する上述の方法により、好適に処理される。数組のマイク ロホーン601〜604の音響信号の到着時間の遅れに対応する関係角度を決定 することにより、発言中の参加者の方向が決定される。次に、この情報は、カメ ラ360の方向を自動的に指向し、調節するために使用される。 例えば、マイクロホーン601,603において捕らえられた音響データ は、x軸に対する関係角度を決定するために使用される。x軸に沿った関係角度 が決定されると、制御器301は、その関係角度とマイクロホーン601〜60 4に対するカメラの既知の位置により、カメラヘッド362を発言中の参加者の 方向へ自動的に水平回転する。同様に、マイクロホーン602,604において 捕らえられた音響データは、y軸に対する関係角度を決定するために使用される 。y軸に沿った関係角度が決定されると、制御器301は、その関係角度とマイ クロホーン601〜604に対するカメラの既知の関係位置により、カメラヘッ ド362を発言中の参加者の方向へ自動的に傾ける。カメラ360を計算された 関係角度に応じて正確に水平回転し、傾斜することにより、発言中の参加者は、 カメラにより自動的に映像として捕らえられる。 図6のマイクロホーンの配列構成は、以降に説明するように、z軸に沿っ た発言中の参加者の位置を決定するためにも使用される。次に、制御器301は 、例えば、発言中の参加者の頭または上休を画面にきっちりと捕らえるため、z 軸に沿った発言中の参加者の位置を使用して、カメラレンズを自動的にズームア ップする。 z軸に沿った発言中の参加者の位置の決定は、他の軸の一つ、例えば、x 軸に対する関係角度を決定することにより、行われる。重ねて言うと、この関係 角度は、図1〜4について説明した方法により、好適に決定される。例えば、一 組のマイクロホーン601,602において捕らえられたデータに対応する第一 関係角度、一組のマイクロホーン602,603において捕らえられたデータに 対応する関係角度が決定される。これらの関係角度が決定されると、制御器30 1はマイクロホーン601,602,603の既知の位置と共にこの情報を使用 して、第一関係角度によるマイクロホーン601,602の中点と、第二関係角 度によるマイクロホーン602,603の中点とから始まる線の交点を決定する 。この交点は、z軸に沿った発言中の参加者の位置を表す。次に、制御器301 は、発言中の参加者を画面にきっちりと捕らえるため、この情報を使用して、カ メラレンズ363をズームアップする。 他の構成では、マイクロホーンの配列365は、マイクロホーン601, 602,604などの三つのマイクロホーンだけで成っている。この実施例では 、マイクロホーン601,602において捕らえられた音響データは、x軸に対 する関係角度を決定するために使用される。同様に、マイクロホーン602,6 04において捕らえられた音響データは、y軸に対する関係角度を決定するため に使用される。次に、関係角度は、発言者を適切に画面にきっちりと捕らえるた め、カメラを水平回転し、傾け、ズームアップするように使用される。この実施 例は三つのマイクロホーンだけを使用しており、四つのマイクロホーンを使用し ている上述の実施例は対称的構成のマイクロホーンを形成している。 動作の好適なモードにおいて、ディスプレイ361に表示された画像は、 ビデオカメラ363が水平回転されているか、または、傾斜されている間、固定 される。このように表示された画像を固定する一つの利点は、そのことが、カメ ラが水平回転され、または傾斜されるとき、一般にステーションBのディスプレ イ361に現れるぼやけた画像を無くすことに役立つことである。 図7は、カメラが水平回転されるか、傾斜されるとき、表示された画像が 固定される動作モードのステップを示す。ビデオカメラ363が、ステップBへ 送られるビデオデータを捕らえると、ステップ701により示されているように 、捕らえられたビデオデータに相当する画像が、ディスプレイ361にほぼリア ルタイムで表示される。また、カメラ363が引き続いてビデオデータを捕らえ ると、ステップ703により示されているように、多くの時間フレームの間に音 響データの流れを捕らえる。好適に、ステップ705により示されているように 、上述の方法により、制御器301は、個々の時間フレームの間に捕らえられた 音響データが、参加者320,321の一人からの音響信号の流れの開始を表し ているか、どうかを決定する。次に、制御器301は、ステップ707により示 されているように、データがその流れの開始を表しているならば、信号の流れを 表す受信された音響信号を識別する。次に、ステップ709により示されている ように、制御器301は、受信された音響信号に基づいて、ビデオカメラ363 に対する参加者の方向を決定する。 参加者の方向を決定するステップ709に応答して、ステップ711によ り示されているように、ビデオカメラ363は、カメラ363を適切に水平回転 し、及びまたは傾斜することにより、参加者の方向へ自動的に向けられる。しか し、この実施態様により、ビデオカメラ363が水平回転しているか、または、 傾斜しているとき、例えば、ディスプレイ361に現れる画像を、カメラを水平 回転するか、または、傾斜する直前に発生するフレームに固定するために、信号 が制御器301へ送られる。ステップ713により示されているように、画像は 、ビデオカメラが動きを停止するまで、示されたフレームを好適に固定する。あ るいは、余分なハードウェアのコストを低減するため、アプリケーションの特定 のハードウェアが使用され、または、ビデオ圧縮デコーダがフレームを固定する 。カメラ363がもはや水平回転していないか、または傾斜していないならば、 ステップ715により示されているように、新しいビデオデータに対応する画像 が、再びディスプレイ361に表示される。 他の動作モードにおいて、第二カメラ364が、図5の装置300に配置 されている。制御器301は、マイクロホーン601〜604に対するカメラ3 64の関係位置も格納している。例えば、カメラ360は、適切な水平回転と傾 斜により個々の発言者を追跡するように使用されるが、カメラ364は、ステー ションAの参加者のグループを画面にきっちりと収めるように使用される。装置 300が、動作中のカメラ360をスイッチに回転するか、または、傾斜してい るとき、装置300はカメラ364へ切り換える。従って、ステーションBの参 加者350,351は、カメラ360が動いている間、カメラ364からの画像 を見る。カメラ300が動きを止めると、言い換えると、水平回転と傾斜の機能 が完了すると、装置300は動作中のカメラ360へ切り換えて戻る。さらに他 の動作モードにおいて、カメラ364は、水平回転と傾斜を適切に行うことによ り、個々の発言者を追跡するためにも使用される。カメラ360,364の一つ だけが与えられた時は何時でも動いているように、カメラ360,364が制御 される。次に、静止しているカメラのビデオ出力がステーションBのディスプレ イ361へ送られるように、装置300は、カメラ360,361の間を連続的 に切り換わる。一つ以上のカメラを使用しているこの様なモードは、フレームを 固定することなく、はっきりと、ぼけない変移を行うことが出来る。 本発明は特定の実施例に関して説明されているが、本発明の精神と範囲の 範囲内の変形と修正が熟慮されていることは理解されるであろう。

Claims (1)

  1. 【特許請求の範囲】 1.音源から到達する音響信号の流れを処理する方法において: 複数の時間フレームの間に音響データを捕らえ; 個々の時間フレームの間に捕らえられた音響データが、音響信号の流れの 始まりを表しているか、どうかを決定し; 前記データが流れの始まりを表しているとき、前記信号の流れを表す受信 された音響信号を識別し; 受信された音響信号に基づいて前記音源の方向を決定する;ステップを含 んでいることを特徴とする前記方法。 2.請求の範囲第1項に記載の方法において:個々の時間フレームにおい て捕らえられた信号が音響信号の流れの始まりを表しているか、どうかを決定す るステップが、個々の時間フレームの間に捕らえられた信号の複数の周波数成分 の大きさを検査するステップを含んでいることを特徴とする前記方法。 3.請求の範囲第2項に記載の方法において:検査するステップが、 個々の時間フレームの間に捕らえられた信号のその各周波数成分の大きさ が、その周波数の暗騒音エネルギーより少なくとも第一所定量だけ大きいか、ど うかを決定し; 複数の周波数に関し、その各周波数成分の大きさが、先行の時間フレーム の、事前に指定された数の間に捕らえられた信号の対応する周波数成分の大きさ より少なくとも第二所定量だけ大きいか、どうかを決定する;ステップを含んで いることを特徴とする前記方法。 4.請求の範囲第3項に記載の方法において:捕らえるステップが、音響 データの各流れを複数のマイクロホーンの位置において捕らえるステップを含ん でおり、識別するステップが; 個々の時間フレームの間に複数のマイクロホーンの位置において捕らえら れた信号の間の相互関係を表す信号を識別し; 対応する暗騒音を相互関係を表す信号のそれぞれから差し引く;ステップ を含んでいることを特徴とする前記方法。 5.請求の範囲第3項に記載の方法において:識別するステップが、複数 の周波数に関し、個々の時間フレームの間に捕らえられた信号の各周波数成分の 大きさが、その周波数に関して暗騒音エネルギーより、少なくとも第一所定数倍 大きいか、どうかを決定することを含んでいることを特徴とする前記方法。 6.請求の範囲第3項に記載の方法において:識別するステップが、複数 の周波数に関して、個々の時間フレームの間に捕らえられた信号の各周波数成分 の大きさが、事前に指定された数の先行する時間フレームの間に捕らえられた信 号の対応する周波数成分より、少なくとも第二所定数倍大きいか、どうかを決定 することを含んでいることを特徴とする前記方法。 7.請求の範囲第4項に記載の方法において:音源の方向を決定するステ ップが、捕らえられた音響信号から、複数のマイクロホーンの位置における一連 の音響信号の到着時間の差を示す時間遅れを差し引くステップを含んでいること を特徴とする前記方法。 8.請求の範囲第7項に記載の方法において:さらに、受信された音響信 号から、複数の値の範囲の一つの内にある、複数の各時間遅れを差し引き、各範 囲内にある潜在的時間遅れの数と各範囲に割り当てられた相対ウエートとに基づ いて実際の時間遅れを選択するステップを含んでいることを特徴とする前記法。 9.請求の範囲第8項に記載の方法において:比較的小さい値を有する潜 在的時間遅れの範囲が、大きい値を有する潜在的時間遅れより高い相対ウエート を割り当てられることを特徴とする前記方法。 10.音源から到達する一連の音響信号を処理する、ビデオ方式会議に使 用する方法において: 複数の時間フレームの間に音響データを捕らえ; 個々の時間フレームの間に捕られた音響データが音響信号の流れの初期を 表すか、どうかを決定し; 前記データがその流れの初期を表す時、前記一連の信号を表す受信された 音響信号を識別し; 受信された音響信号に基づいて、前記音源の方向を決定し; 前記音源の方向を決定するステップに関連してビデオカメラを自動的に合 わせる;ステップを含んでいることを特徴とする前記方法。 11.請求の範囲第10項に記載の方法において:個々の時間フレームの 間に捕らえられた音響データが、一連の音響信号の初期を表すか、どうかを決定 するステップが: 複数の周波数に関し、個々の時間フレームの間に捕らえられた信号の各周 波数成分の大きさが、その周波数の暗騒音エネルギーより少なくとも第一所定量 だけ大きいか、どうかを決定し; 複数の周波数に関し、各周波数成分の大きさが、事前に指定された数の先 行時間フレームの間に捕らえられた対応する信号の周波数成分の大きさより、少 なくとも第二所定量だけ大きいか、どうかを決定する;ステップを含んでいるこ とを特徴とする前記方法。 12.請求の範囲第11項に記載の方法において:方向合わせのステップ が前記音源の方向へカメラを水平回転するステップを含んでいることを特徴とす る前記方法。 13.請求の範囲第11項に記載の方法において:方向合わせのステップ が前記音源の方向へカメラを傾斜するステップを含んでいることを特徴とする前 記方法。 14.請求の範囲第11項に記載の方法において:さらに、受信された音 響信号に基づいて音源の位置を決定するステップを含んでいることを特徴とする 前記方法。 15.請求の範囲第14項に記載の方法において:さらに、音源の位置を 決定するステップに応答して音源を画面に収めるように、カメラのレンズを自動 的にズームアップするステップを含んでいることを特徴とする前記方法。 16.音源から到達する一連の音響信号を処理する装置において: 複数の時間フレームの間に音響データの流れを捕らえる複数のトランスデ ューサと; 個々の時間フレームの間に捕らえられた音響データが、一連の音響信号の 初期を表すか、どうかを決定する手段と; 前記データが流れの初期を表す時、前記一連の信号を表す受信された音響 信号を識別する手段と; 受信された音響信号に基づいて前記音源の方向を決定する手段と;を含ん でいることを特徴とする前記装置。 17.請求の範囲第16項に記載の装置において:捕らえられた音響デー タが一連の音響信号の初期を表すか、どうかを決定する手段が: 暗騒音算定器と; 複数の周波数に関し、個々の時間フレームの間に捕らえられた各信号の周 波数成分の大きさが、その周波数の暗騒音エネルギーより少なくとも第一所定量 だけ大きいか、どうかを決定する第一手段と; 複数の周波数に関し、各周波数成分の大きさが、事前に指定された数の先 行時間フレームの間に捕らえられた信号の対応する周波数成分の大きさより、少 なくとも第二所定量だけ大きいか、どうかを決定する第二手段と;を含んでいる ことを特徴とする前記装置。 18.請求の範囲第17項に記載の装置において:識別する手段が、複数 の周波数に関し、個々の時間フレームの間に捕らえられた信号の各周波数成分の 大きさが、その周波数の暗騒音エネルギーより少なくとも第一所定数の時間にお いて大きいことを特徴とする前記装置。 19.請求の範囲第17項に記載の装置において:識別する手段が、複数 の周波数に関し、個々の時間フレームの間に捕らえられた信号の各周波数成分の 大きさが、事前に指定された数の先行時間フレームの間に捕らえられた信号の対 応する周波数成分の大きさより、少なくとも第二所定数の時間において大きいこ とを特徴とする前記装置。 20.請求の範囲第17項に記載の装置において:識別する手段が、 個々の時間フレームの間に複数のトランスデューサに捕らえられた信号の 間の相互関係を表す信号を識別する手段と; 相互関係を表す信号のそれぞれから対応する暗騒音を差し引く減算器と; を含んでいることを特徴とする前記装置。 21.請求の範囲第20項に記載の装置において:音源の方向を決定する 手段が、捕らえられた音響信号から、複数のマイクロホーンの位置における一連 の音響信号の到着時間の差を表す時間遅れを差し引く手段を含んでいることを特 徴とする前記装置。 22.請求の範囲第21項に記載の方法において:さらに、受信された音 響信号から、それぞれが値の複数の範囲の一つにある複数の潜在的時間遅れを差 し引く手段と、各範囲内にある潜在的時間遅れの数と各範囲に割り当てられた相 対ウエートとに基づいて、実際の時間遅れを選択する手段とを含んでいることを 特徴とする前記装置。 23.請求の範囲第23項に記載の装置において:比較的に小さい値を有 する潜在的時間遅れの範囲が、大きい値を有する潜在的時間遅れの範囲より高い 相対ウエートを割り当てられていることを特徴とする前記装置。 24.音源から到達する一連の音響信号を処理する、ビデオ方式会議に使 用する装置において: ビデオカメラと; 複数の時間フレームの間に音響データの流れを捕らえる複数のトランスデ ューサと; 個々の時間フレームの間に捕らえられた音響データが、一連の音響信号の 初期を表すか、どうかを決定する手段と; 前記データがその流れの初期を表す時、前記一連の信号を表す受信された 音響信号を識別する手段と; 受信された音響信号に基づいて前記音源の方向を決定する手段と;を含ん でおり、 ビデオカメラが、前記音源の方向を決定する手段から受信された信号に応 答して音源の方向へ自動的に合わされることを特徴とする前記装置。 25.請求の範囲第24項に記載の装置において:捕らえられた音響デー タが一連の音響信号の初期を表すか、どうかを決定する手段が、 暗騒音エネルギー算定器と; 複数の周波数に関し、個々の時間フレームの間に捕らえられた信号の各周 波数成分の大きさが、その周波数の暗騒音エネルギーより少なくとも第一所定量 だけ大きいか、どうかを決定する第一手段と; 複数の周波数に関し、各その周波数成分の大きさが、事前に指定された数 の先行時間フレームの間に捕らえられた信号の対応する周波数成分より、少なく とも第二所定量だけ大きいか、どうかを決定する第二手段と;を含んでいること を特徴とする前記装置。 26.請求の範囲第25項に記載の装置において:カメラが、前記音源の 方向を決定する手段から受信された信号に応答して音源の方向へ自動的に水平回 転されることを特徴とする前記装置。 27.請求の範囲第25項に記載の装置において:カメラが、前記音源の 方向を決定する手段から受信された信号に応答して音源の方向へ自動的に傾斜さ れることを特徴とする前記装置。 28.音源から到達する一連の音響信号を処理する、ビデオ方式会議に使 用される装置において; ビデオカメラと; 複数の時間フレームの間に音響データの流れを捕らえる少なくとも第一と 第二、および第三のトランスデューサと; 個々の時間フレームの間に捕らえられた一連の音響信号の初期を表すか、 どうかを決定する手段と; 前記データがその流れの初期を表す時、前記一連の信号を表す受信された 音響信号を識別する手段と; 受信された音響信号に基づいて二次元の前記音源の方向を決定する手段と ;を含み、 ビデオカメラが、前記音源の方向を決定する手段から受信された信号に応 答して前記音源の方向へ自動的に向けられることを特徴とする前記装置。 29.請求の範囲第28項に記載の装置において:捕らえられた音響デー タが一連の音響信号の初期を表すか、どうかを決定する手段が、 暗騒音エネルギー算定器と; 複数の周波数に関して、個々の時間フレームの間に捕らえられた信号の各 周波数成分の大きさが、その周波数の暗騒音エネルギーより少なくとも第一所定 量だけ大きいか、どうかを決定する第一手段と; 複数の周波数に関して、各周波数成分の大きさが、事前に指定された数の 先行時間フレームの間に捕らえられた信号の対応する周波数成分より、少なくと も第二所定量だけ大きいか、どうかを決定する第二手段と;を含んでいることを 特徴とする前記装置。 30.請求の範囲第28項に記載の装置において: 第一トランスデューサが第一軸に沿って第二トランスデューサから変移さ れ、第三トランスデューサが第一軸に直角な第二軸に沿って第二トランスデュー サから変移されており; 第一と第二トランスデューサにより捕らえられた音響データが、第一軸に 対する音源の方向を決定するために使用され、第二と第三のトランスデューサに より捕らえられた音響データが、第二軸に対する音源の方向を決定するために使 用され;および ビデオカメラが、前記音源の方向を決定する手段から受信された信号に応 答して音源の方向へ自動的に水平回転され、傾斜されることを特徴とする前記装 置。 31.請求の範囲第28項に記載の装置において:さらに、複数の時間フ レームの間に音響データの流れを捕らえる第四トランスデューサを含み; 第二トランスデューサが第一と第三トランスデューサの間に配置されて、 第一、第二及び第三トランスデューサが、第一軸に沿って配置され、第四トラン スデューサが、第一軸に直角な第二軸に沿って第二トランスデューサから変移さ れており; 第一と第三トランスデューサにより捕らえられた音響データが、第一軸に 対する音源の方向を決定するために使用され、第二と第四トランスデューサによ り捕らえられた音響データが、第二軸に対する音源の方向を決定するために使用 され; ビデオカメラが、前記音源の方向を決定する手段から受信された信号に応 答して音源の方向へ自動的に水平回転され、傾斜される;ことを特徴とする前記 装置。 32.請求の範囲第31項に記載の装置において:さらに、 音源の位置を決定する手段を含み、四つのトランスデューサの三つにより 捕らえられたデータが、音源の位置を決定するために使用され; カメラが、音源の位置を決定する手段から受信された信号に応答して音源 を画面に収めるように、自動的にズームアップされること;を特徴とする前記装 置。 33.音源から到達する一連の音響信号を処理する、ビデオ方式会議に使 用される方法において: 音響データの流れを第一、第二および第三トランスデューサにおいて複数 の時間フレームの間に捕らえ; 個々の時間フレームの間に捕らえられた音響データが、一連の下記の初期 を表すか、どうかを決定し; 前記データがその流れの初期を表す時、前記一連の信号を表す受信された 音響信号を識別し; 受信された音響信号に基づいて二次元において前記音源の方向を決定し; 前記音源の方向を決定するステップに応答して、ビデオカメラを音源の方 向へ自動的に向ける;ステップを含んでいることを特徴とする前記装置。 34.請求の範囲第33項に記載の方法において:さらに、 音響データの流れを第四トランスデューサにおいて複数の時間フレームの 間に捕らえ; 音源の位置を第三次元において決定し、四つのトランスデューサの三つに より捕らえられた音響データが、音源の位置を決定するために使用され; 音源の位置を決定するステップに応答して、音源を画面に収めるように、 ビデオカメラを自動的にズームアップする;ステップを含んでいることを特徴と する前記方法。 35.ビデオ方式会議に使用されるビデオカメラを操作する方法において: ビデオカメラにより捕らえられたビデオデータに対応する画像を表示し; 複数の時間フレームの間、音源からの一連の音響信号から成る音響データ の流れを捕らえ; 捕らえられた音響データの流れに基づいて前記音源の方向を決定し; 決定するステップに応答して、ビデオカメラを傾斜または水平回転するこ とによりカメラを自動的に向け; ビデオカメラが傾斜または水平回転している間、ディスプレイに表示され た画像を固定する;ステップを含んでいることを特徴とする前記方法。 36.請求の範囲第35項に記載の方法において:固定するステップが、 ディスプレイに現れる画像を、ビデオカメラを水平回転または傾斜する直前に発 生するビデオフレームに固定するステップを含んでいることを特徴とする前記方 法。 37.ビデオ方式会議に使用される、少なくとも第一および第二ビデオカ メラを含んでいる装置を操作する方法において: 第一ビデオカメラにより捕らえられたビデオデータに対応する画像をディ スプレイに表し; 複数の時間フレームの間、音源からの一連の音響信号から成る音響データ の流れを捕らえ; 個々の時間フレームの間に捕らえられた音響データが、一連の音響信号の 初期を表すか、どうかを決定し; 前記データがその一連の信号の初期を表す時、前記一連の信号を表す、受 信された音響信号を識別し; 方向決定に応答してビデオカメラを傾斜および水平回転することにより、 第一ビデオカメラを自動的に向け; 第一ビデオカメラが傾斜または水平回転している間、第二ビデオカメラに より捕らえられたビデオデータに対応する画像をディスプレイに表示する;こと を含んでいることを特徴とする前記方法。
JP50158998A 1996-06-14 1997-05-08 音源位置づけ方法と装置 Expired - Fee Related JP3672320B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/663,670 1996-06-14
US08/663,670 US5778082A (en) 1996-06-14 1996-06-14 Method and apparatus for localization of an acoustic source
PCT/US1997/007850 WO1997048252A1 (en) 1996-06-14 1997-05-08 Method and apparatus for localization of an acoustic source

Publications (3)

Publication Number Publication Date
JP2000512108A true JP2000512108A (ja) 2000-09-12
JP2000512108A5 JP2000512108A5 (ja) 2005-02-10
JP3672320B2 JP3672320B2 (ja) 2005-07-20

Family

ID=24662821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50158998A Expired - Fee Related JP3672320B2 (ja) 1996-06-14 1997-05-08 音源位置づけ方法と装置

Country Status (6)

Country Link
US (1) US5778082A (ja)
EP (1) EP0903055B1 (ja)
JP (1) JP3672320B2 (ja)
CA (1) CA2257444C (ja)
DE (1) DE69738195T2 (ja)
WO (1) WO1997048252A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003514412A (ja) * 1999-11-05 2003-04-15 ウェーブメーカーズ・インコーポレーテッド 音源が一対のマイクロフォンから近いか遠いかを判断する方法
JP2005323381A (ja) * 2004-05-07 2005-11-17 Fuji Xerox Co Ltd マイクロホンの位置確認のためのシステム、方法、及びプログラム
JP2006515490A (ja) * 2003-02-12 2006-05-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 再生位置を決定するための装置及び方法
US7586513B2 (en) 2003-05-08 2009-09-08 Tandberg Telecom As Arrangement and method for audio source tracking
JP2013068434A (ja) * 2011-09-20 2013-04-18 Toyota Motor Corp 音源検出装置

Families Citing this family (145)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5959667A (en) * 1996-05-09 1999-09-28 Vtel Corporation Voice activated camera preset selection system and method of operation
JP3541339B2 (ja) * 1997-06-26 2004-07-07 富士通株式会社 マイクロホンアレイ装置
US5900907A (en) * 1997-10-17 1999-05-04 Polycom, Inc. Integrated videoconferencing unit
JP3157769B2 (ja) * 1998-03-02 2001-04-16 静岡日本電気株式会社 Tv音声制御装置
US6593956B1 (en) * 1998-05-15 2003-07-15 Polycom, Inc. Locating an audio source
IT1306261B1 (it) * 1998-07-03 2001-06-04 Antonio Messina Procedimento ed apparato per la guida automatica di videocameremediante microfoni.
GB2342802B (en) * 1998-10-14 2003-04-16 Picturetel Corp Method and apparatus for indexing conference content
US6618073B1 (en) * 1998-11-06 2003-09-09 Vtel Corporation Apparatus and method for avoiding invalid camera positioning in a video conference
US6469732B1 (en) 1998-11-06 2002-10-22 Vtel Corporation Acoustic source location using a microphone array
JP4467802B2 (ja) * 1998-11-11 2010-05-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 改善された信号定位装置
DE19854373B4 (de) * 1998-11-25 2005-02-24 Robert Bosch Gmbh Verfahren zur Steuerung der Empfindlichkeit eines Mikrofons
US6504926B1 (en) 1998-12-15 2003-01-07 Mediaring.Com Ltd. User control system for internet phone quality
US6408327B1 (en) * 1998-12-22 2002-06-18 Nortel Networks Limited Synthetic stereo conferencing over LAN/WAN
US6185152B1 (en) 1998-12-23 2001-02-06 Intel Corporation Spatial sound steering system
US6321194B1 (en) 1999-04-27 2001-11-20 Brooktrout Technology, Inc. Voice detection in audio signals
US6405163B1 (en) * 1999-09-27 2002-06-11 Creative Technology Ltd. Process for removing voice from stereo recordings
DE19963102A1 (de) * 1999-12-24 2001-06-28 Thomson Brandt Gmbh Bildfernsprechvorrichtung
EP1226578A4 (en) * 1999-12-31 2005-09-21 Octiv Inc TECHNIQUES TO IMPROVE THE CLARITY AND UNDERSTANDING OF AUDIO-REDUCED AUDIO SIGNALS IN A DIGITAL NETWORK
US20020031234A1 (en) * 2000-06-28 2002-03-14 Wenger Matthew P. Microphone system for in-car audio pickup
US20020075965A1 (en) * 2000-12-20 2002-06-20 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
US7039198B2 (en) * 2000-11-10 2006-05-02 Quindi Acoustic source localization system and method
US20030023429A1 (en) * 2000-12-20 2003-01-30 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
GB2375698A (en) * 2001-02-07 2002-11-20 Canon Kk Audio signal processing apparatus
US20020140804A1 (en) * 2001-03-30 2002-10-03 Koninklijke Philips Electronics N.V. Method and apparatus for audio/image speaker detection and locator
DE10119266A1 (de) * 2001-04-20 2002-10-31 Infineon Technologies Ag Programmgesteuerte Einheit
US7236929B2 (en) * 2001-05-09 2007-06-26 Plantronics, Inc. Echo suppression and speech detection techniques for telephony applications
JP3771812B2 (ja) * 2001-05-28 2006-04-26 インターナショナル・ビジネス・マシーンズ・コーポレーション ロボットおよびその制御方法
US6937266B2 (en) * 2001-06-14 2005-08-30 Microsoft Corporation Automated online broadcasting system and method using an omni-directional camera system for viewing meetings over a computer network
GB0120450D0 (en) * 2001-08-22 2001-10-17 Mitel Knowledge Corp Robust talker localization in reverberant environment
US6801632B2 (en) 2001-10-10 2004-10-05 Knowles Electronics, Llc Microphone assembly for vehicular installation
US20030072456A1 (en) * 2001-10-17 2003-04-17 David Graumann Acoustic source localization by phase signature
US6980485B2 (en) * 2001-10-25 2005-12-27 Polycom, Inc. Automatic camera tracking using beamforming
US6795794B2 (en) * 2002-03-01 2004-09-21 The Board Of Trustees Of The University Of Illinois Method for determination of spatial target probability using a model of multisensory processing by the brain
US20040114772A1 (en) * 2002-03-21 2004-06-17 David Zlotnick Method and system for transmitting and/or receiving audio signals with a desired direction
US6912178B2 (en) * 2002-04-15 2005-06-28 Polycom, Inc. System and method for computing a location of an acoustic source
US7146014B2 (en) * 2002-06-11 2006-12-05 Intel Corporation MEMS directional sensor system
US6940540B2 (en) * 2002-06-27 2005-09-06 Microsoft Corporation Speaker detection and tracking using audiovisual data
US7444068B2 (en) * 2002-06-28 2008-10-28 Hewlett-Packard Development Company, L.P. System and method of manual indexing of image data
JP3910898B2 (ja) * 2002-09-17 2007-04-25 株式会社東芝 指向性設定装置、指向性設定方法及び指向性設定プログラム
US7433462B2 (en) * 2002-10-31 2008-10-07 Plantronics, Inc Techniques for improving telephone audio quality
KR101014404B1 (ko) * 2002-11-15 2011-02-15 소니 주식회사 오디오신호의 처리방법 및 처리장치
US7606372B2 (en) * 2003-02-12 2009-10-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for determining a reproduction position
FI118247B (fi) * 2003-02-26 2007-08-31 Fraunhofer Ges Forschung Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa
US7035757B2 (en) * 2003-05-09 2006-04-25 Intel Corporation Three-dimensional position calibration of audio sensors and actuators on a distributed computing platform
KR100906136B1 (ko) * 2003-12-12 2009-07-07 닛본 덴끼 가부시끼가이샤 정보 처리용 로봇
GB0405455D0 (en) * 2004-03-11 2004-04-21 Mitel Networks Corp High precision beamsteerer based on fixed beamforming approach beampatterns
US7126816B2 (en) 2004-03-12 2006-10-24 Apple Computer, Inc. Camera latch
WO2005109951A1 (en) * 2004-05-05 2005-11-17 Deka Products Limited Partnership Angular discrimination of acoustical or radio signals
US20050286443A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Conferencing system
US20050285935A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Personal conferencing node
US7623156B2 (en) * 2004-07-16 2009-11-24 Polycom, Inc. Natural pan tilt zoom camera motion to preset camera positions
US7760887B2 (en) * 2004-10-15 2010-07-20 Lifesize Communications, Inc. Updating modeling information based on online data gathering
US7720236B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Updating modeling information based on offline calibration experiments
US8116500B2 (en) * 2004-10-15 2012-02-14 Lifesize Communications, Inc. Microphone orientation and size in a speakerphone
US7903137B2 (en) * 2004-10-15 2011-03-08 Lifesize Communications, Inc. Videoconferencing echo cancellers
US20060132595A1 (en) * 2004-10-15 2006-06-22 Kenoyer Michael L Speakerphone supporting video and audio features
US7826624B2 (en) * 2004-10-15 2010-11-02 Lifesize Communications, Inc. Speakerphone self calibration and beam forming
US7970151B2 (en) * 2004-10-15 2011-06-28 Lifesize Communications, Inc. Hybrid beamforming
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US7817805B1 (en) 2005-01-12 2010-10-19 Motion Computing, Inc. System and method for steering the directional response of a microphone to a moving acoustic source
US7995768B2 (en) * 2005-01-27 2011-08-09 Yamaha Corporation Sound reinforcement system
EP1705911A1 (en) * 2005-03-24 2006-09-27 Alcatel Video conference system
US7646876B2 (en) * 2005-03-30 2010-01-12 Polycom, Inc. System and method for stereo operation of microphones for video conferencing system
US7970150B2 (en) * 2005-04-29 2011-06-28 Lifesize Communications, Inc. Tracking talkers using virtual broadside scan and directed beams
US7593539B2 (en) * 2005-04-29 2009-09-22 Lifesize Communications, Inc. Microphone and speaker arrangement in speakerphone
US7991167B2 (en) * 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
JP2007019907A (ja) 2005-07-08 2007-01-25 Yamaha Corp 音声伝達システム、および通信会議装置
WO2007058130A1 (ja) * 2005-11-15 2007-05-24 Yamaha Corporation 遠隔会議装置及び放収音装置
US7864210B2 (en) * 2005-11-18 2011-01-04 International Business Machines Corporation System and methods for video conferencing
US8130977B2 (en) * 2005-12-27 2012-03-06 Polycom, Inc. Cluster of first-order microphones and method of operation for stereo input of videoconferencing system
US8072481B1 (en) * 2006-03-18 2011-12-06 Videotronic Systems Telepresence communication system
JP4816221B2 (ja) * 2006-04-21 2011-11-16 ヤマハ株式会社 収音装置および音声会議装置
US8024189B2 (en) 2006-06-22 2011-09-20 Microsoft Corporation Identification of people using multiple types of input
AU2007221976B2 (en) * 2006-10-19 2009-12-24 Polycom, Inc. Ultrasonic camera tracking system and associated methods
US20080101624A1 (en) * 2006-10-24 2008-05-01 Motorola, Inc. Speaker directionality for user interface enhancement
EP2090895B1 (en) * 2006-11-09 2011-01-05 Panasonic Corporation Sound source position detector
US8289363B2 (en) 2006-12-28 2012-10-16 Mark Buckler Video conferencing
NO328582B1 (no) * 2006-12-29 2010-03-22 Tandberg Telecom As Mikrofon for lydkildesporing
JP4403429B2 (ja) * 2007-03-08 2010-01-27 ソニー株式会社 信号処理装置、信号処理方法、プログラム
TWI327230B (en) * 2007-04-03 2010-07-11 Ind Tech Res Inst Sound source localization system and sound soure localization method
CN100505837C (zh) * 2007-05-10 2009-06-24 华为技术有限公司 一种控制图像采集装置进行目标定位的系统及方法
WO2008143561A1 (en) * 2007-05-22 2008-11-27 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for group sound telecommunication
US8767975B2 (en) * 2007-06-21 2014-07-01 Bose Corporation Sound discrimination method and apparatus
NO327899B1 (no) * 2007-07-13 2009-10-19 Tandberg Telecom As Fremgangsmate og system for automatisk kamerakontroll
US8611554B2 (en) * 2008-04-22 2013-12-17 Bose Corporation Hearing assistance apparatus
US20100008515A1 (en) * 2008-07-10 2010-01-14 David Robert Fulton Multiple acoustic threat assessment system
ATE556329T1 (de) * 2008-08-26 2012-05-15 Nuance Communications Inc Verfahren und vorrichtung zum lokalisieren einer schallquelle
CN101350931B (zh) * 2008-08-27 2011-09-14 华为终端有限公司 音频信号的生成、播放方法及装置、处理系统
US20100123785A1 (en) * 2008-11-17 2010-05-20 Apple Inc. Graphic Control for Directional Audio Input
TWI402531B (zh) * 2009-06-29 2013-07-21 Univ Nat Cheng Kung 音源辨位方法與應用此音源辨位方法之音源辨位系統和電腦程式產品
TWI417563B (zh) * 2009-11-20 2013-12-01 Univ Nat Cheng Kung 遠距離音源定位晶片裝置及其方法
TWI396862B (zh) * 2009-12-04 2013-05-21 Teco Elec & Machinery Co Ltd 聲源定位系統、方法及電腦可讀取儲存媒體
US8248448B2 (en) 2010-05-18 2012-08-21 Polycom, Inc. Automatic camera framing for videoconferencing
US9723260B2 (en) 2010-05-18 2017-08-01 Polycom, Inc. Voice tracking camera with speaker identification
US8842161B2 (en) 2010-05-18 2014-09-23 Polycom, Inc. Videoconferencing system having adjunct camera for auto-framing and tracking
US8395653B2 (en) 2010-05-18 2013-03-12 Polycom, Inc. Videoconferencing endpoint having multiple voice-tracking cameras
DE102010026381A1 (de) * 2010-07-07 2012-01-12 Siemens Medical Instruments Pte. Ltd. Verfahren zum Lokalisieren einer Audioquelle und mehrkanaliges Hörsystem
TW201208335A (en) * 2010-08-10 2012-02-16 Hon Hai Prec Ind Co Ltd Electronic device
AU2011312135A1 (en) * 2010-10-07 2013-05-30 Concertsonics, Llc Method and system for enhancing sound
US9078077B2 (en) 2010-10-21 2015-07-07 Bose Corporation Estimation of synthetic audio prototypes with frequency-based input signal decomposition
EP2448265A1 (en) 2010-10-26 2012-05-02 Google, Inc. Lip synchronization in a video conference
JP5516455B2 (ja) * 2011-02-23 2014-06-11 トヨタ自動車株式会社 接近車両検出装置及び接近車両検出方法
US9084036B2 (en) * 2011-05-17 2015-07-14 Alcatel Lucent Signal source localization using compressive measurements
US9030520B2 (en) 2011-06-20 2015-05-12 Polycom, Inc. Automatic camera selection for videoconferencing
US9210302B1 (en) 2011-08-10 2015-12-08 Google Inc. System, method and apparatus for multipoint video transmission
JP5772447B2 (ja) * 2011-09-27 2015-09-02 富士ゼロックス株式会社 音声解析装置
JP2013135325A (ja) * 2011-12-26 2013-07-08 Fuji Xerox Co Ltd 音声解析装置
JP5867066B2 (ja) * 2011-12-26 2016-02-24 富士ゼロックス株式会社 音声解析装置
JP6031761B2 (ja) * 2011-12-28 2016-11-24 富士ゼロックス株式会社 音声解析装置および音声解析システム
JP6031767B2 (ja) * 2012-01-23 2016-11-24 富士ゼロックス株式会社 音声解析装置、音声解析システムおよびプログラム
CN102547209B (zh) * 2012-02-06 2015-07-22 华为技术有限公司 视讯设备控制方法、装置及视讯系统
US8917309B1 (en) 2012-03-08 2014-12-23 Google, Inc. Key frame distribution in video conferencing
US9282405B2 (en) 2012-04-24 2016-03-08 Polycom, Inc. Automatic microphone muting of undesired noises by microphone arrays
US8791982B1 (en) 2012-06-27 2014-07-29 Google Inc. Video multicast engine
CN102819009B (zh) * 2012-08-10 2014-10-01 香港生产力促进局 用于汽车的驾驶者声源定位系统及方法
US20150260333A1 (en) * 2012-10-01 2015-09-17 Revolve Robotics, Inc. Robotic stand and systems and methods for controlling the stand during videoconference
US8957940B2 (en) 2013-03-11 2015-02-17 Cisco Technology, Inc. Utilizing a smart camera system for immersive telepresence
EP2974061A4 (en) * 2013-03-15 2016-11-23 Intel Corp DEVICE AND METHOD FOR DETECTING ANGULAR ORIENTATION OF DEVICE DEVICE USING ULTRASONIC SIGNAL AND WIRELESS SIGNAL
EP2882180A4 (en) * 2013-09-29 2015-10-14 Zte Corp CONTROL METHOD, CONTROL APPARATUS AND CONTROL DEVICE
US10009676B2 (en) 2014-11-03 2018-06-26 Storz Endoskop Produktions Gmbh Voice control system with multiple microphone arrays
US9654868B2 (en) 2014-12-05 2017-05-16 Stages Llc Multi-channel multi-domain source identification and tracking
US10609475B2 (en) 2014-12-05 2020-03-31 Stages Llc Active noise control and customized audio system
US9747367B2 (en) 2014-12-05 2017-08-29 Stages Llc Communication system for establishing and providing preferred audio
US9508335B2 (en) 2014-12-05 2016-11-29 Stages Pcs, Llc Active noise control and customized audio system
WO2016209098A1 (en) * 2015-06-26 2016-12-29 Intel Corporation Phase response mismatch correction for multiple microphones
US9609275B2 (en) 2015-07-08 2017-03-28 Google Inc. Single-stream transmission method for multi-user video conferencing
US11259501B2 (en) * 2015-09-29 2022-03-01 Swinetech, Inc. Warning system for animal farrowing operations
EP3440848B1 (en) 2016-04-07 2020-10-14 Sonova AG Hearing assistance system
US10382929B2 (en) * 2016-04-17 2019-08-13 Sonular Ltd. Communication management and communicating between a mobile communication device and another device
US10063987B2 (en) 2016-05-31 2018-08-28 Nureva Inc. Method, apparatus, and computer-readable media for focussing sound signals in a shared 3D space
US10945080B2 (en) 2016-11-18 2021-03-09 Stages Llc Audio analysis and processing system
US9980042B1 (en) 2016-11-18 2018-05-22 Stages Llc Beamformer direction of arrival and orientation analysis system
US9980075B1 (en) 2016-11-18 2018-05-22 Stages Llc Audio source spatialization relative to orientation sensor and output
WO2019133073A1 (en) * 2017-12-29 2019-07-04 Swinetech, Inc. Improving detection, prevention, and reaction in a warning system for animal farrowing operations
GB2572368A (en) 2018-03-27 2019-10-02 Nokia Technologies Oy Spatial audio capture
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
US11457308B2 (en) 2018-06-07 2022-09-27 Sonova Ag Microphone device to provide audio with spatial context
EP3711284A4 (en) * 2018-08-17 2020-12-16 SZ DJI Technology Co., Ltd. PHOTOGRAPHIC CONTROL PROCEDURE AND CONTROL
US10447970B1 (en) 2018-11-26 2019-10-15 Polycom, Inc. Stereoscopic audio to visual sound stage matching in a teleconference
US11019219B1 (en) * 2019-11-25 2021-05-25 Google Llc Detecting and flagging acoustic problems in video conferencing
WO2022056327A1 (en) 2020-09-11 2022-03-17 Fluke Corporation System and method for acoustic imaging with an accumulated-time view
US11714157B2 (en) * 2020-11-10 2023-08-01 Amazon Technologies, Inc. System to determine direction toward user
US11570558B2 (en) 2021-01-28 2023-01-31 Sonova Ag Stereo rendering systems and methods for a microphone assembly with dynamic tracking
TWI811685B (zh) * 2021-05-21 2023-08-11 瑞軒科技股份有限公司 會議室系統及音訊處理方法
US11681008B2 (en) 2021-07-19 2023-06-20 Toyota Motor Engineering & Manufacturing North America, Inc. System and method for modifying signals to determine an incidence angle of an acoustic wave

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3944736A (en) * 1974-06-05 1976-03-16 General Electric Company Voice-operated switching circuit for a video communications system
US4581758A (en) * 1983-11-04 1986-04-08 At&T Bell Laboratories Acoustic direction identification system
US4741038A (en) * 1986-09-26 1988-04-26 American Telephone And Telegraph Company, At&T Bell Laboratories Sound location arrangement
JPH0771279B2 (ja) * 1988-08-17 1995-07-31 富士通株式会社 テレビ会議用画像処理装置
US4965819A (en) * 1988-09-22 1990-10-23 Docu-Vision, Inc. Video conferencing system for courtroom and other applications
US5206721A (en) * 1990-03-08 1993-04-27 Fujitsu Limited Television conference system
US5058419A (en) * 1990-04-10 1991-10-22 Earl H. Ruble Method and apparatus for determining the location of a sound source
JP2630041B2 (ja) * 1990-08-29 1997-07-16 日本電気株式会社 テレビ会議画像表示制御方法
IT1257164B (it) * 1992-10-23 1996-01-05 Ist Trentino Di Cultura Procedimento per la localizzazione di un parlatore e l'acquisizione diun messaggio vocale, e relativo sistema.
US5335011A (en) * 1993-01-12 1994-08-02 Bell Communications Research, Inc. Sound localization system for teleconferencing using self-steering microphone arrays
JPH06332492A (ja) * 1993-05-19 1994-12-02 Matsushita Electric Ind Co Ltd 音声検出方法および検出装置
WO1995002288A1 (en) * 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
CA2148631C (en) * 1994-06-20 2000-06-13 John J. Hildin Voice-following video system
US5737431A (en) * 1995-03-07 1998-04-07 Brown University Research Foundation Methods and apparatus for source location estimation from microphone-array time-delay estimates

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003514412A (ja) * 1999-11-05 2003-04-15 ウェーブメーカーズ・インコーポレーテッド 音源が一対のマイクロフォンから近いか遠いかを判断する方法
JP2006515490A (ja) * 2003-02-12 2006-05-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 再生位置を決定するための装置及び方法
US7586513B2 (en) 2003-05-08 2009-09-08 Tandberg Telecom As Arrangement and method for audio source tracking
JP2005323381A (ja) * 2004-05-07 2005-11-17 Fuji Xerox Co Ltd マイクロホンの位置確認のためのシステム、方法、及びプログラム
JP2013068434A (ja) * 2011-09-20 2013-04-18 Toyota Motor Corp 音源検出装置

Also Published As

Publication number Publication date
EP0903055A1 (en) 1999-03-24
DE69738195T2 (de) 2008-07-10
CA2257444A1 (en) 1997-12-18
WO1997048252A1 (en) 1997-12-18
EP0903055B1 (en) 2007-10-10
DE69738195D1 (de) 2007-11-22
CA2257444C (en) 2004-03-23
US5778082A (en) 1998-07-07
JP3672320B2 (ja) 2005-07-20
EP0903055A4 (en) 2000-12-13

Similar Documents

Publication Publication Date Title
JP2000512108A (ja) 音源位置づけ方法と装置
CA1230666A (en) Acoustic direction identification system
JP6703525B2 (ja) 音源を強調するための方法及び機器
JP4872871B2 (ja) 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ
US7903137B2 (en) Videoconferencing echo cancellers
US9338549B2 (en) Acoustic localization of a speaker
JP3537962B2 (ja) 音声収集装置及び音声収集方法
US20190313187A1 (en) Controlling the direction of a microphone array beam in a video conferencing system
JP2000165983A (ja) マイクロフォンの感度の制御のための方法
US6023514A (en) System and method for factoring a merged wave field into independent components
EP1705911A1 (en) Video conference system
US20230335149A1 (en) Speech processing device and speech processing method
JP4198915B2 (ja) 空間的音波ステアリングシステム
JP3370530B2 (ja) マイクロホン内蔵型ビデオカメラ
JPS62239631A (ja) ステレオ音声伝送蓄積方式
JP7486153B2 (ja) 音声処理装置および音声処理方法
JPH06276427A (ja) 動画像音声制御装置
JP2008022069A (ja) 音声収録装置および音声収録方法
JPH07162827A (ja) 多地点通信方法および通信端末
JPH08289275A (ja) Tv会議システム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040510

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040510

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040514

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20040817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050419

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080428

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100428

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100428

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110428

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130428

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees