JP3672320B2 - 音源位置づけ方法と装置 - Google Patents
音源位置づけ方法と装置 Download PDFInfo
- Publication number
- JP3672320B2 JP3672320B2 JP50158998A JP50158998A JP3672320B2 JP 3672320 B2 JP3672320 B2 JP 3672320B2 JP 50158998 A JP50158998 A JP 50158998A JP 50158998 A JP50158998 A JP 50158998A JP 3672320 B2 JP3672320 B2 JP 3672320B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- acoustic
- signal
- series
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/403—Linear arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/405—Non-uniform arrays of transducers or a plurality of uniform arrays with different transducer spacing
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
本発明は、一般に、音響信号処理に関し、詳細には、音源の方向およびまたは位置を識別する方法と装置に関する。
幾つかの知られている音響通信装置は、音響信号を捕らえる一つ以上のマイクロホーン取り入れている。しかし、ある状況においては、音源の方向は変化するか、または、予測することが出来ない。例えば、室内の多数の話者が一組の話者マイクロホーンを使用する会議用装置では、異なる人が会議室内の異なる位置から話すので、音の方向は変化する。さらに、話者は話している間動き回る。それにもかかわらず、ビデオ方式会議などの環境では、話者の方向と位置を識別することが望まれる。
発明の要約
本発明は、数組の間隔をおいて離れたマイクロホーンを使用して、共通の音源からのスピーチの方向と他の音響信号を得る音響信号処理方法と装置を意図している。本発明は、個々の時間フレームの間に捕らえた信号が、音源からの音響信号の流れの始まりまたは初期を表しているか、いないかを決定し、データがその流れの初期を表すとき、信号の流れを表す受信された音響信号を識別し、受信された音響信号に基づいた音源の方向を決定することにより、音響信号を処理する方法と装置から構成している。
好適な実施態様において、音源からの音響信号の流れの始まりまたは初期は、周波数毎をベースにして好適に検出される。好適に、次の二つの条件を満足する捕らえた信号のこれらの周波数成分に関連したデータは、音源からの音響信号の始まりにおいて発生する信号を表すと思われる。第一に、周波数成分の大きさは、その周波数の暗騒音のエネルギーより、少なくとも所定量だけ好適に大きくなければならない。第二に、周波数成分の大きさは、先行の時間フレームの所定数の間に捕らえた対応する周波数成分の大きさより、少なくとも所定量だけ好適に大きくなればならない。
二つの条件が個々の時間フレームの間において個々の周波数について満足されるならば、始まりの条件がその周波数に関して満足されると考えられる。時間フレーム中に一組のマイクロホーンにより捕らえられた音響信号の相互関係は、この様な各周波数成分について生成され、各この周波数における騒音の相互関係は差し引かれて、音源からの信号の流れを表す受信音響信号を識別する。好適に、受信された音響信号は、所定の時間の間蓄積される。所定時間の終わりに、少なくとも特定数の周波数の非ゼロ値が蓄積されたならば、蓄積された値は、一組のマイクロホーンにおいて共通の音源から到達する信号の間の時間遅れを決定するために使用される。次に、この情報は、マイクロホーンに対する音源の方向または関係角度を決定するために使用することが出来る。マイクロホーンの配列が、装置の能力を高めるために、ただ一組のマイクロホーンの代わりに有利に使用することが出来る。
本発明は、ビデオ方式会議、ビデオ録画および放送などの用途に特に適しており、その場合、動作カメラを水平回転し、傾斜し、スピーチを始めた個人または数人のグループの方向に切り換えることなどにより、一組のカメラの中の一台のビデオカメラを自動的に向けることは望まれる。
本発明の他の特徴と利点は、以降の詳細な説明と付属図面を読むと、さらにはっきりと理解されるであろう。
【図面の簡単な説明】
図1は、本発明による、音源の方向を位置付ける典型的装置を示す機能構成図である。
図2A〜2Bは、本発明の方法のステップを示す流れ図を示す。
図3は、暗騒音を算定する一つの方法の流れ図である。
図4は、音源からの音響信号を受信する一組のマイクロホーンに関する関係角度の幾何学的構成を示す。
図5は、本発明によるビデオ方式会議の装置を示す。
図6は、本発明によるビデオ方式会議装置に使用されるマイクロホーンの配置を示す。
図7は、ビデオ方式会議装置のビデオカメラを指向する方法のステップを示す流れ図である。
好適な実施態様の説明
図1は、本発明による、音源の方向を位置付ける典型的装置1を示す機能構成図である。例えば、装置1は、反響する環境で発言する人などの音源2の方向を決定するために使用される。従って、本発明は、例えば、発言中の人の方向にビデオカメラを向けることが望まれるビデオ方式会議の環境の用途に特に適している。しかし、本発明は、録音および放送中に指向する普通のカメラなどの他の環境にも使用出来ることが理解されるされるであろう。
図1の多くの機能モジュールは、例えば、読み出し専用メモリー(ROM)、ランダムアクセスメモリー(RAM)およびまたは他の形のメモリーなどの適切にプログラムされたプロセッサにより、実行される。図1のモジュールの機能を行う他の適切なプロセッサには、ミニコンピュータ、マイクロコントローラ、プログラマブル論理アレイおよびアプリケーション特定集積回路がある。この種のプロセッサのプログラミングと使用は、本技術においては周知であり、従って、ここではさらに詳細に説明しない。
図1は、本発明の方法によるステップの流れ図である図2A〜2Bに関連して最もよく理解することが出来る。ステップ100により示されているように、音響データの流れは、距離Dだけ間隔をおいて離れた一組のマイクロホーン10,11などの二つ以上のトランスデューサにより捕らえられる。音響データの流れは、音源2から直接に受信された音響信号、および騒音と反響信号から成っている。一組のマイクロホーンから受信された信号は、アナログ/ディジタル(A/D)変換器12,13を経て、例えば、16KHzで動作する各サンプリングモジュール14,15へ送られる。サンプリングモジュール14,15は、マイクロホーン10,11から受信された各データの流れを、ステップ101,102によりそれぞれ示されているように、N個のサンプルの数値で表されたサンプリングフレームへ変換する。N個のサンプルの数は、例えば、512である。N個のサンプルのブロックは、一般には、N/2のサンプルだけ重なり合う。各乗算器18,19は、ステップ103,104により示されているように、サンプリングモジュール14,15からの出力された信号に、モジュール16,17により生成されたウィンドウ関数を掛ける。ウィンドウ関数モジュール16,17は、例えば、従来のハミングウィンドウを生成する。しかし、この好適な実施態様では、ウィンドウ関数モジュール16,17は、次式のような指数のウィンドウ関数を使用する。
他のウィンドウ関数も使用することが出来る。乗算器18,19の出力に現れる信号は、次式の形を有する。
x1m=w(i)s1m(i),i=0,...,N−1 [2]
x2m=w(i)s2m(i),i=0,...,N−1
ここで、s1m(i)とs2m(i)は、それぞれ、フレームmの間のマイクロホーン10,11から受信された信号を表す。
次に、図2Aのステップ105,106により示されているように、乗算器18,19の出力における信号は、ファーストフーリエ変換(FFT)などの全体的変換を行う各モジュール20,21により各フレームについて処理される。フーリエ変換された信号f1m(k)、f2m(k)は、jが−1の平方根である計算を表す。kの値は、例えば、125Hz〜7.5kHzの範囲であるが、他のkの範囲もまた可能である。次式のフーリエ変換された信号は、その後の処理のために、各FFTモジュール20,21に関連した各メモリー22,23に格納される。
現在のフレームのフーリエ変換された信号は、さらに処理するため他のモジュールへも送られる。例えば、フーリエ変換された信号は、米国出願No.08/434,798に記載されたピッチ検出器などのピッチ検出器90へ送られる。この出願は、参考に本明細書に取り入れられている。
本発明の原理により、一定の暗騒音エネルギーが、マイクロホーンの一つ、例えば、マイクロホーン10から受信された信号の各周波数成分について別々に算定される。ステップ110により示されているように、暗騒音エネルギーは、暗騒音算定器35により算定される。騒音算定器35は、先行のSフレームのフーリエ変換された信号を使用して、先行Sフレームの信号が騒音だけであり、ほぼ一定レベルの騒音があるならば、暗騒音を算定する。フレームSの数が、適切に、例えば、100であってもよい。
図3は、暗騒音を算定する一つの方法のステップを示す流れ図である。図3のステップ200により示されているように、適切な周波数スペクトルが、好適に重なり合っていない周波数帯Lへ分割される。例えば、1KHzの帯域幅をそれぞれ有する8個の周波数帯が、適切に使用される。次に、ステップ202により示されているように、周波数帯毎のエネルギー算定器30は、現在のフレームのフーリエ成分から、各周波数帯について広帯域のエネルギー信号を発生する。従って、例えば、各1KHz帯について32個の係数を仮定すると、各帯の平均エネルギーは次式により計算される。
ここで、bm(r)は、周波数帯rとフレーム番号mの広帯域エネルギーである。
次に、ステップ204により示されているように、各周波数帯の平均広帯域エネルギー信号は、先行のMフレームの広帯域エネルギーから生成される。従って、個々の周波数帯rの平均エネルギーは、次式により好適に計算される。
ここで、Mは、例えば、4に設定され、m’は現在のフレームの番号である。次に、決定が、各周波数帯のエネルギーが先行のフレームに対し比較的一定のままであったか、どうかに関して行われる。具体的には、決定は、206により示されているように、現在のフレームのすべての周波数帯が、その周波数帯の平均エネルギーより少なくとも所定量だけ大きいか、どうかに関して行われる。決定はまた、すべての周波数帯が、その周波数帯の平均エネルギーより少なくとも所定量だけ小さいか、どうかに関しても行われる。言い換えると、帯域毎エネルギー算定器30は、次式のいずれであるかを決定する。
ここで、Tbは5に設定されている。Tbの高低値は、個々のアプリケーションに従って使用される。式[6]のいずれかの決定が、一つ以上の周波数帯について肯定的であるならば、エネルギー算定器30は、エネルギーがステップ208により示された時間において変化していることを示す出力信号を発生する。暗騒音算定器35のカウンタ36は、広域帯エネルギーレベルがほぼ一定になっている連続フレームの番号を追跡して、ゼロへリセットされる。そうでなければ、ステップ210により示されているように、出力信号が送られて、現在のフレームの広域帯エネルギーレベルが先行フレームに対しほぼ一定であることを示し、カウンタ36は一つだけ増分される。
時間に亘ったエネルギーの一定性の他の測定が、ステップ204,206の代わりに使用することが出来る。例えば、一つの他の測定は次式のいずれかを決定することである。
ここで、Mは同様に、例えば、4である。
いずれにしても、暗騒音算定器35は、広域帯エネルギーレベルが、212により示されているように、先行のS個のフレームに対し既にほぼ一定であるか、どうかを決定する。これは、カウンタ36が少なくともSに等しいか、どうかを点検することにより、達成される。先行S個のフレームの広域帯エネルギーレベルが、ほぼ一定でなければ、ステップ213により示されているように、装置1は次のフレームの処理を続ける。しかし、決定212が肯定的であるならば、暗騒音算定器35は、ステップ214により示されているように、次式に従って暗騒音を好適に計算する。
ここで、f1(m-i) *は、f1(m-i)の複合結合であり、Sは、例えば、100に等しい。このために、先行フレームのフーリエ変換された信号の周波数成分は、メモリー22から暗騒音算定器35へ送られる。暗騒音算定器35により発生された、暗騒音を表す出力信号は、以降に詳細に説明されているように、現在フレームの周波数成分が、音源2の方向及びまたは位置の計算に有用なデータであると見なされることを決定するために使用される。
エネルギー算定器30により発生された信号は、暗騒音相互関係算定器40へも送られる。先行S個のフレームの広域帯エネルギーレベルが既にほぼ一定であることが決定されるならば、先行S個のフレームの信号の相互関係信号が、ステップ115により示されているように、騒音算定器40により発生される。暗騒音相互関係は、次式により好適に計算される。
ここで、f2(m-i) *はf2(m-i)の複合結合であり、N(K)は個々の周波数Kにおける騒音の相互関係を表す。このために、先行S個のフレームのフーリエ変換された信号の周波数成分は、各メモリー22,23から暗騒音相互関係算定器40へ送られる。暗騒音相互関係算定器40により発生された、騒音の相互関係を表す出力信号は、以降に詳細に説明されるように、装置1が音源2から発生したと決定する、受信された音響信号の相互関係の識別を支援するために使用される。
本発明のこの好適な実施態様において、マイクロホーン10,11において捕らえられた音響データの周波数成分は、以降に詳細に説明されるように、二つの条件が現在のフレームの個々の周波数成分について満足されるならば、音源2の方向を決定するのに有用であると考えられる。第一に、図2Aの120により示されているように、比較器25は、マイクロホーン10から受信された信号に関し、現在のフレームのどの周波数成分が、たとえ有するにしても、対応する周波数成分の暗騒音b(k)の大きさより少なくとも所定量だけ大きい大きさを有するかを決定する。第二に、121により示されているように、比較器24は、現在のフレームのどの周波数成分が、有するにしても、先行のS個のフレームの対応する周波数成分の大きさより少なくとも所定量だけ大きい大きさを有するかを決定する。ここで、例えば、pは4に設定することが出来る。数学的に、第一条件は次式のように表される。
ここで、例えば、TNは4に設定される。第二条件は次式のように表される。
ここで、例えば、Toは4に設定される。TNとTOの高低値は、個々のアプリケーションに従って使用される。同様に、4以外の事前に指定されたpの値も、使用することが出来る。第一条件は、音源2からの信号が存在していることを示すのに役に立ち、第二条件は、音源2から受信された一連の音響信号の始まりまたは初期を示すのに役に立つ。周波数成分が、式[10]と[11]により示された両方の条件を満足しなければ、装置は、ステップ122により示されているように、音響データの次のフレームの処理を続ける。
式[10]と[11]により示された前述の条件の両方が、特定の周波数kについて満足されるならば、二つの入力のANDゲート26は、両方の条件が現在のフレームの周波数kについて満足されることを示す信号を発生する。次に、ANDゲート26により発生した信号は、始まりの信号の相互関係算定器45へ送られる。ANDゲート26からの信号に応答して、相互関係算定器45は、ステップ130により示されているように、計算して、次式により特定周波数kの相互関係信号を発生する。
cm(k)=f1m(k)f2m *(k) [12]
このために、相互関係算定器45は、各周波数成分信号をFFTモジュール20,21から受信する。次に、ステップ135により示されているように、減算器50は、ステップ115において発生した暗騒音相互関係N(K)を、ステップ130において発生した相互関係cm(K)から差し引く。この様にして、フレームmの周波数kの出力信号am(K)は、次式に従って減算器50により発生される。
am(k)=cm(k)−N(k) [13]
ステップ135から得られた出力信号は、音源2から受信された音響信号の流れの初期または始まりに対応する受信された音響信号を表す。
減算器50により発生した信号は、複数の蓄積器60,・・・,61の対応する蓄積器へ転送される。蓄積器のそれぞれは、4〜240の周波数kの一つに対応する。ステップ140により示されているように、各蓄積器60,・・・,61は、減算器50から得られ、かつ、その特定の周波数に対応する結果を、特定の時間期間について蓄積器60,・・・,61に格納された前の結果に加える。従って、次式により表される。
am,new(k)=am,old(k)+[cm(k)−N(k)] [14]
ここで、am,old(k)は、周波数kの相互関係蓄積器に格納された前の値を表し、am,new(k)は、周波数kの相互関係蓄積器に格納された新しい値を表す。
例えば、2秒の特定の時間期間の終わりにおいて、145により示されているように、決定が、相互関係蓄積器60,・・・,61の所定数より多い蓄積器は、非ゼロのエントリを有する。少なくとも指定された数の蓄積器60,・・・,61が、非ゼロのエントリを有していないならば、従って、更新されていないならば、蓄積器60,・・・,61の値は、ステップ147により示されているように、ゼロへリセットされる。他方、ステップ150により示されているように、決定145が肯定的であるならば、マイクロホーン10,11の音響信号の到着時間の間の時間遅れt(n)を表す信号が発生される。この時間遅れは、蓄積された相互関係信号から時間遅れ計算モジュール70により発生される。
この好適な実施態様において、モジュール70もまた、帯域毎のエネルギー算定器30から信号を受信して、現在のフレームが音源2からの信号の流れを有することを確認する。本実施態様により、帯域毎のエネルギー算定器30から受信された信号がまた、現在のフレームが音源2からの信号の流れを示すことを単に示すならば、モジュール70は、時間遅れ信号t(n)を発生する。
時間遅れt(n)を発生するために、モジュール70は、蓄積器60,・・・,61に現在格納された相互関係値の大きさを好適に基準化する。従って、エントリが非ゼロである、すなわち、言い換えると、更新されていない各周波数蓄積器60,・・・,61について、大きさはゼロに設定される。数学的に表すと、
次に、蓄積された相互関係値の基準化された値に基づいて、モジュール70は、フレームmの間に一組のマイクロホーン10,11に到着する音響信号の時間遅れを表す信号を発生する。
一つの実施態様において、モジュール70は計算して、次式により逆のフーリエ変換を表す信号を発生する。
これは、フレームmの間に一組のマイクロホーン10,11に到着する音響信号の時間遅れの値に相当する値を発生する。従って、例えば、t(n)の最大値は遅れとして選択される。あるいは、補間法が、Iが相互関係の時間分解が増加される整数であることにより、サンプルの端数の遅れを測定するために使用される。従って、例えば、t(n’)の最大値は、遅れとして選択される。
さらに他の実施態様において、ゼロ値のサンプルが、逆変換の流れの実際のサンプル値の間に挿入される。次に、発生した流れは、時間遅れの値を得るために低域フィルターにより濾過される。
他の実施態様において、一組のマイクロホーン10,11に到着する信号の間の時間遅れは、米国特許No.5,058,419に述べられているヒストグラム法などによりモジュール70により算定される。この特許はここに参考に取り入れられている。従って、例えば、二つのマイクロホーン10,11に到着する信号の間の位相差は、蓄積器60,・・・,61に格納された相互関係値による上述のように、多数の周波数について測定される。各測定された位相差は、潜在的時間遅れを内在している。最大発生数を有する時間遅れの範囲内にある潜在的時間遅れの平均は、実際の時間遅れとして選択される。
音源2から到着する音響信号の反射経路が、直接経路より強くなりそうな状況では、上述のヒストグラム法が、優先権をゼロの時間遅れに近い値を有する大きい活性のあるピークへ優先権を与えることにより、修正される。ゼロの時間遅れにより近いピークは、直接経路に一致しそうである。従って、例えば、時間遅れの各範囲は、多数の発生を有し、かつ比較的にゼロにも近い範囲から発生する平均時間遅れを選んで、実際の時間遅れの選択を偏倚するようにウエートを割り付けられる。一般に、相対ウエートは、望まれる時間遅れの選択を偏倚するように既知の情報を考慮しているすべての方法で割り当てられるが、小さい大きさを有する時間遅れの範囲は、より大きい大きさを有する時間遅れの範囲より、より高い相対ウエートを割り当てられる。
時間遅れ信号tが発生すると、マイクロホーン10,11に対する音源2の関係角度は、次式に従って方向または位置の位置づけ器80により決定される。
ここで、vは音の速度、tは時間遅れ、Dはマイクロホーン10,11の間の距離である。音源2の方向を算定するこの方法は、音響信号が平坦波または平面波の形でマイクロホーン10,11へ到達する考えられる場合の離れた領域近似法に基づいている。図4は、音源Cから音響信号を受信する二つのマイクロホーンAとBに対する関係角度Θの幾何学的構成を示しており、この場合、マイクロホーンAとBは、距離Dだけ離れている。平面波の想定が個々のアプリケーションに適切でなければ、他の方法が、マイクロホーン10,11に対する音源2の方向または位置を決定するために使用することが出来る。例えば、この様な方法には、別のマイクロホーンを装置1に取り入れ、上述の方法に従って追加された組のマイクロホーンにおける到着時間の差に相当する遅れを発生する方法がある。次に、既知の方法に従って、多数の時間遅れが、音源2の方向または位置を決定するために使用することが出来る。
本発明の一つの好適な実施態様は、図5に示された装置300などのビデオ方式会議の環境に置かれている。ビデオ方式会議装置300は、相互に離れて配置されている、AとBで表示された二つのステーションを有する。ステーションAの参加者320と321は、ステーションBの参加者350と351と、音声とビデオで通信している。各処理器または制御器301,302が、各ステーションAとBに配置されて、音声とビデオのデータの処理と送信を送信装置310により制御する。送信装置310は、例えば、音声とビデオの信号を送信するISDNまたはTl回線から構成している。
この通信を行うため、音響装置が、各ステーションにおいて音を検出するために配置され、これらの音を表す音響信号を送信装置310によりステーションの間に送信し、各ステーションで検出された音をその他のステーションにおいて再生する。音響装置は、ステーションAおいてマイクロホーン322とステレオロードスピーカ331,332、ステーションBにおいてマイクロホーン352とロードスピーカ341,342から成っている。
ビデオ方式会議装置300には、ステーションAとBの参加者の間の双方向ビデオ通信もある。しかし、表示を容易にするため、図5は、ステーションAからステーションBへのビデオ通信だけを示している。ステーションAからステーションBへのビデオ通信を行うため、ステーションAはさらに、以降に詳細に説明するように、制御器301により制御されたビデオカメラ360を備えている。ビデオカメラ360は、カメラレンズ363を収容しているヘッド部分362を有し、ステーションBへ送るステーションAにおける画像を表す信号を発生する。少なくとも二つのマイクロホーンを有するマイクロホーンの配列は、ビデオカメラと関連づけられ、捕らえた音響データを制御器301へ送信する。制御器301は、図1の点線内に示された装置1の、マイクロホーンの配列から受信された音響データを処理する構成要素を好適に有する。ステーションBは、ステーションAから受信されたビデオ信号を表示するビデオディスプレイ361を有する。
マイクロホーンの配列365の一つの配置が図6に示されており、これは四つのマイクロホーン601,602,603,604から成っている。特に、マイクロホーン配列365は、例えば、マイクロホーン601,602の間の距離d1、マイクロホーン602,603の間の距離d2で、x方向へ一列に配置されたマイクロホーン601,602,603から好適に構成している。第四のマイクロホーンは、y方向にマイクロホーン602からd3の距離に好適に配置されている。従って、マイクロホーン602が(x’,y’,z’)に位置付けられているとすると、マイクロホーン601は(x’−d1,y’,z’)に位置付けられ、マイクロホーン603は(x’+d2,y’,z’)に位置付けられ、マイクロホーン604は(x’,y’+d3,z’)に位置付けられている。制御器301は、既知の値d1,d2,d3、および、例えば、マイクロホーン602などのマイクロホーンの一つの位置に対するビデオカメラ360の位置(x”,y”,z”)とにより事前にプログラムされている。
図5,6のビデオ方式会議装置の動作は、次の通りである。ステーションAの参加者の一人が話し始めると、その参加者のスピーチにより発生した音響信号が、マイクロホーン322により捕らえられ、制御器301へ送られ、そこで、既知の形で処理され、送信装置310によりステーションBへ送られる。ステーションBにおいて、受信された音響信号は、スピーカーで341,342再生される。
発言している参加者により発生した音響信号は、マイクロホーン配列365のマイクロホーン601〜604によっても捕らえられる。捕捉された信号は、制御器301へ送られ、そこで、数組のマイクロホーン601〜604からの信号は、図1〜4に関する上述の方法により、好適に処理される。数組のマイクロホーン601〜604の音響信号の到着時間の遅れに対応する関係角度を決定することにより、発言中の参加者の方向が決定される。次に、この情報は、カメラ360の方向を自動的に指向し、調節するために使用される。
例えば、マイクロホーン601,603において捕らえられた音響データは、x軸に対する関係角度を決定するために使用される。x軸に沿った関係角度が決定されると、制御器301は、その関係角度とマイクロホーン601〜604に対するカメラの既知の位置により、カメラヘッド362を発言中の参加者の方向へ自動的に水平回転する。同様に、マイクロホーン602,604において捕らえられた音響データは、y軸に対する関係角度を決定するために使用される。y軸に沿った関係角度が決定されると、制御器301は、その関係角度とマイクロホーン601〜604に対するカメラの既知の関係位置により、カメラヘッド362を発言中の参加者の方向へ自動的に傾ける。カメラ360を計算された関係角度に応じて正確に水平回転し、傾斜することにより、発言中の参加者は、カメラにより自動的に映像として捕らえられる。
図6のマイクロホーンの配列構成は、以降に説明するように、z軸に沿った発言中の参加者の位置を決定するためにも使用される。次に、制御器301は、例えば、発言中の参加者の頭または上体を画面にきっちりと捕らえるため、z軸に沿った発言中の参加者の位置を使用して、カメラレンズを自動的にズームアップする。
z軸に沿った発言中の参加者の位置の決定は、他の軸の一つ、例えば、x軸に対する関係角度を決定することにより、行われる。重ねて言うと、この関係角度は、図1〜4について説明した方法により、好適に決定される。例えば、一組のマイクロホーン601,602において捕らえられたデータに対応する第一関係角度、一組のマイクロホーン602,603において捕らえられたデータに対応する関係角度が決定される。これらの関係角度が決定されると、制御器301はマイクロホーン601,602,603の既知の位置と共にこの情報を使用して、第一関係角度によるマイクロホーン601,602の中点と、第二関係角度によるマイクロホーン602,603の中点とから始まる線の交点を決定する。この交点は、z軸に沿った発言中の参加者の位置を表す。次に、制御器301は、発言中の参加者を画面にきっちりと捕らえるため、この情報を使用して、カメラレンズ363をズームアップする。
他の構成では、マイクロホーンの配列365は、マイクロホーン601,602,604などの三つのマイクロホーンだけで成っている。この実施例では、マイクロホーン601,602において捕らえられた音響データは、x軸に対する関係角度を決定するために使用される。同様に、マイクロホーン602,604において捕らえられた音響データは、y軸に対する関係角度を決定するために使用される。次に、関係角度は、発言者を適切に画面にきっちりと捕らえるため、カメラを水平回転し、傾け、ズームアップするように使用される。この実施例は三つのマイクロホーンだけを使用しており、四つのマイクロホーンを使用している上述の実施例は対称的構成のマイクロホーンを形成している。
動作の好適なモードにおいて、ディスプレイ361に表示された画像は、ビデオカメラ363が水平回転されているか、または、傾斜されている間、固定される。このように表示された画像を固定する一つの利点は、そのことが、カメラが水平回転され、または傾斜されるとき、一般にステーションBのディスプレイ361に現れるぼやけた画像を無くすことに役立つことである。
図7は、カメラが水平回転されるか、傾斜されるとき、表示された画像が固定される動作モードのステップを示す。ビデオカメラ363が、ステップBへ送られるビデオデータを捕らえると、ステップ701により示されているように、捕らえられたビデオデータに相当する画像が、ディスプレイ361にほぼリアルタイムで表示される。また、カメラ363が引き続いてビデオデータを捕らえると、ステップ703により示されているように、多くの時間フレームの間に音響データの流れを捕らえる。好適に、ステップ705により示されているように、上述の方法により、制御器301は、個々の時間フレームの間に捕らえられた音響データが、参加者320,321の一人からの音響信号の流れの開始を表しているか、どうかを決定する。次に、制御器301は、ステップ707により示されているように、データがその流れの開始を表しているならば、信号の流れを表す受信された音響信号を識別する。次に、ステップ709により示されているように、制御器301は、受信された音響信号に基づいて、ビデオカメラ363に対する参加者の方向を決定する。
参加者の方向を決定するステップ709に応答して、ステップ711により示されているように、ビデオカメラ363は、カメラ363を適切に水平回転し、及びまたは傾斜することにより、参加者の方向へ自動的に向けられる。しかし、この実施態様により、ビデオカメラ363が水平回転しているか、または、傾斜しているとき、例えば、ディスプレイ361に現れる画像を、カメラを水平回転するか、または、傾斜する直前に発生するフレームに固定するために、信号が制御器301へ送られる。ステップ713により示されているように、画像は、ビデオカメラが動きを停止するまで、示されたフレームを好適に固定する。あるいは、余分なハードウェアのコストを低減するため、アプリケーションの特定のハードウェアが使用され、または、ビデオ圧縮デコーダがフレームを固定する。カメラ363がもはや水平回転していないか、または傾斜していないならば、ステップ715により示されているように、新しいビデオデータに対応する画像が、再びディスプレイ361に表示される。
他の動作モードにおいて、第二カメラ364が、図5の装置300に配置されている。制御器301は、マイクロホーン601〜604に対するカメラ364の関係位置も格納している。例えば、カメラ360は、適切な水平回転と傾斜により個々の発言者を追跡するように使用されるが、カメラ364は、ステーションAの参加者のグループを画面にきっちりと収めるように使用される。装置300が、動作中のカメラ360をスイッチに回転するか、または、傾斜しているとき、装置300はカメラ364へ切り換える。従って、ステーションBの参加者350,351は、カメラ360が動いている間、カメラ364からの画像を見る。カメラ300が動きを止めると、言い換えると、水平回転と傾斜の機能が完了すると、装置300は動作中のカメラ360へ切り換えて戻る。さらに他の動作モードにおいて、カメラ364は、水平回転と傾斜を適切に行うことにより、個々の発言者を追跡するためにも使用される。カメラ360,364の一つだけが与えられた時は何時でも動いているように、カメラ360,364が制御される。次に、静止しているカメラのビデオ出力がステーションBのディスプレイ361へ送られるように、装置300は、カメラ360,361の間を連続的に切り換わる。一つ以上のカメラを使用しているこの様なモードは、フレームを固定することなく、はっきりと、ぼけない変移を行うことが出来る。
本発明は特定の実施例に関して説明されているが、本発明の精神と範囲の範囲内の変形と修正が熟慮されていることは理解されるであろう。
Claims (29)
- 音源から到達する一連の音響信号を処理する方法において、
複数の時間フレームの間に複数の場所において音響データを捕らえ、
一の時間フレームの間に前記いずれかの場所において捕らえられた音響データが、前記一連の音響信号の始まりを表しているかどうかを決定し、
前記いずれかの場所における前記音響データが前記一連の音響信号の始まりを表しているとき、前記一連の信号を表す少なくとも二つの場所において受信された音響信号を識別し、
前記受信され識別された音響信号に基づいて前記音源の方向を決定するステップを含むことを特徴とする方法。 - 請求の範囲第1項に記載の方法において、
一の時間フレームにおいて捕らえられた信号が前記一連の音響信号の始まりを表しているかどうかを決定するステップは、前記一の時間フレームの間に捕らえられた信号の複数の周波数成分の大きさを調べるステップを含むことを特徴とする方法。 - 請求の範囲第2項に記載の方法において、前記調べるステップは、
複数の周波数において、前記一の時間フレームの間に捕らえられた信号のその各周波数成分の大きさが、その周波数のバックグラウンドノイズのエネルギーより少なくとも第一所定量だけ大きいかどうかを決定し、
前記複数の周波数において、その各周波数成分の大きさが、事前に指定された数の先行する時間フレームの間に捕らえられた信号の対応する周波数成分の大きさより少なくとも第二所定量だけ大きいかどうかを決定するステップを含むことを特徴とする方法。 - 請求の範囲第3項に記載の方法において、前記識別するステップは、
前記一の時間フレームの間に前記複数の場所において捕らえられた信号の間で相互相関を示す信号を識別し、
前記相互相関を示す信号の各々から対応するバックグラウンドノイズを差し引くステップを含むことを特徴とする方法。 - 請求の範囲第3項に記載の方法において、前記識別するステップは、
前記複数の周波数において、前記一の時間フレームの間に捕らえられた信号の各周波数成分の大きさが、その周波数におけるバックグラウンドノイズのエネルギーより少なくとも第一所定数倍大きいかどうかを決定することを含むことを特徴とする前記方法。 - 請求の範囲第3項に記載の方法において、前記識別するステップは、
前記複数の周波数において、前記一の時間フレームの間に捕らえられた信号の各周波数成分の大きさが、事前に指定された数の先行する時間フレームの間に捕らえられた信号の対応する周波数成分の強さより、少なくとも第二所定数倍大きいかどうかを決定することを含むことを特徴とする前記方法。 - 請求の範囲第4項に記載の方法において、前記音源の方向を決定するステップは、
前記捕らえられた音響信号から、複数のマイクロホーンの位置における前記一連の音響信号の到着時間の差を示す時間遅れを抽出するステップを含むことを特徴とする方法。 - 請求の範囲第7項に記載の方法において、さらに、
前記受信された音響信号から、複数の値の範囲の一つの内にある、複数の潜在的な時間遅れを抽出し、各範囲内にある潜在的時間遅れの数と各範囲に割り当てられた相対的重みづけとに基づいて実際の時間遅れを選択するステップを含むことを特徴とする方法。 - 請求の範囲第8項に記載の方法において、比較的小さい値を有する潜在的時間遅れの範囲は、大きい値を有する潜在的時間遅れより高い相対的重みづけを割り当てられることを特徴とする方法。
- 音源から到達する一連の音響信号を処理する、ビデオ会議に使用する方法において、
複数の時間フレームの間に音響データを捕らえ、
一の時間フレームの間に捕らえられた音響データが前記一連の音響信号の始まりを表すかどうかを決定し、
前記データが前記一連の音響信号の始まりを表すとき、前記一連の信号を表す受信された音響信号を識別し、
受信された音響信号に基づいて、前記音源の方向を決定し、
前記音源の方向を決定するステップに応じて自動的にビデオカメラを向けるステップを含むことを特徴とする方法。 - 請求の範囲第10項に記載の方法において、一の時間フレームの間に捕らえられた音響データが前記一連の音響信号の始まりを表すかどうかを決定するステップは、
複数の周波数において、前記一の時間フレームの間に捕らえられた信号の各周波数成分の大きさが、その周波数のバックグラウンドノイズのエネルギーより少なくとも第一所定量だけ大きいかどうかを決定し、
前記複数の周波数において、各周波数成分の大きさが、事前に指定された数の先行する時間フレームの間に捕らえられた信号の対応する周波数成分の大きさより、少なくとも第二所定量だけ大きいかどうかを決定するステップを含むことを特徴とする方法。 - 請求の範囲第11項に記載の方法において、
前記受信された音響信号に基づいて音源の位置を決定するステップをさらに含むことを特徴とする方法。 - 請求の範囲第12項に記載の方法において、前記音源の位置を決定するステップに応答して、音源を画面に収めるようにカメラのレンズを自動的にズームするステップをさらに含むことを特徴とする方法。
- 音源から到達する一連の音響信号を処理する装置であって、
複数の時間フレームの間に音響データの流れを捕らえる複数のトランスデューサと、
一の時間フレームの間にいずれかのトランスデューサにおいて捕らえられた音響データが、前記一連の音響信号の始まりを表すかどうかを決定する手段と、
いずれかのトランスデューサにおける前記音響データが前記一連の音響信号の始まりを表すとき、前記一連の信号を表す少なくとも二つの場所において受信された音響信号を識別する手段と、
前記受信され識別された音響信号に基づいて前記音源の方向を決定する手段とを含むことを特徴とする装置。 - 請求の範囲第14項に記載の装置であって、捕らえられた音響データが前記一連の音響信号の始まりを表すかどうかを決定する手段は、
バックグラウンドノイズのエネルギーを評価する手段と、
複数の周波数において、前記一の時間フレームの間に捕らえられた信号の各周波数成分の大きさが、その周波数のバックグラウンドノイズのエネルギーより少なくとも第一所定量だけ大きいかどうかを決定する第一の手段と、
前記複数の周波数において、各周波数成分の大きさが、事前に指定された数の先行する時間フレームの間に受信された信号の対応する周波数成分の強さより少なくとも第二所定量だけ大きいかどうかを決定する第二の手段とを含むことを特徴とする装置。 - 請求項の範囲第15項に記載の装置であって、前記識別する手段は、
前記複数の周波数において、前記一の時間フレームの間に捕らえられた信号の各周波数成分の大きさが、その周波数のバックグラウンドノイズのエネルギーより少なくとも第一所定数倍大きいことを特徴とする装置。 - 請求の範囲第15項に記載の装置であって、前記識別する手段は、
前記複数の周波数において、前記一の時間フレームの間に捕らえられた信号の各周波数成分の大きさが、事前に指定された数の先行する時間フレームの間に捕らえられた信号の対応する周波数成分の大きさより、少なくとも第二所定数倍大きいことを特徴とする前記装置。 - 請求の範囲第15項に記載の装置であって、前記識別する手段は、
前記一の時間フレームの間に複数のトランスデューサに捕らえられた信号の間の相互相関を表す信号を識別する手段と、
前記相互相関を表す信号のそれぞれから対応するバックグラウンドノイズを差し引く減算器とを含むことを特徴とする装置。 - 請求の範囲第18項に記載の装置であって、前記音源の方向を決定する手段は、
捕らえられた音響信号から、複数のマイクロホーンの位置における前記一連の音響信号の到着時間の差を表す時間遅れを抽出する手段を含むことを特徴とする装置。 - 請求の範囲第19項に記載の方法であって、
受信された音響信号から、それぞれが値の複数の範囲の一つにある複数の潜在的時間遅れを抽出する手段と、
各範囲内にある潜在的時間遅れの数と各範囲に割り当てられた相対的重みづけとに基づいて、実際の時間遅れを選択する手段とをさらに含むことを特徴とする装置。 - 請求の範囲第20項に記載の装置であって、
比較的小さい値を有する潜在的時間遅れの範囲は、大きい値を有する潜在的時間遅れの範囲より高い相対的重みづけを割り当てられていることを特徴とする装置。 - 音源から到達する一連の音響信号を処理する、ビデオ会議に使用する装置であって、
ビデオカメラと、
複数の時間フレームの間に音響データの流れを捕らえる複数のトランスデューサと、
一の時間フレームの間に捕らえられた音響データが、前記一連の音響信号の始まりを表すかどうかを決定する手段と、
前記データが前記一連の信号の始まりを表すとき、前記一連の信号を表す受信された音響信号を識別する手段と、
前記受信された音響信号に基づいて前記音源の方向を決定する手段とを含み、
前記ビデオカメラは、前記音源の方向を決定する手段から受信された信号に応答して音源の方向に自動的に向くことを特徴とする装置。 - 請求の範囲第22項に記載の装置であって、捕らえられた音響データが前記一連の音響信号の始まりを表すかどうかを決定する手段は、
バックグラウンドノイズのエネルギーを評価する手段と、
複数の周波数において、前記一の時間フレームの間に捕らえられた信号の各周波数成分の大きさが、その周波数のバックグラウンドノイズのエネルギーより少なくとも第一所定量だけ大きいかどうかを決定する第一手段と、
複数の周波数において、各その周波数成分の大きさが、事前に指定された数の先行する時間フレームの間に捕らえられた信号の対応する周波数成分より、少なくとも第二所定量だけ大きいかどうかを決定する第二手段とを含むことを特徴とする装置。 - 請求の範囲第22項に記載の装置であって、
第一のトランスデューサは第二のトランスデューサから第一軸に沿った位置に置かれ、第三のトランスデューサは第二のトランスデューサから第一軸に直角な第二軸に沿った位置に置かれ、
第一と第二のトランスデューサにより捕らえられた音響データは、第一軸に対する音源の方向を決定するために使用され、第二と第三のトランスデューサにより捕らえられた音響データは、第二軸に対する音源の方向を決定するために使用され、
ビデオカメラは、前記音源の方向を決定する手段から受信された信号に応答して音源の方向へ自動的にパンおよびチルトすることを特徴とする装置。 - 請求の範囲第22項に記載の装置であって、
第一、第二、第三のトランスデューサは第一軸に沿って置かれ、前記第二のトランスデューサは前記第一と第二のトランスデューサの間に位置し、第四のトランスデューサは前記第二のトランスデューサから前記第一軸に直角な第二軸に沿った位置に置かれ、
前記第一と第三のトランスデューサにより捕らえられた音響データは、第一軸に対する音源の方向を決定するために使用され、前記第二と第四のトランスデューサにより捕らえられた音響データは、第二軸に対する音源の方向を決定するために使用され、
ビデオカメラは、前記音源の方向を決定する手段から受信した信号に応答して音源の方向へ自動的にパンおよびチルトすることを特徴とする装置。 - 請求の範囲第25項に記載の装置であって、
四つのトランスデューサのうち三つにより捕らえられた音響データが音源の位置を決定するために使用される、音源の位置を決定する手段をさらに含み、
前記カメラは、音源の位置を決定する手段から受信した信号に応答して音源を画面に収めるように、自動的にズームすることを特徴とする装置。 - ビデオ会議に使用されるビデオカメラを操作する方法であって、
前記ビデオカメラにより捕らえられたビデオデータに対応する画像を表示し、
複数の時間フレームの間に、音源からの一連の音響信号を含む音響データの流れを捕らえ、
捕らえられた音響データの流れに基づいて前記音源の方向を決定し、
前記決定するステップに応答して、ビデオカメラをチルトまたはパンすることによりカメラを自動的に向け、
ビデオカメラがチルトまたはパンしている間に、ディスプレイに表示された画像を固定するステップを含むことを特徴とする方法。 - 請求の範囲第27項に記載の方法であって、前記固定するステップは、ディスプレイに現れる画像を、ビデオカメラをパンまたはチルトする直前に発生するビデオフレームに固定するステップを含むことを特徴とする方法。
- ビデオ会議に使用される、少なくとも第一および第二のビデオカメラを含むシステムを操作する方法であって、
第一のビデオカメラにより捕らえられたビデオデータに対応する画像をディスプレイに表示し、
複数の時間フレームの間に、音源からの一連の音響信号を含む音響データの流れを捕らえ、
一の時間フレームの間に捕らえられた音響データが、前記一連の音響信号の始まりを表すかどうかを決定し、
前記データが前記一連の信号の始まりを表すとき、前記一連の信号を表す受信された音響信号を識別し、
前記受信された音響信号に基づき前記音源の方向を決定し、
前記方向の決定に応答して前記ビデオカメラをチルトまたはパンすることにより、第一のビデオカメラを自動的に向け、
第一のビデオカメラがチルトまたはパンしている間、前記第二のビデオカメラにより捕らえられたビデオデータに対応する画像をディスプレイに表示することを含むことを特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/663,670 | 1996-06-14 | ||
US08/663,670 US5778082A (en) | 1996-06-14 | 1996-06-14 | Method and apparatus for localization of an acoustic source |
PCT/US1997/007850 WO1997048252A1 (en) | 1996-06-14 | 1997-05-08 | Method and apparatus for localization of an acoustic source |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2000512108A JP2000512108A (ja) | 2000-09-12 |
JP2000512108A5 JP2000512108A5 (ja) | 2005-02-10 |
JP3672320B2 true JP3672320B2 (ja) | 2005-07-20 |
Family
ID=24662821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50158998A Expired - Fee Related JP3672320B2 (ja) | 1996-06-14 | 1997-05-08 | 音源位置づけ方法と装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US5778082A (ja) |
EP (1) | EP0903055B1 (ja) |
JP (1) | JP3672320B2 (ja) |
CA (1) | CA2257444C (ja) |
DE (1) | DE69738195T2 (ja) |
WO (1) | WO1997048252A1 (ja) |
Families Citing this family (152)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5959667A (en) * | 1996-05-09 | 1999-09-28 | Vtel Corporation | Voice activated camera preset selection system and method of operation |
JP3541339B2 (ja) * | 1997-06-26 | 2004-07-07 | 富士通株式会社 | マイクロホンアレイ装置 |
US5900907A (en) * | 1997-10-17 | 1999-05-04 | Polycom, Inc. | Integrated videoconferencing unit |
JP3157769B2 (ja) * | 1998-03-02 | 2001-04-16 | 静岡日本電気株式会社 | Tv音声制御装置 |
US6593956B1 (en) * | 1998-05-15 | 2003-07-15 | Polycom, Inc. | Locating an audio source |
IT1306261B1 (it) * | 1998-07-03 | 2001-06-04 | Antonio Messina | Procedimento ed apparato per la guida automatica di videocameremediante microfoni. |
GB2342802B (en) * | 1998-10-14 | 2003-04-16 | Picturetel Corp | Method and apparatus for indexing conference content |
US6469732B1 (en) | 1998-11-06 | 2002-10-22 | Vtel Corporation | Acoustic source location using a microphone array |
US6618073B1 (en) * | 1998-11-06 | 2003-09-09 | Vtel Corporation | Apparatus and method for avoiding invalid camera positioning in a video conference |
EP1062839B1 (en) * | 1998-11-11 | 2011-05-25 | Koninklijke Philips Electronics N.V. | Improved signal localization arrangement |
DE19854373B4 (de) * | 1998-11-25 | 2005-02-24 | Robert Bosch Gmbh | Verfahren zur Steuerung der Empfindlichkeit eines Mikrofons |
US6504926B1 (en) | 1998-12-15 | 2003-01-07 | Mediaring.Com Ltd. | User control system for internet phone quality |
US6408327B1 (en) * | 1998-12-22 | 2002-06-18 | Nortel Networks Limited | Synthetic stereo conferencing over LAN/WAN |
US6185152B1 (en) | 1998-12-23 | 2001-02-06 | Intel Corporation | Spatial sound steering system |
US6321194B1 (en) | 1999-04-27 | 2001-11-20 | Brooktrout Technology, Inc. | Voice detection in audio signals |
US6405163B1 (en) * | 1999-09-27 | 2002-06-11 | Creative Technology Ltd. | Process for removing voice from stereo recordings |
US6243322B1 (en) | 1999-11-05 | 2001-06-05 | Wavemakers Research, Inc. | Method for estimating the distance of an acoustic signal |
DE19963102A1 (de) * | 1999-12-24 | 2001-06-28 | Thomson Brandt Gmbh | Bildfernsprechvorrichtung |
EP1226578A4 (en) * | 1999-12-31 | 2005-09-21 | Octiv Inc | TECHNIQUES TO IMPROVE THE CLARITY AND UNDERSTANDING OF AUDIO-REDUCED AUDIO SIGNALS IN A DIGITAL NETWORK |
US20020031234A1 (en) * | 2000-06-28 | 2002-03-14 | Wenger Matthew P. | Microphone system for in-car audio pickup |
US20020075965A1 (en) * | 2000-12-20 | 2002-06-20 | Octiv, Inc. | Digital signal processing techniques for improving audio clarity and intelligibility |
US7039198B2 (en) * | 2000-11-10 | 2006-05-02 | Quindi | Acoustic source localization system and method |
US20030023429A1 (en) * | 2000-12-20 | 2003-01-30 | Octiv, Inc. | Digital signal processing techniques for improving audio clarity and intelligibility |
GB2375698A (en) | 2001-02-07 | 2002-11-20 | Canon Kk | Audio signal processing apparatus |
US20020140804A1 (en) * | 2001-03-30 | 2002-10-03 | Koninklijke Philips Electronics N.V. | Method and apparatus for audio/image speaker detection and locator |
DE10119266A1 (de) * | 2001-04-20 | 2002-10-31 | Infineon Technologies Ag | Programmgesteuerte Einheit |
US7236929B2 (en) * | 2001-05-09 | 2007-06-26 | Plantronics, Inc. | Echo suppression and speech detection techniques for telephony applications |
JP3771812B2 (ja) * | 2001-05-28 | 2006-04-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ロボットおよびその制御方法 |
US6937266B2 (en) * | 2001-06-14 | 2005-08-30 | Microsoft Corporation | Automated online broadcasting system and method using an omni-directional camera system for viewing meetings over a computer network |
GB0120450D0 (en) * | 2001-08-22 | 2001-10-17 | Mitel Knowledge Corp | Robust talker localization in reverberant environment |
US6801632B2 (en) | 2001-10-10 | 2004-10-05 | Knowles Electronics, Llc | Microphone assembly for vehicular installation |
US20030072456A1 (en) * | 2001-10-17 | 2003-04-17 | David Graumann | Acoustic source localization by phase signature |
US6980485B2 (en) * | 2001-10-25 | 2005-12-27 | Polycom, Inc. | Automatic camera tracking using beamforming |
US6795794B2 (en) * | 2002-03-01 | 2004-09-21 | The Board Of Trustees Of The University Of Illinois | Method for determination of spatial target probability using a model of multisensory processing by the brain |
US20040114772A1 (en) * | 2002-03-21 | 2004-06-17 | David Zlotnick | Method and system for transmitting and/or receiving audio signals with a desired direction |
US6912178B2 (en) * | 2002-04-15 | 2005-06-28 | Polycom, Inc. | System and method for computing a location of an acoustic source |
US7146014B2 (en) * | 2002-06-11 | 2006-12-05 | Intel Corporation | MEMS directional sensor system |
US6940540B2 (en) * | 2002-06-27 | 2005-09-06 | Microsoft Corporation | Speaker detection and tracking using audiovisual data |
US7444068B2 (en) * | 2002-06-28 | 2008-10-28 | Hewlett-Packard Development Company, L.P. | System and method of manual indexing of image data |
JP3910898B2 (ja) * | 2002-09-17 | 2007-04-25 | 株式会社東芝 | 指向性設定装置、指向性設定方法及び指向性設定プログラム |
US7433462B2 (en) * | 2002-10-31 | 2008-10-07 | Plantronics, Inc | Techniques for improving telephone audio quality |
KR101014404B1 (ko) * | 2002-11-15 | 2011-02-15 | 소니 주식회사 | 오디오신호의 처리방법 및 처리장치 |
US7606372B2 (en) * | 2003-02-12 | 2009-10-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Device and method for determining a reproduction position |
DE10305820B4 (de) * | 2003-02-12 | 2006-06-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Bestimmen einer Wiedergabeposition |
FI118247B (fi) * | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
NO318096B1 (no) * | 2003-05-08 | 2005-01-31 | Tandberg Telecom As | Arrangement og fremgangsmate for lokalisering av lydkilde |
US7035757B2 (en) * | 2003-05-09 | 2006-04-25 | Intel Corporation | Three-dimensional position calibration of audio sensors and actuators on a distributed computing platform |
KR100906136B1 (ko) * | 2003-12-12 | 2009-07-07 | 닛본 덴끼 가부시끼가이샤 | 정보 처리용 로봇 |
GB0405455D0 (en) * | 2004-03-11 | 2004-04-21 | Mitel Networks Corp | High precision beamsteerer based on fixed beamforming approach beampatterns |
US7126816B2 (en) * | 2004-03-12 | 2006-10-24 | Apple Computer, Inc. | Camera latch |
US8275147B2 (en) * | 2004-05-05 | 2012-09-25 | Deka Products Limited Partnership | Selective shaping of communication signals |
US7522736B2 (en) * | 2004-05-07 | 2009-04-21 | Fuji Xerox Co., Ltd. | Systems and methods for microphone localization |
US20050286443A1 (en) * | 2004-06-29 | 2005-12-29 | Octiv, Inc. | Conferencing system |
US20050285935A1 (en) * | 2004-06-29 | 2005-12-29 | Octiv, Inc. | Personal conferencing node |
US7623156B2 (en) * | 2004-07-16 | 2009-11-24 | Polycom, Inc. | Natural pan tilt zoom camera motion to preset camera positions |
US7826624B2 (en) * | 2004-10-15 | 2010-11-02 | Lifesize Communications, Inc. | Speakerphone self calibration and beam forming |
US7720232B2 (en) * | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Speakerphone |
US7970151B2 (en) * | 2004-10-15 | 2011-06-28 | Lifesize Communications, Inc. | Hybrid beamforming |
US7760887B2 (en) * | 2004-10-15 | 2010-07-20 | Lifesize Communications, Inc. | Updating modeling information based on online data gathering |
US7903137B2 (en) * | 2004-10-15 | 2011-03-08 | Lifesize Communications, Inc. | Videoconferencing echo cancellers |
US7720236B2 (en) * | 2004-10-15 | 2010-05-18 | Lifesize Communications, Inc. | Updating modeling information based on offline calibration experiments |
US20060132595A1 (en) * | 2004-10-15 | 2006-06-22 | Kenoyer Michael L | Speakerphone supporting video and audio features |
US8116500B2 (en) * | 2004-10-15 | 2012-02-14 | Lifesize Communications, Inc. | Microphone orientation and size in a speakerphone |
US7817805B1 (en) | 2005-01-12 | 2010-10-19 | Motion Computing, Inc. | System and method for steering the directional response of a microphone to a moving acoustic source |
US7995768B2 (en) * | 2005-01-27 | 2011-08-09 | Yamaha Corporation | Sound reinforcement system |
EP1705911A1 (en) * | 2005-03-24 | 2006-09-27 | Alcatel | Video conference system |
US7646876B2 (en) * | 2005-03-30 | 2010-01-12 | Polycom, Inc. | System and method for stereo operation of microphones for video conferencing system |
US7593539B2 (en) * | 2005-04-29 | 2009-09-22 | Lifesize Communications, Inc. | Microphone and speaker arrangement in speakerphone |
US7991167B2 (en) * | 2005-04-29 | 2011-08-02 | Lifesize Communications, Inc. | Forming beams with nulls directed at noise sources |
US7970150B2 (en) * | 2005-04-29 | 2011-06-28 | Lifesize Communications, Inc. | Tracking talkers using virtual broadside scan and directed beams |
JP2007019907A (ja) | 2005-07-08 | 2007-01-25 | Yamaha Corp | 音声伝達システム、および通信会議装置 |
EP1971183A1 (en) * | 2005-11-15 | 2008-09-17 | Yamaha Corporation | Teleconference device and sound emission/collection device |
US7864210B2 (en) * | 2005-11-18 | 2011-01-04 | International Business Machines Corporation | System and methods for video conferencing |
US8130977B2 (en) * | 2005-12-27 | 2012-03-06 | Polycom, Inc. | Cluster of first-order microphones and method of operation for stereo input of videoconferencing system |
US8072481B1 (en) * | 2006-03-18 | 2011-12-06 | Videotronic Systems | Telepresence communication system |
JP4816221B2 (ja) * | 2006-04-21 | 2011-11-16 | ヤマハ株式会社 | 収音装置および音声会議装置 |
US8024189B2 (en) | 2006-06-22 | 2011-09-20 | Microsoft Corporation | Identification of people using multiple types of input |
AU2007221976B2 (en) | 2006-10-19 | 2009-12-24 | Polycom, Inc. | Ultrasonic camera tracking system and associated methods |
US20080101624A1 (en) * | 2006-10-24 | 2008-05-01 | Motorola, Inc. | Speaker directionality for user interface enhancement |
JP4177452B2 (ja) * | 2006-11-09 | 2008-11-05 | 松下電器産業株式会社 | 音源位置検知装置 |
US8289363B2 (en) | 2006-12-28 | 2012-10-16 | Mark Buckler | Video conferencing |
NO328582B1 (no) * | 2006-12-29 | 2010-03-22 | Tandberg Telecom As | Mikrofon for lydkildesporing |
JP4403429B2 (ja) * | 2007-03-08 | 2010-01-27 | ソニー株式会社 | 信号処理装置、信号処理方法、プログラム |
TWI327230B (en) * | 2007-04-03 | 2010-07-11 | Ind Tech Res Inst | Sound source localization system and sound soure localization method |
CN100505837C (zh) * | 2007-05-10 | 2009-06-24 | 华为技术有限公司 | 一种控制图像采集装置进行目标定位的系统及方法 |
CN101690149B (zh) * | 2007-05-22 | 2012-12-12 | 艾利森电话股份有限公司 | 用于群组声音远程通信的方法和装置 |
US8767975B2 (en) * | 2007-06-21 | 2014-07-01 | Bose Corporation | Sound discrimination method and apparatus |
NO327899B1 (no) * | 2007-07-13 | 2009-10-19 | Tandberg Telecom As | Fremgangsmate og system for automatisk kamerakontroll |
US8611554B2 (en) * | 2008-04-22 | 2013-12-17 | Bose Corporation | Hearing assistance apparatus |
US20100008515A1 (en) * | 2008-07-10 | 2010-01-14 | David Robert Fulton | Multiple acoustic threat assessment system |
ATE556329T1 (de) * | 2008-08-26 | 2012-05-15 | Nuance Communications Inc | Verfahren und vorrichtung zum lokalisieren einer schallquelle |
CN101350931B (zh) * | 2008-08-27 | 2011-09-14 | 华为终端有限公司 | 音频信号的生成、播放方法及装置、处理系统 |
US20100123785A1 (en) * | 2008-11-17 | 2010-05-20 | Apple Inc. | Graphic Control for Directional Audio Input |
TWI402531B (zh) * | 2009-06-29 | 2013-07-21 | Univ Nat Cheng Kung | 音源辨位方法與應用此音源辨位方法之音源辨位系統和電腦程式產品 |
TWI417563B (zh) * | 2009-11-20 | 2013-12-01 | Univ Nat Cheng Kung | 遠距離音源定位晶片裝置及其方法 |
TWI396862B (zh) * | 2009-12-04 | 2013-05-21 | Teco Elec & Machinery Co Ltd | 聲源定位系統、方法及電腦可讀取儲存媒體 |
US8842161B2 (en) | 2010-05-18 | 2014-09-23 | Polycom, Inc. | Videoconferencing system having adjunct camera for auto-framing and tracking |
US8248448B2 (en) | 2010-05-18 | 2012-08-21 | Polycom, Inc. | Automatic camera framing for videoconferencing |
US9723260B2 (en) | 2010-05-18 | 2017-08-01 | Polycom, Inc. | Voice tracking camera with speaker identification |
US8395653B2 (en) | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
DE102010026381A1 (de) * | 2010-07-07 | 2012-01-12 | Siemens Medical Instruments Pte. Ltd. | Verfahren zum Lokalisieren einer Audioquelle und mehrkanaliges Hörsystem |
TW201208335A (en) * | 2010-08-10 | 2012-02-16 | Hon Hai Prec Ind Co Ltd | Electronic device |
CN103229160A (zh) * | 2010-10-07 | 2013-07-31 | 孔塞尔特松尼奇有限公司 | 用于增强声音的方法和系统 |
US9078077B2 (en) | 2010-10-21 | 2015-07-07 | Bose Corporation | Estimation of synthetic audio prototypes with frequency-based input signal decomposition |
EP2448265A1 (en) | 2010-10-26 | 2012-05-02 | Google, Inc. | Lip synchronization in a video conference |
JP5516455B2 (ja) * | 2011-02-23 | 2014-06-11 | トヨタ自動車株式会社 | 接近車両検出装置及び接近車両検出方法 |
US9084036B2 (en) * | 2011-05-17 | 2015-07-14 | Alcatel Lucent | Signal source localization using compressive measurements |
US9030520B2 (en) * | 2011-06-20 | 2015-05-12 | Polycom, Inc. | Automatic camera selection for videoconferencing |
US9210302B1 (en) | 2011-08-10 | 2015-12-08 | Google Inc. | System, method and apparatus for multipoint video transmission |
JP6001248B2 (ja) * | 2011-09-20 | 2016-10-05 | トヨタ自動車株式会社 | 音源検出装置 |
JP5772447B2 (ja) * | 2011-09-27 | 2015-09-02 | 富士ゼロックス株式会社 | 音声解析装置 |
JP5867066B2 (ja) * | 2011-12-26 | 2016-02-24 | 富士ゼロックス株式会社 | 音声解析装置 |
JP2013135325A (ja) * | 2011-12-26 | 2013-07-08 | Fuji Xerox Co Ltd | 音声解析装置 |
JP6031761B2 (ja) * | 2011-12-28 | 2016-11-24 | 富士ゼロックス株式会社 | 音声解析装置および音声解析システム |
JP6031767B2 (ja) * | 2012-01-23 | 2016-11-24 | 富士ゼロックス株式会社 | 音声解析装置、音声解析システムおよびプログラム |
CN102547209B (zh) * | 2012-02-06 | 2015-07-22 | 华为技术有限公司 | 视讯设备控制方法、装置及视讯系统 |
US8917309B1 (en) | 2012-03-08 | 2014-12-23 | Google, Inc. | Key frame distribution in video conferencing |
US9282405B2 (en) | 2012-04-24 | 2016-03-08 | Polycom, Inc. | Automatic microphone muting of undesired noises by microphone arrays |
US8791982B1 (en) | 2012-06-27 | 2014-07-29 | Google Inc. | Video multicast engine |
CN102819009B (zh) * | 2012-08-10 | 2014-10-01 | 香港生产力促进局 | 用于汽车的驾驶者声源定位系统及方法 |
WO2014055436A1 (en) * | 2012-10-01 | 2014-04-10 | Revolve Robotics, Inc. | Robotic stand and systems and methods for controlling the stand during videoconference |
US8957940B2 (en) | 2013-03-11 | 2015-02-17 | Cisco Technology, Inc. | Utilizing a smart camera system for immersive telepresence |
CN104981983B (zh) * | 2013-03-15 | 2021-10-26 | 英特尔公司 | 用于通过超声和无线信号的装置对装置角度检测的装置和方法 |
EP2882180A4 (en) * | 2013-09-29 | 2015-10-14 | Zte Corp | CONTROL METHOD, CONTROL APPARATUS AND CONTROL DEVICE |
US10009676B2 (en) | 2014-11-03 | 2018-06-26 | Storz Endoskop Produktions Gmbh | Voice control system with multiple microphone arrays |
US10609475B2 (en) | 2014-12-05 | 2020-03-31 | Stages Llc | Active noise control and customized audio system |
US9747367B2 (en) | 2014-12-05 | 2017-08-29 | Stages Llc | Communication system for establishing and providing preferred audio |
US9508335B2 (en) | 2014-12-05 | 2016-11-29 | Stages Pcs, Llc | Active noise control and customized audio system |
US9654868B2 (en) | 2014-12-05 | 2017-05-16 | Stages Llc | Multi-channel multi-domain source identification and tracking |
WO2016209098A1 (en) * | 2015-06-26 | 2016-12-29 | Intel Corporation | Phase response mismatch correction for multiple microphones |
US9609275B2 (en) | 2015-07-08 | 2017-03-28 | Google Inc. | Single-stream transmission method for multi-user video conferencing |
MX2018003163A (es) * | 2015-09-29 | 2018-08-15 | Swinetech Inc | Sistema de advertencia para operaciones de partos porcinos. |
US10735870B2 (en) | 2016-04-07 | 2020-08-04 | Sonova Ag | Hearing assistance system |
US10382929B2 (en) * | 2016-04-17 | 2019-08-13 | Sonular Ltd. | Communication management and communicating between a mobile communication device and another device |
US10063987B2 (en) | 2016-05-31 | 2018-08-28 | Nureva Inc. | Method, apparatus, and computer-readable media for focussing sound signals in a shared 3D space |
US10945080B2 (en) | 2016-11-18 | 2021-03-09 | Stages Llc | Audio analysis and processing system |
US9980075B1 (en) | 2016-11-18 | 2018-05-22 | Stages Llc | Audio source spatialization relative to orientation sensor and output |
US9980042B1 (en) | 2016-11-18 | 2018-05-22 | Stages Llc | Beamformer direction of arrival and orientation analysis system |
WO2019133073A1 (en) * | 2017-12-29 | 2019-07-04 | Swinetech, Inc. | Improving detection, prevention, and reaction in a warning system for animal farrowing operations |
GB2572368A (en) * | 2018-03-27 | 2019-10-02 | Nokia Technologies Oy | Spatial audio capture |
US10951859B2 (en) | 2018-05-30 | 2021-03-16 | Microsoft Technology Licensing, Llc | Videoconferencing device and method |
US11457308B2 (en) | 2018-06-07 | 2022-09-27 | Sonova Ag | Microphone device to provide audio with spatial context |
EP3711284A4 (en) * | 2018-08-17 | 2020-12-16 | SZ DJI Technology Co., Ltd. | PHOTOGRAPHIC CONTROL PROCEDURE AND CONTROL |
US10447970B1 (en) | 2018-11-26 | 2019-10-15 | Polycom, Inc. | Stereoscopic audio to visual sound stage matching in a teleconference |
EP3918813A4 (en) | 2019-01-29 | 2022-10-26 | Nureva Inc. | METHOD, APPARATUS AND COMPUTER-READABLE MEDIUM FOR CREATING AUDIO FOCUS AREAS DISSOCIATED FROM THE MICROPHONE SYSTEM FOR OPTIMIZING AUDIO EDITING AT PRECISE SPATIAL LOCATIONS IN A 3D SPACE |
US11019219B1 (en) * | 2019-11-25 | 2021-05-25 | Google Llc | Detecting and flagging acoustic problems in video conferencing |
KR20230065299A (ko) | 2020-09-11 | 2023-05-11 | 플루커 코포레이션 | 누적-시간 뷰에 의한 음향 영상화를 위한 시스템 및 방법 |
US11714157B2 (en) * | 2020-11-10 | 2023-08-01 | Amazon Technologies, Inc. | System to determine direction toward user |
US11570558B2 (en) | 2021-01-28 | 2023-01-31 | Sonova Ag | Stereo rendering systems and methods for a microphone assembly with dynamic tracking |
TWI811685B (zh) * | 2021-05-21 | 2023-08-11 | 瑞軒科技股份有限公司 | 會議室系統及音訊處理方法 |
US11681008B2 (en) | 2021-07-19 | 2023-06-20 | Toyota Motor Engineering & Manufacturing North America, Inc. | System and method for modifying signals to determine an incidence angle of an acoustic wave |
CN115015939B (zh) * | 2022-05-31 | 2024-06-21 | 湖南大学 | 一种声学感知系统及增大声学感知范围的方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3944736A (en) * | 1974-06-05 | 1976-03-16 | General Electric Company | Voice-operated switching circuit for a video communications system |
US4581758A (en) * | 1983-11-04 | 1986-04-08 | At&T Bell Laboratories | Acoustic direction identification system |
US4741038A (en) * | 1986-09-26 | 1988-04-26 | American Telephone And Telegraph Company, At&T Bell Laboratories | Sound location arrangement |
JPH0771279B2 (ja) * | 1988-08-17 | 1995-07-31 | 富士通株式会社 | テレビ会議用画像処理装置 |
US4965819A (en) * | 1988-09-22 | 1990-10-23 | Docu-Vision, Inc. | Video conferencing system for courtroom and other applications |
US5206721A (en) * | 1990-03-08 | 1993-04-27 | Fujitsu Limited | Television conference system |
US5058419A (en) * | 1990-04-10 | 1991-10-22 | Earl H. Ruble | Method and apparatus for determining the location of a sound source |
JP2630041B2 (ja) * | 1990-08-29 | 1997-07-16 | 日本電気株式会社 | テレビ会議画像表示制御方法 |
IT1257164B (it) * | 1992-10-23 | 1996-01-05 | Ist Trentino Di Cultura | Procedimento per la localizzazione di un parlatore e l'acquisizione diun messaggio vocale, e relativo sistema. |
US5335011A (en) * | 1993-01-12 | 1994-08-02 | Bell Communications Research, Inc. | Sound localization system for teleconferencing using self-steering microphone arrays |
JPH06332492A (ja) * | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
DE69428119T2 (de) * | 1993-07-07 | 2002-03-21 | Picturetel Corp | Verringerung des hintergrundrauschens zur sprachverbesserung |
CA2148631C (en) * | 1994-06-20 | 2000-06-13 | John J. Hildin | Voice-following video system |
US5737431A (en) * | 1995-03-07 | 1998-04-07 | Brown University Research Foundation | Methods and apparatus for source location estimation from microphone-array time-delay estimates |
-
1996
- 1996-06-14 US US08/663,670 patent/US5778082A/en not_active Expired - Lifetime
-
1997
- 1997-05-08 DE DE69738195T patent/DE69738195T2/de not_active Expired - Lifetime
- 1997-05-08 CA CA002257444A patent/CA2257444C/en not_active Expired - Fee Related
- 1997-05-08 WO PCT/US1997/007850 patent/WO1997048252A1/en active IP Right Grant
- 1997-05-08 EP EP97924637A patent/EP0903055B1/en not_active Expired - Lifetime
- 1997-05-08 JP JP50158998A patent/JP3672320B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0903055A4 (en) | 2000-12-13 |
JP2000512108A (ja) | 2000-09-12 |
WO1997048252A1 (en) | 1997-12-18 |
CA2257444C (en) | 2004-03-23 |
DE69738195D1 (de) | 2007-11-22 |
US5778082A (en) | 1998-07-07 |
CA2257444A1 (en) | 1997-12-18 |
DE69738195T2 (de) | 2008-07-10 |
EP0903055A1 (en) | 1999-03-24 |
EP0903055B1 (en) | 2007-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3672320B2 (ja) | 音源位置づけ方法と装置 | |
JP4872871B2 (ja) | 音源方向検出装置、音源方向検出方法及び音源方向検出カメラ | |
CA1230666A (en) | Acoustic direction identification system | |
US7903137B2 (en) | Videoconferencing echo cancellers | |
US10939202B2 (en) | Controlling the direction of a microphone array beam in a video conferencing system | |
US8403105B2 (en) | Estimating a sound source location using particle filtering | |
JP4296197B2 (ja) | 音源追跡のための配置及び方法 | |
JP6703525B2 (ja) | 音源を強調するための方法及び機器 | |
JP3537962B2 (ja) | 音声収集装置及び音声収集方法 | |
US20060280312A1 (en) | Methods and apparatus for capturing audio signals based on a visual image | |
US20080218582A1 (en) | Video conferencing | |
JP2008113431A (ja) | 超音波カメラトラッキングシステム及びそれに関連する方法 | |
JP2004528766A (ja) | 音声/画像を用いて話者を感知し位置探しする方法及び装置 | |
CN113203988B (zh) | 声源定位方法及装置 | |
WO2013009949A1 (en) | Microphone array processing system | |
CN111078185A (zh) | 录制声音的方法及设备 | |
CN111916094A (zh) | 音频信号处理方法、装置、设备及可读介质 | |
EP1705911A1 (en) | Video conference system | |
JP4458128B2 (ja) | 方向検出装置、方向検出方法および方向検出プログラム、ならびに、方向制御装置、方向制御方法および方向制御プログラム | |
JP3514714B2 (ja) | 収音方法およびその装置 | |
JP4198915B2 (ja) | 空間的音波ステアリングシステム | |
US6275252B1 (en) | Method and apparatus for improving video conferencing video capture by distance adaptive filtering | |
WO2023125537A1 (zh) | 声音信号处理方法、装置、设备及存储介质 | |
JP2008022069A (ja) | 音声収録装置および音声収録方法 | |
CN116320850A (zh) | 一种会议主讲人锁定方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040510 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040510 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040514 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20040817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050322 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050419 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080428 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090428 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100428 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100428 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110428 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120428 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130428 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |