JP2004032782A - 全方位カメラ及びマイクロフォンアレイのためのシステム - Google Patents

全方位カメラ及びマイクロフォンアレイのためのシステム Download PDF

Info

Publication number
JP2004032782A
JP2004032782A JP2003180216A JP2003180216A JP2004032782A JP 2004032782 A JP2004032782 A JP 2004032782A JP 2003180216 A JP2003180216 A JP 2003180216A JP 2003180216 A JP2003180216 A JP 2003180216A JP 2004032782 A JP2004032782 A JP 2004032782A
Authority
JP
Japan
Prior art keywords
camera
microphone array
microphone
omnidirectional
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003180216A
Other languages
English (en)
Other versions
JP4252377B2 (ja
Inventor
Ross Cutler
ロス カトラー
Anoop Gupta
アヌープ グプタ
Ivan Tashev
イワン タシェフ
Yong Rui
ヨン ルイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2004032782A publication Critical patent/JP2004032782A/ja
Application granted granted Critical
Publication of JP4252377B2 publication Critical patent/JP4252377B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/58Means for changing the camera field of view without moving the camera body, e.g. nutating or panning of optics or image sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Studio Devices (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)
  • Electrostatic, Electromagnetic, Magneto- Strictive, And Variable-Resistance Transducers (AREA)

Abstract

【課題】マイクロフォンアレイを有する全方位カメラを提供すること。
【解決手段】テレビ会議及びミーティングの記録用デバイスは、会議室テーブル上に配置される。マイクロフォンアレイ308は平面構成で、会議室テーブルからの音響反射をなくすために可能な限りデスクトップの付近に配置される。カメラ302がマイクロフォンベース306に、シリンダ304により接続される。人の声の周波数に対応する約50〜4000Hzのオーディオ周波数が、参加者からマイクロフォンベース306内のすべてのマイクロフォン308までシリンダ304中を通過する。これにより、音源定位(話者の位置)及びビーム形成(特定の方向からの音のみをフィルタリングすることによって、話者の音質を改善すること)が容易になる。
【選択図】    図3A

Description

【0001】
【発明の属する技術分野】
本発明は、全方位カメラ及びマイクロフォンアレイのためのシステムに関し、より詳細には、電子会議およびミーティングの記録のために使用することができる全方位カメラ及びマイクロフォンアレイのためのシステムに関する。
【0002】
【従来の技術】
テレビ会議システムの商業的成功は限られてきた。これは多数の要因による。通常、多数の技術的欠陥がこれらのシステムに存在する。不十分なカメラの視点および不十分な画像解像度により、ミーティング参加者が話者を見ることが困難となる。これが(特にパンチルトズームカメラを有するシステムでは)不正確な話者検出によって一層悪化され、それによりカメラを話者に向けさせないようにする。加えて、不十分なビデオ圧縮技術はしばしば結果として、不十分なビデオ画質および「不規則に変化する」画像表示を生じる。
【0003】
電子会議のために使用されるシステムのキャプチャ(capture)デバイスは、テレビ会議およびミーティングを見るために貴重であるデータの少数の主なソースに焦点を合わせる傾向がある。これらには、ビデオデータ、オーディオデータ、およびコンピュータモニタ上に表示される電子ドキュメントまたはプレゼンテーションが含まれる。ドキュメントおよびプレゼンテーションを共有するための多数のソフトウェアソリューションが存在することを考えると、改善された方法におけるオーディオおよびビデオデータの取得は特に重要である。
【0004】
【発明が解決しようとする課題】
ビデオデータを取得(capture)するための3つの異なる方法が存在する。すなわち、パン(pan)/チルト(tilt)/ズーム(PTZ)カメラ、ミラーベースの全方位カメラ、およびカメラアレイである。PTZカメラは現在最も普及している選択であるが、これらには2つの主な制限がある。第1に、これらは限定された視野を捕まえることしかできない。これらが接近しすぎるようにズームインした場合、ミーティング室の状況が失われ、これらが遠すぎるようにズームアウトした場合、人々の表情が見えなくなる。第2に、制御モータがカメラを動かすために時間がかかるので、ミーティングに対するカメラの反応(たとえば、複数の話者の間で切り替えること)が遅い。実際に、PTZカメラは大変大量にあるいは大変高速に動くことができず、そうでないと、ミーティングを見ている人々の気が非常に散らされる可能性がある。
【0005】
ミラー/プリズムベースの全方位ビジョンセンサにおけるこれらの欠点および最近の技術的進歩を考えて、研究者は、ビデオ信号が取得され、解析される方法を再考し始めている。たとえば、BeHere Corporationは360°インターネットビデオ技術をエンターテインメント、ニュースおよびスポーツのウェブキャストに提供している。そのインターフェイスにより、遠隔のユーザは、パーソナライズされた360°のカメラアングルを他の視聴者とは無関係に制御して、「その場にいる」体験を得ることができる。この手法は、限られた視野および遅いカメラの反応という、PTZカメラが直面する2つの難点を克服するが、これらのタイプのデバイスは、所与の今日の技術および市場の需要を築くには高価すぎる傾向がある。加えて、これらのミラープリズムベースの全方位カメラは、低解像度(1MPセンサでさえも)および焦点ぼけの問題を欠点として有し、この結果としてビデオ品質が低下する。
【0006】
もう1つの手法では、多数の安価なカメラまたはビデオセンサが組み立てられて、全方位カメラアレイが形成される。たとえば、1つの既知のシステムは、4台のNational Television System Committee(NTSC)カメラを使用して、ミーティング室のパノラマビューを構成する。しかし、この設計には欠点がある。第1に、NTSCカメラは比較的低品質のビデオ信号を提供する。加えて、4台のカメラは、信号の解析、送信または記録ができるようになる前に信号をデジタル化するために、4つのビデオキャプチャボードを必要とする。4つのビデオキャプチャボードを必要とすることにより、このようなシステムのコストおよび複雑性が増し、製造および維持がより困難となる。
【0007】
上述したようなビデオキャプチャに関する問題のほかに、高品質のオーディオをミーティング室で取得することもまた困難である。オーディオキャプチャシステムは、様々な雑音および反響音を除去する必要がある。またこのシステムは、異なるレベルの入力信号についてのゲインも調節しなければならない。一般に、これらの要件に対処するための3つの手法がある。最も単純な手法は、至近距離のマイクロフォンを使用する(たとえば、ヘッドセットを介する)ことであるが、これはユーザ/話者にとって煩わしく、じゃまである。第2の手法は、マイクロフォンをミーティング室のテーブルに上に配置することである。これにより多数の音響経路が防止され、これは現在、ミーティングの音声を記録するための最も一般的な手法である。これらのシステムはいくつかの(通常は3つの)ハイパーカーディオイドマイクロフォンを使用して、全方位の特性を提供する。第3の手法は、デスクトップ電子会議システムにおいて提供される。この手法では、単方向マイクロフォンがPTZカメラの最上部に取り付けられ、これが話者を指す。カメラ/マイクロフォンのグループがコンピュータによって制御され、これは別々のグループのマイクロフォンを使用して音源定位を実行する。しかし、この手法には2つの別々のマイクロフォンのセットが必要である。
【0008】
本発明は、このような問題に鑑みてなされたもので、その目的とするところは、テレビ会議及びミーティング記録システムにおける上述したような問題を克服するようにした全方位カメラ及びマイクロフォンアレイのためのシステムを提供することにある。
【0009】
【課題を解決するための手段】
本発明は、人の発話の周波数範囲(50〜4000Hz)について音響的に無反射(acoustically invisible)であるように十分薄く、かつカメラアレイをマイクロフォンアレイに接続する円筒形ロッドからなり、その結果として、音の回折(sound diffraction)および投影(shadowing)が解消されるものである。
【0010】
統合カメラおよびマイクロフォンアレイは360度カメラを使用し、これはテレビ会議に伴う前述の各問題を解決するように設計される。360度カメラを会議用テーブルの中央に配置することができ、これにより、通常のテレビ会議システム(カメラが部屋の一端にある)と比較して、参加者の優れたカメラ視点が与えられる。カメラがテーブルから高められて、ミーティング参加者のほぼ正面の視点が提供される。加えて、統合カメラおよびマイクロフォンアレイは、遠隔の視聴者がミーティング参加者から表情を見るために十分な解像度を提供する(たとえば、1つの実行の実施形態では、3000×480の解像度を有する)。カメラを、カメラアレイ、または、双曲面ミラーを有する単一のビデオセンサを使用する、いかなる全方位タイプにすることもできる。
【0011】
マイクロフォンアレイは平面構成である。マイクロフォンは、好ましくはマイクロフォンアレイベース内に取り付けられ、テーブルからの音響反射をなくすために、可能な限りデスクトップの付近に位置することが好ましい。上述したように、カメラがマイクロフォンアレイベースに、薄い円筒形ロッドにより接続され、これは、人の声の周波数範囲(すなわち、約50〜4000Hz)についてマイクロフォンアレイに対して音響的に無反射である。これにより、話者からアレイ内のすべてのマイクロフォンへの直接パスが提供され、これが音源定位(話者の位置を決定すること)およびビーム形成(話者の方向から来るのではない音をフィルタリングして除くことによって、話者の音質を改善すること)のために優れるようになる。統合マイクロフォンアレイは、リアルタイムの音源定位を実行するために使用され、カメラアレイは、コンピュータビジョンベースの人物検出および追跡と共に使用されて、話者が画像内で位置する場所が正確に検出される。オーディオおよびビデオベースの話者検出を、自動カメラ管理、ならびに、大幅に改良されたビデオ圧縮(たとえば、背景よりも顔の領域により多くのビットを使用することによる)のために使用することができる。
【0012】
統合カメラおよびマイクロフォンアレイの出力がPCに接続されることが好ましく、ここで、画像スティッチング(image Stitching)および圧縮、音源定位、ビーム形成およびカメラ管理などのアプリケーションを行うことができる。
【0013】
統合カメラおよびマイクロフォンアレイの一実施形態は、1394バスを使用してビデオをPCに転送し、アナログケーブルを使用してオーディオをパーソナルコンピュータ(PC)に転送する。優れたビデオ品質を提供し、単一の1394カードのみを必要とする、5台のIEEE 1394カメラが、この実施形態で使用される。他の実施形態は、単一のプリント回路基板を(PCB)をすべてのカメラおよびマイクロフォンについて使用し、すべてのオーディオおよびビデオが単一の1394ケーブルを介して送信されるようにする。1394ケーブルはまた電力も提供し、そのため単一のケーブルのみがカメラとPCの間で必要とされる。
【0014】
使用されるマイクロフォンを全方位にも単方向にもすることができるが、全方位が好ましく、これは、全方位がすべての関心のある音の角度について一様の反応を与えるからである。必要とされるマイクロフォンの最低数は3つであるが、本発明の好ましい実施形態は、音源定位の精度を高め、ビーム形成をよりよくし、オーディオシステム全体のロバスト性のために8つを使用する。マイクロフォンが丸い平面のマイクロフォンベースの円周の周囲の円に等辺に配置されることが好ましいが、他の構成も可能である。使用されるマイクロフォンが多いほど、全方向のオーディオ範囲および信号対雑音比がよりよくなる。しかし、マイクロフォンをより多数にするコストおよび複雑性は、トレードオフである。加えて、多数のマイクロフォンでは、オーディオ信号の処理がより複雑になる。テーブルの雑音を減らすため、マイクロフォンをラバーケース内に取り付けることができ、遮音性がマイクロフォンの下に配置される。
【0015】
カメラはレンズシールドを使用することができ、これは通常の動作モードで上がり、プライバシーモードで下がる。他の方法として、カメラセンサ用のシャッタをオフにすることができ、あるいは、カメラを電気的に絶縁させて、プライバシーモードの間にカメラをオフにすることができる。マイクロフォンはまた、プライバシーモードが呼び出されるとき、オフにされることも好ましい。記録中に、カメラのライトはオンであり、ユーザにカメラがアクティブであることを知らせる。カメラがプライバシーモードであるとき、ライトがオフにされる。
【0016】
統合全方位カメラおよびマイクロフォン設計の様々な他の実施形態が可能である。これは部分的には、システムのモジュラー性による。たとえば、一実施形態では、360度のカメラ範囲を達成するために多数のビデオセンサを使用する全方位カメラが使用される。他の方法として、本発明のもう1つの実施形態では、1つのビデオセンサ、および、パノラマ範囲を達成するために360度からの光をキャプチャする双曲面レンズを使用する、全方位カメラが使用される。さらに、これらのカメラのセットアップのいずれをもそれら自体で使用し、音響的に無反射(accoustically transparent)な円筒形ロッド上で高めて、ミーティング参加者の正面のビューを提供することができる。または、これらを前述のマイクロフォンアレイと統合させることができる。他の方法として、他のカメラ設計も、円筒形ロッドと共に使用することができる。カメラおよびマイクロフォンアレイを接続するロッドはまた、この(50〜4000)Hz範囲内で音を回折しないために十分薄い限り、円筒形である必要もない。
【0017】
同様に、上述したように、一実施形態では、マイクロフォンアレイは、円の円周の周囲に等辺の距離で、かつ、テーブルからの音響反射を最小限にして室内のいずれかの話者へのクリアパスを達成するために可能な限りテーブル表面の付近に、配置された複数のマイクロフォンからなる。しかし、音響的に無反射なロッドを使用して全方位カメラのセットアップに統合することができる、他のマイクロフォン構成が可能である。加えて、上述した全方位マイクロフォンアレイを、いかなるカメラもなしに使用して、最適な360度の音声範囲を達成することができる。この範囲は特に音源定位およびビーム形成に有用であり、これはマルチパス問題が最小限にされるか、あるいは解消されるからである。
【0018】
本発明のカメラおよびマイクロフォンアレイを使用する一実施形態は、コンピュータを使用して、画像データおよびオーディオ信号を最適化する。カメラのデジタル画像出力およびマイクロフォンアレイのオーディオ出力(アナログ−デジタルコンバータを介する)がコンピュータに経路指定される。コンピュータは様々な機能を実行して、画像およびオーディオ入力を拡張かつ利用する。たとえば、パノラマ画像フィルタは、全方位カメラにおける様々なセンサによって取られる画像を共に繋ぎ合わせる(stitch)。加えて、画像データを圧縮して、ネットワーク(インターネットなど)を介した放送のためにより互換性を有するようにすることができ、あるいはコンピュータ読み取り可能な記憶媒体に保存することができ、これは好ましくは、送信かつ/または記録されるビデオおよびオーディオ出力を分割するスプリッタを介して行われる。オプショナルで、画像データをまた人物検出器/追跡器に入力して、カメラ管理を改善することもできる。たとえば、話者を含む画像/ビデオの部分を識別し、これをオーディオ信号に関連付けて、テレビ会議において見られるカメラのビューを、話者が話すときにその方向に向けることができるようにすることができる。加えて、話者の位置を使用してビデオ圧縮を改善することができ、これは、背景よりも顔の領域についてより大きい解像度を可能にすることによって行う。
【0019】
オーディオ入力をまた様々な目的に使用することもできる。たとえば、オーディオを音源定位のために使用して、オーディオをいかなる所与のときにも話者の方向に合わせて最適化できるようにすることができる。加えて、ビーム形成モジュールをコンピュータにおいて使用して、オーディオのビーム形状を改良し、それにより所与の方向からのオーディオのフィルタリングを改善することができる。雑音低減および自動ゲイン制御モジュールを使用して信号対雑音比を改善することもでき、これは部屋の背景雑音に対して話者からのオーディオ信号をよりよくキャプチャするために、雑音を低減し、ゲインを調節することによって行う。これらの各画像およびオーディオ処理モジュールを単独で、あるいは組み合わせて使用することができ、あるいはまったく使用しないことができる。
【0020】
ビデオおよびオーディオ信号は、拡張されてもされなくても、別のテレビ会議の現場またはインターネットに放送することができる。これらをまた、後に見るためにコンピュータ読み取り可能な記憶媒体に保存することもできる。
【0021】
上述した統合カメラおよびマイクロフォンアレイについての主な応用例は、テレビ会議およびミーティングの記録である。マイクロフォンアレイを全方位カメラと統合することによって、必要とされるビデオおよびオーディオの間の較正が大幅に簡素化され(精密に製造されたカメラおよびマイクロフォンアレイでは較正の必要がない)、オーディオおよびビデオ情報を会議室から単一のデバイスにより収集することが達成される。
【0022】
【発明の実施の形態】
[1.0 例示的オペレーティング環境]
以下に示す本発明の好ましい実施形態の説明では、本明細書の一部を形成する添付の図面を参照し、本発明を実施することができる特定の実施形態を示す。他の実施形態を利用することができ、本発明の技術的範囲から逸脱することなく構造上の変更を行うことができることはもちろんである。
【0023】
図1は、本発明を実施することができる適切なコンピューティングシステム環境の一実施例を示す図である。このコンピューティングシステム環境100は、適切なコンピューティング環境の一実施例でしかなく、本発明の用途または機能性の範囲についてのいかなる限定も示唆するものではない。コンピューティング環境100は、例示的オペレーティング環境100に例示したコンポーネントのいずれか1つまたはその組合せに関係するいかなる依存性も要件も有するように解釈されるべきではない。
【0024】
本発明は、多数の他の汎用または専用コンピューティングシステム環境または構成により実施可能である。本発明と共に使用するために適切である可能性のある周知のコンピューティングシステム、環境および/または構成の例には、それだけに限定されないが、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサベースのシステム、セットトップボックス、プログラマブルなコンシューマエレクトロニクス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたはデバイスのいずれかを含む分散コンピューティング環境などが含まれる。
【0025】
本発明は、プログラムモジュールなど、コンピュータによって実行されるコンピュータ実行可能命令に関連して説明することができる。一般に、プログラムモジュールには、特定のタスクを実行するか、あるいは特定の抽象データ型を実施するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。本発明をまた分散コンピューティング環境において実施することもでき、ここではタスクが、通信ネットワークを通じてリンクされる複数のリモート処理デバイスによって実行される。分散コンピュータ環境では、プログラムモジュールは、メモリデバイスを含む、ローカルおよびリモートのコンピュータ記憶媒体に位置することができる。
【0026】
図1を参照すると、本発明を実施するための例示的システムは、コンピュータ110の形式における汎用コンピューティングデバイスを含む。コンピュータ110のコンポーネントは、それだけに限定されないが、処理装置120、システムメモリ130、および、システムメモリを含む様々なシステムコンポーネントを処理装置120に結合するシステムバス121を含むことができる。システムバス121は、いくつかのタイプのバス構造のいずれかにすることができ、これには、様々なバスアーキテクチャのいずれかを使用するメモリバスまたはメモリコントローラ、周辺バスおよびローカルバスが含まれる。例として、限定ではなく、このようなアーキテクチャには、業界標準アーキテクチャ(ISA)バス、マイクロチャネルアーキテクチャ(MCA)バス、拡張ISA(EISA)バス、Video Electronics Standards Association(VESA)ローカルバス、およびメザニンバスとしても知られる周辺装置相互接続(PCI)バスが含まれる。
【0027】
コンピュータ110は通常、様々なコンピュータ可読媒体を含む。コンピュータ読み取り可能な記憶媒体は、コンピュータ110によってアクセスすることができるいかなる使用可能な媒体にすることもでき、これには、揮発性および不揮発性媒体、リムーバブルおよび非リムーバブル媒体が含まれる。例として、限定ではなく、コンピュータ読み取り可能な記憶媒体は、コンピュータ記憶媒体および通信媒体を含むことができる。コンピュータ記憶媒体は、揮発性および不揮発性、リムーバブルおよび非リムーバブルの媒体を含み、これらはコンピュータ可読命令、データ構造、プログラムモジュールまたは他のデータなど、情報の格納のためのいずれかの方法または技術において実施される。コンピュータ記憶媒体には、それだけに限定されないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶、磁気カセット、磁気テープ、磁気ディスク記憶または他の磁気記憶デバイス、または、所望の情報を格納するために使用することができ、コンピュータ110によってアクセスすることができる他のいずれかの媒体が含まれる。通信媒体は通常、コンピュータ可読命令、データ構造、プログラムモジュール、または、搬送波または他の移送メカニズムなどの変調データ信号における他のデータを実施し、いずれかの情報配信媒体を含む。「変調データ信号」という用語は、信号における情報を符号化するような方法でその特性の1つまたは複数が設定あるいは変更されている信号を意味する。例として、限定ではなく、通信媒体には、ワイヤードネットワークまたはダイレクトワイヤード接続などのワイヤード媒体、および、音響、RF、赤外線および他のワイヤレス媒体などのワイヤレス媒体が含まれる。上記のいずれの組合せも、コンピュータ読み取り可能な記憶媒体の範囲内に含まれるべきである。
【0028】
システムメモリ130は、揮発性および/または不揮発性メモリの形式におけるコンピュータ記憶媒体を含み、これは読み取り専用メモリ(ROM)131およびランダムアクセスメモリ(RAM)132などである。基本入出力システム133(BIOS)は、起動中など、コンピュータ110内の複数の要素の間で情報を転送する助けとなる基本ルーチンを含み、通常はROM131に格納される。RAM132は通常、処理装置120によって即時アクセス可能および/または現在動作中であるデータおよび/またはプログラムモジュールを含む。例として、限定ではなく、図1は、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136およびプログラムデータ137を例示する。
【0029】
コンピュータ110はまた、他のリムーバブル/非リムーバブル、揮発性/不揮発性のコンピュータ記憶媒体も含むことができる。例としてのみ、図1は、非リムーバブル、不揮発性の磁気媒体に対する読み書きを行うハードディスクドライブ141、リムーバブル、不揮発性磁気ディスク152に対する読み書きを行う磁気ディスクドライブ151、および、CD−ROMまたは他の光媒体など、リムーバブル、不揮発性の光ディスク156に対する読み書きを行う光ディスクドライブ155を例示する。例示的オペレーティング環境で使用することができる他のリムーバブル/非リムーバブル、揮発性/不揮発性のコンピュータ記憶媒体には、それだけに限定されないが、磁気テープカセット、フラッシュメモリカード、デジタル多用途ディスク、デジタルビデオテープ、ソリッドステートRAM、ソリッドステートROMなどが含まれる。ハードディスクドライブ141は通常システムバス121に、インターフェイス140などの非リムーバブルメモリインターフェイスを通じて接続され、磁気ディスクドライブ151および光ディスクドライブ155は通常システムバス121に、インターフェイス150などのリムーバブルメモリインターフェイスによって接続される。
【0030】
図1に例示したドライブおよびそれらの関連付けられたコンピュータ記憶媒体は、コンピュータ110用のコンピュータ可読命令、データ構造、プログラムモジュールおよび他のデータの記憶装置を提供する。図1では、たとえば、ハードディスクドライブ141が、オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146およびプログラムデータ147を格納するものとして例示される。これらのコンポーネントを、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136およびプログラムデータ137と同じものにも異なるものにもすることができることに留意されたい。オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146およびプログラムデータ147にはここで異なる番号が与えられて、最低でも、それらが異なるコピーであることが例示される。ユーザが、コマンドおよび情報をコンピュータ110へ、キーボード162およびポインティングデバイス161などの入力デバイスを通じて入力することができ、これは一般に、マウス、トラックボールまたはタッチパッドと呼ばれる。他の入力デバイス(図示せず)には、マイクロフォン、ジョイスティック、ゲームパッド、衛星放送受信アンテナ、スキャナなどが含まれる可能性がある。これらおよび他の入力デバイスがしばしば処理装置120へ、システムバス121に結合されるユーザ入力インターフェイス160を通じて接続されるが、これを、パラレルポート、ゲームポートまたはユニバーサルシリアルバス(USB)など、他のインターフェイスおよびバス構造によって接続することができる。モニタ191または他のタイプの表示デバイスもシステムバス121へ、ビデオインターフェイス190などのインターフェイスを介して接続される。モニタに加えて、コンピュータはまた、スピーカ197およびプリンタ196など、出力周辺インターフェイス195を通じて接続することができる他の周辺出力デバイスも含むこともできる。特に本発明に重要なものである、画像のシーケンス193をキャプチャすることができるカメラ192(デジタル/電子のスチールまたはビデオカメラ、またはフィルム/写真スキャナ)もパーソナルコンピュータ110への入力デバイスとして含めることができる。さらに、1台のみのカメラを示すが、多数のカメラをパーソナルコンピュータ110への入力デバイスとして含めることができる。1つまたは複数のカメラからの画像193がコンピュータ110に、適切なカメラインターフェイス194を介して入力される。このインターフェイス194がシステムバス121に接続され、これにより画像をRAM132、またはコンピュータ110に関連付けられた他のデータ記憶デバイスの1つに経路指定し、格納することができる。しかし、画像データをコンピュータ110へ、カメラ192を使用する必要なしに、前述のコンピュータ読み取り可能な記憶媒体のいずれからも入力することができることに留意されたい。
【0031】
コンピュータ110はネットワーク環境において、リモートコンピュータ180など、1つまたは複数のリモートコンピュータへの論理接続を使用して動作することができる。リモートコンピュータ180は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイスまたは他の共通ネットワークノードにすることができ、通常は、コンピュータ110に関連して上述した要素の多数またはすべてを含むが、メモリデバイス181のみを図1に例示した。図1に示す論理接続は、ローカルエリアネットワーク(LAN)171および広域ネットワーク(WAN)173を含むが、他のネットワークも含むことができる。このようなネットワーキング環境は、オフィス、企業全体のコンピュータネットワーク、イントラネットおよびインターネットにおいて一般的である。
【0032】
LANネットワーキング環境において使用するとき、コンピュータ110がLAN171へ、ネットワークインターフェイスまたはアダプタ170を通じて接続される。WANネットワーキング環境において使用するとき、コンピュータ110は通常、モデム172、またはインターネットなどのWAN173を介して通信を確立するための他の手段を含む。モデム172を内部または外部にすることができ、システムバス121へ、ユーザ入力インターフェイス160または他の適切なメカニズムを介して接続することができる。ネットワーク環境では、コンピュータ110に関して示したプログラムモジュールまたはその一部を、リモートメモリデバイスに格納することができる。例として、限定ではなく、図1はリモートアプリケーションプログラム185を、メモリデバイス181上に存在するものとして例示する。図示のネットワーク接続は例示的であり、通信リンクを複数のコンピュータの間で確立する他の手段を使用できる。
【0033】
以上、例示的オペレーティング環境について説明したが、この説明のセクションの残りの部分であるプログラムモジュールについて以下に説明する。
【0034】
[3.0 統合全方位カメラおよびマイクロフォンアレイ]
このセクションでは、音響的に無反射なロッドを介して接続された、統合全方位カメラおよびマイクロフォンアレイについて説明する。
【0035】
[3.1 概観]
本発明は、全方位カメラをマイクロフォンアレイと共に最適に統合する方法に関するもので、この設計の目的は、以下の通りであった。
【0036】
1.マイクロフォンアレイ設計は、話者からアレイ内のすべてのマイクロフォンへのクリアパスを提供するべきである。クリアパスが可能でない場合、使用されるいかなる音源定位およびビーム形成アルゴリズムも非常に困難となり、低下した結果を与える。
【0037】
2.マイクロフォンアレイ設計は、いかなる音源定位およびビーム形成結果も低下させるであろう表面からの音響反射を防止するために、可能な限りデスクトップまたは他の表面の付近にマイクロフォンを配置するべきである。
【0038】
3.カメラアレイが高められて、ミーティング参加者のほぼ正面のビューが提供されるべきである。カメラアレイを、目立たなくするように十分小さくするべきである。
【0039】
4.マイクロフォンアレイのジオメトリ(複数のマイクロフォンの間の位置および距離)により、オーディオ処理アルゴリズムが、作業周波数帯域内で、話者に向けられた、よいビーム形状を達成できるようにし、それにより高い音質を提供するべきである。
【0040】
[3.2 統合設計]
統合カメラおよびマイクロフォンアレイは、マイクロフォンベースをカメラアレイに接続する円筒形のポールを使用する。このポールは、人の発話の周波数範囲(50〜4000Hz)について音響的に無反射(invisible)である。
【0041】
図2のように、統合カメラおよびマイクロフォンアレイ202は、会議室テーブル204の中心に配置される。
【0042】
この設計は、いずれかの所与の話者または音源からすべてのマイクロフォンへのクリアパスを提供し、マイクロフォンアレイをテーブル面の付近に配置して、テーブルからの音響反射から引き起こされるマルチパス問題を回避する。加えて、この設計は、カメラをデスクトップから高め、したがって、すべてのミーティング参加者の正面またはほぼ正面のビューを提供する。
【0043】
統合カメラおよびマイクロフォンアレイはよいビーム形状を保証し、これを、ただ1つの方向からの音をフィルタリングすることによって話者の音質を改善するために使用することができる。さらに、カメラおよびマイクロフォンの統合性は有利であり、これは、それにより較正を繰り返す必要性がないからである。カメラおよびマイクロフォンが単一のデバイスとして統合されるので、ただ1度の最初の較正のみが必要である。また、統合カメラおよびマイクロフォンを小型の固定設計にすることができるので、別々のケーブルおよび会議用テーブル上の追加のスペースを必要とするであろう2つの別々のカメラおよびマイクロフォンのコンポーネントよりも、はるかにじゃまではない。
【0044】
[3.3 システムコンポーネント]
図3A及び図3Bは、統合全方位カメラおよびマイクロフォンアレイの一実施形態を示す図である。この設計におけるコンポーネントには、全方位カメラ302、シリンダ304、マイクロフォンベース306、マイクロフォン308、マイクロフォンプリアンプ310およびアナログ−デジタル(A/D)コンバータ(図示せず)が含まれる。
【0045】
[3.3.1 全方位カメラ]
様々な全方位カメラ技術が存在する。これらには、多数のビデオセンサが共に密接に連続してパックされる、1台のカメラのタイプが含まれる。もう1つの全方位カメラのタイプは、360度からの光線をキャプチャする双曲面レンズを有する単一のビデオセンサを使用する。本発明の統合カメラおよびマイクロフォンアレイ設計は、このようないずれかの全方位カメラを使用することができる。カメラヘッド302を十分に小さくして、会議室テーブルまたは他の表面上に設定されるときにじゃまにならないようにするべきであることが好ましい。
【0046】
マルチセンサカメラ構成が使用される場合、複数のカメラまたはビデオセンサを使用することができる。好ましい数は8つである。これらのセンサは連続するように配置され、各センサの突起の中心が等しい角距離で離れるようにするべきであることが好ましい。たとえば、8つのセンサが使用される場合、各センサは隣接するセンサから45度となる。しかし、異なる距離の画像をキャプチャすることが必要である場合、異なるレンズおよび異なるカメラ配置を使用することが可能である。たとえば、これは、方形または長円形の会議用テーブルの場合である。より長く、より狭い視野を有するレンズをより長い距離に使用することができ、より幅広く、より短い視野を有するレンズをより短い距離にある画像をキャプチャするために使用することができる。この場合、カメラセンサはカメラヘッドの周囲に等辺に配置されない可能性がある。より幅広い視野を有するカメラセンサを、より狭い視野を有するカメラセンサからさらに放して配置することができる。他の方法として、可変の視野を有するカメラ(回転およびズームインおよびアウトして、所与の状況に合わせて調節するカメラ)も使用することができる。
【0047】
図4は、本発明の一実施形態を示す図で、小型のマルチセンサ設計を使用し、多数の小型カメラセンサが連続するように、円形のカメラヘッドの円周の周囲に構成される図である。カメラ404の底部は、好ましくは吸音材料を有して、机からカメラまでマイクロフォンへの音響反射が生じることを防止する。この実施形態では、8つのカメラセンサが使用される。この小型設計では、カメラセンサが共に密接に連続してパックされ、画像スティッチを改善する。この実施形態では、カメラヘッド404は直径約50mmであり、カメラヘッドをベースに接続するシリンダ406は約10インチ(25.4cm)の高さである。この高さはカメラ404を、すべてのミーティング参加者の正面のビューを得るように配置する。別法として、カメラヘッド404をこれより低くすることができ、カメラセンサ402をわずかに上向きにすることができる。これによっても、カメラが幾分目立たなくなる。
【0048】
[3.3.2 シリンダ]
図3A及び図3Bの実施形態を参照すると、全方位カメラ302が好ましくは中空のシリンダ304に取り付けられ、これがマイクロフォンベース306に取り付けられる。シリンダの直径D1を十分に薄くして、シリンダ304が所期の使用に対応する周波数について音響的に無反射となるようにするべきである。カメラケーブルがシリンダ304中を通されて、いかなる音響的な障壁を高めないようにすることが好ましい。シリンダの高さH1を十分に高くして、会議用テーブルの周囲に着席するあらゆる人物の正面のビューが提供されるようにするべきであるが、カメラが目立つようになるほど高くするべきではない。シリンダの高さをオプショナルで調節可能にすることもできる。たとえば、テレビ会議の応用例では、シリンダの高さを調節して、可変デスクおよび参加者の高さを調節することができる。
【0049】
さらに、図3A及び図3Bの実施形態を参照すると、シリンダ304は2cm未満の直径D1を有し、これにより、人の声の周波数に対応する約50〜4000Hzのオーディオ周波数が、いずれかの話す参加者からマイクロフォンベース内のすべてのマイクロフォンまで本質的に乱されずにシリンダ中を通過することができる。シリンダの高さH1は、この実施形態では14cmである。
【0050】
[3.3.3 マイクロフォンベース]
一般に、マイクロフォンベースは、マイクロフォン、マイクロフォンプリアンプおよびA/Dコンバータを保持する。これはシリンダに接続し、カメラケーブルのための接続出口を提供する。マイクロフォンベースは低姿勢であり、デスクトップとマイクロフォンの間の距離を最小限にする。マイクロフォンベースにより、各マイクロフォンから参加者への直接パスが可能となる。
【0051】
統合カメラおよびマイクロフォンアレイの実施形態を図3A及び図3Bに例示する。マイクロフォンベース306の直径D3は、カメラヘッド302の直径D2よりも幅広い。これにより、統合カメラおよびマイクロフォンアレイに安定性をもたらし、容易にひっくり返されることを防止する。マイクロフォンベースの高さH3は比較的小さい。この寸法は、マルチパス問題を回避するために内蔵マイクロフォン308をテーブル表面の十分付近に保つために十分低いが、マイクロフォン308をマイクロフォンベースに内蔵できるようにするために十分高いことが好ましい。この実施形態では、D3は16cm、H3は1.5cm、H2は6cm、D2は10cmである。
【0052】
[3.3.4 マイクロフォン]
使用されるマイクロフォンを全方位にも単方向にもすることができるが、全方位マイクロフォンが好ましく、これは、全方位マイクロフォンがすべての関心のある音の角度について一様の反応を与えるからである。必要とされるマイクロフォンの最低数は3つであるが、本発明の実施形態は、音源定位の精度を高め、ビーム形成をよりよくし、オーディオシステム全体のロバスト性のために8つを使用する。
【0053】
テーブルの雑音を減らすため、マイクロフォンをラバーケース内に取り付けることができ、遮音性を同じ目的のためにマイクロフォンの下に配置することができる。
【0054】
さらに、図3A及び図3Bの実施形態を参照すると、マイクロフォン308が平面のマイクロフォンベース306上の円の円周の周囲に等辺に配置される。この実施形態では、8つのマイクロフォン308が使用される。一般に、使用されるマイクロフォンが多いほど、全方向のオーディオ範囲および信号対雑音比がよりよくなる。しかし、マイクロフォンをより多数にするコストおよび複雑性は、トレードオフである。加えて、多数のマイクロフォンでは、オーディオ信号の処理がより複雑になる。図3A及び図3Bの実施形態では、シリンダ304の中心から各マイクロフォン308の中心までの距離D5は7cmである。
【0055】
[3.3.5 マイクロフォンプリアンプ、A/Dコンバータ]
マイクロフォンプリアンプ310およびアナログ−デジタル(A/D)コンバータ(図示せず)が、図3Bに示すように、マイクロフォンベース306に統合されることが好ましい。この実施形態では、プリアンプ310の幅D4は5.901cmである。マイクロフォンプリアンプはマイクロフォンからの信号を増幅して、後に続くA/Dコンバータのために信号振幅を正規化する。A/Dコンバータは、カメラからのアナログ信号をデジタルに変換する。
【0056】
この実施形態では、マイクロフォンからの信号の信号サンプリングが互いの1マイクロ秒以内に同期化されて、音源定位およびビーム形成が容易にされる。
【0057】
[3.4 プライバシーモード]
カメラはレンズシールドを使用することができ、これは通常の動作モードで開き、プライバシーモードで閉じる。他の方法として、カメラセンサ用のシャッタをオフにすることができ、あるいは、カメラを電気的に絶縁させて、プライバシーモードの間にカメラをオフにすることができる。マイクロフォンはまた、プライバシーモードが呼び出されるとき、オフにされることも好ましい。記録中に、カメラ最上部のライトはオンであり、ユーザにカメラがアクティブであることを知らせる。プライバシーモードがオンであるとき、ライトがオフにされる。
【0058】
[4.0 モジュラー性による他の実施形態]
統合全方位カメラおよびマイクロフォン設計の様々な他の実施形態が可能である。これは部分的にはシステムのモジュラー性による。
【0059】
たとえば、様々なカメラの実施形態を使用することができる。一実施形態では、360度のカメラ範囲を達成するために多数のビデオセンサを使用する全方位カメラが使用される。他の方法として、本発明のもう1つの実施形態では、1つのビデオセンサ、および、パノラマ範囲を達成するために360度からの光をキャプチャする双曲面レンズを使用する、全方位カメラが使用される。さらに、これらのカメラのいずれをもそれら自体で使用し、音響的に無反射な円筒形ロッド上で高めて、ミーティング参加者の正面のビューを提供することができる。または、いずれのカメラもマイクロフォンアレイと統合させることができる。他の方法として、他の全方位カメラ設計も、円筒形ロッドおよび/またはマイクロフォンアレイと共に使用することができる。
【0060】
同様に、様々なマイクロフォン構成を使用することができる。一実施形態では、マイクロフォンアレイは、円の円周の周囲に等辺の距離で、かつ、室内のいずれかの話者へのクリアパスを達成するために可能な限りテーブル表面の付近に、配置された複数のマイクロフォンからなる。しかし、音響的に無反射なロッドを使用してカメラと統合することができる、他のマイクロフォン構成が可能である。他の方法として、上述した全方位マイクロフォンアレイを、いかなるカメラもなしに使用して、最適な360度の音声範囲を達成することができる。この音声範囲は、特に、音源定位およびビーム形成に有用であり、これはマルチパス問題が最小限にされるか、あるいは解消されるからである。
【0061】
統合カメラおよびマイクロフォンアレイの一実施形態では、画像スティッチおよび圧縮がPC上で実行される。他の実施形態は、カメラにおける画像スティッチおよび圧縮を、フィールドプログラマブルゲートアレイ(FPGA)または他のゲートアレイにより実行する。この設計はUSBインターフェイスを使用してカメラおよびPCのインターフェイスを取り、PCに、画像圧縮およびミーティングの記録/放送などの他のタスクを行うためにより多くのCPUサイクルを可能にする。
【0062】
[5.0 例示的な実施形態]
図5は、本発明のカメラおよびマイクロフォンアレイを使用する一実施形態を示す図である。カメラ502の画像出力およびマイクロフォンアレイ504のオーディオ出力が、アナログ−デジタルコンバータ506を介してコンピュータ508に経路指定される。コンピュータ508は様々な機能を実行して、画像およびオーディオ入力を拡張かつ利用する。たとえば、パノラマフィルタモジュール510は、全方位カメラ502における様々なセンサによって取られる画像を共にスティッチする。加えて、画像データを圧縮モジュール512によって圧縮して、ネットワーク(インターネットなど)を介した放送514のためにより互換性を有するようにすることができ、あるいはコンピュータ読み取り可能な記憶媒体516に保存することができる(好ましくはスプリッタ520を介する)。オプショナルで、画像データをまた人物検出器/追跡器モジュール522に入力して、カメラ管理524を改善することもできる。たとえば、話者を含む画像/ビデオの部分を識別し、これをオーディオ信号に関連付けることができ、話者に向けられたカメラ/センサによってキャプチャされた画像が放送されるか、あるいはディスクに保存される。
【0063】
オーディオ入力をまた様々な目的に使用することもできる。たとえば、オーディオを音源定位モジュール526に入力して、話者からのオーディオが分離されるようにすることができる。加えて、ビーム形成モジュール528をコンピュータ508において使用して、オーディオのビーム形状を改良することができる。雑音低減および自動ゲイン制御モジュール530を使用して信号対雑音比を改善することもでき、これは部屋の背景雑音に対して話者からのオーディオ信号をよりよくキャプチャするために、雑音を低減し、ゲインを調節することによって行う。
【0064】
上述したように、ビデオおよびオーディオ信号を他のテレビ会議の現場またはインターネットに放送することができる。これらをまた、後に見るためにコンピュータ読み取り可能な記憶媒体に保存することもできる。
【0065】
以上、本発明の実施形態について説明した。本発明は、この実施形態の開示のみに限定されるものではない。たとえば、上述の統合カメラおよびマイクロフォンアレイの実施形態を、監視システムに適用することができる。多数の修正および変形の実施形態は、上述の開示に照らして可能である。本発明の技術的範囲がこの詳細な説明によって限定されるのではなく、特許請求の範囲によって限定されるものである。
【図面の簡単な説明】
【図1】本発明を実施するための例示的システムを構成する汎用コンピューティングデバイスを示す図である。
【図2】会議用テーブル上の統合カメラおよびマイクロフォンアレイの好ましい位置決めを示す図である。
【図3A】統合カメラおよびマイクロフォンアレイの一実施形態の側面図である。
【図3B】図3Aの統合カメラおよびマイクロフォンアレイの実施形態の平面図である。
【図4】統合カメラおよびマイクロフォンアレイの他の実施形態の斜視図である。
【図5】キャプチャされたビデオおよびオーディオデータを拡張するためにコンピュータを使用する、本発明の一実施形態を示す図である。
【符号の説明】
202 統合カメラおよびマイクロフォンアレイ
204 会議室テーブル
302 全方位カメラ、カメラヘッド
304、406 シリンダ
306 マイクロフォンベース
308 マイクロフォン
310 マイクロフォンプリアンプ
402 カメラセンサ
404 カメラ、カメラヘッド

Claims (54)

  1. オーディオ信号及びビデオ画像データを取得するためのシステムであって、
    前記ビデオ画像データを取得する1つまたは複数のカメラと、
    前記オーディオ信号を取得するマイクロフォンアレイと、
    前記カメラを前記マイクロフォンアレイに接続され、人の声の周波数範囲において音響的に無反射であるシリンダと
    を備えたことを特徴とするシステム。
  2. 前記カメラは、360度を越える画像を取得することを特徴とする請求項1に記載のシステム。
  3. マイクロフォンベースを有し、前記マイクロフォンが前記マイクロフォンベースに取り付けられることを特徴とする請求項1に記載のシステム。
  4. 前記マイクロフォンベースの高さは、いずれかの表面から前記マイクロフォンアレイによってピックアップされた音響反射を最小限にするように、前記マイクロフォンアレイを位置決めするために、十分小さいことを特徴とする請求項3に記載のシステム。
  5. 前記シリンダが音響的に無反射である前記周波数範囲は、50〜4000Hzであることを特徴とする請求項1に記載のシステム。
  6. 前記オーディオ信号がコンピュータに入力され、前記コンピュータは前記オーディオ信号を音源定位のために使用し、前記音源定位は、前記オーディオ信号を生じる音の方向を決定することを特徴とする請求項1に記載のシステム。
  7. 前記オーディオ信号がコンピュータに入力され、前記コンピュータは前記オーディオ信号をビーム形成のために使用し、前記ビーム形成は、ある方向からの音の音質を、他のすべての方向からの前記音をフィルタリングして除くことによって、改善することを特徴とする請求項1に記載のシステム。
  8. 前記オーディオ信号がコンピュータに入力され、前記コンピュータは人物検出および追跡アルゴリズムを使用して、前記ビデオ画像データにおいて取得された人物を正確に検出し、前記人物の前記ビデオ画像データを、前記人物が話すことによって生成された前記オーディオ信号に関連付けることを特徴とする請求項1に記載のシステム。
  9. 前記ビデオ画像データがコンピュータに入力され、前記コンピュータは前記ビデオ画像データを使用して画像を共に繋ぎ合わせることを特徴とする請求項1に記載のシステム。
  10. 前記マイクロフォンアレイ内のマイクロフォンは全方位であることを特徴とする請求項1に記載のシステム。
  11. 前記マイクロフォンアレイ内の前記マイクロフォンは単方向であることを特徴とする請求項1に記載のシステム。
  12. 前記マイクロフォンアレイは3つのマイクロフォンを有することを特徴とする請求項1に記載のシステム。
  13. 前記マイクロフォンアレイは8つのマイクロフォンを有することを特徴とする請求項1に記載のシステム。
  14. 前記マイクロフォンアレイは、複数のマイクロフォンを有し、該マイクロフォンが、平面のマイクロフォンベースの円周の周囲の円に等辺に配置されていることを特徴とする請求項1に記載のシステム。
  15. 少なくとも1つのマイクロフォンが、ラバーケース内に取り付けられ、外側の音響反射から保護されることを特徴とする請求項14に記載のシステム。
  16. 遮音性が少なくとも1つのマイクロフォンの下に配置されて、外側の音響反射から保護されることを特徴とする請求項14に記載のシステム。
  17. 前記カメラはレンズカバーを有し、該レンズカバーは、通常の動作モードで上がり、プライバシーモードで下がることを特徴とする請求項1に記載のシステム。
  18. 前記マイクロフォンが、前記カメラが前記プライバシーモードで呼び出されるとき、オフにされることを特徴とする請求項17に記載のシステム。
  19. カメラのライトは、前記カメラがアクティブであるとき、オンであることを特徴とする請求項1に記載のシステム。
  20. 前記オーディオ信号が、ネットワークを介して送信されることを特徴とする請求項1に記載のシステム。
  21. 前記オーディオ信号が、コンピュータ読み取り可能な記憶媒体に保存されることを特徴とする請求項1に記載のシステム。
  22. 前記ビデオ画像データが、ネットワークを介して送信されることを特徴とする請求項1に記載のシステム。
  23. 前記ビデオ画像データが、コンピュータ読み取り可能な記憶媒体に保存されることを特徴とする請求項1に記載のシステム。
  24. 前記ビデオ画像信号が、コンピュータに1394バスを使用して転送されることを特徴とする請求項1に記載のシステム。
  25. 前記オーディオ信号が、コンピュータにアナログケーブルを使用して転送されることを特徴とする請求項1に記載のシステム。
  26. 前記カメラは、IEEE 1394カメラであることを特徴とする請求項1に記載のシステム。
  27. 電子会議およびミーティングの記録のためにオーディオ信号及びビデオ画像データを取得するための方法であって、
    ミーティングにおける人物の画像を全方位カメラにより取得するステップと、前記ミーティングにおいて生じる音のオーディオ信号をマイクロフォンアレイにより取得し、前記マイクロフォンアレイは、音響的に無反射なロッドによって前記全方位カメラに接続されるマイクロフォンベースに収容されるステップと
    を有することを特徴とする方法。
  28. 前記マイクロフォンアレイが、テーブル上に配置され、前記ミーティングにおける前記人物が前記テーブルの周囲に着席させられることを特徴とする請求項27に記載の方法。
  29. 前記マイクロフォンアレイは、該マイクロフォンアレイによってピックアップされる前記テーブルからの音響反射を最小限にするために、可能な限り前記テーブルの付近にあることを特徴とする請求項28に記載の方法。
  30. 前記マイクロフォンアレイは、3つ以上のマイクロフォンを有することを特徴とする請求項27に記載の方法。
  31. 前記マイクロフォンアレイは、前記マイクロフォンベースの円周に隣接した円において等間隔にされるマイクロフォンを有することを特徴とする請求項30に記載の方法。
  32. 前記全方位カメラは、多数のビデオセンサを有することを特徴とする請求項27に記載の方法。
  33. 前記ビデオセンサが、円の円周の周囲に等間隔にされることを特徴とする請求項32に記載の方法。
  34. 前記全方位カメラは、360度からの光線を取得する双曲面レンズを有する単一のビデオセンサを含むことを特徴とする請求項27に記載の方法。
  35. 前記ロッドは、中空であることを特徴とする請求項27に記載の方法。
  36. 前記ロッドが、マイクロフォンベースに取り付けられ、カメラケーブルは前記ロッドを通過して、前記ケーブルが音の妨げを引き起こさないようにすることを特徴とする請求項27に記載の方法。
  37. 前記ロッドの外径は、2cm以下であることを特徴とする請求項27に記載の方法。
  38. 前記ロッドは、50から4000Hzまでのオーディオ周波数が、話者から前記マイクロフォンアレイ内のすべてのマイクロフォンまで本質的に乱されずに前記ロッドを通過することを可能にするような直径を有することを特徴とする請求項27に記載の方法。
  39. 前記ロッドの高さは、調節可能であることを特徴とする請求項27に記載の方法。
  40. 統合全方位カメラ及びマイクロフォンアレイであって、
    全方位カメラと、
    前記カメラを高めて最適なカメラ範囲を提供する音響的に無反射なロッドと、
    マイクロフォンアレイと
    を備えたことを特徴とする統合全方位カメラ及びマイクロフォンアレイ。
  41. 前記全方位カメラは、360度のカメラ範囲を達成するために多数のビデオセンサを使用することを特徴とする請求項40に記載の統合全方位カメラ及びマイクロフォンアレイ。
  42. 前記全方位カメラは、1つのビデオセンサ及びパノラマ範囲を達成するために360度からの光を受光する双曲面レンズを使用することを特徴とする請求項40に記載の統合全方位カメラ及びマイクロフォンアレイ。
  43. 前記円筒形ロッドは、前記カメラを高めて、テーブルの周囲に着席する人物の正面のビューを提供することを特徴とする請求項40に記載の統合全方位カメラ及びマイクロフォンアレイ。
  44. 前記マイクロフォンアレイは、円の円周の周囲に等辺の距離で配置された複数のマイクロフォンを有することを特徴とする請求項40に記載の統合全方位カメラ及びマイクロフォンアレイ。
  45. 前記マイクロフォンアレイは、表面上で、前記表面からの音響反射を最小限するために可能な限り前記表面の付近に位置していることを特徴とする請求項40に記載の統合全方位カメラ及びマイクロフォンアレイ。
  46. より長く、より狭い視野を有するビデオセンサが使用されて、より長い距離にある画像が取得され、より幅広く、より短い視野を有するビデオセンサが使用されて、より短い距離にある画像が取得されることを特徴とする請求項41に記載の統合カメラ及びマイクロフォンアレイ。
  47. 全方位マイクロフォンアレイであって、
    平面のマイクロフォンベースの円周の周囲の円に等辺に配置される複数のマイクロフォンを有し、
    前記マイクロフォンベースは、該マイクロフォンベースが位置しているいずれかの表面から前記マイクロフォンアレイによってピックアップされた音響反射を最小限にするように、前記マイクロフォンアレイを位置決めするために、十分低いことを特徴とする全方位マイクロフォンアレイ。
  48. 前記複数のマイクロフォンによって取得されたオーディオ信号がコンピュータに入力され、該コンピュータは前記オーディオ信号を音源定位のために使用し、前記音源定位は、前記オーディオ信号を生じる音の方向を決定することを特徴とする請求項47に記載の全方位マイクロフォンアレイ。
  49. 前記複数のマイクロフォンによって取得されたオーディオ信号がコンピュータに入力され、該コンピュータは前記オーディオ信号をビーム形成のために使用し、前記ビーム形成は、ある方向からの音の音質を、他のすべての方向からの前記音をフィルタリングして除くことによって、改善することを特徴とする請求項47に記載の全方位マイクロフォンアレイ。
  50. 前記マイクロフォンアレイ内のマイクロフォンは、全方位であることを特徴とする請求項47に記載の全方位マイクロフォンアレイ。
  51. 前記マイクロフォンアレイ内のマイクロフォンは、単方向であることを特徴とする請求項47に記載の全方位マイクロフォンアレイ。
  52. 前記マイクロフォンアレイは、8つのマイクロフォンを有することを特徴とする請求項47に記載の全方位マイクロフォンアレイ。
  53. 少なくとも1つのマイクロフォンがラバーケース内に取り付けられ、外側の音響反射から保護されることを特徴とする請求項47に記載の全方位マイクロフォンアレイ。
  54. 遮音性が少なくとも1つのマイクロフォンの下に配置されて、外側の音響反射から保護されることを特徴とする請求項47に記載の全方位マイクロフォンアレイ。
JP2003180216A 2002-06-27 2003-06-24 全方位カメラ及びマイクロフォンアレイのためのシステム Expired - Fee Related JP4252377B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/184,499 US7852369B2 (en) 2002-06-27 2002-06-27 Integrated design for omni-directional camera and microphone array

Publications (2)

Publication Number Publication Date
JP2004032782A true JP2004032782A (ja) 2004-01-29
JP4252377B2 JP4252377B2 (ja) 2009-04-08

Family

ID=29717965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003180216A Expired - Fee Related JP4252377B2 (ja) 2002-06-27 2003-06-24 全方位カメラ及びマイクロフォンアレイのためのシステム

Country Status (8)

Country Link
US (1) US7852369B2 (ja)
EP (1) EP1377041B1 (ja)
JP (1) JP4252377B2 (ja)
KR (1) KR100960781B1 (ja)
CN (1) CN1479525B (ja)
AT (1) ATE377326T1 (ja)
DE (1) DE60317139T2 (ja)
TW (1) TW200401943A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006189827A (ja) * 2004-12-30 2006-07-20 Microsoft Corp レンズ遮蔽機構を有するカメラ
JP2008147822A (ja) * 2006-12-07 2008-06-26 Yamaha Corp 音声会議装置および音声会議システム
WO2009006004A1 (en) * 2007-06-28 2009-01-08 Microsoft Corporation Microphone array for a camera speakerphone
JP2010518476A (ja) 2007-02-02 2010-05-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ インタラクティブ患者フォーラム
JP2011004007A (ja) * 2009-06-16 2011-01-06 Ricoh Co Ltd テレビ会議装置、テレビ会議方法、そのプログラム
US8165416B2 (en) 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
US8330787B2 (en) 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
EP2927885A1 (en) 2014-03-31 2015-10-07 Panasonic Corporation Sound processing apparatus, sound processing system and sound processing method
EP2938097A1 (en) 2014-04-24 2015-10-28 Panasonic Corporation Sound processing apparatus, sound processing system and sound processing method
US10182280B2 (en) 2014-04-23 2019-01-15 Panasonic Intellectual Property Management Co., Ltd. Sound processing apparatus, sound processing system and sound processing method
DE112017004363T5 (de) 2016-08-29 2019-06-19 Groove X, Inc. Autonom agierender roboter, der die richtung einer geräuschquelle erkennt
KR102154432B1 (ko) * 2019-04-09 2020-09-09 주식회사 엘지유플러스 영상 촬영 기기 및 이의 동작 방법
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method

Families Citing this family (141)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050140785A1 (en) * 1999-03-16 2005-06-30 Mazzilli Joseph J. 360 degree video camera system
US7598975B2 (en) * 2002-06-21 2009-10-06 Microsoft Corporation Automatic face extraction for use in recorded meetings timelines
US7084904B2 (en) * 2002-09-30 2006-08-01 Microsoft Corporation Foveated wide-angle imaging system and method for capturing and viewing wide-angle images in real time
DE10304215A1 (de) * 2003-01-30 2004-08-19 Gesellschaft zur Förderung angewandter Informatik eV Verfahren und Vorrichtung zur bildgebenden Darstellung von akustischen Objekten sowie ein entsprechendes Computerprogramm-Erzeugnis und ein entsprechendes computerlesbares Speichermedium
CN100420298C (zh) * 2004-06-25 2008-09-17 北京中星微电子有限公司 摄像机拍摄方位数字声控定向方法
NO328311B1 (no) * 2004-10-01 2010-01-25 Tandberg Telecom As Skrivebordterminalfot og skrivebordsystem
US7720236B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Updating modeling information based on offline calibration experiments
US20060132595A1 (en) * 2004-10-15 2006-06-22 Kenoyer Michael L Speakerphone supporting video and audio features
US7473040B2 (en) * 2004-10-15 2009-01-06 Lifesize Communications, Inc. High definition camera pan tilt mechanism
US7903137B2 (en) * 2004-10-15 2011-03-08 Lifesize Communications, Inc. Videoconferencing echo cancellers
US7572073B2 (en) * 2004-10-15 2009-08-11 Lifesize Communications, Inc. Camera support mechanism
US7717629B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Coordinated camera pan tilt mechanism
US7760887B2 (en) * 2004-10-15 2010-07-20 Lifesize Communications, Inc. Updating modeling information based on online data gathering
US7826624B2 (en) * 2004-10-15 2010-11-02 Lifesize Communications, Inc. Speakerphone self calibration and beam forming
US8054336B2 (en) * 2004-10-15 2011-11-08 Lifesize Communications, Inc. High definition pan tilt zoom camera with embedded microphones and thin cable for data and power
US7970151B2 (en) * 2004-10-15 2011-06-28 Lifesize Communications, Inc. Hybrid beamforming
US8116500B2 (en) * 2004-10-15 2012-02-14 Lifesize Communications, Inc. Microphone orientation and size in a speakerphone
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US7667728B2 (en) * 2004-10-15 2010-02-23 Lifesize Communications, Inc. Video and audio conferencing system with spatial audio
JP2006314078A (ja) * 2005-04-06 2006-11-16 Sony Corp 撮像装置、音声記録装置および音声記録方法
US8457614B2 (en) 2005-04-07 2013-06-04 Clearone Communications, Inc. Wireless multi-unit conference phone
US7970150B2 (en) * 2005-04-29 2011-06-28 Lifesize Communications, Inc. Tracking talkers using virtual broadside scan and directed beams
US7991167B2 (en) * 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US7593539B2 (en) 2005-04-29 2009-09-22 Lifesize Communications, Inc. Microphone and speaker arrangement in speakerphone
US20060277254A1 (en) * 2005-05-02 2006-12-07 Kenoyer Michael L Multi-component videoconferencing system
TW200715830A (en) * 2005-10-07 2007-04-16 Sony Taiwan Ltd Image pick-up device of multiple lens camera system to create panoramic image
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
JP4997783B2 (ja) * 2006-02-15 2012-08-08 富士ゼロックス株式会社 電子会議システム、電子会議支援プログラム、電子会議制御装置、情報端末機器、電子会議支援方法
WO2007138617A1 (en) * 2006-05-25 2007-12-06 Asdsp S.R.L. Video camera for desktop videocommunication
US7542668B2 (en) * 2006-06-30 2009-06-02 Opt Corporation Photographic device
US7542671B2 (en) * 2006-06-30 2009-06-02 Opt Corporation Omni directional photographing device
US7667762B2 (en) * 2006-08-01 2010-02-23 Lifesize Communications, Inc. Dual sensor video camera
AU2007221976B2 (en) * 2006-10-19 2009-12-24 Polycom, Inc. Ultrasonic camera tracking system and associated methods
US7924655B2 (en) 2007-01-16 2011-04-12 Microsoft Corp. Energy-based sound source localization and gain normalization
US20080255840A1 (en) * 2007-04-16 2008-10-16 Microsoft Corporation Video Nametags
ITVI20070213A1 (it) * 2007-08-02 2009-02-03 Tekno System Spa Custodia di protezione per telecamere atte alla trasmissione del segnale video in formato digitale.
US8433061B2 (en) * 2007-12-10 2013-04-30 Microsoft Corporation Reducing echo
US8744069B2 (en) * 2007-12-10 2014-06-03 Microsoft Corporation Removing near-end frequencies from far-end sound
US8219387B2 (en) * 2007-12-10 2012-07-10 Microsoft Corporation Identifying far-end sound
CN101533090B (zh) * 2008-03-14 2013-03-13 华为终端有限公司 一种阵列麦克的声音定位方法和装置
US8314829B2 (en) * 2008-08-12 2012-11-20 Microsoft Corporation Satellite microphones for improved speaker detection and zoom
WO2010022453A1 (en) 2008-08-29 2010-03-04 Dev-Audio Pty Ltd A microphone array system and method for sound acquisition
US8537196B2 (en) * 2008-10-06 2013-09-17 Microsoft Corporation Multi-device capture and spatial browsing of conferences
US9124769B2 (en) 2008-10-31 2015-09-01 The Nielsen Company (Us), Llc Methods and apparatus to verify presentation of media content
US20100118112A1 (en) * 2008-11-13 2010-05-13 Polycom, Inc. Group table top videoconferencing device
CN101442654B (zh) * 2008-12-26 2012-05-23 华为终端有限公司 视频通信中视频对象切换的方法、装置及系统
US8072536B1 (en) * 2009-03-03 2011-12-06 Sean Campbell Web cam apparatus
US8441790B2 (en) * 2009-08-17 2013-05-14 Apple Inc. Electronic device housing as acoustic input device
US8654524B2 (en) 2009-08-17 2014-02-18 Apple Inc. Housing as an I/O device
US8624878B2 (en) 2010-01-20 2014-01-07 Apple Inc. Piezo-based acoustic and capacitive detection
US8553906B2 (en) * 2010-02-02 2013-10-08 Creative Technology Ltd Apparatus for enabling karaoke
US8675038B2 (en) 2010-09-28 2014-03-18 Microsoft Corporation Two-way video conferencing system
US8638354B2 (en) * 2010-10-01 2014-01-28 Creative Technology Ltd Immersive video conference system
WO2012056437A1 (en) 2010-10-29 2012-05-03 École Polytechnique Fédérale De Lausanne (Epfl) Omnidirectional sensor array system
US8660847B2 (en) 2011-09-02 2014-02-25 Microsoft Corporation Integrated local and cloud based speech recognition
TWI429938B (zh) 2011-09-16 2014-03-11 Vatics Inc 聲源監視系統及其方法
US9756927B2 (en) 2011-11-30 2017-09-12 Apple Inc. Mounting system for portable electronic device
US8904052B2 (en) 2011-12-23 2014-12-02 Apple Inc. Combined input port
US9591418B2 (en) 2012-04-13 2017-03-07 Nokia Technologies Oy Method, apparatus and computer program for generating an spatial audio output based on an spatial audio input
US9131295B2 (en) 2012-08-07 2015-09-08 Microsoft Technology Licensing, Llc Multi-microphone audio source separation based on combined statistical angle distributions
US9269146B2 (en) 2012-08-23 2016-02-23 Microsoft Technology Licensing, Llc Target object angle determination using multiple cameras
CN103680549B (zh) * 2012-09-10 2016-06-01 联想(北京)有限公司 一种音频处理方法及电子设备
US9563239B2 (en) 2012-09-10 2017-02-07 Apple Inc. Internal computer assembly features and methods
US9055216B1 (en) * 2012-11-19 2015-06-09 A9.Com, Inc. Using sensor data to enhance image data
CN102968991B (zh) 2012-11-29 2015-01-21 华为技术有限公司 一种语音会议纪要的分类方法、设备和系统
CN103856740B (zh) * 2012-12-05 2017-05-24 联想(北京)有限公司 一种信息处理的方法及视频会议系统
US9124762B2 (en) 2012-12-20 2015-09-01 Microsoft Technology Licensing, Llc Privacy camera
US9516417B2 (en) * 2013-01-02 2016-12-06 Microsoft Technology Licensing, Llc Boundary binaural microphone array
JP6253031B2 (ja) 2013-02-15 2017-12-27 パナソニックIpマネジメント株式会社 キャリブレーション方法
US9810925B2 (en) 2013-03-13 2017-11-07 Kopin Corporation Noise cancelling microphone apparatus
TWI494548B (zh) * 2013-04-26 2015-08-01 Solid State System Co Ltd 聲音微元件測試裝置與測試方法
CN103516969A (zh) * 2013-08-23 2014-01-15 Sm器械株式会社 移动式声学照相机及制造方法
CN103475852A (zh) * 2013-09-09 2013-12-25 镇江市新创计算机系统集成有限公司 复合部门办公楼宇电子会议系统
EP3161828A4 (en) * 2014-05-27 2017-08-09 Chase, Stephen Video headphones, systems, helmets, methods and video content files
US10154339B2 (en) * 2014-08-18 2018-12-11 Apple Inc. Rotationally symmetric speaker array
GB2533373B (en) * 2014-12-18 2018-07-04 Canon Kk Video-based sound source separation
ES2906619T3 (es) * 2015-04-01 2022-04-19 Owl Labs Inc Composición y escalamiento de subescenas separadas angularmente
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
KR101686833B1 (ko) * 2015-05-12 2016-12-16 주식회사 우현디지털 화자 추적이 가능한 다자간 회의 영상 제공 시스템
GB2540175A (en) 2015-07-08 2017-01-11 Nokia Technologies Oy Spatial audio processing apparatus
USD788725S1 (en) * 2015-09-11 2017-06-06 Polycom, Inc. Videoconferencing unit
US9531996B1 (en) 2015-10-01 2016-12-27 Polycom, Inc. Method and design for optimum camera and display alignment of center of the room video conferencing systems
US20170099426A1 (en) * 2015-10-01 2017-04-06 Polycom, Inc. Led speaker identifier system
US9598076B1 (en) * 2015-10-22 2017-03-21 Ford Global Technologies, Llc Detection of lane-splitting motorcycles
US10424314B2 (en) * 2015-12-23 2019-09-24 Intel Corporation Techniques for spatial filtering of speech
US9866400B2 (en) 2016-03-15 2018-01-09 Microsoft Technology Licensing, Llc Action(s) based on automatic participant identification
US9686510B1 (en) 2016-03-15 2017-06-20 Microsoft Technology Licensing, Llc Selectable interaction elements in a 360-degree video stream
US10204397B2 (en) 2016-03-15 2019-02-12 Microsoft Technology Licensing, Llc Bowtie view representing a 360-degree image
CN107290711A (zh) * 2016-03-30 2017-10-24 芋头科技(杭州)有限公司 一种语音寻向系统及方法
US10492000B2 (en) 2016-04-08 2019-11-26 Google Llc Cylindrical microphone array for efficient recording of 3D sound fields
CN105764011B (zh) * 2016-04-08 2017-08-29 甄钊 用于3d沉浸式环绕声音乐与影视拾音的传声器阵列装置
CN106708041B (zh) * 2016-12-12 2020-12-29 西安Tcl软件开发有限公司 智能音箱、智能音箱定向移动方法及装置
US9992532B1 (en) * 2017-01-11 2018-06-05 Htc Corporation Hand-held electronic apparatus, audio video broadcasting apparatus and broadcasting method thereof
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US10764474B2 (en) 2017-03-02 2020-09-01 Amazon Technologies, Inc. Assembly for electronic devices
JP6878974B2 (ja) 2017-03-16 2021-06-02 株式会社リコー 撮像装置、撮像システム
CN106842131B (zh) * 2017-03-17 2019-10-18 浙江宇视科技有限公司 麦克风阵列声源定位方法及装置
US11233142B2 (en) 2017-10-31 2022-01-25 The Regents of the Unverslty of California Intrinsically tunable and ultra-linear multi-fin MIS-HEMT devices
WO2019113869A1 (zh) * 2017-12-14 2019-06-20 中国电子科技集团公司电子科学研究院 基于相机阵列的全景光场采集装置、处理方法和计算设备
US10356362B1 (en) * 2018-01-16 2019-07-16 Google Llc Controlling focus of audio signals on speaker during videoconference
US10791268B2 (en) 2018-02-07 2020-09-29 Structionsite Inc. Construction photograph integration with 3D model images
US10339384B2 (en) 2018-02-07 2019-07-02 Structionsite Inc. Construction photograph integration with 3D model images
US10522167B1 (en) * 2018-02-13 2019-12-31 Amazon Techonlogies, Inc. Multichannel noise cancellation using deep neural network masking
JP2021514573A (ja) 2018-02-17 2021-06-10 ドリームヴュ,インコーポレイテッド マルチセンサを使用してオムニステレオビデオを捕捉するためのシステム及び方法
USD931355S1 (en) 2018-02-27 2021-09-21 Dreamvu, Inc. 360 degree stereo single sensor camera
USD943017S1 (en) 2018-02-27 2022-02-08 Dreamvu, Inc. 360 degree stereo optics mount for a camera
US20190324117A1 (en) * 2018-04-24 2019-10-24 Mediatek Inc. Content aware audio source localization
CN108683874B (zh) * 2018-05-16 2020-09-11 瑞芯微电子股份有限公司 一种视频会议注意力聚焦的方法及一种存储设备
US11523212B2 (en) 2018-06-01 2022-12-06 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
US10467758B1 (en) * 2018-07-13 2019-11-05 Structionsite Inc. Imagery-based construction progress tracking
CN109118636B (zh) * 2018-07-18 2021-12-24 平安科技(深圳)有限公司 一种业务处理方法及设备
CN112889296A (zh) 2018-09-20 2021-06-01 舒尔获得控股公司 用于阵列麦克风的可调整的波瓣形状
TWI687753B (zh) * 2018-12-06 2020-03-11 宏碁股份有限公司 全景攝影機與全景攝影系統
CN109743526A (zh) * 2018-12-13 2019-05-10 视联动力信息技术股份有限公司 一种基于视联网的通信连接建立方法及系统
US10785563B1 (en) * 2019-03-15 2020-09-22 Hitachi, Ltd. Omni-directional audible noise source localization apparatus
CN113841419A (zh) 2019-03-21 2021-12-24 舒尔获得控股公司 天花板阵列麦克风的外壳及相关联设计特征
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
CN109873973B (zh) * 2019-04-02 2021-08-27 京东方科技集团股份有限公司 会议终端和会议系统
US11190732B2 (en) * 2019-05-15 2021-11-30 Gama LLC Workstation for neurobiological disorder health professionals
WO2020237206A1 (en) 2019-05-23 2020-11-26 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
US11302347B2 (en) 2019-05-31 2022-04-12 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
JP2022545113A (ja) 2019-08-23 2022-10-25 シュアー アクイジッション ホールディングス インコーポレイテッド 指向性が改善された一次元アレイマイクロホン
US12028678B2 (en) 2019-11-01 2024-07-02 Shure Acquisition Holdings, Inc. Proximity microphone
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
US11706562B2 (en) 2020-05-29 2023-07-18 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
WO2022031872A1 (en) 2020-08-04 2022-02-10 Owl Labs Inc. Designated view within a multi-view composited webcam signal
TWI755037B (zh) * 2020-08-21 2022-02-11 陳筱涵 影音錄製裝置與影音編輯播放系統
JP2023541551A (ja) 2020-08-24 2023-10-03 アウル ラブス、インク. 複数のカメラからのウェブカム信号のマージ
US11367220B1 (en) * 2020-08-27 2022-06-21 Edge 3 Technologies Localization of lens focus parameter estimation and subsequent camera calibration
CN114520888A (zh) * 2020-11-19 2022-05-20 信泰光学(深圳)有限公司 影像撷取系统
CN112565598B (zh) * 2020-11-26 2022-05-17 Oppo广东移动通信有限公司 聚焦方法与装置、终端、计算机可读存储介质和电子设备
WO2022165007A1 (en) 2021-01-28 2022-08-04 Shure Acquisition Holdings, Inc. Hybrid audio beamforming system
US11636842B2 (en) * 2021-01-29 2023-04-25 Iyo Inc. Ear-mountable listening device having a microphone array disposed around a circuit board
EP4047939A1 (en) 2021-02-19 2022-08-24 Nokia Technologies Oy Audio capture in presence of noise
US11778407B2 (en) * 2021-08-10 2023-10-03 Plantronics, Inc. Camera-view acoustic fence
US20230086632A1 (en) * 2021-09-21 2023-03-23 Vistage Innovation LLC Article of furniture featuring collaborative roundtable audio-video conferencing
KR102641869B1 (ko) * 2023-07-14 2024-03-04 캠플러스(주) 스마트홈 구축용 카메라 및 그 카메라의 동작 제어 방법

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63144698A (ja) * 1986-12-08 1988-06-16 Nippon Telegr & Teleph Corp <Ntt> マイクロホン切替収音装置
JPH06351015A (ja) * 1993-06-10 1994-12-22 Olympus Optical Co Ltd テレビジョン会議システム用の撮像システム
JPH0774998A (ja) * 1993-06-25 1995-03-17 Sony Corp 画像・音声記録装置
JPH0743015U (ja) * 1993-12-29 1995-08-11 株式会社オーディオテクニカ 面上収音マイクロホン
JPH07264569A (ja) * 1994-03-16 1995-10-13 Sumitomo Electric Ind Ltd 遠隔会議装置
JPH08125835A (ja) * 1994-10-25 1996-05-17 Matsushita Electric Ind Co Ltd 全方位撮影装置及び全方位画像合成装置
JPH08181899A (ja) * 1994-12-27 1996-07-12 Sharp Corp 画像入力装置
JPH08340466A (ja) * 1995-06-09 1996-12-24 Sony Corp 卓上式カメラ
JPH10215497A (ja) * 1996-11-27 1998-08-11 Fujitsu Ltd マイクロホンシステム
JPH11501411A (ja) * 1995-12-12 1999-02-02 パレト、エウゲニ ホルダナ 球面収差のないレンズ構造及びこのようなレンズ構造を含むステレオカメラ
JPH11164389A (ja) * 1997-11-26 1999-06-18 Matsushita Electric Ind Co Ltd 適応ノイズキャンセラ装置
JP2000092368A (ja) * 1998-09-09 2000-03-31 Canon Inc カメラ制御装置及びコンピュータ読み取り可能な記憶媒体
JP2000134688A (ja) * 1998-10-28 2000-05-12 Fujitsu Ltd マイクロホンアレイ装置

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4658425A (en) * 1985-04-19 1987-04-14 Shure Brothers, Inc. Microphone actuation control system suitable for teleconference systems
JPH04210194A (ja) * 1990-11-30 1992-07-31 Kensaku Hori カメラの撮影に使用するカメラ台
US5426510A (en) * 1992-06-05 1995-06-20 Dolman Associates, Inc. Audio-video system
JP2939087B2 (ja) * 1993-04-07 1999-08-25 シャープ株式会社 全方位視覚系
US5625410A (en) * 1993-04-21 1997-04-29 Kinywa Washino Video monitoring and conferencing system
US5796426A (en) * 1994-05-27 1998-08-18 Warp, Ltd. Wide-angle image dewarping method and apparatus
JPH0832945A (ja) * 1994-07-19 1996-02-02 Hitachi Ltd テレビ電話装置
US5990934A (en) * 1995-04-28 1999-11-23 Lucent Technologies, Inc. Method and system for panoramic viewing
US5745305A (en) * 1995-04-28 1998-04-28 Lucent Technologies Inc. Panoramic viewing apparatus
US5539483A (en) * 1995-06-30 1996-07-23 At&T Corp. Panoramic projection apparatus
US5793527A (en) * 1995-06-30 1998-08-11 Lucent Technologies Inc. High resolution viewing system
WO1997008896A1 (en) * 1995-08-23 1997-03-06 Scientific-Atlanta, Inc. Open area security system
US6115176A (en) * 1995-11-30 2000-09-05 Lucent Technologies Inc. Spherical viewing/projection apparatus
US6111702A (en) * 1995-11-30 2000-08-29 Lucent Technologies Inc. Panoramic viewing system with offset virtual optical centers
US6118474A (en) * 1996-05-10 2000-09-12 The Trustees Of Columbia University In The City Of New York Omnidirectional imaging apparatus
US6341044B1 (en) * 1996-06-24 2002-01-22 Be Here Corporation Panoramic imaging arrangement
US6493032B1 (en) * 1996-06-24 2002-12-10 Be Here Corporation Imaging arrangement which allows for capturing an image of a view at different resolutions
US6373642B1 (en) * 1996-06-24 2002-04-16 Be Here Corporation Panoramic imaging arrangement
US6459451B2 (en) * 1996-06-24 2002-10-01 Be Here Corporation Method and apparatus for a panoramic camera to capture a 360 degree image
US6331869B1 (en) * 1998-08-07 2001-12-18 Be Here Corporation Method and apparatus for electronically distributing motion panoramic images
JP3784474B2 (ja) * 1996-11-20 2006-06-14 日本電気株式会社 ジェスチャー認識方法および装置
AU6515798A (en) * 1997-04-16 1998-11-11 Isight Ltd. Video teleconferencing
JPH10304329A (ja) * 1997-04-30 1998-11-13 Matsushita Electric Works Ltd 会議撮像装置
US6043837A (en) * 1997-05-08 2000-03-28 Be Here Corporation Method and apparatus for electronically distributing images from a panoptic camera system
US6466254B1 (en) * 1997-05-08 2002-10-15 Be Here Corporation Method and apparatus for electronically distributing motion panoramic images
US6356296B1 (en) * 1997-05-08 2002-03-12 Behere Corporation Method and apparatus for implementing a panoptic camera system
US6072522A (en) * 1997-06-04 2000-06-06 Cgc Designs Video conferencing apparatus for group video conferencing
JPH1141577A (ja) * 1997-07-18 1999-02-12 Fujitsu Ltd 話者位置検出装置
JPH11331827A (ja) 1998-05-12 1999-11-30 Fujitsu Ltd テレビカメラ装置
US6924832B1 (en) * 1998-08-07 2005-08-02 Be Here Corporation Method, apparatus & computer program product for tracking objects in a warped video image
US6195204B1 (en) * 1998-08-28 2001-02-27 Lucent Technologies Inc. Compact high resolution panoramic viewing system
US6141145A (en) * 1998-08-28 2000-10-31 Lucent Technologies Stereo panoramic viewing system
US6285365B1 (en) * 1998-08-28 2001-09-04 Fullview, Inc. Icon referenced panoramic image display
US6128143A (en) * 1998-08-28 2000-10-03 Lucent Technologies Inc. Panoramic viewing system with support stand
US6144501A (en) * 1998-08-28 2000-11-07 Lucent Technologies Inc. Split mirrored panoramic image display
JP2000106556A (ja) * 1998-09-29 2000-04-11 Brother Ind Ltd データ記憶装置、データ通信システム、及び記憶媒体
JP2000106566A (ja) * 1998-09-29 2000-04-11 Hitachi Ltd 通信制御装置
US6369818B1 (en) * 1998-11-25 2002-04-09 Be Here Corporation Method, apparatus and computer program product for generating perspective corrected data from warped information
JP2000181498A (ja) * 1998-12-15 2000-06-30 Toshiba Corp ビームフォーマを用いた信号入力装置及び信号入力用プログラムを記録した記録媒体
US6714249B2 (en) * 1998-12-31 2004-03-30 Eastman Kodak Company Producing panoramic digital images by digital camera systems
US6597520B2 (en) * 1999-01-13 2003-07-22 Be Here Corporation Panoramic imaging arrangement
US6175454B1 (en) * 1999-01-13 2001-01-16 Behere Corporation Panoramic imaging arrangement
US6278478B1 (en) * 1999-03-18 2001-08-21 Microsoft Corporation End-to-end network encoding architecture
JP2000308040A (ja) * 1999-04-22 2000-11-02 Sony Corp 双方向高速データ配信装置
US6244759B1 (en) * 1999-05-10 2001-06-12 Rob Russo Adjustable camera support
US6781606B2 (en) * 1999-05-20 2004-08-24 Hewlett-Packard Development Company, L.P. System and method for displaying images using foveal video
US6375370B1 (en) * 2000-02-10 2002-04-23 Cam Guard Systems, Inc. Temporary surveillance system
JP4416290B2 (ja) * 2000-07-31 2010-02-17 富士フイルム株式会社 デジタルカメラ
US6439515B1 (en) * 2000-10-10 2002-08-27 Adam Daniel Powers Video camera support device
US6741250B1 (en) * 2001-02-09 2004-05-25 Be Here Corporation Method and system for generation of multiple viewpoints into a scene viewed by motionless cameras and for presentation of a view path
US7184559B2 (en) * 2001-02-23 2007-02-27 Hewlett-Packard Development Company, L.P. System and method for audio telepresence
US6756990B2 (en) * 2001-04-03 2004-06-29 Be Here Corporation Image filtering on 3D objects using 2D manifolds
US6937266B2 (en) * 2001-06-14 2005-08-30 Microsoft Corporation Automated online broadcasting system and method using an omni-directional camera system for viewing meetings over a computer network
US6628897B2 (en) * 2001-06-20 2003-09-30 Sony Corporation Camera system
US20040021764A1 (en) * 2002-01-28 2004-02-05 Be Here Corporation Visual teleconferencing apparatus
US20040008423A1 (en) * 2002-01-28 2004-01-15 Driscoll Edward C. Visual teleconferencing apparatus
US20030142402A1 (en) * 2002-01-30 2003-07-31 Be Here Corporation Method and apparatus for triggering a remote flash on a camera with a panoramic lens
US7012757B2 (en) * 2002-05-08 2006-03-14 Be Here Corporation Method for designing a lens system and resulting apparatus
US20040254982A1 (en) * 2003-06-12 2004-12-16 Hoffman Robert G. Receiving system for video conferencing system
US7019918B2 (en) * 2003-06-12 2006-03-28 Be Here Corporation Panoramic imaging system

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63144698A (ja) * 1986-12-08 1988-06-16 Nippon Telegr & Teleph Corp <Ntt> マイクロホン切替収音装置
JPH06351015A (ja) * 1993-06-10 1994-12-22 Olympus Optical Co Ltd テレビジョン会議システム用の撮像システム
JPH0774998A (ja) * 1993-06-25 1995-03-17 Sony Corp 画像・音声記録装置
JPH0743015U (ja) * 1993-12-29 1995-08-11 株式会社オーディオテクニカ 面上収音マイクロホン
JPH07264569A (ja) * 1994-03-16 1995-10-13 Sumitomo Electric Ind Ltd 遠隔会議装置
JPH08125835A (ja) * 1994-10-25 1996-05-17 Matsushita Electric Ind Co Ltd 全方位撮影装置及び全方位画像合成装置
JPH08181899A (ja) * 1994-12-27 1996-07-12 Sharp Corp 画像入力装置
JPH08340466A (ja) * 1995-06-09 1996-12-24 Sony Corp 卓上式カメラ
JPH11501411A (ja) * 1995-12-12 1999-02-02 パレト、エウゲニ ホルダナ 球面収差のないレンズ構造及びこのようなレンズ構造を含むステレオカメラ
JPH10215497A (ja) * 1996-11-27 1998-08-11 Fujitsu Ltd マイクロホンシステム
JPH11164389A (ja) * 1997-11-26 1999-06-18 Matsushita Electric Ind Co Ltd 適応ノイズキャンセラ装置
JP2000092368A (ja) * 1998-09-09 2000-03-31 Canon Inc カメラ制御装置及びコンピュータ読み取り可能な記憶媒体
JP2000134688A (ja) * 1998-10-28 2000-05-12 Fujitsu Ltd マイクロホンアレイ装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006189827A (ja) * 2004-12-30 2006-07-20 Microsoft Corp レンズ遮蔽機構を有するカメラ
JP2008147822A (ja) * 2006-12-07 2008-06-26 Yamaha Corp 音声会議装置および音声会議システム
JP2010518476A (ja) 2007-02-02 2010-05-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ インタラクティブ患者フォーラム
US8526632B2 (en) 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
JP2010532137A (ja) * 2007-06-28 2010-09-30 マイクロソフト コーポレーション カメラスピーカフォンのためのマイクロフォン配列
KR101495937B1 (ko) 2007-06-28 2015-02-25 마이크로소프트 코포레이션 카메라 스피커폰을 위한 마이크로폰 어레이
WO2009006004A1 (en) * 2007-06-28 2009-01-08 Microsoft Corporation Microphone array for a camera speakerphone
US8330787B2 (en) 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US8165416B2 (en) 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
US8749650B2 (en) 2007-06-29 2014-06-10 Microsoft Corporation Capture device movement compensation for speaker indexing
JP2011004007A (ja) * 2009-06-16 2011-01-06 Ricoh Co Ltd テレビ会議装置、テレビ会議方法、そのプログラム
EP2927885A1 (en) 2014-03-31 2015-10-07 Panasonic Corporation Sound processing apparatus, sound processing system and sound processing method
US10182280B2 (en) 2014-04-23 2019-01-15 Panasonic Intellectual Property Management Co., Ltd. Sound processing apparatus, sound processing system and sound processing method
EP2938097A1 (en) 2014-04-24 2015-10-28 Panasonic Corporation Sound processing apparatus, sound processing system and sound processing method
DE112017004363T5 (de) 2016-08-29 2019-06-19 Groove X, Inc. Autonom agierender roboter, der die richtung einer geräuschquelle erkennt
US11376740B2 (en) 2016-08-29 2022-07-05 Groove X, Inc. Autonomously acting robot that recognizes direction of sound source
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
KR102154432B1 (ko) * 2019-04-09 2020-09-09 주식회사 엘지유플러스 영상 촬영 기기 및 이의 동작 방법

Also Published As

Publication number Publication date
EP1377041A2 (en) 2004-01-02
DE60317139D1 (de) 2007-12-13
CN1479525A (zh) 2004-03-03
US7852369B2 (en) 2010-12-14
DE60317139T2 (de) 2008-02-07
EP1377041B1 (en) 2007-10-31
US20040001137A1 (en) 2004-01-01
JP4252377B2 (ja) 2009-04-08
ATE377326T1 (de) 2007-11-15
TW200401943A (en) 2004-02-01
EP1377041A3 (en) 2004-08-25
KR100960781B1 (ko) 2010-06-01
KR20040002639A (ko) 2004-01-07
CN1479525B (zh) 2010-05-12

Similar Documents

Publication Publication Date Title
JP4252377B2 (ja) 全方位カメラ及びマイクロフォンアレイのためのシステム
Cutler et al. Distributed meetings: A meeting capture and broadcasting system
KR101495937B1 (ko) 카메라 스피커폰을 위한 마이크로폰 어레이
US8553113B2 (en) Digital image capturing system and method
US7298392B2 (en) Omni-directional camera design for video conferencing
US6542184B1 (en) Methods, apparatus, and program products for presenting panoramic images of a remote location
ES2355271T3 (es) Captura de audio direccional.
US20030160862A1 (en) Apparatus having cooperating wide-angle digital camera system and microphone array
EP1178352A1 (en) Method of and apparatus for presenting panoramic images at a local receiver, and a corresponding computer program
KR100986228B1 (ko) 카메라 장치 및 화상 기록 재생 방법
WO2007037700A1 (en) Directional audio capturing
WO2008075726A1 (ja) ビデオ会議装置
US20150304559A1 (en) Multiple camera panoramic image capture apparatus
WO2015198964A1 (ja) 音声入出力機能付き撮像装置およびテレビ会議システム
US11856387B2 (en) Video conferencing system and method thereof
TWI488503B (zh) 會議攝錄裝置及其方法
KR20100006029A (ko) 원격 화상회의시스템
US20220382132A1 (en) Systems and methods for video camera systems for smart tv applications

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060512

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081226

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090121

R150 Certificate of patent or registration of utility model

Ref document number: 4252377

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130130

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140130

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees