JP2003529060A - 空間的音波ステアリングシステム - Google Patents
空間的音波ステアリングシステムInfo
- Publication number
- JP2003529060A JP2003529060A JP2001570682A JP2001570682A JP2003529060A JP 2003529060 A JP2003529060 A JP 2003529060A JP 2001570682 A JP2001570682 A JP 2001570682A JP 2001570682 A JP2001570682 A JP 2001570682A JP 2003529060 A JP2003529060 A JP 2003529060A
- Authority
- JP
- Japan
- Prior art keywords
- microphone
- signal
- sound source
- acoustic signal
- camera
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000003623 enhancer Substances 0.000 claims abstract description 58
- 230000003595 spectral effect Effects 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 27
- 230000005236 sound signal Effects 0.000 claims abstract description 3
- 238000010521 absorption reaction Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000002347 injection Methods 0.000 claims 2
- 239000007924 injection Substances 0.000 claims 2
- 239000002991 molded plastic Substances 0.000 claims 2
- 230000003213 activating effect Effects 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 8
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 239000000463 material Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 210000003128 head Anatomy 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 150000002739 metals Chemical class 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 102100032566 Carbonic anhydrase-related protein 10 Human genes 0.000 description 1
- 241000721179 Clarias Species 0.000 description 1
- 101000867836 Homo sapiens Carbonic anhydrase-related protein 10 Proteins 0.000 description 1
- 101100490407 Solanum tuberosum AC71 gene Proteins 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 210000003027 ear inner Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000001746 injection moulding Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/34—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
Landscapes
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Acoustics & Sound (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Studio Devices (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Stereo-Broadcasting Methods (AREA)
- Stereophonic Arrangements (AREA)
- Steering Controls (AREA)
Abstract
Description
次元空間的オーディオ技術を利用する空間的音波ステアリングシステムに関する
。
されている。ビデオ会議システム及び他の通信システムだけでなく、多種多様な
セキュリティー、オートメーション及びモニターシステムが、生活の便利さを向
上させ、生活を簡易化し、また生活を安全にする目的で使用される。また、最新
式の音波探知システムは、音声指向カメラ画像ステアリング方式により音源の方
向または場所の探知を可能にする。例えば、Chu et al.の米国特許第5,778
,082号は、空間的に分離した一対のマイクロフォンにより共通の音源からの
スピーチまたは他の音響信号の方向または場所を探知する、音源探知システム及
び方法を開示している。同様に、Bakerの米国特許第5,686,957号は、
マイクロフォンの配列を利用して、半球状可視領域内における特定の話し手の方
向を特定し、方向信号をビデオカメラシステムへ送るものである。しかしながら
、Chu及びBakeのシステムは他の類似のシステムと同様、オーディオ信号振幅の
「差」を検出できるに過ぎないため、音源方向を探知するためには2個以上のマ
イクロフォンの使用が不可欠であり、これらシステムのコスト及び複雑さが増加
する。
次の差動応答を発生するための1個以上のセンサーを備えた有限音響反射表面ま
たはバッフルより成る音響変換器を開示している。Elkoのセンサーは、画像から
得られるセンサーであり、バッフルそれ自体の上に配置する必要がある。Elkoの
変換器はさらに、このバッフルを所定周波数の音波の約1波長乃至半波長にしな
ければならない。かかる制約により、Elkoの装置をビデオカメラのような標準型
ビデオ会議システムと併用するのが難しい。
術分野で求められている。
る。この装置及び方法は、音響信号を変形する複数の反射器と、反射器に近接し
て配置する変換器とを使用する。ノッチ検知器が、変形済み音響信号のスペクト
ルノッチを検知して識別する。その後、方向決定手段が音源方向を探知する。
する。このマイクロフォンシステムは、少なくとも2つの反射器が楕円の中心に
あるマイクロフォンから異なる距離だけ離隔した楕円形マイクロフォンエンハン
サーを有する。反射器は非対称リッジを有し、これらのリッジは、人間の耳の耳
介により発生されるパターンに概念的に類似した、干渉パターンをマイクロフォ
ンにより受信される信号に発生させる。
へ向けられるようにする。特殊な画像装置を用いるか、方向を探知するために少
なくとも2つのマイクロフォンを必要とする従来のビデオ会議システムとは異な
り、本発明の音波ステアリングシステムはただ1個のマイクロフォンを必要とす
るに過ぎず、従来型ビデオ会議システムに組み込むことができる。
デジタルオーディオ情報より成る別個のフレームに変換する。フーリエ解析によ
り、この時間ベース情報を周波数ベースのスペクトル係数に変換する。その後、
空間推定器がこれらのスペクトル係数を用いてフレーム内のスペクトルノッチま
たは反共振を見つける。スペクトル推定器は、探索表を用いてこれらのフレーム
を既知の空間座標に関連付け、この情報をカメラのモニターへ送る。
詳細な説明において、本願の一部であり、本発明の特定の実施例を例示する添付
図面を参照する。図面において、同一の参照番号は幾つかの図を通して実質的に
同じコンポーネントを指すものである。これらの実施例は、当業者が本発明を実
施できるように十分に詳しく記載されており、他の実施例も可能であって、本発
明の範囲から逸脱することなく機械的、方法的、電気的及び他の種類の変形又は
設計変更を行うことができることを理解されたい。従って、以下の詳細の説明は
限定的な意味でとらえるべきではなく、本発明の範囲は、頭書の特許請求の範囲
と均等物の全範囲とによってのみ制限されるものである。
術分野において知られている。この技術は、インターアクティブ/バーチャルリ
アリティーシステム、マルチメディアシステム、通信システムなどに利用される
。本質的に、適正に設計したデジタルフィルターを使用すると、ヘッドホンを着
用した聞き手の周りの「バーチャル」空間の任意の場所で音を発生することがで
きる。従来型3Dシステムでは、所与の音源に関連して最初から存在する空間的
属性を補充または置換するプロセスにより、空間化された音波を発生する。これ
とは対照的に、本発明は、音源からの既存の3D音波を「検出」する新規の3D
音波ステアリングシステムである。
以下、「システム」と呼ぶ)100のブロック図である。このシステム100は
、マイクロフォンシステム101、ビデオカメラ103及びコントローラ105
より成る。コントローラ105は、信号プロセッサー106、空間推定器108
、カメラモーター110、オーディオ圧縮器111及びオーディオ/ビデオ送信
機112を有する。システム100の入力は、画像/音源116である。詳述す
ると、ビデオカメラ103の入力は画像ソース116Aであり、マイクロフォン
エンハンサー102の入力は音源116Bである。オーディオ/ビデオ送信機1
12の出力は、送信媒体118を介して遠隔のオーディオ/ビデオ受信機120
へ送られる。
ステム101と、コントローラ105とだけにより構成される。この実施例にお
いて、コントローラ105は、信号プロセッサー106と、空間推定器108と
から成る。オーディオ圧縮器111及びオーディオ/ビデオ送信器112は、こ
のシステム100の外部か、それと並置して用いることができる。この実施例に
おいて、カメラモーター110は、本質的に、コントローラ105により提供さ
れる情報を利用する。
103とコントローラ105との間などのような種々のコンポーネントの間には
、多数のインターフェイス、バスまたは他の通信手段が介在する。かかるインタ
ーフェイスは、当業者であればわかるように、必要とされる全ての従来型電気的
及び機械的コンポーネントより成るため、これらについては詳述しない。コント
ローラ105は、当該技術分野で良く知られているように、ラップトップの汎用
コンピュータのようなコンピュータまたは局部受信機または遠隔の受信機でよい
。1つの実施例において、コントローラ105は、入力信号を処理するか操作し
て適当な出力信号を発生するために必要な全てのコンポーネントを備えたパーソ
ナルコンピュータである。上述したコンポーネントに加えて、コントローラ10
5は、任意適当なタイプの中央処理ユニット、ユーティリティー、ドライバー、
イベントキュー、アプリケーションなどを含むことができるが、本発明はそれら
に限定されない。1つの実施例において、コントローラ105のコンポーネント
はコンピュータのプロセッサーにより実行される全てのコンピュータプログラム
であり、コンピュータは、メモリーのようなコンピュータにより読取り可能なメ
ディアに記憶された命令の制御下で動作する。コントローラ105はまた、当業
者であればわかるように、コンピュータプログラムを実行するオペレーティング
システムを含む。
換器またはマイクロフォン104とを有する。1つの実施例において、マイクロ
フォンエンハンサー102は、上述したように、干渉パターンを発生して音源1
16Bからの音響信号を変形する非対称リッジまたはフォールドを含んだマイク
ロフォンスリーブより成る。変形済み音響信号は、マイクロフォン104により
電気信号に変換され、この電気信号は信号プロセッサー106へ送られる。1つ
の実施例において、信号プロセッサー106は、マイクロフォン104の出力を
アナログから整数値または浮動小数点値のデジタル表示のようなデジタル信号に
変換する。デジタル信号はさらに、信号のスペクトル干渉パターンを抽出するた
めに信号プロセッサーアルゴリズムにより処理される。この情報は、空間推定器
108へ送られ、この推定器は確立された統計法により音源116Bの方向に関
する「最良予測」を行う。空間推定器108からの方向情報は、カメラモーター
110へ出力される。カメラモーター110は、カメラを移動できる従来型カメ
ラモーターまたは追跡システムの任意のものでよい。カメラモーター110は、
ビデオカメラ103を画像/音源116の方向へ向けて、音源116が捕捉でき
るようにする。1つの実施例では、画像認識アルゴリズムにより、空間推定器1
08の出力を確認する。音源116Bに連携する画像は、オーディオ/ビデオ送
信機112により捕捉され処理される。同時に、オーディオ圧縮器111からの
圧縮済み電気信号も、オーディオ/ビデオ送信機112へ出力される。画像及び
圧縮器済み電気信号はその後、オーディオ/ビデオ送信機112により送信媒体
118を介して別の場所の遠隔/ビデオ受信機120へ送られる。遠隔オーディ
オ/ビデオ受信機120は、画像及びそれに連携する電気信号を処理し復号する
。その結果得られるビデオ出力は、第三者122がモニター124上で見ること
ができ、オーディオ出力は1またはそれ以上のスピーカー126により聞くこと
ができる。
方向にとって特有の周波数特性を発生させ、これらの信号をマイクロフォン10
4へ送ることのできる任意適当なコンポーネントでよい。これらの相互作用パタ
ーンまたは干渉パターンは、各信号のスペクトルにスペクトルノッチとして現れ
る。
有する楕円または卵形をした1つの実施例を示すが、本発明はこれに限定されな
い。図2Bに示すように、卵形の構成は、マイクロフォンの孔部202の両側の
リッジ214間の差または遅延を最大にするが、マイクロフォンエンハンサー1
02の垂直方向のサイズは増加させない。卵形の構成では、長軸206の最小寸
法は信号の分解能により決定されるが、これは実施例により異なる。長軸206
が特定の実施例にとって小さすぎる場合、マイクロフォンエンハンサー102に
含まれるリッジ214は検出可能なパターンを発生できない。長軸206が特定
の実施例にとって大きすぎる場合、所期の音源からの信号の反射波と、他の近く
の音源からの信号の反射波との間に差が存在せず、望ましくないバックグラウン
ドノイズが検出される。1つの実施例において、マイクロフォンエンハンサー1
02は、直軸206が約2cm乃至約6cmまたはそれ以上、短軸208が約0
.5cm乃至約3cmまたはそれ以上である。
背面212(図2Aに示す)とを有し、リムまたはリップ201も備えている。
マイクロフォンエンハンサー102はまた、マイクロフォン104を支持するか
収容するための手段も備えている。図2A及び2Bに示す実施例のマイクロフォ
ンエンハンサー102は、中央にマイクロフォン挿入孔202を有し、この孔部
にマイクロフォン104が装着される。本質的に、マイクロフォン挿入孔202
は平らな端縁部を有する円形の孔である。この実施例において、マイクロフォン
エンハンサー102は、背面212を下側にして表面の方へ向けて設置すると、
マイクロフォン挿入孔202の端縁部上にのみ納まる容器の形状を有する。
るかそれと一体的に形成されるリッジ214及びウェル216の1つの構成を示
すが、本発明はそれに限定されない。一般的に、マイクロフォンエンハンサー1
02は、人間の耳の耳介と概念的に類似の、縦方向の音波の反射器として働く非
対称リッジ214を含む。しかしながら、人間の耳の場合、中耳及び内耳はこれ
らの振動を受ける「受信機」である。本発明において、それ自体のエンハンサー
、即ち「耳」を取付けたマイクロフォン104は、音波の受信を意図した受信機
である。1つの実施例において、マイクロフォンエンハンサー102の1つの半
球に多数のリッジ204及びウェル216が存在する。別の実施例では、リム2
01に近い所に大きなリッジ214が配置されている。さらに別の実施例では、
花の花弁と同様にリッジ214を種々の開放段階に配置して、それらがほぼ外方
向に湾曲し、リム201より先に延びるか、または延びないようにすることがで
きる。
。一般的に、リッジ214が高ければ高いほど、大きなエネルギーの反射または
干渉信号が得られ、検出及び測定が容易になる。1つの実施例において、リッジ
214は約0.25cm乃至約0.5cmの範囲の種々の高さを有する。別の実
施例において、リッジ214は、全てほぼ同じ高さである。さらに別の実施例で
は、一部または全部のリッジ214が約0.5cmより高くする。
2つの隆起部分、即ち、2つのリッジ214かまたは少なくとも2つの頂上部分
または丘部分を有する1つのリッジ214を設ける必要がある。1つの実施例に
おいて、各々がマイクロフォン104から異なる距離だけ離隔した2つのリッジ
214が存在する。マイクロフォンエンハンサー102は最小2個の隆起部分を
備えることができるが、多数の隆起部分またはリッジ214を設けると、多数の
ノッチが検出できるため、信号の方向探知の信頼度が増加する。1つの実施例に
おいて、マイクロフォンエンハンサー102は、2乃至10個またはそれ以上の
リッジ214を有する。図2B及び3に示す実施例では、リッジ214は少な
くともわずかに円形または双曲線状である。
互いに十分な距離離隔する必要がある。そうでなくて、2つの音源がマイクロフ
ォン104の両側であるがマイクロフォンエンハンサー102から同一距離にあ
る場合、「鏡像」状態または混同圏が生じ、システムが2つのうち何れの側から
音波がくるかを探知できなくなる。1つの実施例において、リッジ214は、長
軸206上の垂直方向の中心にあるマイクロフォン挿入孔202の両側にある。
別の実施例において、リッジ214間の距離は、マイクロフォンエンハンサー1
02のサイズに応じて、少なくとも1cm乃至約2.5cmまたはそれよりもさ
らに大きい。
エンハンサー102は、垂直またはほぼ垂直な平面において端縁部上、即ちその
リム201上に配置され、リッジ214の頂部が入来信号に対して直角またはほ
ぼ直角になるようにする。マイクロフォンエンハンサー102がその信号に近づ
く前方に、またはその信号から遠ざかる後方に傾くと、反射の程度、従って信号
強度が大きく減少する。マイクロフォンエンハンサー102が鉛直線から何れか
の方向に傾きすぎると、せん断効果が生じて、リッジ214がもはや適当な干渉
パターンを発生できなくなる。
囲の任意の部分上に納まるように回転することもできる。1つの実施例において
、マイクロフォンエンハンサー102の長軸206は、水平面内にある。即ち、
広くカバーできる位置にある。この構成は、全ての参加者が座ったままでいると
推定する、従来のビデオ会議システムに有用である。別の実施例において、マイ
クロフォンエンハンサー102は、長軸206が垂直方向、即ち人物写真を撮る
位置にあるように配置される。この構成は、全ての参加者が立っていると推定で
きる場合に有用であり、垂直方向の高さを検知するのが望ましい。さらに別の実
施例では、少なくとも2つのマイクロフォンエンハンサー102を「十字架」の
ように配置して、第1のマイクロフォンエンハンサーの長軸が水平またはほぼ水
平に、第2のマイクロソフトエンハンサーの長軸が垂直またはほぼ垂直になるよ
うにすることができる。別の実施例では、1またはそれ以上の円形のマイクロフ
ォンエンハンサー102を使用する。最後の2つの実施例は、参加者が立ったり
座ったりする場合に有用である。
重要な手がかりは、2つの耳における波頭の相対的な差である。同様に、本発明
は、音源の角度位置を、マイクロフォン104の両側のリッジ214における波
頭の相対的な差に基づき測定する。詳述すると、干渉が生じるのは、同じ信号が
2以上の経路を進行して、同一場所、即ちマイクロフォン104のヘッドに到達
するためである。直線経路を進む信号の一部と、マイクロフォンの両側の少なく
とも2つの異なる遅延または反射経路を進む信号の他の部分とを組み合わせると
、本質的に、共通の頂点が音源116Bと、マイクロフォン104とである三角
形が形成される。これにより、遅延経路の信号は、直線経路の信号と、距離の差
に対応する周波数においてのみ破壊的な干渉を開始する。このようにして、対応
するスペクトルノッチが発生する。
101に遭遇する信号の拡大頂面図である。その図は実尺でなく、各音波をその
波の中心または中心に近い所の矢印で表わす。さらに、図示を簡略にするために
、2個のリッジ214だけを示すが、本発明はそれに限定されない。図3に示す
ように、反射することになる第1の音波304はリッジ214で反射し、反射す
ることになる第2の音波は別のリッジ214で反射し、直線経路を行く音波30
6は直接マイクロフォン104へ到達する。その結果、マイクロフォン104は
、反射した音波302、304を、各リッジ214の中心からマイクロフォン3
04までの距離に比例する遅延時間の後、受信する。換言すれば、リッジで反射
する音波の経路302、304は長く、それにより干渉が生じる。図3に示す実
施例では、反射した第1の音波302は距離308だけ遅延し、反射した第2の
音波304は異なる距離310だけ遅延する。実際の干渉または遅延量は、リッ
ジ214、マイクロフォン104及び音源116Bの相対的位置及び大きさを含
む(それらに限定されない)多くのファクターにより可変である。しかしながら
、この時間遅延は、適当な信号処理アルゴリズムを用いて計算可能であり、この
時間遅延は外的条件に応じて変化する。1つの実施例において、時間遅延は約1
秒/330mであるが、その理由は標準的な温度及び圧力で音波が約1秒間約3
30m進むからである。アルゴリズムの結果を用いると、音源116Bの方向を
正確に探知することができる。1つの実施例において、音源116Bの位置は空
間的に±約5°内で追跡される。
フォンエンハンサー102により全ての側を取り囲まれるように、マイクロフォ
ン挿入孔202内に配置されている。詳述すると、リッジ214の高さは、マイ
クロフォン104の高さより大きいように設計されている。このようにすると、
音源116Bからの入来信号が最初に、マイクロフォン104それ自体ではなく
て、マイクロフォンエンハンサー102のリッジ214に到達する。1つの実施
例において、マイクロフォン104のヘッドはマイクロフォン挿入孔202の底
部と同一平面にある。
る限り、任意適当な厚さの任意適当な材料で形成することができる。1つの実施
例において、その材料は高い反射性を有し、また、一部の周波数成分を吸収し、
他の周波数成分を反射するのではなくて、全ての周波数成分をほぼ等しく反射す
るように、スペクトル特性が平らである。1つの特定の実施例において、その材
料の吸収係数は、約100Hz乃至4kHzの周波数で約0.05であり、スペ
クトルの平坦度は、約100Hz乃至8kHzの周波数で約±1デシベル(dB
)である。マイクロフォンエンハンサー102を形成できる材料の種類には、プ
ラスチック、セラミック、金属、種々のタイプの被覆材料等が含まれるが、それ
らに限定されない。1つの実施例において、マイクロフォンエンハンサー102
は、当該技術分野でよく知られた任意タイプの射出成形プロセスによりプラスチ
ックから形成され、その剛性は、広い範囲の温度、例えば0℃乃至約40℃の温
度で形状を保持できるほど十分な値を有する。ある特定の金属のように材料の反
射性が高くて残響を発生する場合、残響により生じる望ましくない信号またはノ
イズを除去するために信号をさらに処理する必要がある。
116Bに関して任意適当な位置に配置可能である。1つの実施例において、マ
イクロフォンシステム101は、水平面だけのキューより成る定位キューだけを
ピップアップする。別の実施例のマイクロフォンシステム101は、水平及び縦
方向の両方のキューより成る定位キューをピックアップする。システム100が
定位キューを探知しようとする場合、マイクロフォンシステム101を音源11
6Bと同じ水平面またはそれとほぼ同じ水平面に位置させる。1つの実施例にお
いて、音源116Bがマイクロフォンシステム101の片側の何れかの側から約
15°またはそれ以上のような、マイクロフォンシステム101の前面に関して
約180°未満の水平アーク内に存在する場合、適当な干渉が発生する。従って
、この実施例では、マイクロフォンシステム101は、水平方向において少なく
とも150°の有効動作範囲を有する。システム100が仰角方向のキューも(
またはそれだけ)を検知する場合、マイクロフォンエンハンサー102は、特定
の音源116Bについて、それ自体のシミュレーションしたヘッド関連伝達関数
(HRTF)、即ち、位置伝達関数(PTF)を発生する。1つの実施例におい
て、音源116Bが、マイクロフォンシステム101の上部または底部の何れか
から約15°またはそれ以上のような、マイクロフォンシステム100の前面に
関して180°未満の垂直アーク内に存在する場合、適当な干渉が発生する。こ
の実施例のマイクロフォンシステム101は、垂直方向において少なくとも15
0°の有効動作範囲を有する。しかしながら、ほとんどのビデオ会議システムで
は、音源116Bは、マイクロフォンシステム101が配置される水平面内また
はその上方に位置する。
ハンサー102から任意適当な距離だけ離れていてもよい。1つの実施例におい
て、音源116Bは、マイクロフォンエンハンサー102から約1m乃至約5m
離れている。音源116Bがマイクロフォンエンハンサー102に近すぎると、
信号が大きくなりすぎて、その方向の正確な検出が困難である。音源116Bが
遠すぎる場合、音源116Bと、その時のバックグラウンドノイズとの判別が難
しい。1つの実施例において、バックグラウンドノイズは、コントローラ105
を適当なアルゴリズムで動くようにプログラミングすることにより吸収する。例
えば、システム100を、最初はバックグラウンドまたは環境ノイズだけで作動
させて、ベースラインが確立できるようにする。所望の音源116Bが一旦スタ
ートすると、ベースラインより高い信号だけがシステム100による考慮の対象
となる。ベースラインまたはそれ以下の信号は、実質的に無視または「減算」さ
れる。即ち、バックグラウンドノイズに比例して1つのサインだけ大きい音波だ
けが考慮される。
周波数応答を発生できる任意適当なマイクロフォンでよい。ノッチまたはローパ
ス若しくはハイパス特性のような普通でないスペクトル特性を有するマイクロフ
ォン104も、システム100がこれらの特性を補償するようにプログラムされ
れば使用可能である。1つの実施例において、マイクロフォン104は平坦なま
たはほぼ平坦なスペクトルを有するマイクロフォンである。特定の実施例におい
て、マイクロフォン104のスペクトル平坦度は、約100Hz乃至10kHz
の周波数で約±2dBである。
ロプロセッサーエンハンサーの直径(即ち長軸)よりも小さい直径を有する。別
の実施例において、マイクロフォン104は、マイクロフォン挿入孔202のよ
うなマイクロフォンエンハンサー102のマイクロフォン装着手段に嵌合するよ
うに設計された、波形率が小さいマイクロフォンである。一般的に、小型マイク
ロフォン104は、長軸206の実効サイズを大きくして、大きな遅延または干
渉を発生することができる。しかしながら、マイクロフォン104がマイクロフ
ォンエンハンサー102と比べて小さすぎると、スペクトル平坦度が劣化する。
あるいは、マイクロフォン104がマイクロフォンエンハンサー102と比べて
大きすぎる場合、マイクロフォンエンハンサー102に含まれるリッジ214の
特異な干渉パターン発生能力が減少する可能性がある。1つの実施例において、
マイクロフォン104の直径は、マイクロフォンエンハンサー102の直径(ま
たは長軸)の約10乃至30%である。別の実施例において、マイクロフォン1
04の直径は約0.635cm乃至約0.95cmである。特定の実施例におい
て、マイクロフォンは、ミネソタ州ミネアポリスのTelex Communications, Inc.
により製造されたTelex Clariaマイクロフォンである。
のシステム101は、本質的に人間の「聴取者」に代わるものである。任意の聴
取者がバーチャル音源の方向及び位置を突き止める、即ち、その音源を探知でき
るようにするには、最初に、「角度を知覚」する必要がある。バーチャル音源の
角度の知覚は、方位角及び仰角で説明できる。従って、本発明は、方位角を求め
、状況によっては仰角も求めて、マイクロフォンシステム101が音源116B
を探知できるようにする。図4に示すように、方位角402は、グラウンドレベ
ル406に平行な第1の水平面404上における音源116Bの相対的角度をい
う。仰角408は、マイクロフォンシステム101の第2の水平面410の上方
のような、水平面の上方にある、音源116Bのような、固定点の角度距離のこ
とである。通常、方位は角度で表わすため、方位及び仰角が0°の位置ある音源
116Bは、聴取者、この場合はマイクロフォンシステム111のすぐ前方にあ
る。方位は、方位円に沿って0°から360°の反時計方向に増加するものとし
て表わすことができる。図4の方位角は約30°であり、仰角406は約60°
である。音源116Bとマイクロフォンシステム101との間の直線距離を知覚
距離と呼ぶことができるが、音源116Bの探知にはこの距離を直接計算する必
要はない。
形成された後、マイクロフォン104により受信される。この干渉は、「スペク
トルピーク」の反対である「スペクトルノッチ」(または反共振)として信号の
スペクトルに現れる。処理用ソフトウェアを用いて、入来干渉パターンを分析、
即ち、デジタル信号のスペクトル成分を推定することにより、特定の空間的方向
に関連のある共通のノッチを突き止めることができる。適当なアルゴリズムを使
用して、入力信号スペクトルの連続するフレームにある、リッジ距離に比例する
特定の周波数範囲の最小点を探索する。音源116Bの方位角を、信号スペクト
ルのノッチ位置に基づき探索表で推定する。垂直方向の干渉パターンを発生させ
ると、音源116Bの仰角も同じ検知方法で推定することができる。この検索に
より、その位置の「可能性が最も高い」空間的方向が得られる。
、空間推定器108の前に、まず信号プロセッサー106へ入力される。信号プ
ロセッサー106は、マイクロフォンシステム101からの入来信号を処理して
、適当な信号を空間推定器へ送るために必要な任意適当なコンポーネントにより
構成可能である。上述したように、また図5に示すように、信号プロセッサー1
06は、アナログ−デジタル(A/D)コンバータ508と、変換器510とを
含むことができる。
器515とより成る。入来アナログ信号はサンプラー514へ入力され、そこで
連続するサンプルが得られる。これらの数値サンプルまたはフレーム516は、
上述したように、スペクトルノッチを含む。しかしながら、フレーム516は、
マイクロフォンシステム101により発生されるスペクトルノッチだけでなく、
音源116Bからの信号に自然に存在する「内容物」としてのスペクトルノッチ
も含む。この内容物としてのノッチは通常、約20ミリ秒(ms)もしくはそれ
より短い時間持続する過渡的なものであり、以下に述べるように、システム10
0により無視される。サンプラー514は、約16kHz乃至48kHzのよう
な任意適当なサンプリング周波数で動作可能である。図5に示す実施例において
、サンプラー514を通過するフレーム516はアナログ値である。これらのフ
レーム516はその後、量子化器515へ入り、そこで、値が調整され、または
量子化されて、全て数の増分になり、信号がデジタル化される。
5に示す実施例の変換器516は、乗算器522、ウィンドウ524及び分析器
526より成る。変換器510において、乗算器522は、ウィンドウ524が
発生するウィンドウ関数をA/Dコンバータ508の出力信号に乗算する。ウィ
ンドウ524は、従来のハミングウィンドウ、指数ウィンドウなどのような当該
技術分野で知られた任意適当なウィンドウ関数を発生できる。乗算器522の出
力の信号は、さらに、分析器526により処理される。
るための所定の割合または値の選択を含む。1つの実施例では、Leavy and Shen
の米国特許出願(発明の名称:A Method and Apparatus for Constructing a Di
gital Filter)に記載されるような主要成分(PCA)分析法またはその変形例
を使用する。別な実施例では、入来デジタル信号を、各フレームについて積分変
換することにより時間領域から周波数領域へ変換する。かかる変換は、逆高速フ
ーリエ変換(IFFT)または高速フーリエ変換(FFT)のようなフーリエ解
析を含むことができる。
詳述しない。本質的に、フーリエ変換は、複雑な波形を数学的に分解して振幅及
び位相を特定できる一連の正弦波にする。各フーリエ変換は、時間のただ1つの
「スライス」だけを見ると考えられるため、特定のスペクトル反共振または最小
点が分かる。1つの実施例において、分析器526は、入来デジタル信号を構成
する一連の512個または1024個の点のFFTを取る。別の実施例において
、分析器526は、Shenの米国特許出願(発明の名称:Method and Apparatus f
or Performing Block Based Frequency Domain Filtering)に記載されたアルゴ
リズムの変形例を使用する。Shen特許は三次元の音を「発生」するアルゴリズム
を記載しているため、これらは必然的に、代わりに三次元の音を「探知」するた
めのパラメータを組み込んだ変形例を含むものである。
ュールへ直接送られて、さらに処理される。図5に示す実施例において、信号は
直接、空間推定器108へ送られる。空間推定器108では、フーリエ変換信号
をノッチ検知器508よりすぐ利用するか、または、まず各変換に関連するメモ
リー506に記憶させ、その後で処理することができる。メモリー506は、最
大N個の情報フレームを記憶することが可能である。本質的に、ノッチ検知器5
02は、分析器526の出力をチェックして、空間的方向に対応する特定の領域
に、上述したマイクロフォンエンハンサー102からの反射によるノッチがない
か否かを探索する。明確なノッチが検出されると、ノッチ検知器502は、統計
的分析を行って、その空間的方向が以前検出したものであるか否かを突き止める
。即ち、前のフレーム516に関する情報を含む探索表504を用いて、検出し
たノッチと、連続する入力フレームとを比較する。このようにして、最も最近の
フレーム516を旧いフレーム516と比較すると、サンプラー514を出る特
定のノッチが、マイクロプロセッサーエンハンサー102により導入された方向
を表わすスペクトルノッチであって、内容としてのスペクトルノッチではないと
、十分な信頼度で決定することが可能である。1つの実施例において、ノッチが
少なくとも約5個またはそれ以上の連続するフレーム516に現れる場合、十分
な信頼度が得られる。1つの実施例において、ノッチ検知器502は、水平方向
のノッチ検知器及び垂直方向のノッチ検知器より成り、これらはそれぞれ、水平
方向及び垂直方向の探索表でノッチを探索する。
10へ送り、このモーターを移動して、ビデオカメラが探知された音源116B
の方向を向くようにする。画像情報は、その後、ビデオカメラからオーディオ/
ビデオ送信機110へ送られる。関連のオーディオ情報も、オーディオ圧縮器1
11からオーディオ/ビデオ送信機へ送られる。
ルの多くに適応するように設計可能である。これらの変数には、周波数(または
ピッチ)、強度(または音の大きさ)及び持続時間が含まれる。別の実施例にお
いて、スペクトルの内容(または音色)もシステム100により検知される。
、即ち、15Hz未満から最高20kHzを超える信号周波数の広い範囲に適応
可能なように設計できる。1つの実施例において、音波ステアリングシステム1
00の信号処理は、可聴スピーチに関連する帯域幅、即ち約300Hzから約5
kHzの帯域幅を中心とするように設計される。スペクトル平滑を行うことによ
り、信号プロセッサー108は、スペクトル中のある特定の音またはノイズを無
視するようにプログラムすることも可能である。
定の時間の間、第2の音源による割込みを無視するようにプログラムすることが
できる。かかる割込みは、別の人間からの音声またはモーターのハム音のような
機械的ノイズを含むことができる。別の人間の音声のような第2の音源からの音
が所定期間経過後も継続している場合、所望であれば、カメラ103を第2の音
源の方向へ向けることができる。
ステム100の感度も、特定の用途に応じて任意適当な態様で調整することがで
きる。1つの実施例において、システム100は、約75−90dBまたはそれ
以上のような通常の会話に関連する強さの音をピックアップできる。別の実施例
では、75dBより小さい強度または約90dBより大きい強度の音も検出でき
る。しかしながら、信号強度がさらに大きくなると、信号の強度比(即ち、反射
経路からの信号に対する直線経路の信号の比率)は、必ずしも同じ比率で変化し
ない。その結果、一方の信号が他方の信号を隠すかマスクキングするようになり
、反射波の検出が困難またはほとんど不可能になって、方向を探知できない。
めの画像認識ステップも含む。例えば、音源116Bの方向を探知するに際して
エラーが生じ、カメラが、唇が動いていないような人または空の椅子に向けられ
ると、画像認識ステップにより、その方向に音源116Bが存在しないことが検
証され、それに応じてカメラを移動することができる。
。1つの実施例において、システムは、参加者の発声が壁に非常に近い所ではな
い普通の会議室で使用される。別の実施例では、はっきりわかるような残響があ
り、カーペットを敷いていない大きな部屋で使用される。
プで説明することができる。捕捉ステップ602では、干渉を含む音響データの
流れを、マイクロフォンシステムから捕捉する。このデータは、604において
、数値サンプリングフレームへ変換する。その後、606において、各フレーム
にウィンドウ関数を乗算する。608において、各フレームにつきフーリエ変換
を発生させる。610において、この変換を用いてスペクトルノッチを探索する
。612において、各フレーム内の特定の方向に対応する特定の領域に、スペク
トルノッチを検出する。613において、これらのフレームをメモリーに記憶さ
せ、614において、前のN個のフレームと相関させる。616において、種々
のスペクトルノッチに関連する既知の場所の探索表を用いて、正しい空間的方向
を突き止める。最後に、618において、「可能性が最も高い」空間的方向をカ
メラモーターへ出力する。
の実施例において、マイクロフォンシステム101は、レンズ703及びカメラ
モーター110を有するビデオカメラ103を備えたビデオシステムに作動的に
接続されている。ビデオシステム及びマイクロフォンシステム101は共に、従
来のモニター702上に設置されている。マイクロフォンシステム101は、モ
ニター702及びビデオカメラ103に関する任意適当な場所に配置することが
できる。マイクロフォンシステム101は、モニター702の前面のスクリーン
704の上方に配置し、マイクロフォンエンハンサー102の周縁部がモニター
702と同一平面またはほぼ同一平面になるようにする。マイクロフォン104
それ自体は、上述したように、ボウル形マイクロフォンエンハンサー102の基
部内の凹部にある。この実施例では、発表者または音源116はシステム100
のほぼ前面に位置し、他の参加者705はそれに近い所に座っている。
において、ビデオ「フレンドリー」またはプラグアンドプレイシステムを使用す
る。かかるシステムは、ユニバーサル・シリアル・バス(USB)付きのコンピ
ュータシステムを含むが、それに限定されない。かかるプラットフォームは、本
発明の技術を用いてより自然なビデオ電話のやりとりを提供することが可能であ
る。特定の実施例において、カリフォルニア州サンタクララのインテル社が製造
するプロシェア200またはチームステーション4システムを使用する。
信機からの出力は、伝送メディア118を介して遠隔のオーディオ/ビデオ受信
機120へ送られる。伝送メディア118は、情報を伝送可能な任意適当な帯域
幅を使用する任意適当なタイプの有線または無線メディアである。出力は、コン
トローラ105に接続された任意適当なタイプのネットワークにより、伝送メデ
ィアを介して、遠隔のオーディオ/ビデオ受信機120へ送ることができる。同
じ伝送メディア118及びネットワークを用いて、遠隔地の任意のオーディオ/
ビデオ送信機から近くのオーディオ/ビデオ受信機へ信号を送り、完全なビデオ
会議を行うことができる。これは、ワイドエリアネットワーク(WAN)、プラ
イベートブランチエクスチェンジ(PBX)、任意タイプのローカルエリアネッ
トワーク(LAN)を、適当なブリッジ、ルーター及びゲートウェイなどと共に
含むが、それらに限定されない。1つの実施例において、普通のダイアルアップ
インターネット接続のような任意適当なタイプのインターネット接続またはIS
DNのような任意タイプの高速インターネット接続を用いる。イサーネットまた
はトークンリングのような1組のメディアアクセスコントロール(MAC)プロ
トコルを用い、情報ネットワークを介して、情報をスムースに流すことができる
。1つの実施例において、伝送メディア118は、送信コントロールプロトコル
/インターネットプロトコル(TCP/IP)のような標準のプロトコルを用い
る双方向完全構造イサーネット接続より成る。受信機120からの信号は、その
後、任意タイプの普通のモニター124と、スピーカーとへ出力され、これを見
る者122は出力されたものを見また聞くことができる。
ピーカーアレイを無響室でテストすると、本発明のシステムをさらに改善できる
。反射、残響、オクルージョン等の効果を測定するために、1またはそれ以上の
「典型的な」会議室でさらにテストを行うことも可能である。アルゴリズム、マ
イクロフォンエンハンサーの形状、リッジのサイズ及び間隔なども、必要に応じ
てさらに調整することもできる。
使用するハードウェアも小型である。2つのマイクロフォン信号間の差を測定す
るのではなくて三次元の音の発生源を検知するため、応答時間及び精度を改善で
きる可能性が高い。1つの実施例において、ステアリングシステム100により
、必要に応じてパンニング及びティルティングを行うことにより、個々の発表者
または話す人を追従することができる。別の実施例では、追従システムまたは音
追跡手段を使用して、カメラを音楽の音のような任意の音源に向ける。さらに別
の実施例では、追跡システムをセキュリティーの目的で使用し、単一の声の音だ
けでなく多数の音声、足音などを検知することができる。適当に改造すると、音
波ステアリングシステムをロボット案内システムと併用することも可能である。
物として同一目的を達成するように設計された任意の構成を使用できることがわ
かるであろう。本願は、本発明の種々の変形例及び設計変更を包含するように意
図されている。従って、本発明は頭書の特許請求の範囲及びその均等物によって
のみ限定されることが明らかである。
る。
である。
波より成る音源からの信号を略示する頂面図である。
システムの方位角及び仰角の幾何学的関係を示す概略図である。
ーラのブロック図である。
ーチャートである。
Claims (25)
- 【請求項1】 音源から到達する音響信号の方向を探知する装置であって、 音響信号を受信し、変形させて、変形済み音響信号を発生させる複数の反射器
と、 反射器の近くに位置して、変形済み音響信号を受信する変換器と、 変換器に作動的に接続され、変形済み音響信号のスペクトルノッチを検出し、
識別する検出器と、 検出器に作動的に接続され、識別したスペクトルノッチに基づき音響信号の方
向を決定する手段とより成る音響信号の方向測定装置。 - 【請求項2】 複数の反射器のうち少なくとも2つの反射器は、変換器から
それぞれ異なる距離だけ離隔し、さらに、複数の反射器は、音響信号に干渉パタ
ーンを発生させてそれらの音響信号を変形させる非対称リッジより成る請求項1
の装置。 - 【請求項3】 各音響信号の一部が変換器に遭遇する前に非対称リッジと遭
遇するため、該部分には変換器に到達する前に時間遅れが生じる請求項2の装置
。 - 【請求項4】 複数の反射器は、楕円形の有限反射表面上に配置され、さら
に、変換器が楕円の中心に位置する請求項1の装置。 - 【請求項5】 反射器は、約100Hz乃至約4kHzの周波数における吸
収係数が少なくとも約0.05である射出成形プラスチックにより作成される請
求項4の装置。 - 【請求項6】 方向決定手段は、識別したノッチを以前検出したノッチと比
較して、特定の空間的方向に関連して生じる共通のノッチを見つける請求項1の
装置。 - 【請求項7】 音響信号の望ましくないノイズを除去するスペクトル平滑器
をさらに備えた請求項6の装置。 - 【請求項8】 カメラ追跡システムが作動的に接続され、方向決定手段から
の出力がカメラ追跡システムを作動してビデオカメラを音源の方向に向ける請求
項7の装置。 - 【請求項9】 音源から到達する音響信号の方向を探知する方法であって、 複数の反射器により音響信号を受信して、変形させ、 反射器の近くに位置する変換器により音響信号を電気信号に変換し、 変換器に作動的に接続された検出器により音響信号のスペクトルノッチを検出
して識別し、 検出器に作動的に接続された手段により、識別したスペクトルノッチに基づき
音響信号の方向を決定するステップより成る音響信号の測定方法。 - 【請求項10】 複数の反射器のうち少なくとも2つの反射器は、変換器か
らそれぞれ異なる距離だけ離隔し、さらに、複数の反射器は、音響信号に干渉パ
ターンを発生させてそれらの音響信号を変形させる非対称リッジより成る請求項
9の方法。 - 【請求項11】 各音響信号の一部が変換器に遭遇する前に非対称リッジと
遭遇するため、該部分には変換器に到達する前に時間遅れが生じる請求項10の
方法。 - 【請求項12】 複数の反射器は、楕円形の有限反射表面上に配置され、さ
らに、変換器が楕円の中心に位置する請求項9の方法。 - 【請求項13】 反射器は、約100Hz乃至約4kHzの周波数における
吸収係数が少なくとも約0.05である射出成形プラスチックにより作成される
請求項12の方法。 - 【請求項14】 方向を決定するステップは、識別したノッチを以前検出し
たノッチと比較して、特定の空間的方向に関連して生じる共通のノッチを見つけ
る請求項9の方法。 - 【請求項15】 スペクトル平滑器を用いて音響信号の望ましくないノイズ
を除去するステップをさらに含む請求項14の方法。 - 【請求項16】 ビデオカメラを有し、該装置に作動的に接続されたカメラ
追跡システムを使用するステップをさらに含み、空間推定器からの出力がカメラ
追跡システムを作動してビデオカメラを音源の方向に向ける請求項15の方法。 - 【請求項17】 音源の方向を探知する方法であって、 音源からの干渉を含む音響データの流れを捕捉し、 音響データを数値より成るサンプリングフレームに変換し、 各フレームにウィンドウ関数を乗算し、 各フレームのフーリエ変換を発生させ、 フーリエ変換を用いてスペクトルノッチを検索し、 特定の空間的方向に対応する特定の領域でスペクトルノッチを発見し、 種々のスペクトルノッチに関連する既知の場所の探索表により探索を行い、 推定した空間的方向をカメラモーターへ出力して、カメラモーターに作動的に
接続されたカメラを音源の方向へ向けるステップより成る音源方向探知方法。 - 【請求項18】 カメラが音源に関連する画像を記録する請求項17の方法
。 - 【請求項19】 三次元の音源が分散した変化する場所から音響信号を発生
させる会議環境に用いるマイクロフォンシステムであって、 非対称リッジを有する少なくとも1つの反射表面の中心に配置したマイクロフ
ォンであって、非対称的リッジと相互作用する音響信号がマイクロフォンへの直
線経路を辿る音響信号より後にマイクロフォンへ到達し、さらにマイクロフォン
に到達する全ての音響信号が電気信号に変換されるマイクロフォンと、 マイクロフォンに関する音源の角度方向を求めるために電気信号を分析する制
御回路とより成るマイクロフォンシステム。 - 【請求項20】 制御回路は、角度方向に関する情報をカメラを有するビデ
オ追跡システムへ送り、さらに、ビデオ追跡システムにより、カメラが送信機か
ら遠隔の受信機へ音響信号に関連する画像を送信する請求項19のシステム。 - 【請求項21】 制御回路は、圧縮オーディオ信号を送信機へ送るオーディ
オ圧縮器を有する請求項19のマイクロフォンシステム。 - 【請求項22】 各々がマイクロフォンの互いに反対側に位置する2つの反
射器より成る、音源の方向を探知するためのマイクロフォンエンハンサーと、 マイクロフォンに結合されて、電気信号をマイクロフォンから音源方向情報を
含む出力信号へ変換するコントローラとより成る音波ステアリングシステム。 - 【請求項23】 ビデオカメラを有し、コントローラに作動的に接続された
カメラ追跡システムをさらに具備し、コントローラの出力信号は、カメラ追跡シ
ステムを作動して、ビデオカメラを音源の方向に向ける請求項22のシステム。 - 【請求項24】 音源からの音響データの流れからスペクトルノッチを探知
して識別し、 識別したスペクトルノッチに基づき音源の方向を決定するステップより成る方
法を実行するようコンピュータに命令する命令を含んだコンピュータにより読み
取り可能なメディア。 - 【請求項25】 音源からの音響データの流れからスペクトルノッチを探知
して識別し、 識別したスペクトルノッチに基づき音源の方向を決定するステップより成る命
令を含んだコンピュータにより読み取り可能なメディアを用いてコンピュータに
命令する方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2000/007843 WO2001074117A1 (en) | 2000-03-24 | 2000-03-24 | Spatial sound steering system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003529060A true JP2003529060A (ja) | 2003-09-30 |
JP4198915B2 JP4198915B2 (ja) | 2008-12-17 |
Family
ID=21741191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001570682A Expired - Fee Related JP4198915B2 (ja) | 2000-03-24 | 2000-03-24 | 空間的音波ステアリングシステム |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP1266538B1 (ja) |
JP (1) | JP4198915B2 (ja) |
AT (1) | ATE492125T1 (ja) |
AU (1) | AU2000239178A1 (ja) |
DE (1) | DE60045392D1 (ja) |
WO (1) | WO2001074117A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006162461A (ja) * | 2004-12-08 | 2006-06-22 | Institute Of Physical & Chemical Research | 音源位置検出装置及び方法 |
JP2009200569A (ja) * | 2008-02-19 | 2009-09-03 | Chiba Inst Of Technology | 音源方向推定方法および装置 |
JP2013532278A (ja) * | 2011-04-27 | 2013-08-15 | エンパイア テクノロジー ディベロップメント エルエルシー | 送信機の3d座標の測定 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106297820A (zh) | 2015-05-14 | 2017-01-04 | 杜比实验室特许公司 | 具有基于迭代加权的源方向确定的音频源分离 |
DE102017221021A1 (de) * | 2017-11-24 | 2019-05-29 | Zf Friedrichshafen Ag | Echoortung mit richtungsabhängigem Resonator |
CN111273230B (zh) * | 2020-03-02 | 2022-06-07 | 开放智能机器(上海)有限公司 | 一种声源定位方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3843034A1 (de) * | 1988-12-21 | 1990-06-28 | Messerschmitt Boelkow Blohm | Mikrofonsystem zum bestimmen der richtung und position einer schallquelle |
US4965775A (en) * | 1989-05-19 | 1990-10-23 | At&T Bell Laboratories | Image derived directional microphones |
US5748757A (en) * | 1995-12-27 | 1998-05-05 | Lucent Technologies Inc. | Collapsible image derived differential microphone |
US5742693A (en) * | 1995-12-29 | 1998-04-21 | Lucent Technologies Inc. | Image-derived second-order directional microphones with finite baffle |
US6185152B1 (en) * | 1998-12-23 | 2001-02-06 | Intel Corporation | Spatial sound steering system |
-
2000
- 2000-03-24 WO PCT/US2000/007843 patent/WO2001074117A1/en active Application Filing
- 2000-03-24 AT AT00918351T patent/ATE492125T1/de not_active IP Right Cessation
- 2000-03-24 EP EP00918351A patent/EP1266538B1/en not_active Expired - Lifetime
- 2000-03-24 AU AU2000239178A patent/AU2000239178A1/en not_active Abandoned
- 2000-03-24 DE DE60045392T patent/DE60045392D1/de not_active Expired - Lifetime
- 2000-03-24 JP JP2001570682A patent/JP4198915B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006162461A (ja) * | 2004-12-08 | 2006-06-22 | Institute Of Physical & Chemical Research | 音源位置検出装置及び方法 |
JP2009200569A (ja) * | 2008-02-19 | 2009-09-03 | Chiba Inst Of Technology | 音源方向推定方法および装置 |
JP2013532278A (ja) * | 2011-04-27 | 2013-08-15 | エンパイア テクノロジー ディベロップメント エルエルシー | 送信機の3d座標の測定 |
Also Published As
Publication number | Publication date |
---|---|
EP1266538B1 (en) | 2010-12-15 |
EP1266538A1 (en) | 2002-12-18 |
DE60045392D1 (de) | 2011-01-27 |
ATE492125T1 (de) | 2011-01-15 |
WO2001074117A1 (en) | 2001-10-04 |
JP4198915B2 (ja) | 2008-12-17 |
AU2000239178A1 (en) | 2001-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6185152B1 (en) | Spatial sound steering system | |
US10491809B2 (en) | Optimal view selection method in a video conference | |
US10972835B2 (en) | Conference system with a microphone array system and a method of speech acquisition in a conference system | |
US5778082A (en) | Method and apparatus for localization of an acoustic source | |
US6469732B1 (en) | Acoustic source location using a microphone array | |
US9030520B2 (en) | Automatic camera selection for videoconferencing | |
US5940118A (en) | System and method for steering directional microphones | |
EP1621017B1 (en) | An arrangement and method for audio source tracking | |
CA1230666A (en) | Acoustic direction identification system | |
JP4469887B2 (ja) | 超音波カメラトラッキングシステム及びそれに関連する方法 | |
US6618073B1 (en) | Apparatus and method for avoiding invalid camera positioning in a video conference | |
EP1551205A1 (en) | Head relational transfer function virtualizer | |
JP2003532348A (ja) | ビデオ会議及び他の応用において、結合されたビデオ及びオーディオ情報を使用して移動物体を追尾するための方法及び装置 | |
WO2014161309A1 (zh) | 一种移动终端实现声源定位的方法及装置 | |
CN115482830B (zh) | 语音增强方法及相关设备 | |
CN111551921A (zh) | 一种声像联动的声源定向系统及方法 | |
CN117480554A (zh) | 语音增强方法及相关设备 | |
US20030031327A1 (en) | Method and apparatus for providing multiple output channels in a microphone | |
JP4198915B2 (ja) | 空間的音波ステアリングシステム | |
US8064618B2 (en) | Direction detection apparatus, direction detection method and direction detection program, and direction control apparatus, direction control method, and direction control program | |
CN118202641A (zh) | 用于房间智能的会议系统及方法 | |
TWI775119B (zh) | 用於雜音過濾之設備與方法及相關聯非暫時性電腦可讀儲存媒體 | |
JPWO2007122729A1 (ja) | 通信システム、通信装置及び音源方向特定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071023 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080122 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080129 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080221 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080228 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080317 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080902 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081002 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131010 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |