JP2003529060A - 空間的音波ステアリングシステム - Google Patents

空間的音波ステアリングシステム

Info

Publication number
JP2003529060A
JP2003529060A JP2001570682A JP2001570682A JP2003529060A JP 2003529060 A JP2003529060 A JP 2003529060A JP 2001570682 A JP2001570682 A JP 2001570682A JP 2001570682 A JP2001570682 A JP 2001570682A JP 2003529060 A JP2003529060 A JP 2003529060A
Authority
JP
Japan
Prior art keywords
microphone
signal
sound source
acoustic signal
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001570682A
Other languages
English (en)
Other versions
JP4198915B2 (ja
Inventor
シェン,アルバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of JP2003529060A publication Critical patent/JP2003529060A/ja
Application granted granted Critical
Publication of JP4198915B2 publication Critical patent/JP4198915B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/34Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Acoustics & Sound (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Stereophonic Arrangements (AREA)
  • Steering Controls (AREA)

Abstract

(57)【要約】 音源からの音響信号の方向を探知する装置及び方法。音響信号を変形させる複数の反射器と、反射器に近接配置した変換器とを用いる。ノッチ検知器は、変形済み音響信号のスペクトルノッチを検出し識別する。その後、探知手段が音源方向を探知する。1つの実施例では、三次元の音を検知できるマイクロフォンシステムを用いる。マイクロフォンシステムは、少なくとも2つの反射器が楕円の中心にあるマイクロフォンから異なる距離だけ離隔した楕円形マイクロフォンエンハンサーを有する。反射器に設けた非対称リッジは、人間の耳の耳界により発生するパターンと概念的に類似の干渉パターンをマイクロフォンが受信する信号に発生させる。

Description

【発明の詳細な説明】
【0001】
【発明の分野】
本発明は、一般的に、音波ステアリングシステムに関し、さらに詳細には、三
次元空間的オーディオ技術を利用する空間的音波ステアリングシステムに関する
【0002】
【発明の背景】
種々の異なる目的のために、音源からの信号を検知できるシステムが多数提案
されている。ビデオ会議システム及び他の通信システムだけでなく、多種多様な
セキュリティー、オートメーション及びモニターシステムが、生活の便利さを向
上させ、生活を簡易化し、また生活を安全にする目的で使用される。また、最新
式の音波探知システムは、音声指向カメラ画像ステアリング方式により音源の方
向または場所の探知を可能にする。例えば、Chu et al.の米国特許第5,778
,082号は、空間的に分離した一対のマイクロフォンにより共通の音源からの
スピーチまたは他の音響信号の方向または場所を探知する、音源探知システム及
び方法を開示している。同様に、Bakerの米国特許第5,686,957号は、
マイクロフォンの配列を利用して、半球状可視領域内における特定の話し手の方
向を特定し、方向信号をビデオカメラシステムへ送るものである。しかしながら
、Chu及びBakeのシステムは他の類似のシステムと同様、オーディオ信号振幅の
「差」を検出できるに過ぎないため、音源方向を探知するためには2個以上のマ
イクロフォンの使用が不可欠であり、これらシステムのコスト及び複雑さが増加
する。
【0003】 Elkoの米国特許第5,742,693号は、所定周波数において一次または二
次の差動応答を発生するための1個以上のセンサーを備えた有限音響反射表面ま
たはバッフルより成る音響変換器を開示している。Elkoのセンサーは、画像から
得られるセンサーであり、バッフルそれ自体の上に配置する必要がある。Elkoの
変換器はさらに、このバッフルを所定周波数の音波の約1波長乃至半波長にしな
ければならない。かかる制約により、Elkoの装置をビデオカメラのような標準型
ビデオ会議システムと併用するのが難しい。
【0004】 上記理由により、音源方向を探知する、便利でコンパクトなシステムが当該技
術分野で求められている。
【0005】
【発明の概要】
本発明は、音源から到達する音響信号の方向を探知する装置及び方法を提供す
る。この装置及び方法は、音響信号を変形する複数の反射器と、反射器に近接し
て配置する変換器とを使用する。ノッチ検知器が、変形済み音響信号のスペクト
ルノッチを検知して識別する。その後、方向決定手段が音源方向を探知する。
【0006】 1つの実施例では、三次元の音波を検知できるマイクロフォンシステムを用意
する。このマイクロフォンシステムは、少なくとも2つの反射器が楕円の中心に
あるマイクロフォンから異なる距離だけ離隔した楕円形マイクロフォンエンハン
サーを有する。反射器は非対称リッジを有し、これらのリッジは、人間の耳の耳
介により発生されるパターンに概念的に類似した、干渉パターンをマイクロフォ
ンにより受信される信号に発生させる。
【0007】 別の実施例の音波ステアリングシステムは、カメラが方向情報により音源の方
へ向けられるようにする。特殊な画像装置を用いるか、方向を探知するために少
なくとも2つのマイクロフォンを必要とする従来のビデオ会議システムとは異な
り、本発明の音波ステアリングシステムはただ1個のマイクロフォンを必要とす
るに過ぎず、従来型ビデオ会議システムに組み込むことができる。
【0008】 別の実施例では、マイクロフォンシステムからのアナログ信号を時間ベースの
デジタルオーディオ情報より成る別個のフレームに変換する。フーリエ解析によ
り、この時間ベース情報を周波数ベースのスペクトル係数に変換する。その後、
空間推定器がこれらのスペクトル係数を用いてフレーム内のスペクトルノッチま
たは反共振を見つける。スペクトル推定器は、探索表を用いてこれらのフレーム
を既知の空間座標に関連付け、この情報をカメラのモニターへ送る。
【0009】
【好ましい実施例の詳細な説明】
音源から到達する音響信号の方向を探知する装置及び方法を開示する。以下の
詳細な説明において、本願の一部であり、本発明の特定の実施例を例示する添付
図面を参照する。図面において、同一の参照番号は幾つかの図を通して実質的に
同じコンポーネントを指すものである。これらの実施例は、当業者が本発明を実
施できるように十分に詳しく記載されており、他の実施例も可能であって、本発
明の範囲から逸脱することなく機械的、方法的、電気的及び他の種類の変形又は
設計変更を行うことができることを理解されたい。従って、以下の詳細の説明は
限定的な意味でとらえるべきではなく、本発明の範囲は、頭書の特許請求の範囲
と均等物の全範囲とによってのみ制限されるものである。
【0010】 バーチャル音響または三次元(3D)サウンドを「発生」できることが当該技
術分野において知られている。この技術は、インターアクティブ/バーチャルリ
アリティーシステム、マルチメディアシステム、通信システムなどに利用される
。本質的に、適正に設計したデジタルフィルターを使用すると、ヘッドホンを着
用した聞き手の周りの「バーチャル」空間の任意の場所で音を発生することがで
きる。従来型3Dシステムでは、所与の音源に関連して最初から存在する空間的
属性を補充または置換するプロセスにより、空間化された音波を発生する。これ
とは対照的に、本発明は、音源からの既存の3D音波を「検出」する新規の3D
音波ステアリングシステムである。
【0011】 図1は、本発明の一実施例によるコンピュータ化音波ステアリングシステム(
以下、「システム」と呼ぶ)100のブロック図である。このシステム100は
、マイクロフォンシステム101、ビデオカメラ103及びコントローラ105
より成る。コントローラ105は、信号プロセッサー106、空間推定器108
、カメラモーター110、オーディオ圧縮器111及びオーディオ/ビデオ送信
機112を有する。システム100の入力は、画像/音源116である。詳述す
ると、ビデオカメラ103の入力は画像ソース116Aであり、マイクロフォン
エンハンサー102の入力は音源116Bである。オーディオ/ビデオ送信機1
12の出力は、送信媒体118を介して遠隔のオーディオ/ビデオ受信機120
へ送られる。
【0012】 別の実施例(図示せず)において、このシステム100は、マイクロフォンシ
ステム101と、コントローラ105とだけにより構成される。この実施例にお
いて、コントローラ105は、信号プロセッサー106と、空間推定器108と
から成る。オーディオ圧縮器111及びオーディオ/ビデオ送信器112は、こ
のシステム100の外部か、それと並置して用いることができる。この実施例に
おいて、カメラモーター110は、本質的に、コントローラ105により提供さ
れる情報を利用する。
【0013】 マイクロフォンシステム101と、コントローラ105との間、ビデオカメラ
103とコントローラ105との間などのような種々のコンポーネントの間には
、多数のインターフェイス、バスまたは他の通信手段が介在する。かかるインタ
ーフェイスは、当業者であればわかるように、必要とされる全ての従来型電気的
及び機械的コンポーネントより成るため、これらについては詳述しない。コント
ローラ105は、当該技術分野で良く知られているように、ラップトップの汎用
コンピュータのようなコンピュータまたは局部受信機または遠隔の受信機でよい
。1つの実施例において、コントローラ105は、入力信号を処理するか操作し
て適当な出力信号を発生するために必要な全てのコンポーネントを備えたパーソ
ナルコンピュータである。上述したコンポーネントに加えて、コントローラ10
5は、任意適当なタイプの中央処理ユニット、ユーティリティー、ドライバー、
イベントキュー、アプリケーションなどを含むことができるが、本発明はそれら
に限定されない。1つの実施例において、コントローラ105のコンポーネント
はコンピュータのプロセッサーにより実行される全てのコンピュータプログラム
であり、コンピュータは、メモリーのようなコンピュータにより読取り可能なメ
ディアに記憶された命令の制御下で動作する。コントローラ105はまた、当業
者であればわかるように、コンピュータプログラムを実行するオペレーティング
システムを含む。
【0014】 マイクロフォンシステム101は、マイクロフォンエンハンサー102と、変
換器またはマイクロフォン104とを有する。1つの実施例において、マイクロ
フォンエンハンサー102は、上述したように、干渉パターンを発生して音源1
16Bからの音響信号を変形する非対称リッジまたはフォールドを含んだマイク
ロフォンスリーブより成る。変形済み音響信号は、マイクロフォン104により
電気信号に変換され、この電気信号は信号プロセッサー106へ送られる。1つ
の実施例において、信号プロセッサー106は、マイクロフォン104の出力を
アナログから整数値または浮動小数点値のデジタル表示のようなデジタル信号に
変換する。デジタル信号はさらに、信号のスペクトル干渉パターンを抽出するた
めに信号プロセッサーアルゴリズムにより処理される。この情報は、空間推定器
108へ送られ、この推定器は確立された統計法により音源116Bの方向に関
する「最良予測」を行う。空間推定器108からの方向情報は、カメラモーター
110へ出力される。カメラモーター110は、カメラを移動できる従来型カメ
ラモーターまたは追跡システムの任意のものでよい。カメラモーター110は、
ビデオカメラ103を画像/音源116の方向へ向けて、音源116が捕捉でき
るようにする。1つの実施例では、画像認識アルゴリズムにより、空間推定器1
08の出力を確認する。音源116Bに連携する画像は、オーディオ/ビデオ送
信機112により捕捉され処理される。同時に、オーディオ圧縮器111からの
圧縮済み電気信号も、オーディオ/ビデオ送信機112へ出力される。画像及び
圧縮器済み電気信号はその後、オーディオ/ビデオ送信機112により送信媒体
118を介して別の場所の遠隔/ビデオ受信機120へ送られる。遠隔オーディ
オ/ビデオ受信機120は、画像及びそれに連携する電気信号を処理し復号する
。その結果得られるビデオ出力は、第三者122がモニター124上で見ること
ができ、オーディオ出力は1またはそれ以上のスピーカー126により聞くこと
ができる。
【0015】 マイクロフォンエンハンサー102は、入来音響信号と相互作用して各空間的
方向にとって特有の周波数特性を発生させ、これらの信号をマイクロフォン10
4へ送ることのできる任意適当なコンポーネントでよい。これらの相互作用パタ
ーンまたは干渉パターンは、各信号のスペクトルにスペクトルノッチとして現れ
る。
【0016】 図2Aは、マイクロフォンエンハンサー102が長軸206及び短軸208を
有する楕円または卵形をした1つの実施例を示すが、本発明はこれに限定されな
い。図2Bに示すように、卵形の構成は、マイクロフォンの孔部202の両側の
リッジ214間の差または遅延を最大にするが、マイクロフォンエンハンサー1
02の垂直方向のサイズは増加させない。卵形の構成では、長軸206の最小寸
法は信号の分解能により決定されるが、これは実施例により異なる。長軸206
が特定の実施例にとって小さすぎる場合、マイクロフォンエンハンサー102に
含まれるリッジ214は検出可能なパターンを発生できない。長軸206が特定
の実施例にとって大きすぎる場合、所期の音源からの信号の反射波と、他の近く
の音源からの信号の反射波との間に差が存在せず、望ましくないバックグラウン
ドノイズが検出される。1つの実施例において、マイクロフォンエンハンサー1
02は、直軸206が約2cm乃至約6cmまたはそれ以上、短軸208が約0
.5cm乃至約3cmまたはそれ以上である。
【0017】 マイクロフォンエンハンサー102はさらに、前面210(図2Bに示す)と
背面212(図2Aに示す)とを有し、リムまたはリップ201も備えている。
マイクロフォンエンハンサー102はまた、マイクロフォン104を支持するか
収容するための手段も備えている。図2A及び2Bに示す実施例のマイクロフォ
ンエンハンサー102は、中央にマイクロフォン挿入孔202を有し、この孔部
にマイクロフォン104が装着される。本質的に、マイクロフォン挿入孔202
は平らな端縁部を有する円形の孔である。この実施例において、マイクロフォン
エンハンサー102は、背面212を下側にして表面の方へ向けて設置すると、
マイクロフォン挿入孔202の端縁部上にのみ納まる容器の形状を有する。
【0018】 図2Bは、マイクロフォンエンハンサー102の楕円形前面210へ固定され
るかそれと一体的に形成されるリッジ214及びウェル216の1つの構成を示
すが、本発明はそれに限定されない。一般的に、マイクロフォンエンハンサー1
02は、人間の耳の耳介と概念的に類似の、縦方向の音波の反射器として働く非
対称リッジ214を含む。しかしながら、人間の耳の場合、中耳及び内耳はこれ
らの振動を受ける「受信機」である。本発明において、それ自体のエンハンサー
、即ち「耳」を取付けたマイクロフォン104は、音波の受信を意図した受信機
である。1つの実施例において、マイクロフォンエンハンサー102の1つの半
球に多数のリッジ204及びウェル216が存在する。別の実施例では、リム2
01に近い所に大きなリッジ214が配置されている。さらに別の実施例では、
花の花弁と同様にリッジ214を種々の開放段階に配置して、それらがほぼ外方
向に湾曲し、リム201より先に延びるか、または延びないようにすることがで
きる。
【0019】 リッジ214は、適当な干渉パターンが発生される限り任意適当な高さでよい
。一般的に、リッジ214が高ければ高いほど、大きなエネルギーの反射または
干渉信号が得られ、検出及び測定が容易になる。1つの実施例において、リッジ
214は約0.25cm乃至約0.5cmの範囲の種々の高さを有する。別の実
施例において、リッジ214は、全てほぼ同じ高さである。さらに別の実施例で
は、一部または全部のリッジ214が約0.5cmより高くする。
【0020】 音源の方向を探知するには、マイクロフォンエンハンサー102に少なくとも
2つの隆起部分、即ち、2つのリッジ214かまたは少なくとも2つの頂上部分
または丘部分を有する1つのリッジ214を設ける必要がある。1つの実施例に
おいて、各々がマイクロフォン104から異なる距離だけ離隔した2つのリッジ
214が存在する。マイクロフォンエンハンサー102は最小2個の隆起部分を
備えることができるが、多数の隆起部分またはリッジ214を設けると、多数の
ノッチが検出できるため、信号の方向探知の信頼度が増加する。1つの実施例に
おいて、マイクロフォンエンハンサー102は、2乃至10個またはそれ以上の
リッジ214を有する。図2B及び3に示す実施例では、リッジ214は少な
くともわずかに円形または双曲線状である。
【0021】 リッジ214はまた、信号干渉の信頼度が少なくとも最小レベルになるように
互いに十分な距離離隔する必要がある。そうでなくて、2つの音源がマイクロフ
ォン104の両側であるがマイクロフォンエンハンサー102から同一距離にあ
る場合、「鏡像」状態または混同圏が生じ、システムが2つのうち何れの側から
音波がくるかを探知できなくなる。1つの実施例において、リッジ214は、長
軸206上の垂直方向の中心にあるマイクロフォン挿入孔202の両側にある。
別の実施例において、リッジ214間の距離は、マイクロフォンエンハンサー1
02のサイズに応じて、少なくとも1cm乃至約2.5cmまたはそれよりもさ
らに大きい。
【0022】 入来音響信号(即ち、音波)と適当に相互作用させるために、マイクロフォン
エンハンサー102は、垂直またはほぼ垂直な平面において端縁部上、即ちその
リム201上に配置され、リッジ214の頂部が入来信号に対して直角またはほ
ぼ直角になるようにする。マイクロフォンエンハンサー102がその信号に近づ
く前方に、またはその信号から遠ざかる後方に傾くと、反射の程度、従って信号
強度が大きく減少する。マイクロフォンエンハンサー102が鉛直線から何れか
の方向に傾きすぎると、せん断効果が生じて、リッジ214がもはや適当な干渉
パターンを発生できなくなる。
【0023】 マイクロフォンエンハンサー102を、特定の用途に応じて、リム201の周
囲の任意の部分上に納まるように回転することもできる。1つの実施例において
、マイクロフォンエンハンサー102の長軸206は、水平面内にある。即ち、
広くカバーできる位置にある。この構成は、全ての参加者が座ったままでいると
推定する、従来のビデオ会議システムに有用である。別の実施例において、マイ
クロフォンエンハンサー102は、長軸206が垂直方向、即ち人物写真を撮る
位置にあるように配置される。この構成は、全ての参加者が立っていると推定で
きる場合に有用であり、垂直方向の高さを検知するのが望ましい。さらに別の実
施例では、少なくとも2つのマイクロフォンエンハンサー102を「十字架」の
ように配置して、第1のマイクロフォンエンハンサーの長軸が水平またはほぼ水
平に、第2のマイクロソフトエンハンサーの長軸が垂直またはほぼ垂直になるよ
うにすることができる。別の実施例では、1またはそれ以上の円形のマイクロフ
ォンエンハンサー102を使用する。最後の2つの実施例は、参加者が立ったり
座ったりする場合に有用である。
【0024】 人間の聴覚において、所与の水平面内にある音源の角度位置を突き止める最も
重要な手がかりは、2つの耳における波頭の相対的な差である。同様に、本発明
は、音源の角度位置を、マイクロフォン104の両側のリッジ214における波
頭の相対的な差に基づき測定する。詳述すると、干渉が生じるのは、同じ信号が
2以上の経路を進行して、同一場所、即ちマイクロフォン104のヘッドに到達
するためである。直線経路を進む信号の一部と、マイクロフォンの両側の少なく
とも2つの異なる遅延または反射経路を進む信号の他の部分とを組み合わせると
、本質的に、共通の頂点が音源116Bと、マイクロフォン104とである三角
形が形成される。これにより、遅延経路の信号は、直線経路の信号と、距離の差
に対応する周波数においてのみ破壊的な干渉を開始する。このようにして、対応
するスペクトルノッチが発生する。
【0025】 図3は、3つの異なる音波302、304、306がマイクロフォンシステム
101に遭遇する信号の拡大頂面図である。その図は実尺でなく、各音波をその
波の中心または中心に近い所の矢印で表わす。さらに、図示を簡略にするために
、2個のリッジ214だけを示すが、本発明はそれに限定されない。図3に示す
ように、反射することになる第1の音波304はリッジ214で反射し、反射す
ることになる第2の音波は別のリッジ214で反射し、直線経路を行く音波30
6は直接マイクロフォン104へ到達する。その結果、マイクロフォン104は
、反射した音波302、304を、各リッジ214の中心からマイクロフォン3
04までの距離に比例する遅延時間の後、受信する。換言すれば、リッジで反射
する音波の経路302、304は長く、それにより干渉が生じる。図3に示す実
施例では、反射した第1の音波302は距離308だけ遅延し、反射した第2の
音波304は異なる距離310だけ遅延する。実際の干渉または遅延量は、リッ
ジ214、マイクロフォン104及び音源116Bの相対的位置及び大きさを含
む(それらに限定されない)多くのファクターにより可変である。しかしながら
、この時間遅延は、適当な信号処理アルゴリズムを用いて計算可能であり、この
時間遅延は外的条件に応じて変化する。1つの実施例において、時間遅延は約1
秒/330mであるが、その理由は標準的な温度及び圧力で音波が約1秒間約3
30m進むからである。アルゴリズムの結果を用いると、音源116Bの方向を
正確に探知することができる。1つの実施例において、音源116Bの位置は空
間的に±約5°内で追跡される。
【0026】 図3に示すように、マイクロフォン104は、作動端またはヘッドがマイクロ
フォンエンハンサー102により全ての側を取り囲まれるように、マイクロフォ
ン挿入孔202内に配置されている。詳述すると、リッジ214の高さは、マイ
クロフォン104の高さより大きいように設計されている。このようにすると、
音源116Bからの入来信号が最初に、マイクロフォン104それ自体ではなく
て、マイクロフォンエンハンサー102のリッジ214に到達する。1つの実施
例において、マイクロフォン104のヘッドはマイクロフォン挿入孔202の底
部と同一平面にある。
【0027】 マイクロフォンエンハンサー102は、比較的剛性で幾分かの反射特性を有す
る限り、任意適当な厚さの任意適当な材料で形成することができる。1つの実施
例において、その材料は高い反射性を有し、また、一部の周波数成分を吸収し、
他の周波数成分を反射するのではなくて、全ての周波数成分をほぼ等しく反射す
るように、スペクトル特性が平らである。1つの特定の実施例において、その材
料の吸収係数は、約100Hz乃至4kHzの周波数で約0.05であり、スペ
クトルの平坦度は、約100Hz乃至8kHzの周波数で約±1デシベル(dB
)である。マイクロフォンエンハンサー102を形成できる材料の種類には、プ
ラスチック、セラミック、金属、種々のタイプの被覆材料等が含まれるが、それ
らに限定されない。1つの実施例において、マイクロフォンエンハンサー102
は、当該技術分野でよく知られた任意タイプの射出成形プロセスによりプラスチ
ックから形成され、その剛性は、広い範囲の温度、例えば0℃乃至約40℃の温
度で形状を保持できるほど十分な値を有する。ある特定の金属のように材料の反
射性が高くて残響を発生する場合、残響により生じる望ましくない信号またはノ
イズを除去するために信号をさらに処理する必要がある。
【0028】 マイクロフォンシステム101は、適切な干渉パターンが発生する限り、音源
116Bに関して任意適当な位置に配置可能である。1つの実施例において、マ
イクロフォンシステム101は、水平面だけのキューより成る定位キューだけを
ピップアップする。別の実施例のマイクロフォンシステム101は、水平及び縦
方向の両方のキューより成る定位キューをピックアップする。システム100が
定位キューを探知しようとする場合、マイクロフォンシステム101を音源11
6Bと同じ水平面またはそれとほぼ同じ水平面に位置させる。1つの実施例にお
いて、音源116Bがマイクロフォンシステム101の片側の何れかの側から約
15°またはそれ以上のような、マイクロフォンシステム101の前面に関して
約180°未満の水平アーク内に存在する場合、適当な干渉が発生する。従って
、この実施例では、マイクロフォンシステム101は、水平方向において少なく
とも150°の有効動作範囲を有する。システム100が仰角方向のキューも(
またはそれだけ)を検知する場合、マイクロフォンエンハンサー102は、特定
の音源116Bについて、それ自体のシミュレーションしたヘッド関連伝達関数
(HRTF)、即ち、位置伝達関数(PTF)を発生する。1つの実施例におい
て、音源116Bが、マイクロフォンシステム101の上部または底部の何れか
から約15°またはそれ以上のような、マイクロフォンシステム100の前面に
関して180°未満の垂直アーク内に存在する場合、適当な干渉が発生する。こ
の実施例のマイクロフォンシステム101は、垂直方向において少なくとも15
0°の有効動作範囲を有する。しかしながら、ほとんどのビデオ会議システムで
は、音源116Bは、マイクロフォンシステム101が配置される水平面内また
はその上方に位置する。
【0029】 音源116Bは、適当な干渉パターンを発生できる限り、マイクロフォンエン
ハンサー102から任意適当な距離だけ離れていてもよい。1つの実施例におい
て、音源116Bは、マイクロフォンエンハンサー102から約1m乃至約5m
離れている。音源116Bがマイクロフォンエンハンサー102に近すぎると、
信号が大きくなりすぎて、その方向の正確な検出が困難である。音源116Bが
遠すぎる場合、音源116Bと、その時のバックグラウンドノイズとの判別が難
しい。1つの実施例において、バックグラウンドノイズは、コントローラ105
を適当なアルゴリズムで動くようにプログラミングすることにより吸収する。例
えば、システム100を、最初はバックグラウンドまたは環境ノイズだけで作動
させて、ベースラインが確立できるようにする。所望の音源116Bが一旦スタ
ートすると、ベースラインより高い信号だけがシステム100による考慮の対象
となる。ベースラインまたはそれ以下の信号は、実質的に無視または「減算」さ
れる。即ち、バックグラウンドノイズに比例して1つのサインだけ大きい音波だ
けが考慮される。
【0030】 マイクロフォン104は、音波エネルギーを電気エネルギーに変換し、所望の
周波数応答を発生できる任意適当なマイクロフォンでよい。ノッチまたはローパ
ス若しくはハイパス特性のような普通でないスペクトル特性を有するマイクロフ
ォン104も、システム100がこれらの特性を補償するようにプログラムされ
れば使用可能である。1つの実施例において、マイクロフォン104は平坦なま
たはほぼ平坦なスペクトルを有するマイクロフォンである。特定の実施例におい
て、マイクロフォン104のスペクトル平坦度は、約100Hz乃至10kHz
の周波数で約±2dBである。
【0031】 マイクロフォン104は任意適当なサイズでよく、1つの実施例では、マイク
ロプロセッサーエンハンサーの直径(即ち長軸)よりも小さい直径を有する。別
の実施例において、マイクロフォン104は、マイクロフォン挿入孔202のよ
うなマイクロフォンエンハンサー102のマイクロフォン装着手段に嵌合するよ
うに設計された、波形率が小さいマイクロフォンである。一般的に、小型マイク
ロフォン104は、長軸206の実効サイズを大きくして、大きな遅延または干
渉を発生することができる。しかしながら、マイクロフォン104がマイクロフ
ォンエンハンサー102と比べて小さすぎると、スペクトル平坦度が劣化する。
あるいは、マイクロフォン104がマイクロフォンエンハンサー102と比べて
大きすぎる場合、マイクロフォンエンハンサー102に含まれるリッジ214の
特異な干渉パターン発生能力が減少する可能性がある。1つの実施例において、
マイクロフォン104の直径は、マイクロフォンエンハンサー102の直径(ま
たは長軸)の約10乃至30%である。別の実施例において、マイクロフォン1
04の直径は約0.635cm乃至約0.95cmである。特定の実施例におい
て、マイクロフォンは、ミネソタ州ミネアポリスのTelex Communications, Inc.
により製造されたTelex Clariaマイクロフォンである。
【0032】 マイクロフォン104及びマイクロフォンエンハンサー102より成る本発明
のシステム101は、本質的に人間の「聴取者」に代わるものである。任意の聴
取者がバーチャル音源の方向及び位置を突き止める、即ち、その音源を探知でき
るようにするには、最初に、「角度を知覚」する必要がある。バーチャル音源の
角度の知覚は、方位角及び仰角で説明できる。従って、本発明は、方位角を求め
、状況によっては仰角も求めて、マイクロフォンシステム101が音源116B
を探知できるようにする。図4に示すように、方位角402は、グラウンドレベ
ル406に平行な第1の水平面404上における音源116Bの相対的角度をい
う。仰角408は、マイクロフォンシステム101の第2の水平面410の上方
のような、水平面の上方にある、音源116Bのような、固定点の角度距離のこ
とである。通常、方位は角度で表わすため、方位及び仰角が0°の位置ある音源
116Bは、聴取者、この場合はマイクロフォンシステム111のすぐ前方にあ
る。方位は、方位円に沿って0°から360°の反時計方向に増加するものとし
て表わすことができる。図4の方位角は約30°であり、仰角406は約60°
である。音源116Bとマイクロフォンシステム101との間の直線距離を知覚
距離と呼ぶことができるが、音源116Bの探知にはこの距離を直接計算する必
要はない。
【0033】 上述したように、干渉パターンは、マイクロフォンエンハンサー102により
形成された後、マイクロフォン104により受信される。この干渉は、「スペク
トルピーク」の反対である「スペクトルノッチ」(または反共振)として信号の
スペクトルに現れる。処理用ソフトウェアを用いて、入来干渉パターンを分析、
即ち、デジタル信号のスペクトル成分を推定することにより、特定の空間的方向
に関連のある共通のノッチを突き止めることができる。適当なアルゴリズムを使
用して、入力信号スペクトルの連続するフレームにある、リッジ距離に比例する
特定の周波数範囲の最小点を探索する。音源116Bの方位角を、信号スペクト
ルのノッチ位置に基づき探索表で推定する。垂直方向の干渉パターンを発生させ
ると、音源116Bの仰角も同じ検知方法で推定することができる。この検索に
より、その位置の「可能性が最も高い」空間的方向が得られる。
【0034】 しかしながら、上述したように、マイクロフォンシステム101からの信号は
、空間推定器108の前に、まず信号プロセッサー106へ入力される。信号プ
ロセッサー106は、マイクロフォンシステム101からの入来信号を処理して
、適当な信号を空間推定器へ送るために必要な任意適当なコンポーネントにより
構成可能である。上述したように、また図5に示すように、信号プロセッサー1
06は、アナログ−デジタル(A/D)コンバータ508と、変換器510とを
含むことができる。
【0035】 図5に示す実施例のA/Dコンバータ508は、サンプラー514と、量子化
器515とより成る。入来アナログ信号はサンプラー514へ入力され、そこで
連続するサンプルが得られる。これらの数値サンプルまたはフレーム516は、
上述したように、スペクトルノッチを含む。しかしながら、フレーム516は、
マイクロフォンシステム101により発生されるスペクトルノッチだけでなく、
音源116Bからの信号に自然に存在する「内容物」としてのスペクトルノッチ
も含む。この内容物としてのノッチは通常、約20ミリ秒(ms)もしくはそれ
より短い時間持続する過渡的なものであり、以下に述べるように、システム10
0により無視される。サンプラー514は、約16kHz乃至48kHzのよう
な任意適当なサンプリング周波数で動作可能である。図5に示す実施例において
、サンプラー514を通過するフレーム516はアナログ値である。これらのフ
レーム516はその後、量子化器515へ入り、そこで、値が調整され、または
量子化されて、全て数の増分になり、信号がデジタル化される。
【0036】 フレーム516はその後、A/Dコンバータから変換器510へ送られる。図
5に示す実施例の変換器516は、乗算器522、ウィンドウ524及び分析器
526より成る。変換器510において、乗算器522は、ウィンドウ524が
発生するウィンドウ関数をA/Dコンバータ508の出力信号に乗算する。ウィ
ンドウ524は、従来のハミングウィンドウ、指数ウィンドウなどのような当該
技術分野で知られた任意適当なウィンドウ関数を発生できる。乗算器522の出
力の信号は、さらに、分析器526により処理される。
【0037】 信号の分析に任意適当なアルゴリズムを使用できるが、これはデータを減少す
るための所定の割合または値の選択を含む。1つの実施例では、Leavy and Shen
の米国特許出願(発明の名称:A Method and Apparatus for Constructing a Di
gital Filter)に記載されるような主要成分(PCA)分析法またはその変形例
を使用する。別な実施例では、入来デジタル信号を、各フレームについて積分変
換することにより時間領域から周波数領域へ変換する。かかる変換は、逆高速フ
ーリエ変換(IFFT)または高速フーリエ変換(FFT)のようなフーリエ解
析を含むことができる。
【0038】 FFTより成る特定の計算は、当該技術分野で良く知られているためここでは
詳述しない。本質的に、フーリエ変換は、複雑な波形を数学的に分解して振幅及
び位相を特定できる一連の正弦波にする。各フーリエ変換は、時間のただ1つの
「スライス」だけを見ると考えられるため、特定のスペクトル反共振または最小
点が分かる。1つの実施例において、分析器526は、入来デジタル信号を構成
する一連の512個または1024個の点のFFTを取る。別の実施例において
、分析器526は、Shenの米国特許出願(発明の名称:Method and Apparatus f
or Performing Block Based Frequency Domain Filtering)に記載されたアルゴ
リズムの変形例を使用する。Shen特許は三次元の音を「発生」するアルゴリズム
を記載しているため、これらは必然的に、代わりに三次元の音を「探知」するた
めのパラメータを組み込んだ変形例を含むものである。
【0039】 現在のフレーム516のフーリエ変換信号は、他のコンポーネントまたはモジ
ュールへ直接送られて、さらに処理される。図5に示す実施例において、信号は
直接、空間推定器108へ送られる。空間推定器108では、フーリエ変換信号
をノッチ検知器508よりすぐ利用するか、または、まず各変換に関連するメモ
リー506に記憶させ、その後で処理することができる。メモリー506は、最
大N個の情報フレームを記憶することが可能である。本質的に、ノッチ検知器5
02は、分析器526の出力をチェックして、空間的方向に対応する特定の領域
に、上述したマイクロフォンエンハンサー102からの反射によるノッチがない
か否かを探索する。明確なノッチが検出されると、ノッチ検知器502は、統計
的分析を行って、その空間的方向が以前検出したものであるか否かを突き止める
。即ち、前のフレーム516に関する情報を含む探索表504を用いて、検出し
たノッチと、連続する入力フレームとを比較する。このようにして、最も最近の
フレーム516を旧いフレーム516と比較すると、サンプラー514を出る特
定のノッチが、マイクロプロセッサーエンハンサー102により導入された方向
を表わすスペクトルノッチであって、内容としてのスペクトルノッチではないと
、十分な信頼度で決定することが可能である。1つの実施例において、ノッチが
少なくとも約5個またはそれ以上の連続するフレーム516に現れる場合、十分
な信頼度が得られる。1つの実施例において、ノッチ検知器502は、水平方向
のノッチ検知器及び垂直方向のノッチ検知器より成り、これらはそれぞれ、水平
方向及び垂直方向の探索表でノッチを探索する。
【0040】 空間的方向を以前探知している場合、方向信号を、その後、カメラモーター1
10へ送り、このモーターを移動して、ビデオカメラが探知された音源116B
の方向を向くようにする。画像情報は、その後、ビデオカメラからオーディオ/
ビデオ送信機110へ送られる。関連のオーディオ情報も、オーディオ圧縮器1
11からオーディオ/ビデオ送信機へ送られる。
【0041】 本発明の音波ステアリングシステム100は、音を特徴付ける種々の変数レベ
ルの多くに適応するように設計可能である。これらの変数には、周波数(または
ピッチ)、強度(または音の大きさ)及び持続時間が含まれる。別の実施例にお
いて、スペクトルの内容(または音色)もシステム100により検知される。
【0042】 詳述すると、システム100は、亜音速から超音速までの帯域幅の信号周波数
、即ち、15Hz未満から最高20kHzを超える信号周波数の広い範囲に適応
可能なように設計できる。1つの実施例において、音波ステアリングシステム1
00の信号処理は、可聴スピーチに関連する帯域幅、即ち約300Hzから約5
kHzの帯域幅を中心とするように設計される。スペクトル平滑を行うことによ
り、信号プロセッサー108は、スペクトル中のある特定の音またはノイズを無
視するようにプログラムすることも可能である。
【0043】 信号プロセッサー108はさらに、1乃至5秒またはそれ以上のようなある特
定の時間の間、第2の音源による割込みを無視するようにプログラムすることが
できる。かかる割込みは、別の人間からの音声またはモーターのハム音のような
機械的ノイズを含むことができる。別の人間の音声のような第2の音源からの音
が所定期間経過後も継続している場合、所望であれば、カメラ103を第2の音
源の方向へ向けることができる。
【0044】 所与の音源116Bからのある特定強度または強さの音の検出能力としてのシ
ステム100の感度も、特定の用途に応じて任意適当な態様で調整することがで
きる。1つの実施例において、システム100は、約75−90dBまたはそれ
以上のような通常の会話に関連する強さの音をピックアップできる。別の実施例
では、75dBより小さい強度または約90dBより大きい強度の音も検出でき
る。しかしながら、信号強度がさらに大きくなると、信号の強度比(即ち、反射
経路からの信号に対する直線経路の信号の比率)は、必ずしも同じ比率で変化し
ない。その結果、一方の信号が他方の信号を隠すかマスクキングするようになり
、反射波の検出が困難またはほとんど不可能になって、方向を探知できない。
【0045】 1つの実施例において、システム100は、音源116Bの存在を確認するた
めの画像認識ステップも含む。例えば、音源116Bの方向を探知するに際して
エラーが生じ、カメラが、唇が動いていないような人または空の椅子に向けられ
ると、画像認識ステップにより、その方向に音源116Bが存在しないことが検
証され、それに応じてカメラを移動することができる。
【0046】 特定の用途に応じて、信号処理アルゴリズムにより残響を補償する必要がある
。1つの実施例において、システムは、参加者の発声が壁に非常に近い所ではな
い普通の会議室で使用される。別の実施例では、はっきりわかるような残響があ
り、カーペットを敷いていない大きな部屋で使用される。
【0047】 上述の音波探知プロセスの1つの実施例は、図6に示すように、一連のステッ
プで説明することができる。捕捉ステップ602では、干渉を含む音響データの
流れを、マイクロフォンシステムから捕捉する。このデータは、604において
、数値サンプリングフレームへ変換する。その後、606において、各フレーム
にウィンドウ関数を乗算する。608において、各フレームにつきフーリエ変換
を発生させる。610において、この変換を用いてスペクトルノッチを探索する
。612において、各フレーム内の特定の方向に対応する特定の領域に、スペク
トルノッチを検出する。613において、これらのフレームをメモリーに記憶さ
せ、614において、前のN個のフレームと相関させる。616において、種々
のスペクトルノッチに関連する既知の場所の探索表を用いて、正しい空間的方向
を突き止める。最後に、618において、「可能性が最も高い」空間的方向をカ
メラモーターへ出力する。
【0048】 図7は、普通のビデオ会議システムに用いる本発明の1つの実施例を示す。こ
の実施例において、マイクロフォンシステム101は、レンズ703及びカメラ
モーター110を有するビデオカメラ103を備えたビデオシステムに作動的に
接続されている。ビデオシステム及びマイクロフォンシステム101は共に、従
来のモニター702上に設置されている。マイクロフォンシステム101は、モ
ニター702及びビデオカメラ103に関する任意適当な場所に配置することが
できる。マイクロフォンシステム101は、モニター702の前面のスクリーン
704の上方に配置し、マイクロフォンエンハンサー102の周縁部がモニター
702と同一平面またはほぼ同一平面になるようにする。マイクロフォン104
それ自体は、上述したように、ボウル形マイクロフォンエンハンサー102の基
部内の凹部にある。この実施例では、発表者または音源116はシステム100
のほぼ前面に位置し、他の参加者705はそれに近い所に座っている。
【0049】 任意適当なタイプのビデオ会議システムを用いることができる。1つの実施例
において、ビデオ「フレンドリー」またはプラグアンドプレイシステムを使用す
る。かかるシステムは、ユニバーサル・シリアル・バス(USB)付きのコンピ
ュータシステムを含むが、それに限定されない。かかるプラットフォームは、本
発明の技術を用いてより自然なビデオ電話のやりとりを提供することが可能であ
る。特定の実施例において、カリフォルニア州サンタクララのインテル社が製造
するプロシェア200またはチームステーション4システムを使用する。
【0050】 図7に示すように、コントローラ105内に収蔵されたオーディオ/ビデオ送
信機からの出力は、伝送メディア118を介して遠隔のオーディオ/ビデオ受信
機120へ送られる。伝送メディア118は、情報を伝送可能な任意適当な帯域
幅を使用する任意適当なタイプの有線または無線メディアである。出力は、コン
トローラ105に接続された任意適当なタイプのネットワークにより、伝送メデ
ィアを介して、遠隔のオーディオ/ビデオ受信機120へ送ることができる。同
じ伝送メディア118及びネットワークを用いて、遠隔地の任意のオーディオ/
ビデオ送信機から近くのオーディオ/ビデオ受信機へ信号を送り、完全なビデオ
会議を行うことができる。これは、ワイドエリアネットワーク(WAN)、プラ
イベートブランチエクスチェンジ(PBX)、任意タイプのローカルエリアネッ
トワーク(LAN)を、適当なブリッジ、ルーター及びゲートウェイなどと共に
含むが、それらに限定されない。1つの実施例において、普通のダイアルアップ
インターネット接続のような任意適当なタイプのインターネット接続またはIS
DNのような任意タイプの高速インターネット接続を用いる。イサーネットまた
はトークンリングのような1組のメディアアクセスコントロール(MAC)プロ
トコルを用い、情報ネットワークを介して、情報をスムースに流すことができる
。1つの実施例において、伝送メディア118は、送信コントロールプロトコル
/インターネットプロトコル(TCP/IP)のような標準のプロトコルを用い
る双方向完全構造イサーネット接続より成る。受信機120からの信号は、その
後、任意タイプの普通のモニター124と、スピーカーとへ出力され、これを見
る者122は出力されたものを見また聞くことができる。
【0051】 必要に応じて信号処理アルゴリズムをチェックし且つ調整するために所定のス
ピーカーアレイを無響室でテストすると、本発明のシステムをさらに改善できる
。反射、残響、オクルージョン等の効果を測定するために、1またはそれ以上の
「典型的な」会議室でさらにテストを行うことも可能である。アルゴリズム、マ
イクロフォンエンハンサーの形状、リッジのサイズ及び間隔なども、必要に応じ
てさらに調整することもできる。
【0052】 本発明のシステムは、従来のビデオ会議システムと比べると、コンパクトで、
使用するハードウェアも小型である。2つのマイクロフォン信号間の差を測定す
るのではなくて三次元の音の発生源を検知するため、応答時間及び精度を改善で
きる可能性が高い。1つの実施例において、ステアリングシステム100により
、必要に応じてパンニング及びティルティングを行うことにより、個々の発表者
または話す人を追従することができる。別の実施例では、追従システムまたは音
追跡手段を使用して、カメラを音楽の音のような任意の音源に向ける。さらに別
の実施例では、追跡システムをセキュリティーの目的で使用し、単一の声の音だ
けでなく多数の音声、足音などを検知することができる。適当に改造すると、音
波ステアリングシステムをロボット案内システムと併用することも可能である。
【0053】 特定の実施例を図示説明したが、当業者は、図示説明した特定の実施例の代替
物として同一目的を達成するように設計された任意の構成を使用できることがわ
かるであろう。本願は、本発明の種々の変形例及び設計変更を包含するように意
図されている。従って、本発明は頭書の特許請求の範囲及びその均等物によって
のみ限定されることが明らかである。
【図面の簡単な説明】
【図1】 図1は、本発明の一実施例による音波ステアリングシステムのブロック図であ
る。
【図2A】 図2Aは、本発明の一実施例のマイクロフォンエンハンサーを略示する底面図
である。
【図2B】 図2Bは、本発明の一実施例のマイクロフォンシステムの展開斜視図である
【図3】 図3は、本発明の一実施例のマイクロフォンシステムと相互作用する3つの音
波より成る音源からの信号を略示する頂面図である。
【図4】 図4は、本発明の一実施例において音源から音響信号を受けるマイクロフォン
システムの方位角及び仰角の幾何学的関係を示す概略図である。
【図5】 図5は、本発明の一実施例による音波ステアリングシステムに用いるコントロ
ーラのブロック図である。
【図6】 図6は、本発明の一実施例において三次元の音を検知するステップを示すフロ
ーチャートである。
【図7】 図7は、本発明の一実施例におけるビデオ会議システムの概略図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04R 3/00 320 H04R 3/00 320 H04S 1/00 H04S 1/00 Z (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AG,AL,AM,AT,AU, AZ,BA,BB,BG,BR,BY,CA,CH,C N,CR,CU,CZ,DE,DK,DM,DZ,EE ,ES,FI,GB,GD,GE,GH,GM,HR, HU,ID,IL,IN,IS,JP,KE,KG,K P,KR,KZ,LC,LK,LR,LS,LT,LU ,LV,MA,MD,MG,MK,MN,MW,MX, NO,NZ,PL,PT,RO,RU,SD,SE,S G,SI,SK,SL,TJ,TM,TR,TT,TZ ,UA,UG,UZ,VN,YU,ZA,ZW Fターム(参考) 5C022 AA03 AA05 AA12 AB62 AB63 AC69 AC71 AC72 AC74 5C064 AA02 AB04 AC04 AC12 AC16 AD02 AD06 AD14 5D020 BB04 5D062 CC13 CC20 5J083 AA05 AB09 AC31 AD18 AE07 AE08 BE08 BE43 CA10

Claims (25)

    【特許請求の範囲】
  1. 【請求項1】 音源から到達する音響信号の方向を探知する装置であって、 音響信号を受信し、変形させて、変形済み音響信号を発生させる複数の反射器
    と、 反射器の近くに位置して、変形済み音響信号を受信する変換器と、 変換器に作動的に接続され、変形済み音響信号のスペクトルノッチを検出し、
    識別する検出器と、 検出器に作動的に接続され、識別したスペクトルノッチに基づき音響信号の方
    向を決定する手段とより成る音響信号の方向測定装置。
  2. 【請求項2】 複数の反射器のうち少なくとも2つの反射器は、変換器から
    それぞれ異なる距離だけ離隔し、さらに、複数の反射器は、音響信号に干渉パタ
    ーンを発生させてそれらの音響信号を変形させる非対称リッジより成る請求項1
    の装置。
  3. 【請求項3】 各音響信号の一部が変換器に遭遇する前に非対称リッジと遭
    遇するため、該部分には変換器に到達する前に時間遅れが生じる請求項2の装置
  4. 【請求項4】 複数の反射器は、楕円形の有限反射表面上に配置され、さら
    に、変換器が楕円の中心に位置する請求項1の装置。
  5. 【請求項5】 反射器は、約100Hz乃至約4kHzの周波数における吸
    収係数が少なくとも約0.05である射出成形プラスチックにより作成される請
    求項4の装置。
  6. 【請求項6】 方向決定手段は、識別したノッチを以前検出したノッチと比
    較して、特定の空間的方向に関連して生じる共通のノッチを見つける請求項1の
    装置。
  7. 【請求項7】 音響信号の望ましくないノイズを除去するスペクトル平滑器
    をさらに備えた請求項6の装置。
  8. 【請求項8】 カメラ追跡システムが作動的に接続され、方向決定手段から
    の出力がカメラ追跡システムを作動してビデオカメラを音源の方向に向ける請求
    項7の装置。
  9. 【請求項9】 音源から到達する音響信号の方向を探知する方法であって、 複数の反射器により音響信号を受信して、変形させ、 反射器の近くに位置する変換器により音響信号を電気信号に変換し、 変換器に作動的に接続された検出器により音響信号のスペクトルノッチを検出
    して識別し、 検出器に作動的に接続された手段により、識別したスペクトルノッチに基づき
    音響信号の方向を決定するステップより成る音響信号の測定方法。
  10. 【請求項10】 複数の反射器のうち少なくとも2つの反射器は、変換器か
    らそれぞれ異なる距離だけ離隔し、さらに、複数の反射器は、音響信号に干渉パ
    ターンを発生させてそれらの音響信号を変形させる非対称リッジより成る請求項
    9の方法。
  11. 【請求項11】 各音響信号の一部が変換器に遭遇する前に非対称リッジと
    遭遇するため、該部分には変換器に到達する前に時間遅れが生じる請求項10の
    方法。
  12. 【請求項12】 複数の反射器は、楕円形の有限反射表面上に配置され、さ
    らに、変換器が楕円の中心に位置する請求項9の方法。
  13. 【請求項13】 反射器は、約100Hz乃至約4kHzの周波数における
    吸収係数が少なくとも約0.05である射出成形プラスチックにより作成される
    請求項12の方法。
  14. 【請求項14】 方向を決定するステップは、識別したノッチを以前検出し
    たノッチと比較して、特定の空間的方向に関連して生じる共通のノッチを見つけ
    る請求項9の方法。
  15. 【請求項15】 スペクトル平滑器を用いて音響信号の望ましくないノイズ
    を除去するステップをさらに含む請求項14の方法。
  16. 【請求項16】 ビデオカメラを有し、該装置に作動的に接続されたカメラ
    追跡システムを使用するステップをさらに含み、空間推定器からの出力がカメラ
    追跡システムを作動してビデオカメラを音源の方向に向ける請求項15の方法。
  17. 【請求項17】 音源の方向を探知する方法であって、 音源からの干渉を含む音響データの流れを捕捉し、 音響データを数値より成るサンプリングフレームに変換し、 各フレームにウィンドウ関数を乗算し、 各フレームのフーリエ変換を発生させ、 フーリエ変換を用いてスペクトルノッチを検索し、 特定の空間的方向に対応する特定の領域でスペクトルノッチを発見し、 種々のスペクトルノッチに関連する既知の場所の探索表により探索を行い、 推定した空間的方向をカメラモーターへ出力して、カメラモーターに作動的に
    接続されたカメラを音源の方向へ向けるステップより成る音源方向探知方法。
  18. 【請求項18】 カメラが音源に関連する画像を記録する請求項17の方法
  19. 【請求項19】 三次元の音源が分散した変化する場所から音響信号を発生
    させる会議環境に用いるマイクロフォンシステムであって、 非対称リッジを有する少なくとも1つの反射表面の中心に配置したマイクロフ
    ォンであって、非対称的リッジと相互作用する音響信号がマイクロフォンへの直
    線経路を辿る音響信号より後にマイクロフォンへ到達し、さらにマイクロフォン
    に到達する全ての音響信号が電気信号に変換されるマイクロフォンと、 マイクロフォンに関する音源の角度方向を求めるために電気信号を分析する制
    御回路とより成るマイクロフォンシステム。
  20. 【請求項20】 制御回路は、角度方向に関する情報をカメラを有するビデ
    オ追跡システムへ送り、さらに、ビデオ追跡システムにより、カメラが送信機か
    ら遠隔の受信機へ音響信号に関連する画像を送信する請求項19のシステム。
  21. 【請求項21】 制御回路は、圧縮オーディオ信号を送信機へ送るオーディ
    オ圧縮器を有する請求項19のマイクロフォンシステム。
  22. 【請求項22】 各々がマイクロフォンの互いに反対側に位置する2つの反
    射器より成る、音源の方向を探知するためのマイクロフォンエンハンサーと、 マイクロフォンに結合されて、電気信号をマイクロフォンから音源方向情報を
    含む出力信号へ変換するコントローラとより成る音波ステアリングシステム。
  23. 【請求項23】 ビデオカメラを有し、コントローラに作動的に接続された
    カメラ追跡システムをさらに具備し、コントローラの出力信号は、カメラ追跡シ
    ステムを作動して、ビデオカメラを音源の方向に向ける請求項22のシステム。
  24. 【請求項24】 音源からの音響データの流れからスペクトルノッチを探知
    して識別し、 識別したスペクトルノッチに基づき音源の方向を決定するステップより成る方
    法を実行するようコンピュータに命令する命令を含んだコンピュータにより読み
    取り可能なメディア。
  25. 【請求項25】 音源からの音響データの流れからスペクトルノッチを探知
    して識別し、 識別したスペクトルノッチに基づき音源の方向を決定するステップより成る命
    令を含んだコンピュータにより読み取り可能なメディアを用いてコンピュータに
    命令する方法。
JP2001570682A 2000-03-24 2000-03-24 空間的音波ステアリングシステム Expired - Fee Related JP4198915B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2000/007843 WO2001074117A1 (en) 2000-03-24 2000-03-24 Spatial sound steering system

Publications (2)

Publication Number Publication Date
JP2003529060A true JP2003529060A (ja) 2003-09-30
JP4198915B2 JP4198915B2 (ja) 2008-12-17

Family

ID=21741191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001570682A Expired - Fee Related JP4198915B2 (ja) 2000-03-24 2000-03-24 空間的音波ステアリングシステム

Country Status (6)

Country Link
EP (1) EP1266538B1 (ja)
JP (1) JP4198915B2 (ja)
AT (1) ATE492125T1 (ja)
AU (1) AU2000239178A1 (ja)
DE (1) DE60045392D1 (ja)
WO (1) WO2001074117A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006162461A (ja) * 2004-12-08 2006-06-22 Institute Of Physical & Chemical Research 音源位置検出装置及び方法
JP2009200569A (ja) * 2008-02-19 2009-09-03 Chiba Inst Of Technology 音源方向推定方法および装置
JP2013532278A (ja) * 2011-04-27 2013-08-15 エンパイア テクノロジー ディベロップメント エルエルシー 送信機の3d座標の測定

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106297820A (zh) 2015-05-14 2017-01-04 杜比实验室特许公司 具有基于迭代加权的源方向确定的音频源分离
DE102017221021A1 (de) * 2017-11-24 2019-05-29 Zf Friedrichshafen Ag Echoortung mit richtungsabhängigem Resonator
CN111273230B (zh) * 2020-03-02 2022-06-07 开放智能机器(上海)有限公司 一种声源定位方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3843034A1 (de) * 1988-12-21 1990-06-28 Messerschmitt Boelkow Blohm Mikrofonsystem zum bestimmen der richtung und position einer schallquelle
US4965775A (en) * 1989-05-19 1990-10-23 At&T Bell Laboratories Image derived directional microphones
US5748757A (en) * 1995-12-27 1998-05-05 Lucent Technologies Inc. Collapsible image derived differential microphone
US5742693A (en) * 1995-12-29 1998-04-21 Lucent Technologies Inc. Image-derived second-order directional microphones with finite baffle
US6185152B1 (en) * 1998-12-23 2001-02-06 Intel Corporation Spatial sound steering system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006162461A (ja) * 2004-12-08 2006-06-22 Institute Of Physical & Chemical Research 音源位置検出装置及び方法
JP2009200569A (ja) * 2008-02-19 2009-09-03 Chiba Inst Of Technology 音源方向推定方法および装置
JP2013532278A (ja) * 2011-04-27 2013-08-15 エンパイア テクノロジー ディベロップメント エルエルシー 送信機の3d座標の測定

Also Published As

Publication number Publication date
EP1266538B1 (en) 2010-12-15
EP1266538A1 (en) 2002-12-18
DE60045392D1 (de) 2011-01-27
ATE492125T1 (de) 2011-01-15
WO2001074117A1 (en) 2001-10-04
JP4198915B2 (ja) 2008-12-17
AU2000239178A1 (en) 2001-10-08

Similar Documents

Publication Publication Date Title
US6185152B1 (en) Spatial sound steering system
US10491809B2 (en) Optimal view selection method in a video conference
US10972835B2 (en) Conference system with a microphone array system and a method of speech acquisition in a conference system
US5778082A (en) Method and apparatus for localization of an acoustic source
US6469732B1 (en) Acoustic source location using a microphone array
US9030520B2 (en) Automatic camera selection for videoconferencing
US5940118A (en) System and method for steering directional microphones
EP1621017B1 (en) An arrangement and method for audio source tracking
CA1230666A (en) Acoustic direction identification system
JP4469887B2 (ja) 超音波カメラトラッキングシステム及びそれに関連する方法
US6618073B1 (en) Apparatus and method for avoiding invalid camera positioning in a video conference
EP1551205A1 (en) Head relational transfer function virtualizer
JP2003532348A (ja) ビデオ会議及び他の応用において、結合されたビデオ及びオーディオ情報を使用して移動物体を追尾するための方法及び装置
WO2014161309A1 (zh) 一种移动终端实现声源定位的方法及装置
CN115482830B (zh) 语音增强方法及相关设备
CN111551921A (zh) 一种声像联动的声源定向系统及方法
CN117480554A (zh) 语音增强方法及相关设备
US20030031327A1 (en) Method and apparatus for providing multiple output channels in a microphone
JP4198915B2 (ja) 空間的音波ステアリングシステム
US8064618B2 (en) Direction detection apparatus, direction detection method and direction detection program, and direction control apparatus, direction control method, and direction control program
CN118202641A (zh) 用于房间智能的会议系统及方法
TWI775119B (zh) 用於雜音過濾之設備與方法及相關聯非暫時性電腦可讀儲存媒體
JPWO2007122729A1 (ja) 通信システム、通信装置及び音源方向特定装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071023

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080122

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080129

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080221

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080228

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080317

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080526

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080902

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081002

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111010

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131010

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees