JP6150793B2 - 直接音による到着時間差の判定 - Google Patents

直接音による到着時間差の判定 Download PDF

Info

Publication number
JP6150793B2
JP6150793B2 JP2014517218A JP2014517218A JP6150793B2 JP 6150793 B2 JP6150793 B2 JP 6150793B2 JP 2014517218 A JP2014517218 A JP 2014517218A JP 2014517218 A JP2014517218 A JP 2014517218A JP 6150793 B2 JP6150793 B2 JP 6150793B2
Authority
JP
Japan
Prior art keywords
interest
event
computer
signal
readable storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014517218A
Other languages
English (en)
Other versions
JP2015502519A (ja
Inventor
ヴェルサミー カビタ
ヴェルサミー カビタ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amazon Technologies Inc
Original Assignee
Amazon Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amazon Technologies Inc filed Critical Amazon Technologies Inc
Publication of JP2015502519A publication Critical patent/JP2015502519A/ja
Application granted granted Critical
Publication of JP6150793B2 publication Critical patent/JP6150793B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/86Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves with means for eliminating undesired waves, e.g. disturbing noises

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

優先権主張および関連出願
本出願は、2011年6月24日に出願された米国非仮出願第13/168,759号に対する優先権を主張し、かつそれに関連し、参照により本明細書に組み込まれる。
手拍子または指を鳴らすことなどの音響信号が拡張された現実環境内で入力として使用され得る。場合によっては、システムおよび技法がこれらの環境内でこれらの音響信号の位置を判定しようと試み得る。音響源の空間座標を位置特定または判定する従来の方法は、環境によって導入された歪みに敏感であり、誤った結果を生むことが多い。音響信号の空間座標を効果的かつ正確に判定する手法が所望される。
詳細な説明が、添付の図を参照しながら記載される。図中、参照番号の一番左の桁(複数可)は、参照番号が最初に現れる図を識別する。異なる図の同じ参照番号は、類似または同一の構成要素または特徴を示す。
本明細書に記載されるように拡張された現実環境を含み得る例となる部屋内に展開される音響信号の空間座標を判定するように構成されるセンサノードを有する例示的な場面を示す。 図1の例となる部屋内の所定の位置に展開される複数のマイクロホンを含む例示的なセンサノードを示す。 音響源および音響源に対する計算された位置を含む例示的な部屋を図示する。 直接音および間接音を示す図3の例示的な部屋の平面図を図示する。 信号および対応する反響音の例示的なグラフである。 過渡信号を生成する音響源からの直接音に基づきTDOAを判定する例示的なプロセスである。 人間の発話などの音響源からの直接音に基づきTDOAを判定する例示的なプロセスである。 直接音を判定し、直接音源を位置特定する例示的なプロセスである。
拡張された現実環境が、聴覚的身振り、人間の発話、物理的環境の物体との聴覚的相互作用などの入力のための音響信号を利用し得る。これらの音響信号の検出は、最小入力を提供するが、音響信号の空間内の位置を特定または位置を確認することができるより豊かな入力モードが可能である。例えば、胸の高さでの手拍子が拍手として無視されてもよいが、ユーザの頭上の手拍子が特殊な機能の実行を要求してもよい。別の例では、立ったまま話している人が話しながら座っている人よりも発話認識に対して優先されてもよい。一例を挙げれば、位置特定は、1立方メートルあたり1000キログラム未満の密度を有する媒体を伝播される音響信号であってもよい。例えば、圧力の約1標準大気の気体空気(約100キロパスカル)。
複数のマイクロホンが音響信号を検出するために使用されてもよい。マイクロホンのそれぞれで音響信号の到着時間を測定することによって、互いに対するそれぞれのマイクロホンの既知の位置と仮定すると、到着時間差が生成される。この到着時間差(TDOA)データは、音響信号の位置を計算するために双曲線位置決めに使用されてもよい。特に可聴周波数(約300Hzから約3KHzに及ぶものを含む)を有する音響環境は、信号およびノイズ豊かである。さらに、音響信号は、ユーザ、備品、壁などを含む物理的環境内の様々な物体と相互作用する。この相互作用は、直接音ならびに間接音をもたらし得る。直接音は、他の物体もしくは表面との障害または相互作用なしに、音響源から検知マイクロホンに直接進む音である。対照的に、間接音は、反射、屈折などの1つ以上の間接経路を介して進む。反響音などの間接音は、比較的短い時間の間にわたって受信される直接信号の一連のエコーとして明示してもよい。
一般に、音響源とセンサとの間の経路長が、直接音よりも間接音に対してより長い。別の言い方をすれば、直接音は概して、音源からセンサまでのより短い距離を進む。信号の伝達のための合理的な均質媒体と仮定すると、より長い経路長は、直接音と比較して音源からセンサに移行するのにより多くの時間が間接音によって要するという結果になる。双曲線位置決めにおいて正確な時間差の重要性と仮定すると、このようなタイミングの変動は、計算された位置の重大な誤差につながり得る。したがって、反響音の場合などの複数の類似の信号の存在は、計算された時間遅延の重大な変動および計算された位置における誤差の対応する導入を引き起こし得る。
信号反響音を引き起こし得る環境内の信号源の位置を判定することにおいて使用するのに好適な到着時間差(TDOA)データを生成するための装置および技法が本明細書に開示される。このような環境内で、音響源から信号を取得するマイクロホンが、既知である互いに相対的位置を有する所定の物理的配列で配設される。この点で、原点がマイクロホンに対して特定されてもよい。次いで、音響信号の空間座標が、原点に対して定義されてもよい。時間差TDOAモジュールは、信号から音響信号の空間座標を判定するにおいてTDOA位置特定モジュールによる使用に好適な1組の時間遅延を生成するように構成される。
本明細書に記載されるように、TDOAモジュールは、音響源から生じる直接音を判定する可聴信号を処理し、かつ到着時間差遅延間隔を提供するように構成される。TDOAモジュールは、信号の直接音成分を探し、かつ反響音、エコーなどを無視するように構成される。信号の一部分が直接音を判定するために使用されてもよい。例えば、信号が直接音または間接音であるかどうかを判定するために、対象となる事象の最初の2ミリ秒が使用されてもよい。
いくつかの実装では、既知の物理的属性が可能なTDOA結果を抑制するかまたはフィルタリングするために使用されてもよい。物理的属性は、マイクロホン、部屋の寸法などの間隔および位置決めを含んでもよい。例えば、マイクロホン間隔が既知である場合、2つのマイクロホン間を進むときに音速を超える音をもたらすTDOA結果が無視されてもよい。
例示的な環境
図1は、センサノード102を有する部屋の例示的な場面100を示す。センサノード102は、拡張された現実環境で使用され得るなど、部屋内の音響信号の空間座標を判定するように構成される。センサノード102は、天井、壁、卓上、据え付けられた床など、部屋の周囲の様々な位置に位置してもよい。
ここで示されるように、センサノード102は、音響信号を受信するように構成される複数のマイクロホン104を組み込むかまたは結合される。部屋内の物体までの距離を測定する別の方法を提供する測距システム106もまた存在してもよい。測距システム106は、レーザ距離計、音響距離計、光学式距離計、構造化光モジュールなどを備えてもよい。構造化光モジュールは、構造化光源からの構造化光とカメラによって取得される画像との相互作用に少なくとも一部基づき、位置、地形、またはこの中の環境または物体の他の物理的特性を判定するように構成される構造化光源およびカメラを備えてもよい。
ネットワークインターフェース108が、同じ家屋もしくは会社の中などのローカルネットワーク、またはインターフェースを介してアクセスされるなどのリモートリソース上に、他の装置が同じ部屋の中などの局所的に配置される、センサノード102を結合するように構成されてもよい。いくつかの実装では、センサノード102の構成要素が、部屋全体にわたって分布され、有線または無線接続によって互いに通信するように構成されてもよい。
センサノード102は、コンピューティング装置110を含んでもよい。コンピューティング装置110は、1つ以上のプロセッサ112と、1つ以上の入力/出力インターフェース114と、メモリ116とを備えてもよい。メモリ116は、オペレーティングシステム118と、到着時間差(TDOA)モジュール120と、TDOA位置特定モジュール122とを格納してもよい。いくつかの実装では、複数のコンピューティング装置110間のリソースは共有されてもよい。これらのリソースは、入力/出力装置、プロセッサ112、メモリ116などを含んでもよい。メモリ116は、コンピュータ可読記憶媒体(「CRSM」)を含んでもよい。CRSMは、この上に記憶された命令を実装するコンピューティング装置によってアクセス可能である任意の利用可能な物理的媒体であってもよい。CRSMとしては、ランダムアクセスメモリ(「RAM」)、読み出し専用メモリ(「ROM」)、電気的消去可能プログラマブル読み出し専用メモリ(「EEPROM」)、フラッシュメモリもしくは他のメモリ技術、コンパクトディスク読み出し専用メモリ(「CD−ROM」)、デジタル多用途ディスク(「DVD」)もしくは他の光学ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置もしくは他の磁気記憶装置、または所望の情報を記憶するために使用されることが可能であり、かつコンピューティング装置によってアクセスされることが可能である任意の他の媒体が挙げられ得るがこれらに限定されない。
入力/出力インターフェース114は、コンピューティング装置110をマイクロホン104、測距システム106、ネットワークインターフェース108、または大気圧センサ、温度センサ、湿度計、気圧計、画像プロジェクタ、カメラなどの他の装置に結合するように構成されてもよい。コンピューティング装置110とマイクロホン104およびネットワークインターフェース108などの外部装置間の結合は、ワイヤ、光ファイバケーブル、無線などを介してもよい。
TDOAモジュール120は、マイクロホン104によって受信される直接音音響信号を使用して到着時間差遅延値を判定するように構成される。いくつかの実装では、TDOAモジュール120は、入力/出力インターフェース114にアクセス可能なセンサからデータを受け取るように構成されてもよい。例えば、TDOAモジュール120は、温度および湿度データに少なくとも一部基づき到着時間差を判定してもよい。図6〜8に関してより詳細に後述されるように、TDOAモジュール120は、信号入力を受け取り、かつ音響信号の最初の音源と関連付けられるTDOA遅延を判定するように構成される。直接音の使用は、より正確な位置特定に対して部屋の中の反響音による誤差を最小限にする。
TDOAモジュール120によって利用可能であると、TDOA位置特定モジュール122は、音響信号の音源位置を判定するためにTDOAデータを使用するように構成される。この判定は、TDOAデータおよびマイクロホンの既知の位置に基づく双曲線位置決めを含んでもよい。
図2は、センサノード102の図200を示す。この図では、支持構造物202が、2つの線形部材が互いに垂直に配設され、それぞれがD1およびD2の長さを有する、十字架を備える。支持構造物202は、マイクロホン間の既知の所定の距離を維持するのに役立ち、これは次に、音響信号の空間座標の判定に使用されてもよい。5つのマイクロホン104(1)〜(5)が、十字架の中心ならびに十字架のそれぞれのアームの端部に配設される。マイクロホン104の数および配置ならびに支持構造物202の形状は変化し得ることが理解される。例えば、他の実装では、支持構造物は、三角形、円形、または別の幾何学的形状を表現してもよい。いくつかの実装では、非対称支持構造形状、マイクロホンの分布、またはその両方が使用されてもよい。
支持構造物202は、部屋の構造の一部を含んでもよい。例えば、マイクロホン104は、部屋の中の既知の位置の壁、天井、床などに据え付けられてもよい。いくつかの実装では、マイクロホン104が設置され、互いに対する位置が、測距システム106、構造化光走査、手入力などによって他の検知手段によって判定されてもよい。
測距システム106はまた、センサノード102の一部として図示される。上述されるように、測距システム106は、光学、音響、無線、または他の距離測定技法および装置を利用してもよい。測距システム106は、物体、ユーザ、マイクロホン104などの間の距離、位置、またはその両方を判定するように構成されてもよい。例えば、一実装では、マイクロホン104は、部屋の中の様々な位置に配置され、互いに対する正確な位置は、それぞれに配設される光学タグを検出するように構成される光学式距離計を使用して判定されてもよい。
別の実装では、測距システム106は、音響変換器を備えてもよく、マイクロホン104は、音響変換器によって生成される信号を検出するように構成されてもよい。例えば、それぞれが超音波を部屋の特定のセクタの中に伝えるように1組の超音波変換器が配設されてもよい。マイクロホン104は、超音波信号を受信するように構成されてもよく、あるいは専用の超音波マイクロホンが使用されてもよい。互いに対してマイクロホンの既知の位置と仮定すると、アクティブソーナ測距および位置決めが提供されてもよい。
図3は、部屋などの例示的な容積300を図示する。この図では、センサノード102が天井に配設されるが、卓上を最初に叩くことなどの音響源302が音響信号を生成する。この音響信号は、部屋全体にわたって伝播し、マイクロホン104によって受信される。次に、信号に関するマイクロホン104からのデータが入力/出力インターフェース114を介してコンピューティング装置110内のTDOA推定モジュール120に伝達される。TDOA推定モジュール120は、データを使用して、TDOA値を生成する。しかしながら、ノイズ、反響音などの環境条件のため、TDOA値は変化し得る。TDOA位置特定モジュール122は、TDOA値を使用して位置を計算する。したがって、TDOA値が不正確であると、音響源の計算された位置は不正確である。例えば、部屋の中の音の反響音が、センサノード102内のマイクロホンによって検出すると、異なる時間遅延を有するいくつかの音響信号をもたらし得る。様々な時間遅延を有するこれらの異なる音響信号に基づく判定は、容積内の計算された位置の変位をもたらすであろう。TDOA推定が反響音の影響を回避するため、本明細書に記載される方法および技法を使用する計算された位置304(1)が音響源302に密接に一致する。対照的に、本明細書に記載される方法および技法がなければ、別の計算された位置304(2)が卓上、壁306、床、天井などからの音響信号の反響音により誤りになる。
図4は、直接音および間接音を示す図3の例示的な部屋の平面図400を図示する。上述されるように、音響源302は、音響信号を生成する。この信号は、外側に伝播する。直接音402は、音響源302とマイクロホン104との間の最短の非閉塞経路をもたらす信号である。対照的に、示されるような間接音404は、音響源302からマイクロホンまでより長い経路を取る。例えば、ここで示されるように間接音404は、音響源302から生じ、壁306からマイクロホン104(5)に向かって反射することを示される。間接音404がより長い経路をたどるため、間接音404信号は、直接音402よりわずかに遅く到着する。
図5は、信号および対応する反響音の例示的なグラフ500である。このグラフでは、水平軸502が経過時間を示すが、垂直軸504が信号振幅を示す。2つの信号の振幅が経時的に表示され、それぞれが異なるマイクロホンで受信される。2つの直接信号は、限定するためではなく、説明を容易にするためにここで示される。
第1のマイクロホン104で受信される直接音から生じる第1の直接信号506が実線によって示される。第2のマイクロホン104で受信される直接音からの第2の直接信号508が点線で示される。第1の直接信号506および第2の直接信号508の第1のピーク間の時間差が到着時間差間隔510である。例えば、これは、中央のマイクロホン104(5)と104(2)などの別のマイクロホンとの間で比較するときの信号の受信の時間差であってもよい。一般化相互相関を含む他の方法もまた、到着時間差を判定するために使用されてもよい。
グラフ500はまた、マイクロホンが間接信号512を傍受したことを示す。単一の間接信号が、限定するためではなく、説明を容易にするためにここで示される。例えば、硬い壁および床を有する小さな部屋では、いくつかの間接反響音音響信号がマイクロホン104で検出されてもよい。マイクロホン104によって受信される信号が、これらの直接信号と間接信号との組み合わせである。結果として、任意のマイクロホン104で受信された信号の振幅は、間接信号によって干渉されなかった直接信号のものを超えるかまたは未満であってもよい。例えば、相殺的干渉は、特定のマイクロホンの間接信号より低い振幅を有する直接信号をもたらし得る。
TDOAデータが間接信号512によって破損されるような受信された信号に基づくべきである場合、不正確なTDOA間隔510が判定されてもよい。次に、この不正確なTDOA間隔は、信号の不正確な位置特定につながるであろう。
グラフ500はまた、システムの雑音レベル514を示す。この雑音レベルは、センサによって検出される周囲ノイズを含んでもよい。センサがマイクロホン104である場合、これは、空調システム、冷蔵庫の稼働モータ、外部の風の音などの音を含み得る。雑音レベル514はまた、検知機器の動作、固体装置の熱ノイズなどによって生成されるノイズを含んでもよい。これに関連して、振幅が雑音レベル514のものを超えるときに信号が有意であると考えられてもよい。雑音レベル514は、静的または動的に調節可能であってもよい。
グラフ500は、センサからの信号が、いくらかでもあれば、雑音レベル514以下である静寂期間516をさらに示す。例を続けると、第1の直接信号506からの信号は、静寂期間516で示されるが、静寂期間516の間、雑音レベル514より低い。いくつかの実装では、静寂期間516は、約10msから約150msまで幅があってもよい。
この例で示されるように、音響源は、時間の経過とともに増大する振幅を有する信号を生成した。ここで、第1の直接信号506の初期ピーク518は、信号の振幅が雑音レベル514を超えることを示される。後述されるように、第1の直接信号506および第2の直接信号508の初期ピーク518は、間接信号512のピークから分離されてもよい。直接信号間のTDOA間隔510を測定することによって、TDOAデータ品質全体が改良され、位置特定の精度が改良する。
1つのセンサに対する直接信号520の全持続時間が示される。いくつかの信号は過渡的または持続的であり得る。過渡的直接信号は250ミリ秒(ms)以下の持続時間を有してもよい。過渡信号としては、ユーザの指の叩く音、手拍子、個人の足音、クリック音などが挙げられる。持続的信号は、過渡信号を超える全ての持続時間に渡る。場合よっては、250msを超えて持続する信号が持続的信号であると考えられてもよいが、この閾値未満の信号が過渡的であると考えられてもよい。当然のことながら、1つの例となる持続時間閾値が定められているが、他の実施形態が任意の他の閾値を利用してもよい。持続的信号としては、人間の発話、口笛、息遣い音、可聴ビーコンなどが挙げられる。
例示的なプロセス
以下のプロセスは、本明細書のアーキテクチャまたは他のアーキテクチャによって実践されてもよい。これらのプロセスは、論理フローグラフ内のブロックの集積として示される。ブロックのいくつかは、ハードウェア、ソフトウェア、またはこれらの組み合わせで実践され得る操作を表す。ソフトウェアの状況では、ブロックは、1つ以上のプロセッサによって実行されるときに、記載された操作を行う1つ以上のコンピュータ可読記憶媒体に記憶されるコンピュータ実行可能命令を表す。概して、コンピュータ実行可能命令は、特定の機能を行うかまたは特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、構成要素、データ構造などを含む。操作が記載される順は、限定と解釈されるものではなく、記載されたブロックのあらゆる番号は、プロセスを実践するためにあらゆる順または並行して組み合わせることができる。さらに、以下のプロセスが音響信号に対するTDOAの推測を説明するが、非音響信号は、本明細書に記載されるように処理されてもよい。
図6は、過渡信号を生成する音響信号からの直接音を判定する例示的なプロセス600である。602では、音響源と関連付けられる複数の可聴信号が複数のマイクロホンから取得される。例えば、部屋の中のマイクロホン104(1)〜(5)は、卓上を叩くユーザの音響源302からの可聴信号を収集してもよい。
604では、ノイズが可聴信号から除去されてもよい。アナログ装置、デジタル処理、またはこれらの組み合わせを使用してノイズ除去が行われてもよい。606では、可聴信号は、狭いバンドパスフィルタでフィルタリングされる。例えば、バンドパスフィルタは、約800ヘルツ(Hz)から約2キロヘルツ(KHz)に及ぶ帯域幅を有してもよい。いくつかの実装では、他のバンドパスフィルタの帯域幅が使用されてもよい。帯域幅は、不要な周波数帯域を除去しながら対象となる事象を通過するために選択される。
608では、フィルタリングされた信号の雑音レベルが静的または動的のいずれかで推定される。静的雑音レベル推定は、所定の雑音レベルレベルを設定してもよい。対照的に、動的雑音レベルは、時間の経過とともに追跡および調節するように構成されてもよい。一実装では、平均切り上げ/下方追跡手法が使用されてもよく、信号が推定された雑音レベルを超えて上昇するとき、雑音レベルがゆっくりと増大されるが、信号が推定された雑音レベルを下回るとき、雑音レベルがより速く減少し得るようにする。結果として、雑音レベルは、ゆっくりと上昇し、速く下落し得る。
610では、フィルタリングされた信号内の対象となる事象が特定の時間で発生すると判定される。例えば、卓上で指を叩くユーザと関連付けられる音の一部に相当する鋭いピークが、150ミリ秒の時間で判定されてもよい。いくつかの実装では、信号がどこで雑音レベルを超えるかを判定する振り返りが行われてもよい。他の状況では、信号対ノイズ比(SNR)を有し、所定のSNRを超えるあらゆる信号が、対象となる事象として指定されてもよい。
612では、対象となる事象の前に静寂期間が存在するとき、本プロセスは614に進む。静寂期間は、上述されるように、静的または動的に調節されてもよい。静寂期間が存在しないとき、本プロセスは610に戻り、対象となる事象を識別するのを試み続けてもよい。
614では、対象となる事象の信号が雑音レベルを超えて上昇し始める時間が判定される。616では、雑音レベルを越えた対象となる事象に相当する信号と関連付けられる初期ピークが検出される。直接音に相当する初期ピークの所定の数または持続時間が選択されてもよい。所定の数または持続時間は、静的または動的に設定されてもよい。例えば、静的に設定される場合、いくつかの実装では、第1の3つのピークは直接音であると考えられてもよい。間接音のより長い経路長に伴われる増大された伝播時間による後のピークが無視される。
618では、複数の信号の第1のピークに少なくとも一部基づくTDOA値が判定される。反響音または他の歪曲信号を含まずに、直接音に基づくTDOA値がより正確である。
620では、TDOA値は、1つ以上の物理的属性に少なくとも一部基づいてフィルタリングされる。これらの物理的属性は、マイクロホン104の既知の位置、部屋の寸法、温度、大気圧などを含んでもよい。例えば、測距システム106によって判定される範囲を超える位置に相当するTDOA値が、フィルタリングされ、除去されてもよい。
図7は、人間の発話などの持続的音響源からの直接音を判定する例示的なプロセス700である。人間の発話の信号特性としては、持続された時間、周波数および時間領域の変動性、低い平均電力などが挙げられる。これらの特性は従来、特に間接信号が存在する環境で人間の発話の追跡を複雑にした。
702では、音響源と関連付けられる複数の可聴信号が複数のマイクロホンから取得される。例えば、部屋の中のマイクロホン104(1)〜(5)は、大声で話しているユーザを含む音響源からの可聴信号を収集してもよい。
704では、ノイズが可聴信号から除去されてもよい。いくつかの実装では、バンドパスフィルタが適用されてもよい。例えば、バンドパスフィルタは、約2キロヘルツ(KHz)から約8キロヘルツ(KHz)に及ぶ帯域幅を有してもよい。706では、信号の雑音レベルが静的または動的のいずれかで推定される。静的雑音レベル推定は、所定の雑音レベルレベルを設定してもよい。対照的に、動的雑音レベルは、上述されるように、時間の経過とともに追跡および調節するように構成されてもよい。
708では、対象となる事象が特定の時間で識別される。例えば、対象となる事象は、話しているユーザを含んでもよい。この対象となる事象は、信号がいつ所定のSNRを超えるかを判定されてもよい。
710では、対象となる事象の前に静寂期間が存在するとき、本プロセスは712に進む。静寂期間は、上述されるように、静的または動的に調節されてもよい。静寂期間が存在しないとき、本プロセスは708に戻り、対象となる事象を識別するのを試み続けてもよい。
712では、信号上昇時間は、信号がいつ静寂期間の雑音レベルを超えて上昇し始めるかを判定される。714では、サンプルの時間窓が信号上昇時間またはその前後で開始して指定される。716では、窓内のサンプルに少なくとも一部基づき1組のTDOA値が判定される。718では、サンプルの窓は、時間tだけ前方にスライドされる。例えば、いくつかの実装では、窓は、約2ミリ秒だけ前進されてもよい。
720では、サンプルが直接信号の少なくとも一部分を含む対象となる領域内であるとき、本プロセスは722に進む。サンプルが対象となる領域内にないとき、本プロセスは708に戻り、特定の時間で対象となる事象を識別してもよい。
722では、現在スライドされた窓内のサンプルに少なくとも一部基づくTDOA値が判定される。724では、連続的窓から安定した1組のTDOA値が達成されると、本プロセスは726に続く。いくつかの実装では、安定した1組のTDOA値が、互いの2%以内であるTDOA値の4つの窓を含んでもよい。726では、安定したTDOA値が位置特定に提供される。724では、TDOA値が安定していない、すなわち、互いに所定の閾値を超えて変化するとき、本プロセスは718に戻り、窓をスライドさせ、かつTDOAを計算し続けてもよい。いくつかの実装では、全プロセス700は、話しているユーザなどの持続的な可聴源の連続的追跡を提供するように反復されてもよい。
図8は、直接音を判定し、かつ直接音源を位置特定する例示的なプロセス800である。802では、音響源と関連付けられる複数の可聴信号が複数のマイクロホンから取得される。804では、直接信号の少なくとも一部分を含む可聴信号内の領域が判定される。上述されるように、この判定は、信号がいつ静寂期間に従う雑音レベルを超えて上昇するかを検出することを含んでもよい。直接信号は、反射を含まない音響源からの音の受信によって生成される信号を含む。
806では、領域内の可聴信号間の相互相関値が、TDOA値を生成する位相変換(PHAT)で計算される。PHATの計算を対象となる領域に限定することによって、信号全体の連続的計算と比較して計算要件が減少される。
808では、音響源の位置が、対象となる領域の相互相関値から生じるデータに少なくとも一部基づいて判定される。TDOAデータが直接音を反映するため、反響音の処理による劣化が存在しない。結果として、TDOAデータはより正確であり、より正確な位置特定につながる。
結論
主題が構造的特徴に特有の言葉で記載されたが、添付の特許請求の範囲に定義される主題は、必ずしも記載された特定の特徴に限定されないことが理解されるべきである。むしろ、特定の特徴は、特許請求の範囲を実践する例示的な形態として開示される。
付記
1.実行されるときに、
複数のマイクロホンから音響源と関連付けられる複数の可聴信号を取得することと、
バンドパスフィルタで複数の可聴信号をフィルタリングすることと、
フィルタリングされた可聴信号の雑音レベルを推定することと、
複数のフィルタリングされた可聴信号のそれぞれに対して、
対象となる事象を識別することと、
対象となる事象の前にいつ静寂期間が存在するかを判定することと、
対象となる事象がいつ雑音レベル超えて上昇するかを判定することと、
対象となる事象が雑音レベルを超えて上昇した後のピークを検出することと、
ピークが発生する時間を判定することと、
複数のフィルタリングされた可聴信号内でピークが発生する時間の間の差に少なくとも一部基づき、対象となる事象に対する到着時間差(TDOA)値を判定することと、を含む行為を1つ以上のプロセッサに行わせるコンピュータ実行可能命令を記憶する、1つ以上のコンピュータ可読記憶媒体。
2.バンドパスフィルタは、約800ヘルツから約2キロヘルツに及ぶ帯域幅を有するように構成される、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
3.対象となる事象は、約250ミリ秒未満の持続時間を有する音響信号を含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
4.音響信号は、人間の身振りによって生成される、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
5.行為は、フィルタリングされた可聴信号のそれぞれからノイズを除去することをさらに含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
6.行為は、複数のマイクロホンまたは複数のマイクロホンが存在する部屋の1つ以上の物理的属性に少なくとも一部基づき、TDOA値をフィルタリングすることをさらに含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
7.物理的属性は、複数のマイクロホン間の既知の距離を含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
8.物理的属性は、部屋の既知の寸法を含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
9.実行されるときに、
音響源と関連付けられる複数の可聴信号を取得することと、
複数の可聴信号のそれぞれに対して、
音響源からの非反射音に相当する可聴信号の一部分を含む対象となる事象を識別することと、
対象となる事象の前にいつ静寂期間が存在するかを判定することと、
対象となる事象がいつ雑音レベルを超えて上昇するかを判定することと、
対象となる事象が雑音レベルを超えて上昇した後のピークを検出することと、
ピークが発生する時間を判定することと、
複数のフィルタリングされた可聴信号内でピークが発生する時間の間の差に少なくとも一部基づき、対象となる事象に対する到着時間差(TDOA)値を判定することと、を含む行為を1つ以上のプロセッサに行わせるコンピュータ実行可能命令を記憶する、1つ以上のコンピュータ可読記憶媒体。
10.行為は、バンドパスフィルタで複数の可聴信号をフィルタリングすることをさらに含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
11.バンドパスフィルタは、約800ヘルツから約2キロヘルツに及ぶ帯域幅を有するように構成される、付記2に記載の1つ以上のコンピュータ可読記憶媒体。
12.行為は、複数の可聴信号の雑音レベルを推定することをさらに含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
13.行為は、複数の可聴信号からノイズを除去することをさらに含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
14.対象となる事象は、約250ミリ秒未満の持続時間を有する音響源によって生成される音響信号をさらに含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
15.音響信号は、ある環境の中で物体を物理的に打つユーザによって生成される、付記6に記載の1つ以上のコンピュータ可読記憶媒体。
16.行為は、複数の可聴信号を受信する複数のマイクロホンの1つ以上の物理的属性、または複数のマイクロホンが存在する部屋の物理的属性に少なくとも一部基づき、TDOA値をフィルタリングすることをさらに含む、付記1に記載の1つ以上のコンピュータ可読記憶媒体。
17.物理的属性は、マイクロホン間の既知の距離を含む、付記8に記載の1つ以上のコンピュータ可読記憶媒体。
18.物理的属性は、部屋の既知の寸法を含む、付記8に記載の1つ以上のコンピュータ可読記憶媒体。
19.
複数のセンサと、
センサに結合され、かつ
センサを介して、音響源と関連付けられる複数の信号を取得し、
複数の信号のそれぞれに対して、
音響源からの非反射音に相当する信号の一部分を含む対象となる事象を識別し、
対象となる事象の前にいつ静寂期間が存在するかを判定し、
対象となる事象がいつ雑音レベルを超えて上昇するかを判定し、
対象となる事象が雑音レベルを超えて上昇した後のピークを検出し、
ピークが発生する時間を判定し、かつ
信号のピークが発生する時間の間の差に少なくとも一部基づき、到着時間差(TDOA)値を判定するように構成される到着時間差モジュールと、を備える、システム。
20.センサは、マイクロホンを備える、付記11に記載のシステム。
21.到着時間差モジュールは、
バンドパスフィルタで信号をフィルタリングし、かつ
信号の雑音レベルを推定するようにさらに構成される、付記11に記載のシステム。
22.センサに結合され、判定されたTDOAに少なくとも一部基づき音源を位置特定するように構成される到着時間差モジュールをさらに備える、付記11に記載のシステム。
23.実行されるときに、
複数のマイクロホンから音響源と関連付けられる複数の可聴信号を取得することと、
可聴信号の雑音レベルを推定することと、
複数の可聴信号のそれぞれに対して、
対象となる事象を識別することと、
対象となる事象の前にいつ静寂期間が存在するかを判定することと、
対象となる事象が静寂期間後に雑音レベルを超えて上昇する時間を判定することと、
閾値時間量内で、対象となる事象が静寂期間を超えて上昇する時間から開始するサンプルの窓を指定することと、
窓内の可聴サンプルに少なくとも一部基づき到着時間差(TDOA)値を計算することと、
時間tだけサンプルの窓を前方にスライドさせることと、
可聴サンプルがいつ対象となる領域内にあるかを判定することと、
時間tだけ窓を前方にスライドさせた後に窓内の可聴サンプルに少なくとも一部基づきTDOA値を再び計算することと、を含む行為を1つ以上のプロセッサに行わせるコンピュータ実行可能命令を記憶する、1つ以上のコンピュータ可読記憶媒体。
24.対象となる領域は、対象となる事象からの直接信号の少なくとも一部分を含む、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
25.静寂期間は、約100ミリ秒未満の持続時間である、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
26.静寂期間は、任意の可聴信号が雑音レベル以下である期間を含む、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
27.サンプルの窓は、約2ミリ秒未満の持続時間である、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
28.対象となる事象は、人間の発話を含む、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
29.行為は、約2キロヘルツから約8キロヘルツに及ぶ帯域幅を有するように構成されるバンドパスフィルタで、複数の可聴信号をフィルタリングすることをさらに含む、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
30.行為は、複数の可聴信号からノイズを除去することをさらに含む、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
31.行為は、複数のマイクロホンまたは複数のマイクロホンが存在する一つの部屋の1つ以上の物理的属性に少なくとも一部基づき、TDOA値をフィルタリングすることをさらに含む、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
32.物理的属性は、複数のマイクロホン間の既知の距離を含む、付記24に記載の1つ以上のコンピュータ可読記憶媒体。
33.物理的属性は、部屋の既知の寸法を含む、付記24に記載の1つ以上のコンピュータ可読記憶媒体。
34.行為は、
所定の数の連続的窓値から安定した1組のTDOAが達成されると、安定したTDOA値を使用して音響源を位置特定することをさらに含む、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
35.行為は、音響源を連続的に追跡することをさらに含む、付記16に記載の1つ以上のコンピュータ可読記憶媒体。
36.実行されるときに、
複数のマイクロホンから音響源と関連付けられる複数の可聴信号を取得することと、
可聴信号のそれぞれの中で、直接信号の少なくとも一部分を含む領域を判定することと、
直接信号を含む領域内の可聴信号に対する到着時間差値を計算することと、
到着時間差値に少なくとも一部基づき音響源の位置を判定することと、を含む行為を1つ以上のプロセッサに行わせるコンピュータ実行可能命令を記憶する、1つ以上のコンピュータ可読記憶媒体。
37.直接信号のそれぞれは、反射を含まない音響源からの信号の受信によって生成される信号を含む、付記29に記載の1つ以上のコンピュータ可読記憶媒体。
38.計算することは、位相変換を適用することを含む、付記29に記載の1つ以上のコンピュータ可読記憶媒体。
39.計算することは、一般化相互相関技法を適用することを含む、付記29に記載の1つ以上のコンピュータ可読記憶媒体。
40.位置を判定することは、複数のマイクロホンまたは複数のマイクロホンが存在する部屋の1つ以上の物理的属性に少なくとも一部基づき、到着時間差値をフィルタリングすることをさらに含む、付記29に記載の1つ以上のコンピュータ可読記憶媒体。
41.物理的属性は、マイクロホン間の既知の距離を含む、付記33に記載の1つ以上のコンピュータ可読記憶媒体。
42.物理的属性は、部屋の既知の寸法を含む、付記33に記載の1つ以上のコンピュータ可読記憶媒体。
43.
複数のセンサと、
センサに結合され、かつ
複数のセンサから音響源と関連付けられる複数の可聴信号を取得し、
複数の可聴信号のそれぞれに対して、
対象となる事象を識別し、
対象となる事象の前にいつ静寂期間が存在するかを判定し、
対象となる事象が静寂期間後に雑音レベルを超えて上昇する時間を判定し、
閾値時間量内で、対象となる事象が静寂期間を超えて上昇する時間から開始するサンプルの窓を指定し、
窓内のサンプルに少なくとも一部基づき到着時間差(TDOA)値を計算し、
時間tだけサンプルの窓を前方にスライドさせ、
サンプルがいつ対象となる領域内にあるかを判定し、
時間tだけ窓を前方にスライドさせた後に窓内のサンプルに少なくとも一部基づきTDOA値を再び計算するように構成される到着時間差モジュールと、を備える、システム。
44.対象となる領域は、対象となる事象からの直接信号の少なくとも一部分を含む、付記36に記載のシステム。
45.センサは、マイクロホンを含む、付記36に記載のシステム。
46.対象となる事象は、反射を含まないマイクロホンによって直接的に受信される可聴信号の一部分を含む、付記36に記載のシステム。
47.到着時間差モジュールは、
バンドパスフィルタで複数の可聴信号をフィルタリングし、かつ
複数の可聴信号の雑音レベルを推定するようにさらに構成される、付記36に記載のシステム。
48.センサに結合され、計算されたTDOA値に少なくとも一部基づき音響源を位置特定するように構成される到着時間差モジュールをさらに備える、付記36に記載のシステム。

Claims (30)

  1. 実行されるときに、
    音響源と関連付けられる複数の可聴信号を取得することと、
    前記複数の可聴信号の雑音レベルを推定することであって、前記雑音レベルは、時間の経過とともに追跡された可聴信号に基づいて動的に更新される、ことと、
    前記複数の可聴信号のそれぞれに対して、
    前記音響源からの直接信号に相当する前記可聴信号の一部分を含む対象となる事象を識別することと、
    前記対象となる事象の前にいつ静寂期間が存在するかを判定することと、
    前記対象となる事象がいつ前記更新された雑音レベルを超えて上昇するかを判定することと、
    前記対象となる事象が前記更新された雑音レベルを越えて上昇した後のピークを検出することと、
    前記ピークが発生する時間を判定することと、
    前記複数の可聴信号内で前記ピークが発生する前記時間の間の差に少なくとも一部基づき、前記対象となる事象に対する到着時間差(TDOA)値を判定することと、
    を含む動作を1つ以上のプロセッサに行わせるコンピュータ実行可能命令を記憶する、1つ以上のコンピュータ可読記憶媒体。
  2. 前記動作は、バンドパスフィルタで前記複数の可聴信号をフィルタリングすることをさらに含む、請求項1に記載の1つ以上のコンピュータ可読記憶媒体。
  3. 前記バンドパスフィルタは、約800ヘルツから約2キロヘルツに及ぶ帯域幅を有するように構成される、請求項2に記載の1つ以上のコンピュータ可読記憶媒体。
  4. 前記動作は、前記複数の可聴信号からノイズを除去することをさらに含む、請求項1に記載の1つ以上のコンピュータ可読記憶媒体。
  5. 前記対象となる事象は、約250ミリ秒未満の持続時間を有する前記音響源によって生成される音響信号をさらに含む、請求項1に記載の1つ以上のコンピュータ可読記憶媒体。
  6. 前記音響信号は、ある環境の中で物体を物理的に打つユーザによって生成される、請求項に記載の1つ以上のコンピュータ可読記憶媒体。
  7. 前記動作は、前記複数の可聴信号を受信する複数のマイクロホンの間の既知の距離に少なくとも一部基づき、前記TDOA値をフィルタリングすることをさらに含む、請求項1に記載の1つ以上のコンピュータ可読記憶媒体。
  8. 前記動作は、前記複数の可聴信号を受信する複数のマイクロホンが存在する部屋の既知の寸法に少なくとも一部基づき、前記TDOA値をフィルタリングすることをさらに含む、請求項に記載の1つ以上のコンピュータ可読記憶媒体。
  9. 複数のセンサと、
    前記センサに結合された到着時間差モジュールであって、
    前記センサを介して、音響源と関連付けられる複数の信号を取得し、
    前記複数の信号の雑音レベルを推定し、前記雑音レベルは、時間の経過とともに追跡された信号に基づいて動的に更新され、
    前記複数の信号のそれぞれに対して、
    前記音響源からの直接信号に相当する前記信号の一部分を含む対象となる事象を識別し、
    前記対象となる事象の前にいつ静寂期間が存在するかを判定し、
    前記対象となる事象がいつ前記更新された雑音レベルを超えて上昇するかを判定し、
    前記対象となる事象が前記更新された雑音レベルを越えて上昇した後のピークを検出し、
    前記ピークが発生する時間を判定し、および、
    前記信号の前記ピークが発生する前記時間の間の差に少なくとも一部基づき、到着時間差(TDOA)値を判定するように構成されてい到着時間差モジュールと、
    を備え、システム。
  10. 前記センサは、マイクロホンを備えている、請求項に記載のシステム。
  11. 前記到着時間差モジュールは、バンドパスフィルタで前記信号をフィルタリングするようにさらに構成されている、請求項に記載のシステム。
  12. 前記センサに結合され、前記判定されたTDOA値に少なくとも一部基づき前記音響源を位置特定するように構成される到着時間差モジュールをさらに備える、請求項に記載のシステム。
  13. 前記センサは、マイクロホンを備え、前記システムは、前記センサに結合された到着時間差モジュールであって、前記マイクロホンの間の既知の距離、または前記マイクロホンが存在する一つの部屋の既知の寸法に少なくとも一部基づき、前記TDOA値をフィルタリングするように構成されてい到着時間差モジュールをさらに備えている、請求項に記載のシステム。
  14. 実行されるときに、
    複数のマイクロホンから音響源と関連付けられる複数の可聴信号を取得することと、
    前記複数の可聴信号の雑音レベルを推定することであって、前記雑音レベルは、時間の経過とともに追跡された可聴信号に基づいて動的に更新される、ことと、
    前記複数の可聴信号のそれぞれに対して、
    対象となる事象を識別することと、
    前記対象となる事象の前にいつ静寂期間が存在するかを判定することと、
    前記対象となる事象が前記静寂期間後に前記更新された雑音レベルを超えて上昇する時間を判定することと、
    閾値時間量内で、前記対象となる事象が前記静寂期間を超えて上昇する前記時間から開始するサンプルの窓を指定することと、
    前記窓内の前記サンプルに少なくとも一部基づき到着時間差(TDOA)値を計算することと、
    前記サンプルの窓を時間t前方にスライドさせることと、
    前記サンプルがいつ対象となる領域内にあるかを判定することと、
    前記窓を前記時間t前方にスライドさせた後に前記窓内の前記サンプルに少なくとも一部基づきTDOA値を再び計算することと、
    を含む動作を1つ以上のプロセッサに行わせるコンピュータ実行可能命令を記憶する、1つ以上のコンピュータ可読記憶媒体。
  15. 前記対象となる領域は、前記対象となる事象からの直接信号の少なくとも一部分を含む、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  16. 前記静寂期間は、約100ミリ秒未満の持続時間である、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  17. 前記静寂期間は、あらゆる可聴信号が前記更新された雑音レベル以下である期間を含む、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  18. 前記サンプルの窓は、約2ミリ秒未満の持続時間である、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  19. 前記対象となる事象は、人間の発話を含む、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  20. 前記動作は、約2キロヘルツから約8キロヘルツに及ぶ帯域幅を有するように構成されるバンドパスフィルタで、前記複数の可聴信号をフィルタリングすることをさらに含む、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  21. 前記動作は、前記複数の可聴信号からノイズを除去することをさらに含む、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  22. 前記動作は、前記複数のマイクロホン間の既知の距離に少なくとも一部基づき、前記TDOA値をフィルタリングすることをさらに含む、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  23. 前記動作は前記複数のマイクロホンが存在する部屋の既知の寸法に少なくとも一部基づき、前記TDOA値をフィルタリングすることをさらに含む、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  24. 前記動作は、
    所定の数の連続的窓値から安定した1組のTDOAが達成されると、前記安定したTDOA値を使用して前記音響源を位置特定することをさらに含む、請求項14に記載の1つ以上のコンピュータ可読記憶媒体。
  25. 複数のセンサと、
    前記センサに結合された到着時間差モジュールであって、
    前記複数のセンサから音響源と関連付けられる複数の可聴信号を取得し、
    前記複数の可聴信号の雑音レベルを推定し、前記雑音レベルは、時間の経過とともに追跡された信号に基づいて動的に更新され、
    前記複数の可聴信号のそれぞれに対して、
    対象となる事象を識別し、
    前記対象となる事象の前にいつ静寂期間が存在するかを判定し、
    前記対象となる事象が前記静寂期間後に前記更新された雑音レベルを超えて上昇する時間を判定し、
    閾値時間量内で、前記対象となる事象が前記静寂期間を超えて上昇する前記時間から開始するサンプルの窓を指定し、
    前記窓内の前記サンプルに少なくとも一部基づき到着時間差(TDOA)値を計算し、
    前記サンプルの窓を時間t前方にスライドさせ、
    前記サンプルがいつ対象となる領域内にあるかを判定し、および、
    前記窓を前記時間t前方にスライドさせた後に、前記窓内の前記サンプルに少なくとも一部基づきTDOA値を再び計算するように構成されている、到着時間差モジュールと、
    を備え、システム。
  26. 前記対象となる領域は、前記対象となる事象からの直接信号の少なくとも一部分を含む、請求項25に記載のシステム。
  27. 前記センサは、マイクロホンを含む、請求項25に記載のシステム。
  28. 前記対象となる事象は、マイクロホンによって直接受信される可聴信号の一部分を含む、請求項25に記載のシステム。
  29. 前記到着時間差モジュールは、
    バンドパスフィルタで前記複数の可聴信号をフィルタリングするようにさらに構成される、請求項25に記載のシステム。
  30. 前記センサに結合され、前記計算されたTDOA値に少なくとも一部基づき前記音響源を位置特定するように構成される到着時間差モジュールをさらに備える、請求項25に記
    載のシステム。
JP2014517218A 2011-06-24 2012-06-22 直接音による到着時間差の判定 Active JP6150793B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/168,759 US9194938B2 (en) 2011-06-24 2011-06-24 Time difference of arrival determination with direct sound
US13/168,759 2011-06-24
PCT/US2012/043817 WO2012178061A1 (en) 2011-06-24 2012-06-22 Time difference of arrival determination with direct sound

Publications (2)

Publication Number Publication Date
JP2015502519A JP2015502519A (ja) 2015-01-22
JP6150793B2 true JP6150793B2 (ja) 2017-06-21

Family

ID=47361746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014517218A Active JP6150793B2 (ja) 2011-06-24 2012-06-22 直接音による到着時間差の判定

Country Status (5)

Country Link
US (1) US9194938B2 (ja)
EP (1) EP2724554B1 (ja)
JP (1) JP6150793B2 (ja)
CN (1) CN103797821B (ja)
WO (1) WO2012178061A1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676728B1 (en) * 2011-03-30 2014-03-18 Rawles Llc Sound localization with artificial neural network
EP2581814A1 (en) * 2011-10-14 2013-04-17 Elo Touch Solutions, Inc. Method for detecting a touch-and-hold touch event and corresponding device
US8704070B2 (en) 2012-03-04 2014-04-22 John Beaty System and method for mapping and displaying audio source locations
US9113243B2 (en) * 2012-08-16 2015-08-18 Cisco Technology, Inc. Method and system for obtaining an audio signal
US9197930B2 (en) * 2013-03-15 2015-11-24 The Nielsen Company (Us), Llc Methods and apparatus to detect spillover in an audience monitoring system
US9042563B1 (en) * 2014-04-11 2015-05-26 John Beaty System and method to localize sound and provide real-time world coordinates with communication
CN104535965A (zh) * 2014-12-29 2015-04-22 江苏科技大学 基于嵌入式gpu系统的并行化声源定位系统及方法
KR101741309B1 (ko) * 2015-02-17 2017-05-30 한국전자통신연구원 차량의 고장 진단 장치 및 방법
CN104730495B (zh) * 2015-04-16 2017-08-11 清华大学苏州汽车研究院(相城) 便携式声源定位装置及其采用的定位方法
KR101699445B1 (ko) * 2015-07-17 2017-01-24 아이브스테크놀러지(주) 복합 감지 cctv, 이상 감지 장치 및 이의 방법
DE102015218068A1 (de) * 2015-09-21 2017-03-23 Robert Bosch Gmbh Bodenkontaktiervorrichtung und Verfahren zum Aussenden eines Signals
WO2017077534A1 (en) * 2015-11-02 2017-05-11 Samsung Electronics Co., Ltd Method and system for measurement of ambience parameters using audio signals
CN108886400B (zh) * 2016-04-12 2022-03-01 三菱电机株式会社 接收装置、接收方法以及计算机能读取的记录介质
CN105979442B (zh) * 2016-07-22 2019-12-03 北京地平线机器人技术研发有限公司 噪声抑制方法、装置和可移动设备
CN106338290B (zh) * 2016-10-26 2021-03-16 山东大学 一种机器人自主充电的导航系统及方法
US20180160226A1 (en) * 2016-12-05 2018-06-07 Semiconductor Components Industries, Llc Reducing or eliminating transducer reverberation
WO2018173266A1 (ja) 2017-03-24 2018-09-27 ヤマハ株式会社 収音装置および収音方法
CN107677992B (zh) * 2017-09-30 2021-06-22 深圳市沃特沃德股份有限公司 移动侦测方法、装置和监控设备
JP6976131B2 (ja) * 2017-10-16 2021-12-08 三菱重工サーマルシステムズ株式会社 空調システム及び空調制御方法
US11002825B2 (en) * 2017-12-29 2021-05-11 Sonitor Technologies As Position determination system having a deconvolution decoder using a joint snr-time of arrival approach
CA3000122C (en) 2018-03-29 2019-02-26 Cae Inc. Method and system for determining a position of a microphone
US10291999B1 (en) 2018-03-29 2019-05-14 Cae Inc. Method and system for validating a position of a microphone
US10565977B1 (en) * 2018-08-20 2020-02-18 Verb Surgical Inc. Surgical tool having integrated microphones
JP2022500692A (ja) * 2018-09-14 2022-01-04 ジーエヌ ヒアリング エー/エスGN Hearing A/S 部屋内における雑音消去のための方法及びサウンドシステム
US10277981B1 (en) * 2018-10-02 2019-04-30 Sonos, Inc. Systems and methods of user localization
CN110072177B (zh) * 2019-04-30 2022-04-08 北京小米智能科技有限公司 空间划分信息获取方法、装置及存储介质
US11226396B2 (en) 2019-06-27 2022-01-18 Gracenote, Inc. Methods and apparatus to improve detection of audio signatures
WO2021168620A1 (zh) * 2020-02-24 2021-09-02 京东方科技集团股份有限公司 声源跟踪控制方法和控制装置、声源跟踪系统
US11714163B2 (en) * 2020-03-18 2023-08-01 Samsung Electronics Co., Ltd. Acoustic collision detection and localization for robotic devices
CN111474521B (zh) * 2020-04-09 2022-06-28 南京理工大学 多径环境中基于麦克风阵列的声源定位方法
US20210120353A1 (en) * 2020-12-23 2021-04-22 Intel Corporation Acoustic signal processing adaptive to user-to-microphone distances
CN113484825B (zh) * 2021-06-15 2023-03-28 长江大学 一种声源定位系统及方法
CN113702910A (zh) * 2021-08-31 2021-11-26 冠捷显示科技(厦门)有限公司 一种基于双麦克风的声音定位方法及其装置

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5973998A (en) 1997-08-01 1999-10-26 Trilon Technology, Llc. Automatic real-time gunshot locator and display system
US6414960B1 (en) 1998-12-29 2002-07-02 International Business Machines Corp. Apparatus and method of in-service audio/video synchronization testing
US6414690B1 (en) 1999-12-08 2002-07-02 Xerox Corporation Gamut mapping using local area information
US7149691B2 (en) 2001-07-27 2006-12-12 Siemens Corporate Research, Inc. System and method for remotely experiencing a virtual environment
US7102615B2 (en) 2002-07-27 2006-09-05 Sony Computer Entertainment Inc. Man-machine interface using a deformable device
US8947347B2 (en) * 2003-08-27 2015-02-03 Sony Computer Entertainment Inc. Controlling actions in a video game unit
US7039199B2 (en) * 2002-08-26 2006-05-02 Microsoft Corporation System and process for locating a speaker using 360 degree sound source localization
CN1777814B (zh) 2003-05-09 2010-06-23 西门子公司 定位局部放电的测量装置及其应用
US7720683B1 (en) 2003-06-13 2010-05-18 Sensory, Inc. Method and apparatus of specifying and performing speech recognition operations
US7418392B1 (en) 2003-09-25 2008-08-26 Sensory, Inc. System and method for controlling the operation of a device by voice commands
AU2004281282A1 (en) 2003-10-14 2005-04-28 E.I. Dupont De Nemours And Company Process for the preparation of 1,1,1,3,3-pentafluoropropane and 1,1,1,3,3,3-hexafluoropropane
JP2007528496A (ja) 2004-03-09 2007-10-11 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 位置決定方法、装置、コンピュータープログラム
US7522736B2 (en) 2004-05-07 2009-04-21 Fuji Xerox Co., Ltd. Systems and methods for microphone localization
US7512036B2 (en) * 2005-08-16 2009-03-31 Ocean Server Technology, Inc. Underwater acoustic positioning system and method
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
KR101483269B1 (ko) 2008-05-06 2015-01-21 삼성전자주식회사 로봇의 음원 위치 탐색 방법 및 그 장치
CA2750200C (en) * 2009-01-05 2015-12-15 Schlumberger Canada Limited Processing time series data embedded in high noise
WO2011032024A1 (en) * 2009-09-11 2011-03-17 Advanced Bionics, Llc Dynamic noise reduction in auditory prosthesis systems
US20120223885A1 (en) 2011-03-02 2012-09-06 Microsoft Corporation Immersive display experience

Also Published As

Publication number Publication date
WO2012178061A1 (en) 2012-12-27
CN103797821B (zh) 2017-08-29
JP2015502519A (ja) 2015-01-22
CN103797821A (zh) 2014-05-14
US20120327746A1 (en) 2012-12-27
EP2724554A4 (en) 2015-03-18
US9194938B2 (en) 2015-11-24
EP2724554B1 (en) 2019-06-05
EP2724554A1 (en) 2014-04-30

Similar Documents

Publication Publication Date Title
JP6150793B2 (ja) 直接音による到着時間差の判定
US9129223B1 (en) Sound localization with artificial neural network
CN103443649B (zh) 用于使用可听声音和超声进行源定位的系统、方法、设备和计算机可读媒体
Ba et al. L1 regularized room modeling with compact microphone arrays
US20110317522A1 (en) Sound source localization based on reflections and room estimation
US9069065B1 (en) Audio source localization
US9081083B1 (en) Estimation of time delay of arrival
US9319787B1 (en) Estimation of time delay of arrival for microphone arrays
Tervo et al. Acoustic reflection localization from room impulse responses
KR101369139B1 (ko) 음원 위치 추적 방법 및 장치
JP2006194700A (ja) 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム
JP2015507422A (ja) 音源位置推定
JP2014098568A (ja) 音源位置推定装置、音源位置推定方法および音源位置推定プログラム
JP2013148576A (ja) 変調された背景音を利用して位置特定を行う携帯装置、コンピュータプログラム、および方法
KR101086304B1 (ko) 로봇 플랫폼에 의해 발생한 반사파 제거 신호처리 장치 및 방법
Paulose et al. Acoustic source localization
CN111277352B (zh) 通过时间同步的联网扬声器发现环境
KR100730297B1 (ko) 머리전달함수 데이터베이스를 이용한 음원 위치 추정 방법
Di Carlo et al. dEchorate: a calibrated room impulse response database for echo-aware signal processing
Wu et al. Passive sonic detection and ranging for locating sound sources
KR20090017208A (ko) 음원 위치 추적 방법 및 장치
Zamaninezhad et al. Localization of environmental reflectors from a single measured transfer function
Mahdinejad et al. Implementation of time delay estimation using different weighted generalized cross correlation in room acoustic environments
JP7189555B2 (ja) 音響処理装置、音響処理方法およびプログラム
Witew Using a multilateration strategy to determine the sensor positions in acoustic array measurements

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150714

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160629

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20170203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170523

R150 Certificate of patent or registration of utility model

Ref document number: 6150793

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250