JP2015507422A - 音源位置推定 - Google Patents

音源位置推定 Download PDF

Info

Publication number
JP2015507422A
JP2015507422A JP2014551704A JP2014551704A JP2015507422A JP 2015507422 A JP2015507422 A JP 2015507422A JP 2014551704 A JP2014551704 A JP 2014551704A JP 2014551704 A JP2014551704 A JP 2014551704A JP 2015507422 A JP2015507422 A JP 2015507422A
Authority
JP
Japan
Prior art keywords
microphone
sound source
sound
acoustic
effect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014551704A
Other languages
English (en)
Other versions
JP6225118B2 (ja
Inventor
ケヒヒアン,パトリック
アウェルチェス,オッケ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2015507422A publication Critical patent/JP2015507422A/ja
Application granted granted Critical
Publication of JP6225118B2 publication Critical patent/JP6225118B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8083Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/20Reflecting arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/08Mouthpieces; Microphones; Attachments therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/34Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by using a single transducer with sound reflecting, diffracting, directing or guiding means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

音源の位置推定値を決定する装置が、二つのマイクロホン(M1、M2)と、音源位置から前記第一のマイクロホン(M1)への音に音響効果を与える音響要素(203)とを有する。音響効果は、マイクロホン(M1、M2)の間の軸(201)に対して非対称的である。位置回路(305)が、両マイクロホン(M1、M2)における到達時間に応じて、音源についての前記軸の異なる側の二つの可能な位置を推定する。推定器(307)が、第一のマイクロホン信号の音響効果が前記軸(201)の一方の側の音源についての前記音響効果の期待される特性に一致する度合いを示す音響効果指標を決定する。別の回路(309)が、該音響効果指標に応じて二つの可能な位置の間で選択することによって前記位置推定値を決定する。この手法は、二つのマイクロホンにおける到達時間に基づく位置決定に付随する位置決定の曖昧さを解決しうる。

Description

本発明は音源の位置決定に、排他的ではないが詳細には、二つのマイクロホンにおける信号の到達時間差に基づく位置推定に関する。
多くの応用において、音源の位置を知ることは有益であり、たとえば音源から捕捉されるオーディオの信号処理を最適化するために使用されうる。たとえば、ハンズフリー通信および遠隔会議アプリケーションのための信号処理が、音源の特定的な位置、典型的には角方向のみに依存して、最適化されうる。よって、多くのオーディオ処理システムは、音源の(たとえば角度上の)位置が検出および追跡されうるようにするオーディオ追跡システムを有する。
音源の位置を決定するための一つの手法はマイクロホン・アレイを使い、マイクロホン信号の間の相対的な差が源の位置を推定するために解析される。マイクロホン・アレイを使う一般的な定位方法は主として、各マイクロホンへの音波の到達時間差を計算することに基づく。
密な間隔のマイクロホンを使う他の定位方法は、二つのマイクロホン信号を組み合わせることによって一次差分(first order differential)応答を構築し、音源の方向にヌルを方向制御するために最適化基準を使うことに基づく。
三つのマイクロホンを使うと、アレイに対する音源の位置が、到達時間に基づいて、実際には到達時間の差に基づいて、360度の(水平な)方位角平面において決定できる。しかしながら、関連した処理のコストおよび複雑さを減らすために、マイクロホンの数をできるだけ減らすことが望ましい。よって、二つだけのマイクロホンを使って位置決定を実行することが望ましい。
二つのマイクロホンでは、適正な到達時間計算は特定的な位置の決定、すなわち典型的には水平面内の位置決定を許容しうる。しかしながら、そのような計算は音源からの送信の時間がわかっていることを必要とし、よって典型的には音源が位置決定回路と同期されていることを必要とする。これは典型的にはきわめて非実際的であり、よって位置決定は典型的にはマイクロホンの間の到達時間測定値の差に基づく。二マイクロホン実装について、これは角方向のみが典型的には決定でき、音源までの距離はわからないことを意味する。しかしながら、多くの応用について、そのような角位置の決定はきわめて有利であり、実際、多くの応用にとって十分である。
しかしながら、二マイクロホン・セットアップでのもう一つの問題は、図1に示されるように、二つのマイクロホンを互いに結ぶ軸のまわりに完全に対称的であるということである。この例では、二つのマイクロホンM1およびM2は、二つのマイクロホンM1およびM2の間の差の時間に基づいて音源Sまでの角距離Aを決定するために使われる。
このように、システムはマイクロホンM1およびM2についての波面の間の到達時間差を決定する。源が遠距離場に位置している場合、音波は平面状であり互いに平行であると想定できる。三角測量を使って、角度は、
t=(d/c)cosA (1)
によって到達時間差(TDOA: Time Difference Of Arrival)(単位・秒)に関係付けられる。ここで、dはマイクロホン間の間隔、cは空気中での音速である。よって角度Aは
A=cos-1(tc/d) (2)
によって決定できる。ここで、Aは範囲[0,180°]内である。
しかしながら、この手法は本来的な曖昧さがあり、範囲[0,180°]内でしかAを決定できない。よって、360度の方位角平面における源の方向について十分な情報を与えない。具体的には、音源が位置Sとファントム位置Gのどちらに位置しているかを区別できない。
よって、音源位置推定のための改善された手法が有利であろう。特に、柔軟性が増す、操作および/または実装が容易にされる、複雑さが低下する、コストが低減される、計算上の要求が低減されるおよび/またはパフォーマンスが改善されることを許容する手法が有利であろう。特に、改善された音源位置決定のために好適な、特に二マイクロホン・セットアップについて曖昧さ解決を許容する手法が有利であろう。
よって、本発明は、単独でまたは任意の組み合わせにおいて上述した欠点の一つまたは複数を好ましくは緩和、軽減または解消しようとするものである。
本発明のある側面によれば、音源の位置推定値を決定する装置であって:第一のマイクロホン信号を生成する第一のマイクロホンと;第二のマイクロホン信号を生成する第二のマイクロホンと;音源位置から前記第一のマイクロホンへの音に、前記第一および第二のマイクロホンの間の軸に対して非対称的な音響効果を与える音響要素と;位置プロセッサとを有しており、前記位置プロセッサは:音源からのオーディオについての前記第一のマイクロホンおよび前記第二のマイクロホンにおける到達時間に応答して、音源についての第一の可能な位置および第二の可能な位置を推定する第一の位置回路であって、前記第一の可能な位置は前記軸の一方の側の第一の領域内の位置であり、前記第二の可能な位置は前記軸の他方の側の第二の領域内の位置である、回路と;前記第一のマイクロホン信号について第一の音響効果指標を決定する推定器であって、前記第一の音響効果指標は前記第一のマイクロホン信号の音響効果が前記第一の領域内の音源についての前記音響効果の期待される特性に一致する度合いを示す、推定器と;前記第一の音響効果指標に応じて前記第一の可能な位置と前記第二の可能な位置との間で選択することによって前記音源についての位置推定値を決定する第二の位置回路とを有する、装置が提供される。
本発明は、改善されたおよび/または容易にされた音源についての位置決定/推定を許容しうる。特に、位置決定/推定はたった二つのマイクロホンを使って実行されうる。
この手法は、音源位置間の対称性を破るために物理的な音響要素が使用されることができ、マイクロホン信号における非対称な音響効果が、異なる可能な位置推定値の間の曖昧さを解決するために使用できるという認識に基づいている。
音響効果の期待される特性は、あらかじめ決定された特性であってもよい。期待される特性は、前記音響効果がどのように前記第一の領域についての諸音源位置に影響するかを反映してもよい。前記音響効果は、前記第一の領域内および前記第二の領域内の音響効果について異なるであろう。期待される特性はこの差を反映することができる。前記音響効果は、前記第二の領域に比して前記第一の領域についてはずっと強いように構成されてもよく、あるいはその逆でもよい。期待される特性は、音響効果の不在であってもよい。たとえば、音響効果は前記第二の領域内の音源については有意でり、前記第一の領域内の音源については無視できるのでもよい。前記第一の領域についての期待される特性は、(有意な)音響効果がないということであってもよい。
前記第一の位置回路は特に、前記音源からのオーディオについての前記第一のマイクロホンと前記第二のマクロホンとの間の到達時間差に応答して、前記第一の可能な位置および前記第二の可能な位置を推定するよう構成されていてもよい。
前記位置は一次元位置であってもよい。たとえば、前記第一および第二の可能な位置は、それらの位置を一次元の位置に限定する制約条件の下で決定されてもよい。それらの位置は特に、角方向のような、マイクロホン配置から音源に向かう方向であってもよい。
前記第一および第二の領域は、前記第一の位置回路が前記二つの可能な位置を決定する位置平面の二つの半平面に対応していてもよい。そのような場合、前記二つの半平面は、前記マイクロホン間の軸によって分割されていてもよい。前記位置平面は特に水平面であってもよい。前記位置平面は前記マイクロホン間の軸を含んでいてもよい。
前記選択は、閾値との比較に基づいていてもよい。個別的な例として、前記音響効果指標がある閾値を超える場合に前記第一の可能な位置が選択されてもよく、そうでない場合に前記第二の可能な位置が選択される。
本発明の任意的な特徴によれば、前記第一の音響効果指標は、前記第一のマイクロホン信号の前記音響効果が前記第一の領域内の音源についての前記音響要素の期待される音響効果に一致する前記度合いを、前記第一のマイクロホン信号の前記音響効果が前記第二の領域内の音源についての前記音響効果の期待される特性に一致する度合いに比して示す。
これは、多くのシナリオにおいて改善された位置決定を提供でき、特に、前記第一および第二の可能な位置の間のより信頼できる選択を提供しうる。前記第一または第二の領域のいずれかについての期待される音響効果はヌル効果であってもよい。すなわち、前記音響効果が前記第一または前記第二の領域のいずれかについて無視できることが期待されてもよい。
本発明のある任意的な特徴によれば、前記音響効果は前記軸に対して非対称的に周波数依存であり、前記推定器は、前記第一の信号の周波数応答と前記第一の領域内の音源についての期待される周波数応答との間の相関の度合いの決定に応じて、前記第一の音響効果指標を生成するよう構成される。
これは、処理を容易にしうる、および/またはより信頼できる選択を提供しうる、および/または音響要素の実装を容易にしうる。音響効果は、諸音源から前記第一のマイクロホンへの、前記二つの領域について異なる周波数伝達関数を示してもよい。期待される特性は、特に、前記第一のマイクロホン信号についての期待される周波数領域特性であってもよい。
いくつかの実施形態では、前記推定器は、前記第一の信号の周波数応答と前記第二の領域における音源についての期待される周波数応答との間の相関の度合いの決定に応じて前記第一の音響効果指標を生成するよう構成されていてもよい。
本発明のある任意的な特徴によれば、前記音響効果は非対称的に周波数依存であり、前記推定器は、前記第一のマイクロホン信号をフィルタ処理して第一のフィルタ処理されたマイクロホン信号を生成するフィルタを有しており、前記第一のフィルタ処理されたマイクロホン信号に応答して前記第一の音響効果指標を決定するよう構成されている。
これは、多くの実施形態において前記二つの可能な位置の間でのより信頼できる選択を提供しうる。多くのシナリオにおいて、前記音響要素は、特定の周波数区間においてより顕著なおよび/またはより非対称的な音響効果を提供してもよい。そのような諸周波数区間における特性を露わに考慮することによって、より信頼できる選択が達成できる。
本発明のある任意的な特徴によれば、前記音響要素は、前記第一の領域内の音源からの反射を前記第一のマイクロホンに受領させるが、前記第二の領域内の音源からの反射は受領させないよう構成される。
これは、多くのシナリオにおいて前記二つの可能な位置の間のより信頼できる選択を提供しうる特に有意でありかつ非対称的な効果を提供しうる。特に、これは、多くの実施形態において、直接経路と間接経路との間の減殺的干渉に起因する著しい落ち込み〔ノッチ〕を与える。そのような落ち込みは、マイクロホン信号において特に信頼できる形で検出でき、特に、音源信号の周波数応答が知られていない場合でさえもしばしば検出可能であることがある。
本発明のある任意的な特徴によれば、前記期待される特性は、前記第一の領域内の音源からの直接的な音成分と反射された音成分との間の干渉から帰結する干渉効果である。
これは、多くのシナリオにおいて前記二つの可能な位置の間のより信頼できる選択を提供しうる特に有意でありかつ非対称的な効果を提供しうる。特に、これはしばしば、前記第一のマイクロホン信号において比較的簡単に検出できる特性でありうる。
本発明のある任意的な特徴によれば、前記期待される特性は干渉周波数応答である。
これは、多くのシナリオにおいて前記二つの可能な位置の間のより信頼できる選択を提供しうる。特に、特定の諸周波数での落ち込みの度合いを、音源が前記第一の領域内または前記第二の領域内のどちらに位置しているかを検出するために使ってもよい。
本発明のある任意的な特徴によれば、前記音響要素は前記軸の一方の側にのみ存在する。
これは、処理を容易にすることがありおよび/またはより信頼できる選択を提供することがありおよび/または前記音響要素の実装を容易にすることがある。特に、これは、多くの実施形態において、高度に非対称的な音響効果を生成するための複雑さの低い手法を提供する。
本発明のある任意的な特徴によれば、前記推定器は、前記第一のマイクロホン信号の前記第二のマイクロホン信号との比較に応じて前記第一の音響効果指標を決定するよう構成されている。
これは、多くのシナリオにおいて改善された位置決定を提供することがあり、特に、前記第一および第二の可能な位置の間のより信頼できる選択を提供することがある。多くの実施形態において、これは、音源からレンダリングされるオーディオの特性(たとえば周波数分布)における変動に対する高められた不感性を提供しうる。
本発明のある任意的な特徴によれば、本装置はさらに、諸音源位置から前記第二のマイクロホンへの音についての第二の音響効果を提供する第二の音響要素を有する。前記第二の音響効果は前記軸に対して非対称的である。前記位置プロセッサは:前記第二のマイクロホン信号について第二の音響効果指標を決定する第二の推定器を有しており、前記第二の音響効果指標は前記第二のマイクロホン信号の音響効果が前記第二の領域内の音源についての前記第二の音響効果の期待される特性に一致する度合いを示し;前記第二の位置回路は、さらに前記第二の音響効果指標に応じて前記第一の可能な位置と前記第二の可能な位置との間で選択することによって、前記音源についての前記位置推定値を決定するよう構成されている。
これは、多くのシナリオにおいて改善された位置決定を提供することがあり、特に、前記第一および第二の可能な位置の間のより信頼できる選択を提供することがある。
本発明のある任意的な特徴によれば、前記第二の位置回路は、前記第一の音響効果指標が前記第二の音響効果指標を超える場合に前記第一の可能な位置を選択し、前記第二の音響効果指標が前記第一の音響効果指標を超える場合に前記第二の可能な位置を選択するよう構成される。
これは、多くのシナリオにおいて改善された位置決定を提供することがあり、特に、前記第一および第二の可能な位置の間のより信頼できる選択を提供することがある。
本発明のある任意的な特徴によれば、前記音響要素の最も近い点が、前記第一のマイクロホンから高々10cmのところに位置している。
これは、多くのシナリオにおいて改善された位置決定を提供することがあり、および/またはより実際的な実装を提供することがある。特に、近距離場効果が無視できることを保証することがある。
本発明のある任意的な特徴によれば、前記第一のマイクロホンと前記第二のマイクロホンとの間の距離が1cm以上50cm以下である。
これは、多くのシナリオにおいて改善された位置決定を提供することがあり、および/またはより実際的な実装を提供することがある。
本発明のある側面によれば、諸音源位置から第一のマイクロホンまでの音に対する音響効果を与える音響要素を有するオーディオ環境における音源についての位置推定値を、前記第一のマイクロホンからの第一のマイクロホン信号および第二のマイクロホンからの第二のマイクロホン信号から決定するための装置であって、前記音響効果は前記第一のマイクロホンと前記第二のマイクロホンとの間の軸に対して非対称的であり、当該装置は:前記第一のマイクロホン信号を受領する第一の受領器と;前記第二のマイクロホン信号を受領する第二の受領器と;音源からのオーディオについて前記第一のマイクロホンおよび前記第二のマイクロホンにおける到達時間に応答して、音源についての第一の可能な位置および第二の可能な位置を推定する第一の位置回路であって、前記第一の可能な位置は前記軸の一方の側の第一の領域内の位置であり、前記第二の可能な位置は前記軸の他方の側の第二の領域内の位置である、回路と;前記第一のマイクロホン信号について音響効果指標を決定する推定器であって、前記音響効果指標は前記第一のマイクロホン信号の音響効果が前記第一の領域内の音源についての前記音響効果の期待される特性に一致する度合いを示す、推定器と;前記音響効果指標に応じて前記第一の可能な位置と前記第二の可能な位置との間で選択することによって前記音源についての位置推定値を決定する第二の位置回路とを有する、装置が提供される。
本発明のある側面によれば、諸音源位置から第一のマイクロホンまでの音に対する音響効果を与える音響要素を有するオーディオ環境における音源についての位置推定値を、前記第一のマイクロホンからの第一のマイクロホン信号および第二のマイクロホンからの第二のマイクロホン信号から決定する方法であって、前記音響効果は前記第一のマイクロホンと前記第二のマイクロホンとの間の軸に対して非対称的であり、当該方法は:前記第一のマイクロホン信号を受領する段階と;前記第二のマイクロホン信号を受領する段階と;音源からのオーディオについて前記第一のマイクロホンおよび前記第二のマイクロホンにおける到達時間に応答して、音源についての第一の可能な位置および第二の可能な位置を推定する段階であって、前記第一の可能な位置は前記軸の一方の側の第一の領域内の位置であり、前記第二の可能な位置は前記軸の他方の側の第二の領域内の位置である、段階と;前記第一のマイクロホン信号について音響効果指標を決定する段階であって、前記音響効果指標は前記第一のマイクロホン信号の音響効果が前記第一の領域内の音源についての前記音響効果の期待される特性に一致する度合いを示す、段階と;前記音響効果指標に応じて前記第一の可能な位置と前記第二の可能な位置との間で選択することによって前記音源についての前記位置推定値を決定する段階とを含む、方法が提供される。
本発明のこれらおよびその他の側面、特徴および利点は、以下に記述される実施形態(単数または複数)を参照することから明白となり、明快にされるであろう。
本発明の実施形態について、単に例として、図面を参照して記述する。
従来技術に基づいて音源の位置を推定するための構成の例を示す図である。 本発明のいくつかの実施形態に基づいて音源の位置を推定するための構成の例を示す図である。 本発明のいくつかの実施形態に基づいて音源についての位置推定値を決定するシステムの要素の例を示す図である。 本発明のいくつかの実施形態に基づいて音源の位置を推定するための構成の例を示す図である。 音源の位置を推定するための構成についての周波数応答の例を示す図である。 音源の位置を推定するための構成についての周波数応答の例を示す図である。 音源の位置を推定するための構成についての周波数応答の例を示す図である。 音源の位置を推定するための構成についてのインパルス応答の例を示す図である。 本発明のいくつかの実施形態に基づいて音源の位置推定値を決定するシステムの要素の例を示す図である。 本発明のいくつかの実施形態に基づいて音源の位置を推定するための構成の例を示す図である。 本発明のいくつかの実施形態に基づいて音源の位置を推定するための構成の例を示す図である。
以下の記述は、音源への角方向を決定するために二つだけのマイクロホンにおける到達時間差(TDOA)を使って音源からの位置推定に適用可能な本発明の実施形態に焦点を当てるが、本発明がこの応用に限定されず、音源の位置を決定する他の多くの応用に適用されてもよいことは理解されるであろう。
図2は、本手法のためのセットアップの配位の例を示している。図1と同様に、本システムは互いとの所与の距離をもって位置されている二つのマイクロホンM1およびM2を用いる。記載される諸手法において、音源Sから二つのマイクロホンM1およびM2への音の到達時間差が、まず二つの可能な位置を生成するために使用される。特に、マイクロホンM1、M2の間の軸201の左側の半平面内の第一の可能な位置が生成され、右側の半平面内の第二の可能な位置が生成される。TDOAはマイクロホンM1、M2の間の軸201のまわりの対称的な位置については同じになる(TDOAアルゴリズムの角位置推定値Aが180°範囲内での位置しか決定できないことに対応)ので、TDOAアルゴリズムは対称的な位置の間の区別をすることができない。
しかしながら、図2の手法では、音源Sから第一のマイクロホンM1への音に音響効果を与える音響要素203が導入される。さらに、音響効果はマイクロホン間の軸201に対して非対称的である。このように、音響要素203は、音源が左半平面にあるか右半平面にあるかに依存して、第一のマイクロホン信号からの信号に対して差を導入する。
本手法では、この導入された非対称性が、二つの可能な位置の間で(特に、今の例では、二つの可能な方向の間で)選択するために、すなわち音源が図2の位置Sにあるか位置Gにあるかを決定するために、使われる。これは、第一のマイクロホン信号上の音響要素203の音響効果が予測可能であり、よって第一のマイクロホンM1からのマイクロホン信号が、音源が左半平面内に位置している場合には左半平面についての物理的な効果に対応するある属性を、音源が右半平面内に位置している場合には右半平面についての物理的な効果に対応するある属性を示すことになる。したがって、測定されるマイクロホン信号が左半平面または右半平面のどちらに最もよく対応する属性を示すかを検出することによって、音源の位置が左半平面にあるか右半平面にあるかを決定し、よって二つの可能な位置から適切な位置を選択することが可能である。
より具体的には、図2の例において、音響要素203(特に障害物)は第一のマイクロホンM1の近くに位置されており、第一のマイクロホンM1についての音響効果(よって第一のマイクロホンM1からの信号に対する影響)が音響要素203が音源とマイクロホンM1との間の位置しているかマイクロホンM1が音源と音響要素203との間に位置しているかに依存するような仕方で設計されている。特に、音響要素は、一方のシナリオについては強くかつ明確に検出可能な音響効果が生じるが他方のシナリオについては生じないようなものであってもよい。すると、二つの可能な位置推定値の間の選択は、単に音響効果が第一のマイクロホン信号において検出できるか否かに基づいてなされてもよい。
図3は、本発明のいくつかの実施形態に基づく音源についての位置推定値を決定するシステムの例を示している。
本システムは図2に示される構成を含む。よって、本システムは第一および第二のマイクロホンM1、M2を、第一のマイクロホンM1に近接した音響要素203とともに有する。音響要素203は第二のマイクロホンM2よりも第一のマイクロホンM1に近く、第二のマイクロホンM2における音響信号に対する影響は無視できるほどでありうる。さらに、第一のマイクロホンM1に与えられた音響効果はマイクロホンM1、M2の間の軸201に関して非対称的である。
図3の例では、第一および第二のマイクロホンM1、M2はデジタル化され、好適に増幅されたマイクロホン信号を提供する(あるいは等価だが、第一および第二のマイクロホンM1、M2が、捕捉されたアナログ・マイクロホン信号を好適に増幅し、デジタル化するための回路(図示せず)にフィードされる)。
今の例では、デジタル化された信号は任意的なダウンコンバーター301、303にフィードされる。該ダウンコンバーターは、その後の処理のための計算負荷を軽減するために、サンプル・レートを好適なレートまで下げる。
次いで、ダウンコンバートされたマイクロホン信号は、第一の位置プロセッサ305にフィードされる。第一の位置プロセッサ305は、音源からのオーディオについての第一のマイクロホンM1および第二のマイクロホンM2における到達時刻に応答して音源についての第一の可能な位置および第二の可能な位置についての推定値を生成する。
この個別的な例では、第一の位置プロセッサ305は一次元位置のTDOA推定を実行する。具体的には、マイクロホンM1、M2の間の中点から音源に向かう角方向Aが、二つのマイクロホン信号の間の相対的な時間差に基づいて推定される。
他の実施形態では、二次元位置(またさらには三次元位置)を決定するために制約条件が使用されてもよいことは理解されるであろう。たとえば、音源が軸201に対して固定距離のところに位置していることがわかっている場合には、第一の位置プロセッサ305は、それらのマイクロホン信号についてのTDOAに基づいて(たとえば角度推定値および軸201までの距離から)対応する二次元位置を決定してもよい。
さらに、二つのマイクロホンに基づくTDOAアルゴリズムは、典型的には一次元位置が決定されることを許容するだけであるが、他の実施形態では、たとえば音源からの信号についての絶対的な到達時間を決定することによって、二次元位置推定が実行されてもよい。しかしながら、そのような手法は典型的には、音源からのオーディオについての開始時間がわかっていることを要求し、そのことはさらに音源と本システムが緊密に同期されていることを要求し、これは典型的には非実際的である。
よって、今の例では、第一の位置プロセッサ305が音源についての二つの可能な位置推定値を決定する。二つの位置推定値はマイクロホンM1、M2の間の軸のまわりに対称的である。
二つのマイクロホンにおける信号についてTDOAに基づく位置推定を生成するための多くの異なるアルゴリズムおよび技法が知られており、いかなる好適な手法が使われてもよいことは理解されるであろう。マイクロホン軸のまわりの対称性のため、そのようなアルゴリズムは典型的には180°角度範囲における位置推定値を生成し、軸の各半平面において一つの位置推定値(たとえば一つの方向)を与える。
このように、第一の位置プロセッサ305は、マイクロホン軸201の一方の側である第一の領域内にある第一の可能な位置推定値と、マイクロホン軸201の反対側にある第二の領域内にある第二の可能な位置推定値を生成する。各領域は原理的には軸によって画定される半平面に対応しうるが、本システムが正確な位置推定値を提供する領域は、多くの実際的な応用ではより制約されることがある。たとえば、正確な位置推定のためには、典型的には、音源が遠距離場に位置していること、音源がマイクロホン軸201に近すぎないこと、音源がマイクロホンから遠すぎないこと、音源が音響要素に近すぎないことなどが要求されることがある。よって、実際上は、本手法が実際的に適用可能であると考えられる領域は、半平面全体よりも実質的に小さいことがある。
同様に、本手法は、二次元平面内で位置推定を実行し、音源は実質的にこの平面内にあることが想定されている。この平面内に位置されていない音源については、TDOAアルゴリズムは、二次元平面内の投影された点から逸脱する推定値を与えることがある(本質的には、TDOAアルゴリズムは、マイクロホン軸のまわりに回転対称な位置推定値を生成する)。また、音響要素203の効果は音響要素203の個別的な特性に依存して、想定される平面外の音源については、期待される値から逸脱することがある。このように、実際上は、位置推定の正確さおよび/または信頼性は、音源が位置していると想定される平面外の音源については劣化することがある。しかしながら、典型的には、本手法は、音源が位置していると想定される平面からあまり顕著に逸脱していない音源については相変わらず好適であろう。
第一の位置プロセッサ305は特に、二つのマイクロホン信号の相関推定に基づいてTDOAを決定してもよい。たとえば、二つのマイクロホンM1、M2の間の相互相関関数が時間に関して取られ、この関数を最大にする時間遅延τがtを決定する。時間遅延の限界はマイクロホン間の間隔に基づく:
−d/c≦τ≦d/c (3)
ここで、dはマイクロホン間の間隔、cは空気中の音速である。
数学的には、問題は、
Figure 2015507422
である。ここで、m1およびm2はそれぞれ第一および第二のマイクロホン信号であり、nは秒単位での時間であり、fは相互相関関数を表わす。
デジタル・プロセッサ上では、信号は通例、信号のナイキスト周波数の二倍でサンプリングされ、よって相関関数はサンプル単位での時間差を生じ、それがサンプリング周波数に基づいて秒に変換できる。信号がダウンサンプリングされる例では、ダウンサンプリングされたサンプル・レートは適切であり、よってダウンサンプリングはTDOA推定値について、よって決定される位置について、より低い粒度を導入しうる。
先述したように、次いで、角方向推定値は次式から決定できる。
A=cos-1(tc/d) (5)
ここで、Aは[0,180°]の範囲内である。よって、二つの角度±Aに対応する二つの可能な位置推定値が第一の位置プロセッサ305によって生成される。
もう一つの例として、位置推定器305は、いくつかの実施形態では、マイクロホン信号にビーム形成アルゴリズムを適用することによって位置推定を実行してもよい。ここで、ビーム形成アルゴリズムは、音源の方向にヌルを与えるよう、前記信号を重み付けして組み合わせるよう構成されている。このように、ビーム形成は、二つのマイクロホンM1、M2の組み合わせの信号エネルギーを最小にするよう構成された適応的なビーム形成であってもよい。二つのマイクロホン信号を組み合わせて適応的な信号処理を適用して源の方向にヌルをもつマイクロホン応答を生成することによって、音源についての位置推定値が自動的に生成される。
本来的に、そのような手法は、音源からの経路長の差が、よってマイクロホンM1、M2における信号の到達時間の差が信号間の減殺的干渉につながるよう、すなわちそれらの信号が180°位相外れになるよう、信号を組み合わせようとする。よって、本手法は、本来的に、二つのマイクロホンM1、M2における到達時間にも基づいており、特にマイクロホンM1、M2における到達時間差に基づく。結果として、このアルゴリズムも、二つの半平面の間の区別をすることができず、よって二つの可能な位置を推定する。
図3のシステムでは、二つのマイクロホン信号は音響効果推定器307にもフィードされる。音響効果推定器307は、第一のマイクロホンM1から信号についての音響効果指標を決定するよう構成されている。第一の音響効果指標は、第一のマイクロホン信号の音響効果が、半平面の一方(またはその領域)にある音源についての音響要素203の音響効果の期待される特性に一致する度合いを示す。
特に、音響要素203は、予測可能な音響効果を与える物理的属性をもつ物理的要素である。たとえば、音響効果は数学的解析を介して、特定的な測定を介して(たとえばシステムの較正中に)、シミュレーションを介しておよび/またはモデル評価を介して、あらかじめ決定されることができる。さらに、音響効果は非対称的であるよう設計され、よって音響要素203の推定される/予測される/あらかじめ決定される音響効果は、二つの異なる半平面における音源について異なってくる。
よって、受領された第一のマイクロホン信号を解析することによって、音響効果推定器307は、第一のマイクロホン信号が、第一の半平面内に位置する音源あるいは第二の半平面に位置する音源のいずれについて経験される音響効果から帰結する可能性が高い属性をもつかを決定することができる。
多くの実施形態では、第一のマイクロホン信号が単に音響効果と比較されることができ、音響効果指標は類似性がどのくらい近いかを示してもよいことは理解されるであろう。たとえば、音響効果が第一の半平面内の音源からの音響伝達関数における落ち込みを与える場合、音響効果推定器307は、音響効果指標を、第一のマイクロホン信号が期待される周波数に落ち込みをもつ度合いを反映するよう決定してもよい。
そのような直接的な比較は典型的には、音源からレンダリングされる音の個別的な特性が無視できるときに適切である。たとえば、音響効果が所与の周波数区間における伝達関数の周波数応答の特徴的なパターンである場合、捕捉された第一のマイクロホン信号は、その周波数区間内の同様なパターンをもつかどうかを見るために、直接評価されることができる。これは、音源からの音が与えられた周波数区間において実質的に平坦な周波数応答をもつと考えられるとしてのことである。いくつかのシナリオまたは実施形態では、音響効果指標の決定は、音源からレンダリングされるオーディオの特性について第一のマイクロホン信号を、たとえば第二のマイクロホンM2によって捕捉された音源からのオーディオを使って、補償することを含んでいてもよいことは理解されるであろう。
第一の位置プロセッサ305および音響効果推定器307は、音響効果指標および二つの可能な位置を受け取る位置選択器309に結合されている。位置選択器309は、音響効果指標に基づいて音源についての最終的な推定された位置推定値を決定するよう構成されている。よって、位置選択器309は二つの可能な位置の間で、すなわち第一の半平面内の位置と第二の半平面内の位置との間で、音響効果指標の値に基づいて選択をする。
たとえば、音響効果指標が、第一のマイクロホン信号が、第一の半平面からの音響効果の特性によく一致する特性をもつことを示す場合、第一の半平面内の可能な位置推定値として最終的な位置推定値を生成することに進む。そうでない場合には、第二の半平面内の可能な位置推定値として最終的な位置推定値を生成することに進む。たとえば、位置選択器309は単に、音響効果指標がある閾値を超えるか否かに依存して二つの可能な位置の間で選択をしてもよい。
このように、本システムは、非対称的である予測可能な音響効果を提供するために音響要素の導入を使う。該予測可能な音響効果は、たった二つのマイクロホンを使うTDOAアプローチによって導入される曖昧さを解決するためにマイクロホンの少なくとも一つにおいて検出されることができる。このようにして、改善された位置決定が達成できる。
いくつかの実施形態では、音響効果指標の決定は、第一のマイクロホンM1からのマイクロホン信号が第一の半平面からの期待される音響効果に一致するかどうかの解析にのみ基づいていてもよい。たとえば、第一の半平面内の音源について所与の周波数領域パターンが期待される場合、音響効果推定器307は単に、期待される周波数応答と受領された信号の周波数応答との間の周波数領域相関値を決定してもよい(よって、考えている周波数区間において音源が十分平坦であることを想定している)。
しかしながら、他の実施形態では、音響効果指標は、第一のマイクロホン信号が他方の半平面内の音源についての音響効果の期待される特性に一致する度合いに応じて決定されてもよい。
たとえば、音響効果が、一方の半平面からは所与の周波数領域パターンが期待され、他方の半平面からは異なる周波数領域パターンが期待されるようなものである場合、音響効果指標は、両方の周波数パターンについて周波数相関値を決定してもよい。その場合、音響効果指標はたとえば、第一の半平面についての相関値を第二の半平面についての相関値で割った比として決定されてもよい。そのような例では、位置選択器309は単に、音響効果指標が1より大きい場合には第一の半平面内の位置推定値を選択し、そうでない場合には第二の半平面内の位置推定値を選択してもよい。このように、第一のマイクロホン信号が期待される周波数パターンに最もよく一致する位置が選択される。
多くの実施形態において、音響要素203は、音響効果がマイクロホン軸201に関して非対称的に周波数依存であるよう設計される。特に、音響要素203は、第一の半平面内の音源についての音響伝達関数に周波数依存の変動を導入するが、第二の半平面内では導入しないよう構成されていてもよい。そのような場合、音響効果指標は、受領された信号の周波数表現が第一の半平面内の音源についてその音響要素によって導入される周波数表現とどのくらいよく一致するかを評価することによって決定されてもよい。
いくつかの実施形態では、そのような相関または比較は、音源から放射される音の周波数応答についての補償を含んでいてもよい。これはたとえば、音響要素203が典型的には何の効果ももたない第二のマイクロホン信号に基づいて第一のマイクロホン信号を補償することによってなされてもよい。よって、第二のマイクロホン信号は、音源からの放射される音(これはノイズおよび他の音源より十分大きいものとして)の周波数応答を表わすべきである。実際、それはさらに、オーディオ環境の周波数特性を反映してもよい。
たとえば、FFTが第一および第二のマイクロホン信号両方に適用されてもよい。その場合、第一のマイクロホン信号についての値は第二のマイクロホン信号の対応する値によって除算されてもよい(典型的には規格化後)。結果として得られる周波数スペクトルは次いで、音響効果指標を決定するために、音響効果についての期待される周波数パターンとの相関を調べられてもよい。このように、位置選択器309は相関が十分高いか否かに依存して二つの位置の間で選択をすることができる。
多くのシナリオにおいて、物理的な効果は、比較的狭い周波数区間に制約される、あるいは比較的狭い周波数区間において最も優勢にされることができる。そのような場合、音響効果推定器307は有利には、関連する周波数区間をフィルタ抽出するフィルタを含んでいてもよく、音響効果指標の決定は、フィルタ処理された信号から決定されてもよい。そのような手法は、多くのシナリオにおいて、改善された、より信頼できる位置決定を提供しうる。
フィルタ処理は暗黙的に実行されてもよい。たとえば、FFTは、第一のマイクロホン信号に適用されてもよいが、ビン値の部分集合のみが期待される周波数応答と比較されるのでもよい。
いくつかの実施形態では、音響要素203は、第一のマイクロホンM1が第一の領域内の音源からは反射を受領するが、第二の領域内の音源からは反射を受領しないようにするよう構成される。これは図4に示されている。図4では、音響要素201はSを含む半平面からの音源を反射することができる。図のように、直接的な音響経路401は音源SからマイクロホンM1に出ている。さらに、反射される音響経路403は音源SからマイクロホンM1に出ている。しかしながら、音源位置Gからのいかなる反射もマイクロホンM1から遠ざかる。よって、音響要素201は一方の半平面からの音源にのみ反射を導入する。
これらの実施形態において、本システムは、そのような反射に対応する第一のマイクロホン信号内の特性を検出するよう構成されていてもよい。特に、音響要素203は、反射が直接経路と反射される経路との間の干渉効果を導入するよう設計されることができる。さらに、音響要素203(特にマイクロホンM1から音響要素の反射表面までの距離)を適切に設計することによって、干渉効果は、認識可能な周波数パターンを導入するよう構成されることができる。実際、設計は、反射が望ましい周波数範囲において起こることを保証することができる。
特に、反射は、周波数応答において一つまたは複数の著しい落ち込みを導入する干渉を導入することができる。これは、音響要素203を、所与の周波数について減殺的干渉を提供するよう設計することによって達成できる。特に、減殺的干渉は、直接的経路長と反射経路長との間の差が半波長に等しい(その結果、マイクロホンに到達する信号が180°位相がずれている)ときに起こる。
よって、図4に示されるように、マイクロホン軸のどちら側に源が位置しているかに依存して、スペクトル特性における差が生じることができる。たとえばマイクロホンM1については、境界効果と同様の効果が生成され、Sを含む半平面内の音源についての直接音と反射音との間の建設的および減殺的干渉を引き起こす。これらの効果が生じる周波数は、マイクロホンに対する障害物のサイズ、形状および距離に依存する。
このように、いくつかの実施形態では、干渉効果に対応する周波数応答はあらかじめ決定されていてもよく、受領される第一のマイクロホン信号はあらかじめ決定された周波数応答と比較されてもよい。十分近い一致が検出される場合には、音響要素203と反対の半平面内の位置推定値が選択され、そうでない場合には、音響要素203と同じ半平面内の位置推定値が選択される。
いくつかの実施形態では、期待される特性は、第一および第二のマイクロホン信号が一方の半平面内の音源からは実質的に等しいが他方の平面内の音源についてはそうでないべきであるというものであってもよい。たとえば、図4において、マイクロホン信号はGを含む半平面内の音源については実質的に等しいが、Cを含む半平面内の音源については異なる。このように、第一のマイクロホン信号についての期待される特性は相対的な特性、すなわち、第二のマイクロホン信号の特性とある種の関係をもつということであってもよい。(複雑さの低い例として、位置がどちらの半平面内であるかに依存して、二つの信号が同じべきであるまたは異なるべきであるというものであってもよい。)
このように、いくつかの実施形態では、音響効果指標は、第一のマイクロホン信号の第二のマイクロホン信号との比較に応答して決定される。
反射からの干渉特性に基づく手法の具体例として、音響効果推定器307は、音響要素201によって影響される信号スペクトルの領域のみをフィルタ抽出するために帯域通過フィルタ処理を使うことができる。次いで、帯域通過信号のパワーが比較されて、どちらの半平面(左または右)に音源が位置しているかを決定する。音響要素201は、どちらの方向角の半平面に音源が位置しているかに依存してスペクトルの明確な相違を生じるよう、設計されることができる。
図5〜図7は、スピーカーで再生され、約1.5m離れて位置する2素子マイクロホン・アレイによって捕捉された掃引信号のスペクトル特性を、次の三つの異なる配位について示している:
図5:音響要素201なし。
図6:音響要素201は第一のマイクロホンM1と音源との間に位置。
図7:音響要素201は音源の反対側に位置(たとえば図4でSに音源をもつものに対応)。
図5は、製造プロセスからの若干の所与の許容差(通例±3dB)の範囲内で共通であるマイクロホン・スペクトルの相違を示している。
図6と図7を比べると、どちらの半平面に源が位置しているかに依存して、マイクロホン信号応答の間の非常に明瞭かつ大きな相違が示される。この差は約6.5kHzで約20dBにまで達し(約10kHzで約8dBの控えめなブーストもある)、位置弁別目的のために使用できる。そのような差は、マイクロホン応答の±3dBの差よりさらに大きく、本方法はマイクロホンのミスマッチに対して堅牢となる。
6.5kHzでの観察された結果の背後にある機構を理解するために、図8に示した時間領域のインパルス応答を考えてもよい。第一のマイクロホンM1について、インパルス応答はサンプル198、200および201における反射を表示している。これらは、最初にマイクロホンに到達する音波に関連する直接場とほぼ同じくらいの大きさである。反射は、第一の音響要素によって生じる反射によって明瞭に引き起こされており、図7の観察を与える音波の減殺的および建設的干渉につながる。音響要素201がマイクロホンと音源との間に位置している図6とは対照的に、これらの反射はマイクロホンからは離れるほうに進む。
音響要素の物理的および音響的属性は一般に、個々の実施形態の選好、要求および制約に依存する。たとえば、反射および干渉に基づく手法のためには、信号における結果として得られるスペクトル差は、マイクロホンに対する音響要素203のサイズ、形状および距離に依存する。
上記の諸例では、音響要素203は、軸201の一方の側にのみ、すなわち完全に一方の半平面内に存在するよう設計されていた。これは、高度な非対称性を提供すると同時に、複雑さの低い手法を提供しうる。特に、本手法は、一つのマイクロホン上の反射を、マイクロホン軸の一方の側からのみ発するよう制約しうる。
マイクロホンM1、M2および音響要素203の配置はしばしばごくコンパクトであり、それでいて良好な位置推定を提供しうる。実際、特に有利なパフォーマンスが、第一のマイクロホンM1と第二のマイクロホンM2の間の距離が1cmから5cmまでの間(両端点含む)である配置について見出されている。さらに、マイクロホンM1の近くに位置される音響要素203について有利なパフォーマンスが見出されている。特に、音響要素の最も近い点が第一のマイクロホンM1から高々10cmのところに位置されるときに特に有利なパフォーマンスが見出されている。近接した音響要素203は特に、可聴周波数範囲内の強い干渉パターンを引き起こす強い反射を与えうる。
マイクロホンM1、M2および音響要素203の配置の例が図9に示されている。
いくつかの実施形態では、配置は、図10に示されるように、第二のマイクロホンM2に近接して位置される第二の音響要素1001を含んでいてもよい。第二の音響要素1001は、第一のマイクロホンM1のあたりの第一の音響要素203に対して、第二のマイクロホンM2のあたりに対称的に位置されていてもよい。
そのような実施形態では、音響効果推定器307に対応して、第二のマイクロホンM1のために第二の推定器が使われてもよい。そのような実施形態では、二つの可能な位置の間の選択は第一および第二のマイクロホン信号がどのくらい二つの半平面のそれぞれからの音響効果をよく示しているかの推定に基づいていてもよい。
たとえば、図10の例では、音源Sからのオーディオは音響要素203によって反射されるが、第二の音響要素1001によっては反射されない。このように、この音源については、第一のマイクロホン信号は、反射によって引き起こされる干渉効果の特徴的な周波数パターンを示すが、第二のマイクロホン信号はそうではない。
しかしながら、(マイクロホン軸に関して)対称的な位置にある音源については、反射を、よって干渉を経験するのは第二のマイクロホンM2となり、第一のマイクロホンは経験しなくなる。よって、この場合は、第一のマイクロホン信号は、反射によって引き起こされる干渉効果の特徴的な周波数パターンを示さないが、第二のマイクロホン信号は示す。
干渉効果についての特徴的なパターンの存在の相対的な指示は、このように、二つの可能なシナリオの間で選択するために使われてもよい。特に、特徴的な周波数パターンと二つのマイクロホン信号それぞれの周波数領域表現との間の相関がそれぞれ決定されてもよい。次いで、最高の相関を示すマイクロホンについて起こる反射に対応する位置が選択されることができる。
第二の音響要素の使用は、曖昧さを解決するために有用な追加的な情報を提供することがあり、よって選択の、よって生成される最終的な位置推定値の信頼性を高めることがある。
いくつかの実施形態では、二つの音響要素1001、203は単一の音響要素のパーツとして形成されてもよいことは理解されるであろう。そのような実施形態の例が図11に示されている。
上記の記述は明確のため本発明の実施形態を、種々の機能的な回路、ユニットおよびプロセッサに言及しつつ記述していることが理解されるであろう。しかしながら、本発明を損なうことなく、異なる機能的な回路、ユニットまたはプロセッサの間での任意の好適な機能の分配が使用されうることは明白であろう。たとえば、別個のプロセッサまたはコントローラによって実行されるよう示されている機能が同じプロセッサまたはコントローラによって実行されてもよい。よって、特定の機能ユニットまたは回路への言及は、厳密な論理的または物理的な構造または編成を示すというよりは、記載される機能を提供する好適な手段に言及したものとしてのみ見るべきである。
本発明は、ハードウェア、ソフトウェア、ファームウェアまたはこれらの任意の組み合わせを含むいかなる好適な形で実装されることもできる。本発明は任意的に、少なくとも部分的に、一つまたは複数のデータ・プロセッサおよび/またはデジタル信号プロセッサ上で走るコンピュータ・ソフトウェアとして実装されてもよい。本発明のある実施形態の要素およびコンポーネントは、物理的、機能的および論理的に、任意の好適な仕方で実装されてもよい。実際、機能は単一のユニットに、複数のユニットに、または他の機能ユニットの一部として実装されてもよい。よって、本発明は、単一のユニットで実装されてもよいし、あるいは物理的および機能的に、異なるユニット、回路およびプロセッサの間で分散されていてもよい。
本発明はいくつかの実施形態との関連で述べてきたが、本稿に記載される特定の形に限定されることは意図されていない。むしろ、本発明の範囲は付属の請求項によってのみ限定される。さらに、ある特徴が特定の実施形態との関連で記載されているように見えることがありうるが、当業者は、記載される諸実施形態のさまざまな特徴が本発明に基づいて組み合わされてもよいことを認識するであろう。請求項において、有する/含むの語は他の要素またはステップの存在を排除するものではない。
さらに、個別に挙げられてはいても、複数の手段、要素、回路または方法ステップが、たとえば単一の回路、ユニットまたはプロセッサによって実装されてもよい。さらに、個々の特徴が異なる請求項に含まれていたとしても、それらは可能性としては有利に組み合わされうるのであって、異なる請求項に含まれていることが、特徴の組み合わせが実現可能でないおよび/または有利でないことを含意するものではない。また、ある特徴があるカテゴリーの請求項に含まれていることは、このカテゴリーへの限定を含意するのではなく、むしろ、その特徴が適宜他のカテゴリーの請求項にも等しく適用可能であることを示す。さらに、請求項における特徴の順序は、それらの特徴が作用しなければならないいかなる特定の順序をも含意しない。特に、方法請求項における個々のステップの順序はそれらのステップがその順序で実行されなければならないことを含意するものではない。むしろ、ステップは任意の好適な順序で実行されうる。さらに、単数形での言及は複数を排除するものではない。「ある」「第一の」「第二の」などの言及は複数を排除するものではない。請求項における参照符号は、単に明快にするための例として与えられているのであって、いかなる仕方であれ特許請求の範囲を限定するものと解釈してはならない。

Claims (15)

  1. 音源の位置推定値を決定する装置であって:
    第一のマイクロホン信号を生成する第一のマイクロホンと;
    第二のマイクロホン信号を生成する第二のマイクロホンと;
    音源位置から前記第一のマイクロホンへの音に、前記第一および第二のマイクロホンの間の軸に対して非対称的な音響効果を与える音響要素と;
    位置プロセッサとを有しており、前記位置プロセッサは:
    ・音源からのオーディオについての前記第一のマイクロホンおよび前記第二のマイクロホンにおける到達時間に応答して、音源についての第一の可能な位置および第二の可能な位置を推定する第一の位置回路であって、前記第一の可能な位置は前記軸の一方の側の第一の領域内の位置であり、前記第二の可能な位置は前記軸の反対側の第二の領域内の位置である、回路と;
    ・前記第一のマイクロホン信号について第一の音響効果指標を決定する推定器であって、前記第一の音響効果指標は前記第一のマイクロホン信号の音響効果が前記第一の領域内の音源についての前記音響効果の期待される特性に一致する度合いを示す、推定器と;
    ・前記第一の音響効果指標に応じて前記第一の可能な位置と前記第二の可能な位置との間で選択することによって前記音源についての位置推定値を決定する第二の位置回路とを有する、
    装置。
  2. 前記第一の音響効果指標は、前記第一のマイクロホン信号の前記音響効果が前記第一の領域内の音源についての前記音響要素の期待される音響効果に一致する前記度合いを、前記第一のマイクロホン信号の前記音響効果が前記第二の領域内の音源についての前記音響効果の期待される特性に一致する度合いに比して示すものである、請求項1記載の装置。
  3. 前記音響効果は前記軸に対して非対称的に周波数依存であり、前記推定器は、前記第一の信号の周波数応答と前記第一の領域内の音源についての期待される周波数応答との間の相関の度合いの決定に応じて、前記第一の音響効果指標を生成するよう構成されている、請求項1記載の装置。
  4. 前記音響効果は非対称的に周波数依存であり、前記推定器は、前記第一のマイクロホン信号をフィルタ処理して第一のフィルタ処理されたマイクロホン信号を生成するフィルタを有しており、前記第一のフィルタ処理されたマイクロホン信号に応答して前記第一の音響効果指標を決定するよう構成されている、請求項1記載の装置。
  5. 前記音響要素は、前記第一の領域内の音源からの反射を前記第一のマイクロホンに受領させるが、前記第二の領域内の音源からの反射は受領させないよう構成されている、請求項1記載の装置。
  6. 前記期待される特性は、前記第一の領域内の音源からの直接的な音成分と反射された音成分との間の干渉から帰結する干渉効果である、請求項5記載の装置。
  7. 前記期待される特性は干渉周波数応答である、請求項6記載の装置。
  8. 前記音響要素は前記軸の一方の側にのみ存在する、請求項1記載の装置。
  9. 前記推定器は、前記第一のマイクロホン信号の前記第二のマイクロホン信号との比較に応じて前記第一の音響効果指標を決定するよう構成されている、請求項1記載の装置。
  10. 諸音源位置から前記第二のマイクロホンへの音についての第二の音響効果を提供する第二の音響要素をさらに有する請求項1記載の装置であって、前記第二の音響効果は前記軸に対して非対称的であり、前記位置プロセッサはさらに:
    ・前記第二のマイクロホン信号について第二の音響効果指標を決定する第二の推定器を有しており、前記第二の音響効果指標は前記第二のマイクロホン信号の音響効果が前記第二の領域内の音源についての前記第二の音響効果の期待される特性に一致する度合いを示し;
    前記第二の位置回路は、さらに前記第二の音響効果指標に応じて前記第一の可能な位置と前記第二の可能な位置との間で選択することによって、前記音源についての前記位置推定値を決定するよう構成されている、
    請求項1記載の装置。
  11. 前記第二の位置回路は、前記第一の音響効果指標が前記第二の音響効果指標を超える場合に前記第一の可能な位置を選択し、前記第二の音響効果指標が前記第一の音響効果指標を超える場合に前記第二の可能な位置を選択するよう構成されている、請求項10記載の装置。
  12. 前記音響要素の最も近い点が、前記第一のマイクロホンから高々10cmのところに位置している、請求項1記載の装置。
  13. 前記第一のマイクロホンと前記第二のマイクロホンとの間の距離が1cm以上50cm以下である、請求項1記載の装置。
  14. 諸音源位置から第一のマイクロホンまでの音に対する音響効果を与える音響要素を有するオーディオ環境における音源についての位置推定値を、前記第一のマイクロホンからの第一のマイクロホン信号および第二のマイクロホンからの第二のマイクロホン信号から決定する装置であって、前記音響効果は前記第一のマイクロホンと前記第二のマイクロホンとの間の軸に対して非対称的であり、当該装置は:
    前記第一のマイクロホン信号を受領する第一の受領器と;
    前記第二のマイクロホン信号を受領する第二の受領器と;
    音源からのオーディオについて前記第一のマイクロホンおよび前記第二のマイクロホンにおける到達時間に応答して、音源についての第一の可能な位置および第二の可能な位置を推定する第一の位置回路であって、前記第一の可能な位置は前記軸の一方の側の第一の領域内の位置であり、前記第二の可能な位置は前記軸の反対側の第二の領域内の位置である、回路と;
    前記第一のマイクロホン信号について音響効果指標を決定する推定器であって、前記音響効果指標は前記第一のマイクロホン信号の音響効果が前記第一の領域内の音源についての前記音響効果の期待される特性に一致する度合いを示す、推定器と;
    前記音響効果指標に応じて前記第一の可能な位置と前記第二の可能な位置との間で選択することによって前記音源についての位置推定値を決定する第二の位置回路とを有する、
    装置。
  15. 諸音源位置から第一のマイクロホンまでの音に対する音響効果を与える音響要素を有するオーディオ環境における音源についての位置推定値を、前記第一のマイクロホンからの第一のマイクロホン信号および第二のマイクロホンからの第二のマイクロホン信号から決定する方法であって、前記音響効果は前記第一のマイクロホンと前記第二のマイクロホンとの間の軸に対して非対称的であり、当該方法は:
    前記第一のマイクロホン信号を受領する段階と;
    前記第二のマイクロホン信号を受領する段階と;
    音源からのオーディオについて前記第一のマイクロホンおよび前記第二のマイクロホンにおける到達時間に応答して、音源についての第一の可能な位置および第二の可能な位置を推定する段階であって、前記第一の可能な位置は前記軸の一方の側の第一の領域内の位置であり、前記第二の可能な位置は前記軸の反対側の第二の領域内の位置である、段階と;
    前記第一のマイクロホン信号について音響効果指標を決定する段階であって、前記音響効果指標は前記第一のマイクロホン信号の音響効果が前記第一の領域内の音源についての前記音響効果の期待される特性に一致する度合いを示す、段階と;
    前記第一の音響効果指標に応じて前記第一の可能な位置と前記第二の可能な位置との間で選択することによって前記音源についての前記位置推定値を決定する段階とを含む、
    方法。
JP2014551704A 2012-01-17 2013-01-08 音源位置推定 Active JP6225118B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261587267P 2012-01-17 2012-01-17
US61/587,267 2012-01-17
PCT/IB2013/050139 WO2013108147A1 (en) 2012-01-17 2013-01-08 Audio source position estimation

Publications (2)

Publication Number Publication Date
JP2015507422A true JP2015507422A (ja) 2015-03-05
JP6225118B2 JP6225118B2 (ja) 2017-11-01

Family

ID=47741204

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014551704A Active JP6225118B2 (ja) 2012-01-17 2013-01-08 音源位置推定

Country Status (8)

Country Link
US (1) US9351071B2 (ja)
EP (1) EP2810453B1 (ja)
JP (1) JP6225118B2 (ja)
CN (1) CN104041075B (ja)
BR (1) BR112014017279B1 (ja)
RU (1) RU2611563C2 (ja)
TR (1) TR201807219T4 (ja)
WO (1) WO2013108147A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9078057B2 (en) * 2012-11-01 2015-07-07 Csr Technology Inc. Adaptive microphone beamforming
FR2998438A1 (fr) * 2012-11-16 2014-05-23 France Telecom Acquisition de donnees sonores spatialisees
US9226062B2 (en) * 2014-03-18 2015-12-29 Cisco Technology, Inc. Techniques to mitigate the effect of blocked sound at microphone arrays in a telepresence device
JP2016092767A (ja) * 2014-11-11 2016-05-23 共栄エンジニアリング株式会社 音響処理装置及び音響処理プログラム
GB2549922A (en) * 2016-01-27 2017-11-08 Nokia Technologies Oy Apparatus, methods and computer computer programs for encoding and decoding audio signals
KR102514464B1 (ko) 2016-09-14 2023-03-24 매직 립, 인코포레이티드 공간화 오디오를 갖는 가상 현실, 증강 현실 및 혼합 현실 시스템들
CN106782585B (zh) * 2017-01-26 2020-03-20 芋头科技(杭州)有限公司 一种基于麦克风阵列的拾音方法及系统
JP6828804B2 (ja) 2017-03-24 2021-02-10 ヤマハ株式会社 収音装置および収音方法
US10334360B2 (en) * 2017-06-12 2019-06-25 Revolabs, Inc Method for accurately calculating the direction of arrival of sound at a microphone array
US10524048B2 (en) * 2018-04-13 2019-12-31 Bose Corporation Intelligent beam steering in microphone array
US11906642B2 (en) * 2018-09-28 2024-02-20 Silicon Laboratories Inc. Systems and methods for modifying information of audio data based on one or more radio frequency (RF) signal reception and/or transmission characteristics
JP7245034B2 (ja) * 2018-11-27 2023-03-23 キヤノン株式会社 信号処理装置、信号処理方法およびプログラム
CN111289947B (zh) * 2018-12-07 2023-04-07 阿里巴巴集团控股有限公司 信息处理方法、装置以及设备
US11874200B2 (en) 2020-09-08 2024-01-16 International Business Machines Corporation Digital twin enabled equipment diagnostics based on acoustic modeling
CN112684413B (zh) * 2021-03-17 2021-05-25 杭州灵伴科技有限公司 声源寻向方法和xr设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010125797A1 (ja) * 2009-04-28 2010-11-04 パナソニック株式会社 補聴装置、及び補聴方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4862278A (en) 1986-10-14 1989-08-29 Eastman Kodak Company Video camera microphone with zoom variable acoustic focus
BG60225B2 (bg) * 1988-09-02 1993-12-30 Qsound Ltd. Метод и устройство за формиране на звукови изображения
US5969838A (en) * 1995-12-05 1999-10-19 Phone Or Ltd. System for attenuation of noise
US7068801B1 (en) 1998-12-18 2006-06-27 National Research Council Of Canada Microphone array diffracting structure
US8947347B2 (en) * 2003-08-27 2015-02-03 Sony Computer Entertainment Inc. Controlling actions in a video game unit
US7039199B2 (en) 2002-08-26 2006-05-02 Microsoft Corporation System and process for locating a speaker using 360 degree sound source localization
JP4873913B2 (ja) * 2004-12-17 2012-02-08 学校法人早稲田大学 音源分離システムおよび音源分離方法、並びに音響信号取得装置
EP1838131B1 (en) * 2005-01-13 2017-06-28 Fujitsu Ltd. Sound receiver
JP3906230B2 (ja) * 2005-03-11 2007-04-18 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体
EA011601B1 (ru) * 2005-09-30 2009-04-28 Скуэрхэд Текнолоджи Ас Способ и система для направленного захвата аудиосигнала
CN1952684A (zh) * 2005-10-20 2007-04-25 松下电器产业株式会社 利用麦克风定位声源的方法和装置
JP5098176B2 (ja) 2006-01-10 2012-12-12 カシオ計算機株式会社 音源方向判定方法及び装置
US7474589B2 (en) 2006-10-10 2009-01-06 Shotspotter, Inc. Acoustic location of gunshots using combined angle of arrival and time of arrival measurements
EP2090895B1 (en) * 2006-11-09 2011-01-05 Panasonic Corporation Sound source position detector
JP4449987B2 (ja) * 2007-02-15 2010-04-14 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
DE602007007581D1 (de) * 2007-04-17 2010-08-19 Harman Becker Automotive Sys Akustische Lokalisierung eines Sprechers
DE102008029352A1 (de) 2008-06-20 2009-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zum Lokalisieren einer Schallquelle
JP2010112996A (ja) * 2008-11-04 2010-05-20 Sony Corp 音声処理装置、音声処理方法およびプログラム
JP2010213091A (ja) 2009-03-11 2010-09-24 Ikegami Tsushinki Co Ltd 音源位置推定装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010125797A1 (ja) * 2009-04-28 2010-11-04 パナソニック株式会社 補聴装置、及び補聴方法

Also Published As

Publication number Publication date
TR201807219T4 (tr) 2018-06-21
JP6225118B2 (ja) 2017-11-01
EP2810453A1 (en) 2014-12-10
CN104041075A (zh) 2014-09-10
BR112014017279B1 (pt) 2020-12-15
BR112014017279A8 (pt) 2017-07-04
US9351071B2 (en) 2016-05-24
EP2810453B1 (en) 2018-03-14
RU2014133745A (ru) 2016-03-10
CN104041075B (zh) 2017-10-24
WO2013108147A1 (en) 2013-07-25
US20140376741A1 (en) 2014-12-25
RU2611563C2 (ru) 2017-02-28
BR112014017279A2 (pt) 2017-06-13

Similar Documents

Publication Publication Date Title
JP6225118B2 (ja) 音源位置推定
Cobos et al. A survey of sound source localization methods in wireless acoustic sensor networks
US8184843B2 (en) Method and apparatus for sound source localization using microphones
US9354310B2 (en) Systems, methods, apparatus, and computer-readable media for source localization using audible sound and ultrasound
KR102088222B1 (ko) 분산도 마스크를 이용한 음원 국지화 방법 및 음원 국지화 장치
Grobler et al. Sound based localization and identification in industrial environments
Pourmohammad et al. N-dimensional N-microphone sound source localization
JP2006194700A (ja) 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム
EP2732301B1 (en) Sound source localization using phase spectrum
Seo et al. Impulsive sound source localization using peak and RMS estimation of the time-domain beamformer output
KR101086304B1 (ko) 로봇 플랫폼에 의해 발생한 반사파 제거 신호처리 장치 및 방법
Tervo et al. Estimation of reflective surfaces from continuous signals
Aktas et al. Acoustic direction finding using single acoustic vector sensor under high reverberation
KR100931401B1 (ko) 스펙트럼 왜곡을 유발하는 인공귀 및 이를 이용한 음원방향 검지 방법
Al-Sheikh et al. Sound source direction estimation in horizontal plane using microphone array
KR100730297B1 (ko) 머리전달함수 데이터베이스를 이용한 음원 위치 추정 방법
EP3182734A2 (en) Method for using a mobile device equipped with at least two microphones for determining the direction of loudspeakers in a setup of a surround sound system
Salvati et al. A real-time system for multiple acoustic sources localization based on ISP comparison
KR20200066891A (ko) 2차원 마이크 어레이를 이용한 3차원 음원 위치 검출 장치 및 방법
JP2013024687A (ja) ターゲット識別システム
JP2000266832A (ja) 音源方向測定方法及び装置
Nguyen et al. Multiple sound sources localization with perception sensor network
JP2020043456A (ja) 音響処理装置、音響処理方法およびプログラム
KR20200011134A (ko) 음원 위치 추정장치 및 이를 포함하는 로봇
Zacca et al. Inferring the location of reflecting surfaces exploiting loudspeaker directivity

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170411

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171006

R150 Certificate of patent or registration of utility model

Ref document number: 6225118

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250