JP3999689B2 - 音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法 - Google Patents

音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法 Download PDF

Info

Publication number
JP3999689B2
JP3999689B2 JP2003071735A JP2003071735A JP3999689B2 JP 3999689 B2 JP3999689 B2 JP 3999689B2 JP 2003071735 A JP2003071735 A JP 2003071735A JP 2003071735 A JP2003071735 A JP 2003071735A JP 3999689 B2 JP3999689 B2 JP 3999689B2
Authority
JP
Japan
Prior art keywords
sound source
sound
source position
position acquisition
elevation angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003071735A
Other languages
English (en)
Other versions
JP2004279241A (ja
Inventor
治 市川
雅史 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2003071735A priority Critical patent/JP3999689B2/ja
Priority to US10/801,440 priority patent/US20040228215A1/en
Publication of JP2004279241A publication Critical patent/JP2004279241A/ja
Application granted granted Critical
Publication of JP3999689B2 publication Critical patent/JP3999689B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/801Details
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法に関し、より詳細には、マイクロフォンを可能な限り少なくしても高い精度で仰角データを含む音源位置の取得を可能とする、高精度の音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法に関する。
【0002】
【従来の技術】
マイクロフォン・アレイで音源位置推定性能を向上させるためには、従来では多数のマイクロフォンを含む、多チャンネル同時入力が可能な処理システムが必要とされている。この処理システムは、音源位置に対向するように効率的に駆動部材を制御させることを可能とする。しかしながら、マイクロフォンを多数配置して音源の位置を取得するのは、システム全体のコストを増加させてしまうといった不都合もある。このため、これまでマイクロフォンの数を低減させる試みがなされている。しかしながら、従来のマイクロフォンの数を減少させる検討では、マイクロフォンの数を少なくすると、音源方向に対して充分な指向性を与えるための情報を与えることができないという不都合が生じていた。また、従来の方法を使用しても音源の性質を特定し、測定環境を管理した条件下では、ある程度音源位置を取得することが可能とはなるものの、周囲の雑音や、音源の性質の変動、さらに部屋の伝達特性により影響を受けやすい、といった不都合も生じることが知られていた
【0003】
少数のマイクロフォンを使用した音源位置の推定では、これまで種々の方法が提案されている。例えば、マイクロフォンを2本使用した両耳受聴方法がこれまで知られている。この方法は、頭部伝達関数(HRTF)を使用して、両耳位置で頭部伝達関数を測定し、基準音を発生する音源を様々な方位角(azimuth)、距離(range)、仰角(elevation)に配置することにより、両耳位置での伝達特性を加味して、これらの位置情報を得る方法である。上述した頭部伝達関数は、音源から耳に至る伝達特性を、頭部、胸部、耳介の影響を含めて、実験的にモデルごとに決定して得られる関数なので、汎用性に乏しいという不都合がある。
【0004】
さらに、上述した頭部伝達関数を使用した音源位置の取得は、音源からの信号を測定し、予め測定された頭部伝達関数により与えられる音響スペクトルと一致するものを選択することにより音源位置の取得を行うものである。したがって頭部伝達関数を使用した方法は、例えば音源が基準音源であれば、ある程度正確に音源位置を取得することが原理的には可能となる。しかしながら、頭部伝達関数を使用する音源位置取得は、頭部伝達関数に生じるディップまたはピークを特徴的なキー・プロファイルとして使用するので、上述したディップまたはピークを有している音源の場合には、誤った判断を与える可能性が高い。このため、頭部伝達関数を使用した音源位置の取得は、音源位置の取得よりも音場再現の分野で多く使用されているのが現状である。
【0005】
さらに詳細に従来の音源位置の取得方法については、例えば、奥及他、「ロボットの耳は2つで十分か」、日本音響学会誌、第58巻、第3号、205−210、2002年において開示されるように、2つのマイクロフォンを使用した音源位置の取得も検討されている。この方法では、頭部伝達関数から得られる両耳間強度差(ILD: Interaural Level Differences)および両耳間時間差(ITD: Interaural Time Difference)を使用して、距離および方位角を取得する。上述した2つのマイクロフォンを使用する音源位置の取得では、観測された音響スペクトルから上述した特性値を測定することにより、音源の方位と距離とを取得することが可能であることが示されている。しかしながら、これらの情報だけでは、音響スペクトルの音源が正面方向にある場合の距離を取得することができない。
【0006】
この理由は、正面方向では距離が異なった場合でも、両耳間強度差および両耳間時間差は、それぞれ同一になってしまうためである。また、両耳間強度差および両耳間時間差だけを使用した音源位置取得方法では、仰角についても有意義な取得を行うことができない、という不都合もある。この理由は、方位と距離とが同一の場合、仰角が異なっても両耳間時間差および両耳間強度差は同一となってしまうためである。上述した理由から距離および仰角を含めた音源位置の取得を行うためには、後述する片耳受聴と同様に、音響スペクトルの変形や残響を手がかりにすることが必要とされると考えられており、さらに検討を加える必要があることが指摘されている。
【0007】
上述した両耳受聴とは別に、これまで片耳受聴といわれる方法により、音源位置を取得することも試みられている。片耳受聴による音源位置の取得は、人間が音源までの距離を取得する方法に類似する方法であり、音が大きく、残響の少ない音を近くの音として知覚し、音が小さく残響の多い音を遠い音として知覚させる。上述したように音の大きさと残響とを使用することにより、大まかな音源位置までの距離を取得することができる。しかしながら、音の大きさは対象とする音源に依存し、残響のレベルは、音響スペクトルの測定環境にも依存する。人間の場合においては、対象とする音源や環境に対する情報を、視覚情報を含めて高度な情報処理を行うことで補い、音源までの距離の取得に利用することが可能であると考えられている。このような処理は、純粋な機械的処理のみに基づいた情報処理装置を含む信号処理システムにおいて実現することは実際上困難である。
【0008】
また人間における音源位置の取得方法についての検討によると、音源までの方位や仰角が頭部や耳介の影響で、特定の周波数領域のスペクトルの減衰を与えることが知られている。しかしながら、頭部伝達関数を利用する方法について説明したと同じ理由により、音源の性質の影響をうけるため、実現が困難である。
【0009】
また、耳介に類似する反射板の利用ということに関しては、その反射特性を積極的に利用して、遠方の微少な音を収録するための集音器も提案されている。図15には、これまで提案されている集音器の概略的な構成を示す。図15に示す集音器100は、遠方音源からの音波101を反射させるための反射板102と、反射された音波を収録するためのマイクロフォン104とを含んで構成されている。反射板102は、概ね放物面から形成されており、マイクロフォン104は、放物面の焦点位置に配置されている。反射板102により反射された音波106は、焦点に集められるので、効率的な集音を可能とするものの、音源位置を取得する機能を含むものではない。
【0010】
さらに、ロボットや音声対応KIOSK端末など、人間から話しかけられる対象となりうる装置においては、「その方向を向く」、「マイクロフォン・アレイの指向性を該当する方向に向ける」、「遠いので無視する」といった動作が必要とされる。このためには、ロボットや装置が音源、すなわち話者までの距離や方向を認識し、駆動制御系を制御して、必要な動作を起動させる必要がある。すなわち、信号音の種類が未知である条件下において、既存技術に基づけば、(1)マイクロフォン1本では、原理的に音源位置の取得が不可能であること、(2)マイクロフォン2本の既存システムでは正面方向の距離取得と垂直方向の仰角取得が不可能である、という不都合があった。
【0011】
また、従来のように、マイクロフォンの本数を増加させて、適切な位置に配置することにより、上述した制限が緩和でき、かつ取得精度も向上するものの、デザイン・コストといった実装上の制約のために、少数のマイクロフォンで上述した制限が緩和できることが求められている。
【0012】
【発明が解決しようとする課題】
上述したように、予め高度な事前知識を必要とするスペクトルの変形や音量、残響の強度といった尺度を使用することなく、情報処理システムを使用して音源の位置を取得するために適切な新たな手法および手段が必要とされていた。さらに、上述した手段および手法を使用することにより、音源までの距離、方位角、仰角を取得できる、音源位置取得システムおよび音源位置取得方法が必要とされていた。さらに、上述した良好な音源位置取得性を可能とする音反射要素およびそのための形成方法が必要とされていた。
【0013】
【課題を解決するための手段】
本発明は、上述した従来技術の本質的な不都合に鑑みてなされたものであり、本発明は、少なくとも1つの収録手段、具体的にはマイクロフォンを使用することにより音源までの仰角情報について高精度の解析を可能とすることができれば、従来技術の不都合を改善することができ、より高精度の音源位置取得システム、音源位置取得方法を提供することができる、という認識のもとになされたものである。
【0014】
本発明は、上記課題を解決するために、音源から発生された音波に対して、音源位置に応じて固有の反射を生じさせ、直接音と共に同時に収録させた音響データとして収録される。この音響データは、後の処理のためにディジタル・データへと変換され、記録装置に一旦保持される。これらの音響データは、本発明において遅延変形として参照される新たな尺度を提供することを可能とする。このため、本発明においては信号音源の種類に依存せずに、新たに「遅延変形」という尺度を、従来の尺度に追加的に使用することを可能とし、従来の音源位置取得における不都合を解決することを可能とする。
【0015】
上述した遅延変形に対して高い固有性を与えて記録するために、本発明では、音源から発生した音波に音源位置に対応した固有の反射を生じさせて記録を可能とする音反射要素と、記録された音響データを処理する処理方法とを使用する。
【0016】
音反射要素は、反射された後に記録された音波と、反射されずに直接記録された直接波と反射に伴う経路差をもって遅れて到着した反射波とを重畳して収録手段へと集める。音源の相対位置に固有となるように規定された経路差は、本発明において使用する遅延変形を生成し、この遅延変形を含む音響データが本発明の処理方法により処理されることで、本発明の特定の実施の形態では、仰角を含む位置情報の高精度な取得が可能となる。本発明において導入されるこの遅延変形プロファイルは、周囲環境に影響を受けない尺度として音源位置取得のために使用される。
【0017】
すなわち、本発明によれば、音源と収録手段との間の相対位置に対応した遅延変形を生成する音反射要素と、
前記音反射要素を介して収録された音響データを記録する記憶部と、
前記遅延変形が重畳された音響データを使用して、音源位置を取得するための音源位置取得部と
を含む音源位置取得システムが提供される。本発明の前記音反射要素は、音源と収録手段との間の相対位置に関連する回転楕円体として形成され、前記遅延変形を前記相対位置に固有に生成する。本発明の前記音源位置取得部は、ホワイトノイズ音源が生成する固有の遅延変形を含む基準テンプレートを格納する基準テンプレート格納部と、
背景ノイズのテンプレートを格納する背景ノイズ・テンプレート格納部と、
前記基準テンプレートと背景ノイズ・テンプレートとを使用して前記音響データとの残差を算出する残差生成部と、
生成された残差を使用して、最小残差を与える基準テンプレートを選択する選択部とを含む。本発明の前記基準テンプレート格納部は、基準テンプレートと、該基準テンプレートを与えた音源位置とを対応させて格納する。本発明の前記音源位置取得システムは、複数または単数の音反射要素を含み、前記相対位置として音源までの距離と、方位角と、仰角とを含む音源の位置データを同時に取得する。
【0018】
本発明によれば、情報処理装置を制御して音源の位置を取得させる音源位置取得方法であって、該音源位置取得方法は、
音源と収録手段との間の相対位置に対応して遅延変形が重畳された音響データを収録するステップと、
前記収録された音響データを記憶部に格納させるステップと、
前記遅延変形が重畳された音響データを読み出して、前記遅延変形により指定される音源の前記相対位置を取得するステップと
を情報処理装置に実行させる、音源位置取得方法が提供される。本発明における前記遅延変形は、音源と収録手段との間の前記相対位置に関連する回転楕円体からの反射により生成され、前記遅延変形は、前記相対位置に固有に生成される。本発明における前記音源位置取得ステップは、ホワイトノイズ音源が生成する前記相対位置固有の遅延変形を含む基準テンプレートを格納する基準テンプレート格納部から基準テンプレートを読み出させるステップと、
背景ノイズのテンプレートを格納する背景ノイズ・テンプレート格納部から背景ノイズ・テンプレートを読み出させるステップと、
前記基準テンプレートと背景ノイズ・テンプレートとを使用して前記音響データとの残差を算出させるステップと、
生成された残差を使用して、最小残差を与える基準テンプレートを選択するステップと
を情報処理装置に実行させる。本発明の前記選択ステップは、選択された基準テンプレートを参照して、該当する基準テンプレートに対応する音源位置を取得するステップを実行させるステップを含む。本発明においては、前記取得された音源位置から音源までの前記相対位置として、距離と、方位角と、仰角とを同時に取得するステップを実行させる。
【0019】
本発明によれば、音源と収録手段との間の相対位置に対応した遅延変形を生成するための音反射要素であって、該音反射要素は、反射面が、焦点間の距離が前記音源と前記収録手段までの距離に対応する複数の楕円を、前記焦点間を連結する軸を中心として回転させて形成される複数の回転楕円体からなる包絡線を含んで構成される、
音反射要素が提供される。
【0020】
本発明における前記複数の楕円は、前記音源と前記収録手段との間の仰角に関連して生成され、前記仰角が大きくなるにつれて扁平とすることができる。本発明における前記反射面は、前記焦点間を連結する軸を中心として対応する楕円を回転させて生成される前記複数の回転楕円体の包絡面として形成することができる。
【0021】
本発明によれば、音源と収録手段との間の相対位置に対応した遅延変形を生成するための音反射要素を形成する方法であって、前記方法は、
焦点間の距離が前記音源と前記収録手段までの距離とに対応する楕円を、前記焦点間を連結する軸を中心として回転させて複数の回転楕円体を生成するステップと、
前記複数の回転楕円体の包絡面を生成して反射面を形成するステップと、
を含む、音反射要素の形成方法が提供される。本発明における前記複数の楕円は、前記音源と前記収録手段との間の仰角に関連して生成され、前記仰角が大きくなるにつれて扁平とすることができる。
【0022】
【発明の実施の形態】
A.音反射要素の構成
図1は、本発明において使用する距離、方位角、および仰角を定義した図である。図1においては収録手段であるマイクロフォンM1、M2が使用されており、方位角、距離、および仰角は、マイクロフォンM1、M2の中点から測った位置座標として表されている。音源SSは、マイクロフォンの中点から所定の距離rだけ離れているのが示されている。上述した座標系において本発明では、音源位置を、カーテシアン座標系(x,y,z)または極座標系(r,θ,φ)で表示することが可能となる。以下、本発明においては仰角の取得を特定の実施の形態として説明するが、本発明においては、方位角、仰角にかかわらず、角度および距離の尺度をもって収録されるいかなる音源の位置の取得についても適用することができる。
【0023】
本発明は、本質的に音源から直接収録された音波と音反射要素の反射面で反射した反射波との間の経路差を、音源の位置と経路差とを対応させるように音反射要素の形状を構成するものである。本発明においては、本質的に音反射要素を楕円曲線の集合として構成する。従来から楕円曲面は、一方の楕円の焦点から発生した音波は、他方の焦点へと反射することが知られている。図2は、一般的な楕円の性質を示す。図2に示されるように、本発明においては、反射面の断面を、一方の焦点Aに音源を配置し、マイクロフォンを他の焦点位置Bに配置する楕円を使用して構成させる。図2に示した配置では、焦点Aを出発した音波Srは、壁のどの位置で反射したとしても、同じ焦点位置Bに集まる。反射面として楕円を使用することにより、反射波は、反射せず焦点Aから焦点Bへと直接到達した音波Sdとは、常に楕円曲線により規定された一定の経路差(2a−f)を有することになる。
【0024】
次に、上記経路差に着目して、本発明においては上記経路差を積極的に音源位置の取得に利用することを検討した。ここで、音源位置取得における現実的な音反射要素の適用態様を考えると、音反射要素に相対的にマイクロフォンが固定され、話者などの音源が移動することが現実的な構成を考える上で重要であるものと考えられる。そこで、マイクロフォンの位置を焦点Bに固定し、音源の位置が他の焦点Aとなるように、焦点Aの位置を変化させた場合の反射面の性質について検討する。図3においては、音源の位置判断を行う最大の距離を規定し、それ以上の距離についてはノイズであるものとして判断するものとする。図3では、音源位置は、想定する最も遠い位置fmaxから、想定する最も近い位置fまで移動されている。同時に図3には、音源がfmaxから最も近い位置fまで移動した場合の両位置を焦点とする楕円の包絡線の形状Rが示されている。図3に示されるように、焦点A(音源位置)がマイクロフォンに近い時には、楕円は丸みを帯びた円に近い形状となり、焦点A(音源位置)が遠い時には、楕円はつぶれた形状となる。また、焦点Aが離れるにつれ、左端の形状は放物線に漸近的に近づいてゆく。本発明においては、本質的に音反射要素の形状を、音源位置の移動に関連して形成される楕円曲線の包絡線として構成する。
【0025】
図4は、図3に示した包絡線の形状を反射面として構成した場合の、音源位置Aからの音波の反射を概略的に示した図である。図4に示されるように、近い音源位置からの音波が、楕円曲線の奥の部分で反射した場合には、その反射波はマイクロフォン位置である焦点Bに集まる。一方で、楕円曲線の端部付近で反射した場合には角度が合わないため拡散される。そのため、検出される反射波の主要な部分を、音反射要素の奥の部分で反射したものが占めることになる。同様に、他の音源位置に対しても、その音源位置に応じて主要な反射波成分となりうる反射位置を、音反射要素の反射面Rを包絡線から構成することにより、生成することができることが見出された。すなわち、本発明においては、楕円の包絡面を含む反射面を有する音反射要素を形成することにより音源位置に対して固有で、かつ主要な反射波を生成できることが見出された。一方、この主要な反射波と直接波との経路差は、対応する楕円により規定される経路差に相当する遅延時間を伴うことがわかる。
【0026】
さらに本発明者らは、上述した楕円の包絡線を反射面として使用した場合の仰角識別性について検討を加えた。図5に、マイクロフォン位置Bと音源位置Aとの間の距離を設定する最大距離とし、仰角θを、想定される最も低い角度θ0から想定する最も高い角度θmaxまで移動させた場合の楕円曲線の包絡線と、包絡線に対応する音反射要素の形状RSとを示す。図4において説明したように、包絡線で音反射要素RSを形成すると、低い角度の音源からの音波は、音反射要素の奥の部分で反射したものが主要な反射波となり、高い角度の音源からの音波は、音反射要素の端の部分で反射したものが主要な反射波を構成する。この主要な反射波は、対応する楕円により規定される経路差に相当する遅延時間を伴う。すなわち、音源位置に対応した固有の反射波となる。
【0027】
これまで、反射面の断面形状を使用して本発明を詳細に説明してきたが、現実的には本発明の音反射要素の形状は、3次元形状とする必要がある。本発明においては、音反射要素の音波を反射する反射面の3次元形状は、マイクロフォンを設置する側の焦点と音源位置とされる焦点とを連結する軸を中心として、該当する楕円を回転させて形成される複数の回転楕円体の包絡面として形成することができる。
【0028】
図6には、本発明にしたがって構成された音反射要素の具体的な実施の形態を示す。図6に示した本発明の音反射要素10は、形状を認識しやすくするために、音源位置に対応した個々の回転楕円体との接線が併せて示されている。図6に示すように、本発明の音反射要素10は、回転楕円体の包絡面を使いやすいサイズに切り出すことにより構成されている。図6(a)は、音反射要素10の凹面側から見た斜視図であり、図6(b)が同一の音反射要素を、その凸部から見た斜視図である。図6に示されるように、本発明の音反射要素10は、底部10aが離心率の大きな楕円体から構成され、上端部10bが、離心率の大きくされた楕円体から構成されていて、上端部10aに向かって仰角に応じて狭くなる構成とされている。
【0029】
本発明の音反射要素10においては、マイクロフォン12は、音反射要素10構成する回転楕円体の一方の共通焦点に配置されていると共に、マイクロフォン12は、底部10aを含む平面14上に、音反射要素10に対して対称となる位置に配置されている。図6に示した実施の形態では、マイクロフォン12の位置は、音反射要素10の横方向端部を連結する仮想線16よりも音反射要素10側に配設されている。しかしながら、本発明においてはマイクロフォン12の位置は、音反射要素10からの反射波を、ノイズを抑えて均等に受け取ることができる限りどのような位置とすることもできる。また、本発明の音反射要素10は、平面14を境界として上下方向に連結して使用することもできる。
【0030】
図7は、本発明の音反射要素10の配置の実施の形態を示した斜視図である。図7に示した配置の実施の形態においては、音反射要素10および音反射要素18が互いに対として配置されている。音反射要素10および音反射要素18は、図6で説明したと同様の構成としてマイクロフォン12、12aが配置されている。さらに、図7に示した音反射要素の配置の実施の形態では、音反射要素10および音反射要素18は、ともに同一方向に向けられていて、音反射要素10、音反射要素18の凹部が向いた方向における音源の位置取得を行うために適した構成とされている。本発明の音反射要素は、本質的には、1つの音反射要素を使用しても音源位置の仰角取得を行うことが可能であるものの、図7に示すように、音反射要素を対として使用することにより、音源位置までの距離、仰角、方位角を同時に決定することが可能となる。
【0031】
また、音反射要素の全体の形状を小さく設計すると、直接波と主要な反射波の経路差が短くなる。その影響を精度よく観測するためには、高いサンプリング周波数が必要となる。本発明における特定の実施の形態では、音源への仰角0°の時と仰角72°の時とで、直接波と主要な反射波の経路差を約9.5cmとした場合、これは、約0.28msの遅延時間差となる。サンプリング周波数を48KHzとした場合、約13サンプルの差となる。すなわち、理論的には、音源への仰角を0°から72°までの最大13段階で識別できる解像度を持つこととなる。本発明において、解像度を保ったまま全体の形状を半分の大きさに設計するならば、サンプリング周波数を2倍の96KHzとする必要がある。また、全体の形状を2倍の大きさに設計するならば、サンプリング周波数は半分の24KHzでも同じ解像度を達成できるということになる。
【0032】
B.本発明における音源位置取得方法および音源位置取得システム
図8には、本発明の音源位置取得方法の概略的なフローチャートを示す。図9に示した本発明の音源位置取得方法では、上述したセクションAで説明した音反射要素を使用して、仰角の取得を行う。図8に示すように、本発明の音源位置取得方法はステップS10において、音反射要素を介してマイクロフォンにより音声データなどの音響データを収集し、ADコンバータなどを使用して、ディジタル・データに変換した後、メモリに格納する。ステップS12においては、音響データから「プロファイル・フィッティング法による雑音抑圧処理」(市川ら、社団法人電子情報通信学会技術報告、SP2002−21、19頁〜23頁、2002年、5月)に詳細に開示された方法にしたがって、観測プロファイルを算出し、同時に、それぞれの格納部に格納しておいた基準テンプレート(STP)データおよび背景ノイズ・テンプレート(BNT)を読み出し、ステップS14において、観測された観測プロファイルと、基準テンプレートおよび背景ノイズ・テンプレートとの1次結合との間の残差Φn,ωを算出し、適切なメモリに残差Φn,ωを格納する。
【0033】
ステップS16では、さらに読み出すべく基準テンプレートが残されているか否かを判断し、すべての基準テンプレートについて算差が算出された後、ステップS18で、残差Φn,ωをサブバンド周波数毎に正規化してメモリに格納する。ステップS20では、正規化された残差Φn,ωの最小値を決定し、その後、ステップS22において、算出された残差の最小値を与えた基準テンプレートに対応する音源位置を取得して、音源位置として選択し、ステップS24において選択された音源位置に対応して登録された音源位置の座標を適切な形式で出力させることにより、取得した音源位置に対して駆動要素を制御させる。
【0034】
本発明において前記の残差を算出する方法としては、プロファイル・フィッティング法(以下PF法として参照する。)を適用することができる。特に本発明の好適な実施の形態では、PF法を採用することが好ましい。PF法は、「プロファイル・フィッティング法による雑音抑圧処理」(市川ら、社団法人電子情報通信学会技術報告、SP2002−21、19頁〜23頁、2002年、5月)にも開示された雑音抑圧方法であり、仰角、方位角および距離の規定された音源からの観測プロファイルを利用して雑音除去を行うための方法である。しかしながら、本発明においては音源位置の推定を行うための処理にも適切であることが見出された。
【0035】
本発明において特定の実施の形態における処理に使用される観測プロファイルとは、マイクロフォンで収録された音声信号を遅延和アレイによって処理し、その際に遅延和アレイの指向性を向ける方向を、最大値から最小値まで振って観測されるサブバンド周波数毎のパワー分布のことを意味する。本発明において基準テンプレートとは、本発明において採用する音反射要素を介して収録され、位置が既知のホワイトノイズ音源について予め測定された遅延変形を含む観測プロファイルを、指向性を振る方向を横軸、パワーを縦軸に持つ2次元の観測プロファイルを面積正規化したテンプレート・プロファイルを意味する。
【0036】
また、本発明において背景ノイズ・テンプレートとは、雑音源位置にホワイトノイズ音源を置いて観測された音響プロファイを、指向性の振り幅を、サンプリング・チャネル数に対して面積正規化されたテンプレート・プロファイルを意味する。基準テンプレートおよび背景ノイズ・テンプレートの作成においては、前述したように、全周波数帯域にパワーを持つホワイトノイズを使用するのが望ましいが、実際に観測される信号および雑音を使用して近似的に代替することもできる。
【0037】
さらに、本発明における残差Φn,ωは、下記式で与えられる。
【0038】
【数1】
Figure 0003999689
上記式中、Xω(θ)は、本発明の音反射要素を通して遅延変形が重畳された音声信号をθ方向に遅延和アレイの指向性を向けて処理したサブバンド周波数ωのパワーであり、ここでは、観測プロファイルとして呼んでいる。Pn,ω(θ)は、音源位置に対応する基準テンプレートとして格納されたテンプレート・プロファイルであり、Qω(θ)は、背景ノイズ・テンプレートとして格納されたテンプレート・プロファイルである。また、nは、音源位置に対応する。
【0039】
PF法を音声強調に用いるときには、この成分分解はフレームごとに行うが、音源位置取得の場合には全音声フレームの平均に対して1回行うことにより音源位置の取得が可能である。また、Xω(θ)は、数秒の呼びかけ発声の平均値を使用することができる。上記式を使用して、αn, ωとβn, ωが決定されれば、その残差Φn, ωが求まる。さらに、下記式で定義されるように、サブバンドごとのパワーで除し、Ω個のサブバンドで平均した正規化残差bar_Φn, ωを求める。
【0040】
【数2】
Figure 0003999689
また、音源候補位置の取得は、下記式(3)を使用して、正規化残差が最も小さくなるようなサンプル・テンプレート音源候補位置hat_nを選択し、取得された音源位置を選択することにより実行される。
【0041】
【数3】
Figure 0003999689
本発明において使用する「プロファイル」という指標は、音響スペクトルに対する遅延変形の尺度だけでなく、従来から利用されてきた両耳時間差および両耳強度差の尺度を包含している。すなわち、本発明の方法は、遅延変形を単独に検出するだけではなく、従来から利用されてきた両耳時間差および両耳強度差の尺度を、遅延変形の尺度と同時に使用することを可能とする。このため本発明では、音源の位置取得に必要な距離、方位角、仰角の情報を同時に取得することを可能とする。したがって、本発明によれば、従来に比較して少ないマイクロフォンを使用して音源位置取得の処理を一元的に実行することができ、また音源位置取得システムの利用性を拡大することが可能となる。すなわち、従来では1つまたは2つといった少数のマイクロフォンを使用する音源位置取得方法では、不可能であった、仰角取得を例外的に扱うことなく、従来から可能であった水平方向の方向取得などのケースと同時に処理することを可能とするので、より高速に付与することが可能となる。また、従来から可能であったケースの方向取得に対しても音反射要素による遅延変形の尺度を加えることにより、より高精度の位置取得が可能となる。
【0042】
図9は、本発明の特定の実施の形態における音源位置取得システムの概略的構成を示した図である。本発明の音源位置取得システムは、話者20からの話声を集め、記録するための音反射要素22と、この音反射要素22において記録された音響データをディジタル・データに変換して格納するための記録部24と、音響データを解析して音源位置を取得するための音源位置取得部26とを含んで構成されている。取得された音源位置情報は、予め登録しておいた基準テンプレートを使用して決定された音源位置の座標カーテシアン座標(x,y,z)または極座標(r、θ、φ)などの適切な形式で図示しないアプリケーション実行部へと渡される。
【0043】
アプリケーション実行部は、位置座標の入力を受け取って、特定の実施の形態に必要とされる駆動要素28を駆動させることができる構成とされている。駆動要素28としては、例えばロボットの頭部、手、足、目、口、胴体、足、全身などの部材や、キオスク装置のカメラ、マイクロフォン、セキュリティ・システムにおけるマイク、カメラなどを挙げることができるが、本発明においてはこれの駆動要素に限定されるものではない。
【0044】
また、概ね本発明の音源位置取得システムは、中央処理装置(CPU)、メモリ、外部I/O制御装置、モデムやNICといった装置を含んで構成される情報処理装置として構成される。さらに本発明の音源位置取得システムは、アプリケーション・ソフトウエアにより駆動されるロボットなどの駆動要素を含んで構成される装置に搭載され、駆動要素の所定の位置を、原位置と、取得した音源位置までの距離差、方位角差、仰角差とを比較して駆動制御する。
【0045】
図10は、本発明の音源位置取得システムに含まれる音源位置取得部26の機能構成を示した詳細な機能ブロック図である。図10に示した音源取得部26は、上述したようにロボットやキオスク、キャッシュ・ディスペンサー、音響を感知して動作を行うセキュリティ装置などに搭載された、音源位置取得方法を実行するためのプログラムを、CPUが実行することにより上述した各手段として機能させることにより実現される。図10に示すように、本発明の音源位置取得部26は、音反射要素22によりディジタル・データとして記録部に一旦格納された音響データを読み出して、処理のために格納する音響データ格納部30と、基準テンプレート(STP)格納部32と、背景ノイズ・テンプレート(BNT)格納部34とを含んで構成されている。
【0046】
さらに、本発明の音源位置取得部26は、残差を算出するためのプロファイル・フィッティング部(PF)部36と、PF部36により得られた残差Φ , ωを格納するための残差格納部38と、正規化された残差から最小残差を与える基準テンプレートを選択する選択部40と、必要とされるアプリケーションを実行するためのアプリケーション実行部42とを含んで構成されている。
【0047】
本発明のPF部36は、音響データを読み込んで、観測プロファイルへと変換し、その後、STP格納部32から基準テンプレートを読み出すと共に、BNT格納部34から背景ノイズ・テンプレートの読み出しを実行する。PF部36は、テンプレートの一次結合と、観測プロファイルとの残差を算出し、その結果を、残差格納部38へと登録する。さらに、音源位置取得部26は、残差格納部38に格納された残差を正規化し、正規化された残差を比較することにより、選択部40において残差の最小を与える正規化残差が特定される。その後、該当する残差を与えた基準テンプレートを参照して格納された3次元位置を適切な形式として取得する。
【0048】
図11は、本発明においてSTP格納部32に格納された基準テンプレートおよび位置座標のデータ構造を概略的に示した図である。STP格納部32には、3次元位置(1,...,N:Nは、正の整数であり、基準テンプレートの総数に対応する。)に対応する記憶領域が割り当てられている。各記憶領域iには、STPデータと、その3次元位置データ(x,y,z)とが、それぞれのアドレスに関連して格納されている。また、本発明の別の実施の形態では、基準テンプレートと、3次元位置データとを互いに参照可能に別々の格納領域に格納しておくことができる。
【0049】
図11に示されるように、上述した記憶領域iには、STPデータと3次元位置データとが、対応して格納されているのが例示的に示されている。PF部36は、音響データが入力されると、観測プロファイルへと変換し、記憶領域iに順にアクセスして、基準テンプレートを読み出し、BNTデータを使用して1次結合を算出して、その値と観測プロファイルとの残差計算を実行させ、結果を残差格納部38へと出力させる。なお、本発明においては、STP格納部32に格納されるSTPデータは、本発明において採用する音反射要素により規定された遅延変形が導入されているので、仰角に固有の遅延変形が与えられており、高精度に仰角取得を行うことができる。選択部40は、残差の最小値から当該残差を与えた記憶領域iを参照して、当該記憶領域iに格納された3次元位置データ(x,y,z)を読み出すことにより、音源の取得位置を取得している。取得された3次元位置データは、図11に示した駆動要素28の駆動を制御するための、アプリケーション実行部42への制御入力とされる。
【0050】
【実施例】
以下、本発明を具体的な実施の形態をもって説明するが、本発明は後述する実施例に限定されるものではない。
【0051】
(実施例1)正面方向の仰角取得のための音反射要素
音源候補位置の方位角を90°(正面方向)、音源までの距離を2mとし、取得可能な仰角を0°〜72°として回転楕円体の包絡面を作成し、音反射要素とした。実施例1で形成された音反射要素の上端部は、高仰角の音源位置からの音波をマイクロフォン位置に収束するように反射し音反射要素の根元に近い部分では、低仰角の音源位置からの音波がマイクロフォン位置に収束するように反射される。一方、それら以外の音源位置からの音波は拡散される。反射位置が異なれば、直接波との行程差も異なり、音源位置に対応した遅延量が付与された、特有な反射波が生成される。
【0052】
上述した音反射要素を使用した場合、音源への仰角0°の時と仰角72°の時とで、直接波と主要な反射波の経路差に約0.28ms(ミリ秒)の遅延時間差が生成された。音源位置取得システムを上述した音反射要素とマイクロフォンと、ADコンバータと、マイクロコンピュータとから構成させ、取得された音源位置の精度を検討した。音源位置取得システムのサンプリング周波数を48KHzとし、音源への仰角が0°〜72°までの仰角解像度を最大13レベルで識別可能とした。
【0053】
(実施例2)
音反射要素における「遅延変形」生成の確認
実施例1で形成した音反射要素を使用して、図7のように配置し、2つのマイクロフォンをそれぞれ取り付けて、本発明の集音記録部を形成した。入力には、話声を用い、正面方向、距離2m、仰角0°15°30°45°60°の音源位置から数秒の呼びかけ、「おーい」、「もしもし」を再生し、入力音声として観測プロファイルを生成した。このとき、サンプリング周波数を、48KHzとした。本発明の遅延変形を有する反射波の存在を確認するため、高感度の観測プロファイル分析方法である白色化相互相関(CSP= Cross-power Spectrum Phase analysis)法:西浦ら、「マイクロフォンアレーを用いたCSP法に基づく複数音源位置取得」、電子情報通信学会論文誌、D−11、第3巻、J83-D-II、第8号、1713−1721頁)を使用した。
【0054】
CSP法は、高感度に音響スペクトルをトレースすることができる手法なので、本発明における遅延変形を高感度に与えることができる。仰角30°の音源について、算出されたCSP係数を示す。CSP法は、擬似的なピークを多数発生するため、主ピークに比べて、どの位小さな強度の副ピークまで有効なピークとして考えるかについては、任意性がある。今回は、主ピークの10分の1以上の強度を持ち、かつ、上位3番目までの強度を持つピークのみを有効なピークと設定した。図12に、仰角30°の音源について、入力音声信号から得られたCSP係数を示す。また、その結果を表1に示す。
【0055】
【表1】
Figure 0003999689
【0056】
順位が1位の強度を有するピーク位置は、直接収録波に対応し、これが0であることは、正面方向に音源が配置されていることを示している。順位が2位、3位のピークには、直接波と反射波の相関による副ピーク2つが、表に示す設計点の位置で検出されることが期待される。実施例2では、表1に示すように0°以外のケースで少なくとも1つの顕著な強度を有する副ピークを検出することができた。また、設計ポイントに対応するすなわち、この期待される副ピークの存在を検出することで、音源位置に対応した遅延変形が検出された。音源仰角0°のケースでは、期待される副ピーク位置は検出されなかったが、この理由は、実施例1で形成した音反射要素は、仰角0°での反射面積がゼロ(音反射要素の根元)としたためであると考えられる。
【0057】
図13には、実施例2において得られた副ピーク位置と、設計上期待される副ピーク位置との相関性を示す。図13に示すように、観測された副ピーク位置は、実施例1の音反射要素において期待される反射波の存在位置と良好な相関性を有していることが示されている。図13に示された結果から、実施例1において形成された音反射要素は、期待された遅延変形を与えることが示された。
【0058】
(実施例3)
実施例1で形成した音反射要素を使用して、実際に音源の仰角を正しく取得できるか否かについて検討を加えた。遅延変形を利用した音源位置の取得のため、この実施例ではPF法を使用した。雑音源として、水平角75°、距離1m、仰角0°から、ホワイトノイズを再生して背景ノイズをシミュレーションさせた。仰角を換えて5つの位置からの呼びかけ発声および音声のレベルを変えて背景ノイズと重畳することにより、テスト音声を作成した。下記式を使用して、2位の候補にどのくらい差をつけているかという観点からスコアρを定義することにより、仰角位置取得の精度を検討した。nは、設定位置に対応する基準テンプレートの識別子であり、残差Φ が、設定位置における正規化残差を示す。
【0059】
【数4】
Figure 0003999689
【0060】
【数5】
Figure 0003999689
【0061】
上述したスコアは、正しい音源候補位置に対応するプロファイルを選択した場合の正規化残差がゼロならば100%のスコアが与えられ、音源候補位置取得に失敗した場合には、他のプロファイルを使用した時が正規化残差最小となるので、0%以下のスコアとなる。
【0062】
実施例3では、正規化残差を算出するときのサブバンドの平均操作は、音反射要素の影響を強く受ける985Hz〜7504Hzの範囲で行った。得られた結果を図14に示す。図14に示すように、どの場合も、PF法の成分分解の効果により、雑音の影響を大きく受けることなく、5つの音源候補位置から正しい1つを選択できていることが示される。また、本発明において背景ノイズ・テンプレートを使用しない場合には、S/N比の低下と共にスコアが低下することが示されており、本発明において背景ノイズ・テンプレートを含めて残差を生成することにより、音源位置の取得を高精度に、かつS/N比に関係なく行うことができることが示された。
【0063】
以上実施例をもって本発明を説明してきたが、本発明は上述した実施例に限定されるものではなく、種々の変更、除外、他の実施例についても当業者であれば可能であることが理解されよう。また、本発明の音源取得方法は、これまで知られたいかなるプログラミング言語ででも記述することができ、これらの言語としては、C言語、C++言語、アセンブラ語、機械語などを挙げることができる。また、本発明の音源取得方法を実行させるためのコンピュータ実行可能なプログラムは、ROM、EEPROM、フラッシュメモリ、CD−ROM、DVD、フレキシブル・ディスク、ハードディスクなどに格納して頒布することができる。
【図面の簡単な説明】
【図1】 本発明における音源位置および位置を規定するためのパラメータを示した図。
【図2】 本発明において遅延変形を生成する本質的原理を説明した図。
【図3】 本発明において音反射要素の反射面を形成するための本質的原理を示した図。
【図4】 図3に示した反射面における音波の反射を概略的に示した図。
【図5】 本発明において形成される音反射要素の断面形状を形成する包絡線を示した図。
【図6】 本発明の音反射要素の実施の形態を示した図。
【図7】 本発明の音反射要素の配置の実施の形態を示した図。
【図8】 本発明の音源位置取得方法の概略的なフローチャート。
【図9】 本発明の音源位置取得システムの概略的な構成を示したブロック図。
【図10】 本発明の音源位置取得部の詳細な構成を示したブロック図。
【図11】 本発明の基準テンプレートおよび3次元位置座標の格納の実施の形態を示した図。
【図12】 本発明において得られた遅延変形を示した図。
【図13】 本発明において生成された遅延変形と設計上の遅延変形との相関性を示した図
【図14】 本発明により取得された音源位置の精度を示した図。
【図15】 従来の集音器の概略的な構成を示した図。
【符号の説明】
10…音反射要素
12…収録手段(マイクロフォン)
14…平面
16…仮想線
18…音反射要素
20…話者
22…音反射要素
24…記録部
26…音源位置取得部
28…駆動要素
30…音響データ格納部
32…STP格納部
34…BNT格納部
36…PF部
38…残差格納部
40…選択部
42…アプリケーション実行部

Claims (12)

  1. 音源と収録手段との間の相対位置に対応した固有の遅延変形を生成するための音反射要素と、
    前記音反射要素を介して収録された音響データを記録する記憶部と、
    前記遅延変形が重畳された音響データを使用して、音源位置を取得するための音源位置取得部と
    を含む音源位置取得システムであって、
    前記音反射要素は、
    反射面が、焦点間の距離が前記音源と前記収録手段までの距離に対応する複数の楕円を、前記焦点間を連結する軸を中心として回転させて形成される複数の回転楕円体の包絡面として形成される、
    音源位置取得システム。
  2. 前記複数の楕円は、前記音源と前記収録手段との間の仰角に関連して生成され、前記仰角が大きくなるにつれて扁平とされる複数の楕円をさらに含む、
    請求項1に記載の音源位置取得システム。
  3. 前記音源位置取得部は、ホワイトノイズ音源が生成する固有の遅延変形を含む基準テンプレートを格納する基準テンプレート格納部と、
    背景ノイズのテンプレートを格納する背景ノイズ・テンプレート格納部と、
    前記基準テンプレートと背景ノイズ・テンプレートとを使用して前記音響データとの残差を算出する残差生成部と、
    生成された残差を使用して、最小残差を与える基準テンプレートを選択する選択部と
    を含む、請求項1または2に記載の音源位置取得システム。
  4. 前記基準テンプレート格納部は、基準テンプレートと、該基準テンプレートを与えた音源位置とを対応させて格納する、
    請求項に記載の音源位置取得システム。
  5. 前記音源位置取得システムは、複数の前記音反射要素を含み、前記相対位置として音源までの距離と、方位角と、仰角とを含む音源の位置データを同時に取得する、
    請求項に記載の音源位置取得システム。
  6. 音源と収録手段との間の相対位置に対応した固有の遅延変形が重畳された音響データを収録するステップと、
    前記収録された音響データを記憶部に格納させるステップと、
    前記遅延変形が重畳された音響データを読み出して、前記遅延変形により指定される音源の前記相対位置を取得するステップと
    を情報処理装置に実行させて前記音源の位置を取得させる音源位置取得方法であって、
    前記遅延変形は、反射面が、焦点間の距離が前記音源と前記収録手段までの距離に対応する複数の楕円を、前記焦点間を連結する軸を中心として回転させて形成される複数の回転楕円体の包絡面として形成される音反射要素からの反射により生成され、
    前記相対位置を取得するステップは、ホワイトノイズ音源が生成する前記相対位置固有の遅延変形を含む基準テンプレートを格納する基準テンプレート格納部から基準テンプレートを読み出させるステップと、
    背景ノイズのテンプレートを格納する背景ノイズ・テンプレート格納部から背景ノイズ・テンプレートを読み出させるステップと、
    前記基準テンプレートと背景ノイズ・テンプレートとを使用して前記音響データとの残差を算出させるステップと、
    生成された残差を使用して、最小残差を与える基準テンプレートを選択するステップと、
    選択された前記基準テンプレートを参照して、該当する基準テンプレートに対応する音源位置を取得するステップとを情報処理装置に実行させる、
    音源位置取得方法。
  7. 前記複数の楕円は、前記音源と前記収録手段との間の仰角に関連して生成され、前記仰角が大きくなるにつれて扁平とされる複数の楕円をさらに含む、
    請求項6に記載の音源位置取得方法。
  8. 前記音反射要素を複数用いて、前記取得された前記相対位置として、距離と、方位角と、仰角とを同時に取得するステップを実行させる、
    請求項に記載の音源位置取得方法。
  9. 音源と収録手段との間の相対位置に対応した固有の遅延変形を生成するための音反射要素であって、該音反射要素は、
    反射面が、焦点間の距離が前記音源と前記収録手段までの距離に対応する複数の楕円を、前記焦点間を連結する軸を中心として回転させて形成される複数の回転楕円体の包絡面として形成される、
    音反射要素。
  10. 前記複数の楕円は、前記音源と前記収録手段との間の仰角に関連して生成され、前記仰角が大きくなるにつれて扁平とされる複数の楕円をさらに含む、
    請求項に記載の音反射要素。
  11. 音源と収録手段との間の相対位置に対応した固有の遅延変形を生成するための音反射要素を形成する方法であって、前記方法は、
    焦点間の距離が前記音源と前記収録手段までの距離とに対応する楕円を、前記焦点間を連結する軸を中心として回転させて複数の回転楕円体を生成するステップと、
    前記複数の回転楕円体の包絡面を生成して反射面を形成するステップと、
    を含む、音反射要素の形成方法。
  12. 前記複数の楕円は、前記音源と前記収録手段との間の仰角に関連して生成され、前記仰角が大きくなるにつれて扁平とされる複数の楕円をさらに含む
    請求項11に記載の音反射要素の形成方法。
JP2003071735A 2003-03-17 2003-03-17 音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法 Expired - Fee Related JP3999689B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003071735A JP3999689B2 (ja) 2003-03-17 2003-03-17 音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法
US10/801,440 US20040228215A1 (en) 2003-03-17 2004-03-16 Sound source localization system, and sound reflecting element

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003071735A JP3999689B2 (ja) 2003-03-17 2003-03-17 音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法

Publications (2)

Publication Number Publication Date
JP2004279241A JP2004279241A (ja) 2004-10-07
JP3999689B2 true JP3999689B2 (ja) 2007-10-31

Family

ID=33288100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003071735A Expired - Fee Related JP3999689B2 (ja) 2003-03-17 2003-03-17 音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法

Country Status (2)

Country Link
US (1) US20040228215A1 (ja)
JP (1) JP3999689B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3925734B2 (ja) * 2003-03-17 2007-06-06 財団法人名古屋産業科学研究所 対象音検出方法、信号入力遅延時間検出方法及び音信号処理装置
JP2006203850A (ja) * 2004-12-24 2006-08-03 Matsushita Electric Ind Co Ltd 音像定位装置
US7331310B1 (en) * 2005-02-16 2008-02-19 Ken Sersland Domestic animal training method
EP1928207B1 (en) * 2006-11-28 2014-01-01 Leka Stillfilm A device for generating dispersed sound waves
JP4924259B2 (ja) * 2007-07-20 2012-04-25 日本電気株式会社 位置検出装置及びこれを用いた電気機器、位置検出方法
WO2009019748A1 (ja) * 2007-08-03 2009-02-12 Fujitsu Limited 受音装置、指向特性導出方法、指向特性導出装置及びコンピュータプログラム
US8433061B2 (en) * 2007-12-10 2013-04-30 Microsoft Corporation Reducing echo
US8219387B2 (en) * 2007-12-10 2012-07-10 Microsoft Corporation Identifying far-end sound
US8744069B2 (en) * 2007-12-10 2014-06-03 Microsoft Corporation Removing near-end frequencies from far-end sound
US20130282370A1 (en) * 2011-01-13 2013-10-24 Nec Corporation Speech processing apparatus, control method thereof, storage medium storing control program thereof, and vehicle, information processing apparatus, and information processing system including the speech processing apparatus
US9299360B2 (en) 2011-01-13 2016-03-29 Nec Corporation Speech processing apparatus, control method thereof, storage medium storing control program thereof, and vehicle, information processing apparatus, and information processing system including the speech processing apparatus
WO2012148390A1 (en) * 2011-04-27 2012-11-01 Empire Technology Development Llc Measurement of 3d coordinates of transmitter
JP5997007B2 (ja) * 2012-10-31 2016-09-21 日本電信電話株式会社 音源位置推定装置
WO2017075127A1 (en) * 2015-10-30 2017-05-04 Hornet Industries, Llc System and method to locate and identify sound sources in a noisy environment
WO2017135063A1 (ja) * 2016-02-04 2017-08-10 ソニー株式会社 音声処理装置、および音声処理方法、並びにプログラム
CN106226740B (zh) * 2016-08-04 2019-01-01 北京地平线信息技术有限公司 远场声源定位系统和方法
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
CN112285650B (zh) * 2020-10-19 2022-05-06 中南大学 异常tdoa存在下未知波速声发射源定位方法、系统及存储介质
CN112526495B (zh) * 2020-12-11 2024-07-30 厦门大学 一种基于耳廓传导特性的单耳声源定位方法及系统
CN115150712B (zh) * 2022-06-07 2024-06-18 中国第一汽车股份有限公司 一种车载麦克风系统及汽车

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3812493A (en) * 1970-11-23 1974-05-21 Us Navy Bistatic passive radar
US4225954A (en) * 1978-12-21 1980-09-30 The United States Of America As Represented By The Secretary Of The Navy Acoustical deverberator
US4279019A (en) * 1979-05-15 1981-07-14 California Institute Of Technology Method and apparatus for delay analysis of energy transmitted through a medium
US4807165A (en) * 1987-10-30 1989-02-21 Crown International, Inc. Method for the determination and display of signal arrival time, intensity and direction
US6185152B1 (en) * 1998-12-23 2001-02-06 Intel Corporation Spatial sound steering system
US6826284B1 (en) * 2000-02-04 2004-11-30 Agere Systems Inc. Method and apparatus for passive acoustic source localization for video camera steering applications
SE518418C2 (sv) * 2000-12-28 2002-10-08 Ericsson Telefon Ab L M Ljudbaserad närhetsdetektor
JP4590114B2 (ja) * 2001-02-08 2010-12-01 キヤノン株式会社 座標入力装置及びその制御方法、記録媒体

Also Published As

Publication number Publication date
US20040228215A1 (en) 2004-11-18
JP2004279241A (ja) 2004-10-07

Similar Documents

Publication Publication Date Title
JP3999689B2 (ja) 音源位置取得システム、音源位置取得方法、該音源位置取得システムに使用するための音反射要素および該音反射要素の形成方法
US10993065B2 (en) Systems and methods of calibrating earphones
JP7158806B2 (ja) オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム
Haneda et al. Common-acoustical-pole and zero modeling of head-related transfer functions
JP5728094B2 (ja) 到来方向推定から幾何学的な情報の抽出による音取得
EP3507996B1 (en) Method of determining a personalized head-related transfer function and interaural time difference function, and computer program product for performing same
JP5814476B2 (ja) 空間パワー密度に基づくマイクロフォン位置決め装置および方法
JP2014505420A (ja) オーディオ・システムおよびその動作方法
KR20130116299A (ko) 음향 삼각 측량에 의한 공간 선택적 사운드 취득 장치 및 방법
Brutti et al. Localization of multiple speakers based on a two step acoustic map analysis
Li et al. Toward Pitch-Insensitive Speaker Verification via Soundfield
Srivastava et al. How to (virtually) train your sound source localizer
Shujau et al. Using in-air acoustic vector sensors for tracking moving speakers
Guthrie Stage acoustics for musicians: A multidimensional approach using 3D ambisonic technology
US11337021B2 (en) Head-related transfer function generator, head-related transfer function generation program, and head-related transfer function generation method
US11470429B2 (en) Method of operating an ear level audio system and an ear level audio system
US11937072B2 (en) Headphones, out-of-head localization filter determination device, out-of-head localization filter determination system, out-of-head localization filter determination method, and program
JP7189555B2 (ja) 音響処理装置、音響処理方法およびプログラム
WO2022150950A1 (zh) 评估传声器阵列一致性的方法和装置
JP7395906B2 (ja) ヘッドホン、頭外定位フィルタ決定装置、及び頭外定位フィルタ決定方法
Zohourian et al. Direct-to-reverberant energy ratio estimation based on interaural coherence and a joint ITD/ILD model
WO2024041821A1 (en) Hearing abilities assessment
JP2021052273A (ja) 頭外定位フィルタ決定システム、頭外定位フィルタ決定方法、及びプログラム
Joshi et al. Modeling of pinna related transfer functions (prtf) using the finite element method (fem)
JP2022034267A (ja) バイノーラル再生装置およびプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060328

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060626

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060629

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070807

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20070807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070809

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100817

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees