JP2009236688A - 音源方向検出方法、装置及びプログラム - Google Patents

音源方向検出方法、装置及びプログラム Download PDF

Info

Publication number
JP2009236688A
JP2009236688A JP2008083329A JP2008083329A JP2009236688A JP 2009236688 A JP2009236688 A JP 2009236688A JP 2008083329 A JP2008083329 A JP 2008083329A JP 2008083329 A JP2008083329 A JP 2008083329A JP 2009236688 A JP2009236688 A JP 2009236688A
Authority
JP
Japan
Prior art keywords
sound
receiving means
source direction
sound source
sound receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008083329A
Other languages
English (en)
Other versions
JP5045938B2 (ja
Inventor
Miki Sato
幹 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008083329A priority Critical patent/JP5045938B2/ja
Publication of JP2009236688A publication Critical patent/JP2009236688A/ja
Application granted granted Critical
Publication of JP5045938B2 publication Critical patent/JP5045938B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

【課題】受音手段対毎に異なる検出性能の影響を軽減し、高精度で音源方向を検出可能な音源方向検出方法を提供する。
【解決手段】複数の受音手段対5、15、25毎に音源から受音手段対を構成する2つの受音手段に音波が到達する時間差を求め、受音手段対間の距離等に基づき受音手段対毎に信頼度を求める。次いで、複数の受音手段対毎に時間差に基づき音源方向候補を求める。そして、複数の受音手段対毎に得られた音源方向候補同士の差が最小となる音源方向候補の組み合わせを選択し、更に、選択した2つの音源方向候補のうち信頼度が高い受音手段対により求まった音源方向候補を最終の音源方向として決定する。
【選択図】図1

Description

本発明は、音源の方向を検出する音源方向検出方法、装置及びプログラムに関し、特に、複数のマイクロホン等の受音手段で受音した信号を用いて音源方向を検出する音源方向検出方法、装置及びプログラムに関するものである。
従来、この種の音源方向検出方法は、例えば、ユーザとインタラクションを行う装置において、ユーザの方向を検出するために用いられている。このような音源方向検出方法を用いる装置としては、特開2003−326479号公報に記載のロボット装置等が挙げられる(特許文献1)。
このロボット装置は、発話を行ったユーザの方向を検出し、音声認識のための受音手段の指向性や、画像認識のための撮像手段の画角をユーザの方向に適切な方向に一致させるように動作を行う。
このような音源方向検出方法としては、例えば、特開平11−142499号公報(特許文献2)や特開2005−77205号公報(特許文献3)等に記載された2つのマイクロホンに音波が到達する時間差から音源方向を求める手法が知られている。この手法では、2つのマイクロホンで受音した信号から音波がそれぞれのマイクロホンに到達する時間差τを求め、式(1)により音源方向θを求める。
Figure 2009236688
…(1)
但し、cは音速、Mはマイクロホン間の距離である。
このような2つのマイクロホンを用いた手法では、図6に示すように時間差τに対応する音源方向は、マイクロホンXとマイクロホンYをつなぐ直線に対して対称な2つの音源方向候補φXYとψXYとして求まる。そのため、一意には決まらず、全方位(360度)を対象とした音源方向検出は行うことができない。
この問題を解決するため、例えば、特開平9−222352号公報には、2つのマイクロホンにより求まる2つの音源方向候補のいずれかに向けてマイクロホンを駆動し、2回目の測定を行い、1回目と2回目の測定結果を比較することにより音源方向を求める手法が記載されている(特許文献4)。
しかしながら、このような手法は、マイクロホンを駆動して再測定を行うため、駆動装置を設けなければならず、装置の簡素化が困難であり、駆動時間よりも短時間の音の検出ができない。
そこで、例えば、特開2006−304124号公報(特許文献5)や特開2006−194700号公報(特許文献6)には、2つのマイクロホン対により求まる音源方向候補を用いて、360度を対象とした音源方向検出を行う手法が記載されている。
特開2003−326479号公報 特開平11−142499号公報 特開2005−77205号公報 特開平09−222352号公報 特開2006−304124号公報 特開2006−194700号公報
特許文献5、6等に記載の従来手法では、マイクロホン対を2つとする、マイクロホン対を直交した配置とする等、マイクロホン数や配置が限定されており、多種多様な形態の機器において音源方向検出を行うため、任意の数や配置のマイクロホンを用いた音源方向検出を行うことができない。
また、2つのマイクロホンに音波が到達する時間差から音源方向を求める手法において、マイクロホンに入力される音のサンプリングレートf[Hz]とすると、式(1)は式(2)のように表すことができる。
Figure 2009236688
…(2)
但し、kは音波の到達した時間差をサンプル数で表したものである。
この時、音源方向θは、時間差kが大きくなるほど、即ち、マイクロホン間をつなぐ直線方向に近づくほど(90度に近づくほど)分解能が低下するという特性を有している。
参考として、図7はM=0.13[m]、f=11025[Hz]、c=320[m/s]とした場合の音源方向θの例を示す。更に、音源方向θはマイクロホン対の間隔Mが小さいほど分解能が低下するという特性を有する。
これは、式(2)においてθが存在するkの範囲は、式(3)を満たす最大の整数値Kmax(以下、Kmaxを最大時間差と記す)を用いると、−Kmax≦k≦Kmaxとなるためである。
Kmax≦fM/c …(3)
そのため、複数のマイクロホン対により求まる音源方向候補は、マイクロホン対に対する音の到来方向や、マイクロホン対の間隔等のマイクロホンの配置によって検出性能が異なり、分解能の低い音源方向候補を用いると、信頼性が低い誤った音源方向を検出してしまう。
そこで、任意の数や配置のマイクロホンを用いて音源方向検出を行うには、このようなマイクロホン対毎に異なる検出性能の影響を軽減して高精度な音源方向検出を行う手法が必要となる。
本発明の目的は、上記課題を解決し、受音手段対毎に異なる検出性能の影響を軽減し、高精度で音源方向を検出することが可能な音源方向検出方法及び装置を提供することにある。
本発明は、複数の受音手段対からの受音信号に基づき音源方向を検出する音源方向検出方法であって、信頼度計算手段により少なくとも前記受音手段対間の距離に基づいて前記受音手段対毎に信頼度を求めるステップと、音源方向決定手段により前記複数の受音手段対の信頼度のうちより信頼度の高い受音手段対に基づき前記音源方向を決定するステップと、を含むことを特徴とする。
また、本発明は、複数の受音手段対からの受音信号に基づき音源方向を検出する音源方向検出方法であって、時間差計算手段により前記複数の受音手段対毎に音源から受音手段対を構成する2つの受音手段に音波が到達する時間差を求めるステップと、信頼度計算手段により少なくとも前記受音手段対間の距離に基づき前記受音手段対毎に信頼度を求めるステップと、音源方向候補計算手段により前記複数の受音手段対毎に前記時間差に基づき音源方向候補を求めるステップと、音源方向決定手段により前記複数の受音手段対毎に得られた前記音源方向候補同士の差が最小となる音源方向候補の組み合わせを選択し、選択した2つの音源方向候補のうち前記信頼度が高い受音手段対により求まった音源方向候補を最終の音源方向として決定するステップと、を含むことを特徴とする。
また、本発明は、複数の受音手段対からの受音信号に基づき音源方向を検出する音源方向検出装置であって、少なくとも前記受音手段対間の距離に基づいて前記受音手段対毎に信頼度を求める手段と、前記複数の受音手段対の信頼度のうちより信頼度の高い受音手段対に基づき前記音源方向を決定する手段と、を備えたことを特徴とする。
また、本発明は、複数の受音手段対からの受音信号に基づき音源方向を検出する音源方向検出装置であって、前記複数の受音手段対毎に音源から受音手段対を構成する2つの受音手段に音波が到達する時間差を求める手段と、少なくとも前記受音手段対間の距離に基づき前記受音手段対毎に信頼度を求める手段と、前記複数の受音手段対毎に前記時間差に基づき音源方向候補を求める手段と、前記複数の受音手段対毎に得られた前記音源方向候補同士の差が最小となる音源方向候補の組み合わせを選択し、選択した2つの音源方向候補のうち前記信頼度が高い受音手段対により求まった音源方向候補を最終の音源方向として決定する手段と、を備えたことを特徴とする。
本発明によれば、任意の受音手段の配置において受音手段対毎に異なる検出性能の影響を軽減でき、音源方向を高精度で検出することが可能となる。
次に、発明を実施するための最良の形態について図面を参照して詳細に説明する。
(第1の実施形態)
図1は本発明に係る音源方向検出装置の第1の実施形態を示すブロック図である。本発明はN個の受音手段対と、N個の信頼度付き時間差計算部と、最終方向計算部等を有する。Nは3以上の整数とする。
以下の実施形態ではN=3とした場合の例を説明する。図1に示すように本実施形態に係る音源方向検出装置は、受音手段1と受音手段2とで構成される第1の受音手段対5を具備する。受音手段1、2は、例えば、マイクロホンであり、一定間隔を置いて配置されている。
時間差計算部3は音源から受音手段1と受音手段2に音波が到達する時間差を計算する。信頼度計算部4は受音手段1、2間の距離等に基づいて受音手段対5の信頼度を計算する。時間差計算部3と信頼度計算部4で第1の信頼度付き時間差計算部6が構成されている。
また、受音手段11と12からなる第2の受音手段対15を具備する。受音手段11、12は同様にマイクロホン等であり、一定間隔を置いて配置されている。時間差計算部13は音源から受音手段11と受音手段12に音波が到達する時間差を計算し、信頼度計算部14は同様に受音手段対15の信頼度を受音手段11、12間の距離等に基づいて計算する。時間差計算部13と信頼度計算部14で第3の信頼度付き時間差計算部16が構成されている。
更に、受音手段21と22からなる第3の受音手段対25を具備する。受音手段21、22はマイクロホン等であり、一定間隔を置いて配置されている。時間差計算部23は同様に音源から受音手段21と受音手段22に音波が到達する時間差を計算し、信頼度計算部24は同様に受音手段対25の信頼度を受音手段21、22間の距離等に基づいて計算する。時間差計算部23と信頼度計算部24で第3の信頼度付き時間差計算部26が構成されている。
信頼度計算部4、信頼度計算部14、信頼度計算部24で得られた信頼度は最終方向計算部7に送られ、最終方向計算部7は後述するようにそれら信頼度等に基づいて最終の音源方向を決定する。最終方向計算部7で得られた最終方向は出力端子8から外部に出力される。
なお、第1の受音手段対5を構成する受音手段1、2と、第2の受音手段対15を構成する受音手段11、12のうちいずれか1つを同一とする構成も可能である。例えば、受音手段1と受音手段11を同一(共用)とする、受音手段2と受音手段12を同一(共用)とする等が挙げられる。
また、第2の受音手段対15と第3の受音手段対25を構成する受音手段11、12、21、22と、第3の受音手段対25と第1の受音手段対5を構成する受音手段21、22、1、2についても同様である。例えば、受音手段1と11、受音手段1と12、受音手段11と21、受音手段11と22を同一(共用)とする等が挙げられる。
図2は受音手段2と受音手段11、受音手段12と受音手段21、受音手段22と受音手段1を同一(共用)とした時の受音手段の配置を示す図である。以下、この配置を例として説明する。
図2に示すように受音手段の配置は各受音手段間の距離により一意に表すことが可能であるので、第1の受音手段対5を構成する受音手段1と、受音手段11間の距離をd1[m]とする。第2の受音手段対15を構成する受音手段11と、受音手段21間の距離をd2[m]とする。第3の受音手段対25を構成する受音手段21と、受音手段1間の距離をd3[m]とする。
また、求める音源方向の基準として図面上側方向を0[度]方向とし、第1の受音手段対5を構成する受音手段1と、受音手段11間をつなぐ直線の垂線方向をσ1[度]とする。第2の受音手段対15を構成する受音手段11と、受音手段21間をつなぐ直線の垂線方向をσ2[度]とする。更に、第3の受音手段対25を構成する受音手段21と、受音手段1間をつなぐ直線の垂線方向をσ3[度]、とする。以下、この値を各受音手段対の傾きとする。
次に、本実施形態の動作を説明する。まず、時刻tにおいて各構成要素は以下のように動作する。受音手段1、11、21は、例えば、マイクロホン等によって音響−電気変換された信号を生成する。時刻tにおける受音手段1、11、21により生成された信号X1(t)、X2(t)、X3(t)は、以下の式(4)、(5)、(6)に示すように目的音源が発生した音信号S(t)に対し、目的音源から各受音手段への音の到達時間n1、n2、n3遅延した信号に相当する。
X1(t)=S(t−n1) …(4)
X2(t)=S(t−n2) …(5)
X3(t)=S(t−n3) …(6)
第1の受音手段対5は受音手段1、11により生成された信号X1(t)、X2(t)を第1の信頼度付き時間差計算部6に出力する。第2の受音手段対15は受音手段11、21により生成された信号X2(t)、X3(t)を第2の信頼度付き時間差計算部16に出力する。第3の受音手段対25は同様に受音手段21、1により生成された信号X3(t)、X1(t)を第3の信頼度付き時間差計算部26に出力する。
第1の信頼度付き時間差計算部6は、受音手段1、11により生成された信号X1(t)、X2(t)を入力として、後述する時間差信号δ1(t)と信頼度信号γ1(t)を最終方向計算部7に出力する。
第2の信頼度付き時間差計算部16は、同様に受音手段11、21により生成された信号X2(t)、X3(t)を入力として、後述する時間差信号δ2(t)と信頼度信号γ2(t)を最終方向計算部7に出力する。
第3の信頼度付き時間差計算部26は、同様に受音手段21、1により生成された信号X3(t)、X1(t)を入力として、後述する時間差信号δ3(t)と信頼度信号γ2(t)を、最終方向計算部7に出力する。
時間差信号δ1(t)、δ2(t)、δ3(t)は、それぞれ時間計算部3、13、23で生成する。信頼度信号γ1(t)、γ2(t)、γ2(t)は、それぞれ信頼度計算部4、14、24で生成する。
最終方向計算部7は、第1、第2、第3の信頼度付き時間差計算部6、16、26により生成された時間差信号δ1(t)、δ2(t)、δ3(t)と、信頼度信号γ1(t)、γ2(t)、γ3(t)を入力として、音源方向の最終方向θ(t)を決定し、出力端子8から外部に出力する。
次に、最終方向計算部7において最終方向θ(t)を求める手順について説明する。まず、信頼度信号γ1(t)が以下の式を満たす場合、
γ1(t)≧τ …(7)
時間差計算部3により生成された時間差信号δ1(t)から受音手段対5における音源方向候補φ1(t)、ψ1(t)を算出する。但し、τは予め設定された定数である。音源方向候補φ1(t)、ψ1(t)は、サンプリングレートf[Hz]、音速c[m/s]、とすると、受音手段対間の距離d1[m]と受音手段対の傾きσ1[度]、時間差信号δ1(t)を用いてそれぞれ以下の式で求める。
Figure 2009236688
…(8)
Figure 2009236688
…(9)
一方、信頼度信号γ1(t)が式(7)を満たさない場合には、φ1(t)、ψ1(t)は不定値とする。なお、式(7)による判定は必ずしも必要ではなく、判定なしで時間差信号から音源方向候補を求めてもよい。
同様に、最終方向計算部7は同様に時間差信号δ2(t)、受音手段対間の距離d2[m]、受音手段対の傾きσ2[度]から、音源方向候補φ2(t)、ψ2(t)を算出する。また、同様に時間差信号δ3(t)、受音手段対間の距離d3[m]、受音手段対の傾きσ3[度]から、音源方向候補φ3(t)、ψ3(t)を算出する。
次に、異なる受音手段対において算出された音源方向候補の差を算出する。ここで、音源方向候補A、Bの差を音源方向候補差(A−B)と記述し、以下のように定義するものとする。
(A−B)=|A−B| …(10)
本実施形態では、以下の12通りの音源方向候補差のうち音源方向候補A、Bの両方が不定値でないものを求める。
(φ1−φ2)、(φ1−ψ2)、(φ1−φ3)、(φ1−ψ3)、(ψ1−φ2)、(ψ1−ψ2)、(ψ1−φ3)、(ψ1−ψ3)、(φ2−φ3)、(φ2−ψ3)、(ψ2−φ3)、(ψ2−ψ3)
最後に、これら音源方向候補差の中で値が最小となる音源方向候補の組み合わせを選択する。例えば、(φ1−φ2)、(φ1−φ3)、(ψ2−φ3)等を選択する。次に、選択した2つの音源方向候補のうち、信頼度信号が大きい受音手段対により求まった音源方向候補を最終方向θ(t)とする。最終方向θ(t)は2つの音源方向候補の平均値としてもよい。
次に、第1の信頼度付き時間差計算部6の各構成部の動作について説明する。まず、時間差計算部3は、受音手段1、11により生成された信号X1(t)、X2(t)を入力として、目的音源が発生した音信号S(k)が受音手段1、11に到達する時間差(n1−n2)を算出し、時間差信号δ1(t)として信頼度計算部4及び最終方向計算部7に出力する。
時間差信号δ1(t)は、信号X1(t)、X2(t)の相互相関値R1(k)が最大となるkとして求める。相互相関値R1(k)は、信号X1(t)、X2(t)のLサンプルのデータを1フレームとして、以下の式により求める。
Figure 2009236688
…(11)
この時、サンプリングレートf[Hz]、音速c[m/s]、受音手段1と11間の距離d1[m]を用いて、上記式(3)により求められる最大時間差Kmax1に対し、−kmax1+1≦k≦kmax1+1を満たす整数kの中で、R1(k)が最大となる値を時間差信号δ1(t)とする。
時間差計算部13は、同様に受音手段11、21により生成された信号X2(t)、X3(t)を入力として、目的音源が発生した音信号S(k)が受音手段11、21に到達する時間差(n2−n3)を算出し、時間差信号δ2(t)として信頼度計算部14及び最終方向計算部7に出力する。
時間差計算部23は、同様に受音手段21、1により生成された信号X3(t)、X1(t)を入力として、目的音源が発生した音信号S(k)が受音手段21、1に到達する時間差(n3−n1)、を算出し、時間差信号δ3(t)として信頼度計算部24及び最終方向計算部7に出力する。
なお、時間差計算は、上述の相互相関値により求める手法に限るものではなく、例えば、異なる相関値計算手法や入力波形のパターンマッチング等、信号間の時間差が求まればその他の手法を用いてもよい。
信頼度計算部4は、時間差計算部3により得られた時間差信号δ1(t)を入力として信頼度を算出し、信頼度信号γ1(t)として最終方向計算部7に出力する。信頼度信号γ1(t)は、距離d1[m]及び距離d1、d2、d3の中の最大値dmaxを用いて以下の式により求める。Kmax1は上述のように最大時間差である。
Figure 2009236688
…(12)
信頼度計算部14は、同様に時間差計算部13により生成された時間差信号δ2(t)を入力として信頼度を算出し、信頼度信号γ2(t)として最終方向計算部7に出力する。信頼度計算部24は、同様に時間差計算部23により生成された時間差信号δ3(t)を入力として信頼度を算出し、信頼度信号γ3(t)として最終方向計算部7に出力する。
図3は参考としてd1=0.20[m]、d2=0.30[m]、d3=0.25[m]、f=11025[Hz]、c=320[m/s]とした場合の信頼度信号γ1(t)、γ2(t)、γ3(t)の例を示す。横軸は時間差信号、縦軸は信頼度信号である。
また、信頼度信号γ1(t)は、式(12)に代わり時間差信号δ1(t)により求まる方向の1サンプル差あたりの角度差を用いて以下の式により求めてもよい。
Figure 2009236688
…(13)
なお、信頼度信号γ2(t)或いは信頼度信号γ3(t)も同様の方法を用いて求めても良い。
図4は参考としてd1=0.20[m]、d2=0.30[m]、d3=0.25[m]、f=11025[Hz]、c=320[m/s]とした場合の信頼度信号γ1(t)、γ2(t)、γ3(t)の例を示す。横軸は時間差信号、縦軸は信頼度信号である。
この時、信頼度信号γ1(t)、γ2(t)、γ3(t)は、各受音手段対において求まる音源方向候補に対して間隔が最大且つ受音手段対の傾きの方向に向いているほど大きくなる。そのため、信頼度信号は受音手段対の受音手段間をつなぐ直線方向に近づくほど、または受音手段対の間隔が小さくなるほど小さい値となり、各受音手段対において求まる音源方向候補の分解能の度合いを示す指標となる。
なお、本実施形態では、受音手段対が3個の例を示したが、本発明はこれに限ることなく、それ以上の受音手段対を用いても良い。また、上述のように受音手段は共有する構成でも構わない。
本実施形態では、複数の受音手段対により求まる複数の時間差の中から分解能の高いものを選択することが可能となり、受音手段対毎に異なる検出性能の影響を軽減でき、高精度な音源方向検出方法を実現できる。
以上のように本発明によれば、受音手段対毎に算出する信頼度を用いて音源の最終方向を決定することにより、複数の受音手段対毎の音源方向候補の中から、信頼度の高いものを優先して用いて最終方向を決定するため、音源方向の信頼性を高めることが可能となる。また、時間差が大きくなるほど対応する音源方向間の角度が大きくなり分解能が低下するという特性を持つ。従って、時間差の大きさを用いて信頼度を求めることにより、信頼度は受音手段対における音源方向候補の分解能が高いか否かを判定する指標となる。
また、時間差は受音手段対間の距離が小さくなるほど対応する音源方向間の角度が大きくなり分解能が低下するという特性を持つ。そのため、受音手段対間の距離を用いて信頼度を求めることにより、信頼度は分解能が高い受音手段対で求まる音源方向候補か否かを判定する指標となる。
更に、受音手段の入力信号が大きいほど受音手段は音源に近い、または音をさえぎる障害物がない可能性が高い。そのため、受音手段対で求まる音源方向候補は、目的音を正確に受音し、回り込みの影響等が少ない正確な値であると考えられる。従って、入力信号の大きさを用いて信頼度を求めることにより、信頼度は受音手段対に音が正確に入力されているか否かを判定する指標となる。
(第2の実施形態)
図5は本発明の第2の実施形態を示すブロック図である。図5では図1と同一部分には同一符号を付して説明を省略する。図5は同様にN=3の時の構成を示す。本実施形態では、図1に示す第1の実施形態の構成に電力計算部9、19、29を追加している。それ以外は図1と同様である。これら電力計算部は、それぞれ受音手段対の間に接続している。
信頼度計算部4、14、24以外の同一構成要素の動作は、第1の実施形態と同様であるので、電力計算部9、19、29と、信頼度計算部4、14、24について説明する。受音手段対の配置は図2と同じとする。
本実施形態の動作について説明する。まず、時刻tにおいて各構成要素は以下のように動作する。
電力計算部9は、受音手段1、11により生成された信号X1(t)、X2(t)を入力として電力信号P1(t)を算出し、信頼度計算部4に出力する。電力信号P1(t)は信号X1(t)、X2(t)のLサンプルのデータを1フレームとして以下の式により求める。
Figure 2009236688
…(14)
電力計算部19は、同様に受音手段11、21により生成された信号X2(t)、X3(t)を入力として電力信号P2(t)を算出し、信頼度計算部14に出力する。電力計算部29は、同様に受音手段21、1により生成された信号X3(t)、X1(t)を入力として電力信号P3(t)を算出し、信頼度計算部24に出力する。
なお、電力信号は、X1(t)とX2(t)の振幅の絶対値の平均値や、X1(t)とX2(t)の自乗値の平均値、X1(t)とX2(t)の絶対値のうち大きい方の値等、受音手段対に入力される信号の大きさを表す値であればよい。
信頼度計算部4は、時間差計算部3により生成された時間差信号δ1(t)と、電力計算部9により生成された電力信号P1(t)を入力として信頼度を算出し、信頼度信号γ1(t)として最終方向計算部7に出力する。
信頼度信号γ1(t)は、式(12)により求まる値に、更に電力信号P1(t)を乗じた値とする。即ち、以下の式で示す。
Figure 2009236688
…(15)
なお、信頼度信号γ1(t)は、式(13)により求まる値に、更に電力信号P1(t)を乗じた値としてもよい。即ち、以下の式で示す。
Figure 2009236688
…(16)
信頼度計算部14は、同様に時間差計算部13により生成された時間差信号δ2(t)と、電力計算部19により生成された電力信号P2(t)とを入力として信頼度を算出し、信頼度信号γ2(t)として最終方向計算部7に出力する。
信頼度計算部24は、同様に時間差計算部23により生成された時間差信号δ3(t)と、電力計算部29により生成された電力信号P3(t)を入力として、信頼度を算出し、信頼度信号γ3(t)として最終方向計算部7に出力する。
本実施形態では、信頼度信号γ1(t)、γ2(t)、γ3(t)は、第1の実施形態の信頼度を示す値に対し、更に受音手段対に入力される音が大きいほど大きくなる値となる。そのため、各受音手段対において求まる音源方向候補の分解能の度合いに加え、各受音手段対に入力される音の正確さの度合いを示す指標となる。
また、信頼度信号γ1(t)は、式(15)より時間差信号δ1(t)の項を省略し、以下の式により求めてもよい。信頼度信号γ2(t)、γ3(t)も同様である。
Figure 2009236688
…(17)
この時、信頼度信号γ1(t)、γ2(t)、γ3(t)は、受音手段対において求まる音源方向候補に対し、受音手段対の間隔が大きくなるほど、または受音手段対に入力される音が大きいほど大きくなる値となり、各受音手段対の分解能及び各受音手段対に入力される音の正確さの度合いを示す指標となる。
本実施形態では、第1の実施形態に比べてより高精度に音源方向を検出することが可能となる。
本実施形態では同様に受音手段対が3個の例を示したが、本発明はこれに限ることなく、それ以上の受音手段対を用いても良い。また、上述のように受音手段は共有する構成でも構わない。
なお、本発明は、ハードウェア、ソフトウェア又はこれらの組み合わせにより実現することができる。
本発明は、ロボット装置、携帯電話、ビデオカメラ、監視カメラ、テレビ会議システム等、音の方向に応じてマイクロホンの指向性やカメラの撮像方向を制御する装置に好適に使用することができる。
本発明に係る音源方向検出装置の第1の実施形態を示すブロック図である。 第1の実施形態の受音手段の配置例を示す図である。 第1の実施形態に関わる信頼度信号の一例を示す図である。 第1の実施形態に関わる信頼度信号の一例を示す図である。 本発明の第2の実施形態を示すブロック図である。 時間差と音源方向候補の関係を示す図である。 音源方向候補の一例を示す図である。
符号の説明
1、2、11、12、21、22 受音手段
3、13、23 時間差計算部
4、14、24 信頼度計算部
5 第1の受音手段対
6 第1の信頼度付き時間差計算部
7 最終方向計算部
8 出力端子
9、19、29 電力計算部
15 第2の受音手段対
16 第2の信頼度付き時間差計算部
19 電力計算部
25 第3の受音手段対
26 第3の信頼度付き時間差計算部
29 電力計算部

Claims (21)

  1. 複数の受音手段対からの受音信号に基づき音源方向を検出する音源方向検出方法であって、
    信頼度計算手段により少なくとも前記受音手段対間の距離に基づいて前記受音手段対毎に信頼度を求めるステップと、
    音源方向決定手段により前記複数の受音手段対の信頼度のうちより信頼度の高い受音手段対に基づき前記音源方向を決定するステップと、
    を含むことを特徴とする音源方向検出方法。
  2. 前記音源方向を決定するステップにおいて、前記受音手段対毎に音源から受音手段対を構成する2つの受音手段に音波が到達する時間差を求め、前記受音手段対毎に前記時間差に基づき音源方向候補を求め、前記信頼度が高い受音手段対の音源方向候補に基づき最終の音源方向を決定することを特徴とする請求項1に記載の音源方向検出方法。
  3. 複数の受音手段対からの受音信号に基づき音源方向を検出する音源方向検出方法であって、
    時間差計算手段により前記複数の受音手段対毎に音源から受音手段対を構成する2つの受音手段に音波が到達する時間差を求めるステップと、
    信頼度計算手段により少なくとも前記受音手段対間の距離に基づき前記受音手段対毎に信頼度を求めるステップと、
    音源方向候補計算手段により前記複数の受音手段対毎に前記時間差に基づき音源方向候補を求めるステップと、
    音源方向決定手段により前記複数の受音手段対毎に得られた前記音源方向候補同士の差が最小となる音源方向候補の組み合わせを選択し、選択した2つの音源方向候補のうち前記信頼度が高い受音手段対により求まった音源方向候補を最終の音源方向として決定するステップと、
    を含むことを特徴とする音源方向検出方法。
  4. 前記音源方向を決定するステップにおいて、前記2つの音源方向候補の平均値を最終の音源方向として決定することを特徴とする請求項3に記載の音源方向検出方法。
  5. 前記信頼度は、前記受音手段対間の距離と、前記受音手段対を構成する2つの受音手段に音波が到達する時間差に基づいて求めることを特徴とする請求項1又は3に記載の音源方向検出方法。
  6. 前記信頼度は、前記受音手段対間の距離と、前記受音手段対を構成する2つの受音手段の受音信号の大きさに基づいて求めることを特徴とする請求項1又は3に記載の音源方向検出方法。
  7. 前記信頼度は、前記受音手段対間の距離と、前記受音手段対を構成する2つの受音手段に音波が到達する時間差と、前記受音手段対を構成する2つの受音手段の受音信号の大きさに基づいて求めることを特徴とする請求項1又は3に記載の音源方向検出方法。
  8. 複数の受音手段対からの受音信号に基づき音源方向を検出する音源方向検出装置であって、
    少なくとも前記受音手段対間の距離に基づいて前記受音手段対毎に信頼度を求める手段と、
    前記複数の受音手段対の信頼度のうちより信頼度の高い受音手段対に基づき前記音源方向を決定する手段と、
    を備えたことを特徴とする音源方向検出装置。
  9. 前記音源方向決定手段は、前記受音手段対毎に音源から受音手段対を構成する2つの受音手段に音波が到達する時間差を求め、前記受音手段対毎に前記時間差に基づき音源方向候補を求め、前記信頼度が高い受音手段対の音源方向候補に基づき最終の音源方向を決定することを特徴とする請求項8に記載の音源方向検出装置。
  10. 複数の受音手段対からの受音信号に基づき音源方向を検出する音源方向検出装置であって、
    前記複数の受音手段対毎に音源から受音手段対を構成する2つの受音手段に音波が到達する時間差を求める手段と、
    少なくとも前記受音手段対間の距離に基づき前記受音手段対毎に信頼度を求める手段と、
    前記複数の受音手段対毎に前記時間差に基づき音源方向候補を求める手段と、
    前記複数の受音手段対毎に得られた前記音源方向候補同士の差が最小となる音源方向候補の組み合わせを選択し、選択した2つの音源方向候補のうち前記信頼度が高い受音手段対により求まった音源方向候補を最終の音源方向として決定する手段と、
    を備えたことを特徴とする音源方向検出装置。
  11. 前記音源方向決定手段は、前記2つの音源方向候補の平均値を最終の音源方向として決定することを特徴とする請求項10に記載の音源方向検出装置。
  12. 前記信頼度を求める手段は、前記受音手段対間の距離と、前記受音手段対を構成する2つの受音手段に音波が到達する時間差に基づいて求めることを特徴とする請求項10又は11に記載の音源方向検出装置。
  13. 前記信頼度を求める手段は、前記受音手段対間の距離と、前記受音手段対を構成する2つの受音手段の受音信号の大きさに基づいて求めることを特徴とする請求項10又は11に記載の音源方向検出装置。
  14. 前記信頼度を求める手段は、前記受音手段対間の距離と、前記受音手段対を構成する2つの受音手段に音波が到達する時間差と、前記受音手段対を構成する2つの受音手段の受音信号の大きさに基づいて求めることを特徴とする請求項10又は11に記載の音源方向検出装置。
  15. コンピュータを、
    少なくとも受音手段対間の距離に基づいて前記受音手段対毎に信頼度を求める手段と、
    複数の受音手段対の信頼度のうちより信頼度の高い受音手段対に基づき前記音源方向を決定する手段と、
    して機能させるためのプログラム。
  16. 前記音源方向決定手段は、前記受音手段対毎に音源から受音手段対を構成する2つの受音手段に音波が到達する時間差を求め、前記受音手段対毎に前記時間差に基づき音源方向候補を求め、前記信頼度が高い受音手段対の音源方向候補に基づき最終の音源方向を決定することを特徴とする請求項15に記載のプログラム。
  17. コンピュータを、
    複数の受音手段対毎に音源から受音手段対を構成する2つの受音手段に音波が到達する時間差を求める手段と、
    少なくとも前記受音手段対間の距離に基づき前記受音手段対毎に信頼度を求める手段と、
    前記複数の受音手段対毎に前記時間差に基づき音源方向候補を求める手段と、
    前記複数の受音手段対毎に得られた前記音源方向候補同士の差が最小となる音源方向候補の組み合わせを選択し、選択した2つの音源方向候補のうち前記信頼度が高い受音手段対により求まった音源方向候補を最終の音源方向として決定する手段と、
    して機能させるためのプログラム。
  18. 前記音源方向決定手段は、前記2つの音源方向候補の平均値を最終の音源方向として決定することを特徴とする請求項17に記載のプログラム。
  19. 前記信頼度を求める手段は、前記受音手段対間の距離と、前記受音手段対を構成する2つの受音手段に音波が到達する時間差に基づいて求めることを特徴とする請求項17又は18に記載のプログラム。
  20. 前記信頼度を求める手段は、前記受音手段対間の距離と、前記受音手段対を構成する2つの受音手段の受音信号の大きさに基づいて求めることを特徴とする請求項17又は18に記載のプログラム。
  21. 前記信頼度を求める手段は、前記受音手段対間の距離と、前記受音手段対を構成する2つの受音手段に音波が到達する時間差と、前記受音手段対を構成する2つの受音手段の受音信号の大きさに基づいて求めることを特徴とする請求項17又は18に記載のプログラム。
JP2008083329A 2008-03-27 2008-03-27 音源方向検出方法、装置及びプログラム Active JP5045938B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008083329A JP5045938B2 (ja) 2008-03-27 2008-03-27 音源方向検出方法、装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008083329A JP5045938B2 (ja) 2008-03-27 2008-03-27 音源方向検出方法、装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2009236688A true JP2009236688A (ja) 2009-10-15
JP5045938B2 JP5045938B2 (ja) 2012-10-10

Family

ID=41250824

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008083329A Active JP5045938B2 (ja) 2008-03-27 2008-03-27 音源方向検出方法、装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5045938B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014035226A (ja) * 2012-08-08 2014-02-24 Jvc Kenwood Corp 音源方向検出装置、音源方向検出方法、音源方向検出プログラム
KR20140040812A (ko) * 2011-07-14 2014-04-03 마이크로소프트 코포레이션 위상 스펙트럼을 사용한 음원 위치 측정 기법
US9361576B2 (en) 2012-06-08 2016-06-07 Samsung Electronics Co., Ltd. Neuromorphic signal processing device and method for locating sound source using a plurality of neuron circuits
JP2017158030A (ja) * 2016-03-01 2017-09-07 パナソニックIpマネジメント株式会社 マイクアレイシステム及びマイクアレイシステムの製造方法
KR20180008159A (ko) * 2016-07-15 2018-01-24 국방과학연구소 펄스 신호 수집정보의 확률적 선택에 의한 위치탐지방법
WO2022118367A1 (ja) * 2020-12-01 2022-06-09 三菱電機株式会社 音源方向推定装置、プログラム及び音源方向推定方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102005590B1 (ko) * 2011-07-14 2019-10-08 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 위상 스펙트럼을 사용한 음원 위치 측정 기법
US9817100B2 (en) 2011-07-14 2017-11-14 Microsoft Technology Licensing, Llc Sound source localization using phase spectrum
JP2014525037A (ja) * 2011-07-14 2014-09-25 マイクロソフト コーポレーション 位相スペクトルを使った音源定位
KR20140040812A (ko) * 2011-07-14 2014-04-03 마이크로소프트 코포레이션 위상 스펙트럼을 사용한 음원 위치 측정 기법
US9435873B2 (en) 2011-07-14 2016-09-06 Microsoft Technology Licensing, Llc Sound source localization using phase spectrum
US9361576B2 (en) 2012-06-08 2016-06-07 Samsung Electronics Co., Ltd. Neuromorphic signal processing device and method for locating sound source using a plurality of neuron circuits
JP2014035226A (ja) * 2012-08-08 2014-02-24 Jvc Kenwood Corp 音源方向検出装置、音源方向検出方法、音源方向検出プログラム
JP2017158030A (ja) * 2016-03-01 2017-09-07 パナソニックIpマネジメント株式会社 マイクアレイシステム及びマイクアレイシステムの製造方法
KR20180008159A (ko) * 2016-07-15 2018-01-24 국방과학연구소 펄스 신호 수집정보의 확률적 선택에 의한 위치탐지방법
KR101881868B1 (ko) * 2016-07-15 2018-07-25 국방과학연구소 펄스 신호 수집정보의 확률적 선택에 의한 위치탐지방법
WO2022118367A1 (ja) * 2020-12-01 2022-06-09 三菱電機株式会社 音源方向推定装置、プログラム及び音源方向推定方法
JPWO2022118367A1 (ja) * 2020-12-01 2022-06-09
JP7237255B2 (ja) 2020-12-01 2023-03-10 三菱電機株式会社 音源方向推定装置、プログラム及び音源方向推定方法
CN116490451B (zh) * 2020-12-01 2023-11-03 三菱电机楼宇解决方案株式会社 声源方向估计装置、计算机能读入的记录介质和声源方向估计方法

Also Published As

Publication number Publication date
JP5045938B2 (ja) 2012-10-10

Similar Documents

Publication Publication Date Title
JP5045938B2 (ja) 音源方向検出方法、装置及びプログラム
US9734822B1 (en) Feedback based beamformed signal selection
US9900685B2 (en) Creating an audio envelope based on angular information
CN100551028C (zh) 用于音源追踪的装置和方法
US6525993B2 (en) Speaker direction detection circuit and speaker direction detection method used in this circuit
US7313243B2 (en) Sound pickup method and system with sound source tracking
JP4797330B2 (ja) ロボット
JP4812302B2 (ja) 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム
JP2007089058A (ja) マイクアレイ制御装置
JP2008236077A (ja) 目的音抽出装置,目的音抽出プログラム
KR20110057661A (ko) 이동체 및 그 제어방법
JP2019062435A (ja) 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム
KR101091646B1 (ko) 소나 및 소나 구동 방법
KR101542647B1 (ko) 화자 검출을 이용한 오디오 신호 처리 방법 및 장치
EP3182734B1 (en) Method for using a mobile device equipped with at least two microphones for determining the direction of loudspeakers in a setup of a surround sound system
JP6697982B2 (ja) ロボットシステム
JP4266669B2 (ja) バイスタティック方位検出システム及び検出方法
JP2018141643A (ja) ふ仰角算出装置およびふ仰角算出方法
KR20090016205A (ko) 로봇 환경에서의 음원 방향 결정 시스템 및 방법
EP2214420A1 (en) Sound emission and collection device
JP2002315089A (ja) 話者方向検出回路
CN112102536A (zh) 门禁控制器、门禁控制方法和计算机可读存储介质
CN112098949A (zh) 一种定位智能设备的方法和装置
JP2021012314A (ja) 集音処理装置、集音処理方法、及びプログラム
JP6496042B2 (ja) 超音波解析装置、超音波解析方法及び超音波解析プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100804

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100804

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120620

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120703

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5045938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150