JP4676893B2 - 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 - Google Patents
信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP4676893B2 JP4676893B2 JP2006019627A JP2006019627A JP4676893B2 JP 4676893 B2 JP4676893 B2 JP 4676893B2 JP 2006019627 A JP2006019627 A JP 2006019627A JP 2006019627 A JP2006019627 A JP 2006019627A JP 4676893 B2 JP4676893 B2 JP 4676893B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- vector
- arrival direction
- direction estimation
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
[観測信号]
まず、観測信号の定式化を行う。すべての信号はあるサンプリング周波数fsでサンプリングされ、離散的に表現されるものとする。N個の信号が混合されてM個のセンサで観測されたとする。本発明では、信号の発生源からセンサまでの距離により信号が減衰・遅延し、また壁などにより信号が反射して伝送路歪みが発生しうる状況を扱う。このような状況での混合は、源信号sk(t),k=1,...,N、からセンサxq(t)へのインパルス応答hqk(l),q=1,...,M,k=1,...,Nによる畳込み混合
信号の到来方向の推定は周波数領域で行われることが多い。本発明でも周波数領域において各操作を行う。そのため、センサでの観測信号xq(t)にL点の短時間フーリエ変換を適用して周波数毎の時間系列
式(1)で示されている時間領域での畳み込み混合は、周波数領域では、
従来技術では、M個のセンサを直線状に並べるセンサアレイを用いるのが一般的であった。図8(a)に従来よく用いられるセンサアレイの構成を示す。センサqの位置dqは既知であるとし、そこでの観測信号をxq(t)とする。また、センサの並びと垂直な方向を90°として、源信号sk(t)の到来方向を0°≦θk≦180°とする。この到来方向θkを全ての信号源について推定する。
次に、従来の到来方向推定方法を2つ簡単に述べる。
[従来法1]MUSIC法
広く用いられる方法としては、MUSIC(MUtiple SIgnal Classification)法がある(非特許文献1参照)。
これは、周波数f毎に方向推定を行う。まず観測信号X(f,τ)の相関行列R(f)=<X(f,τ)・X(f,τ)H>τを求め、これを固有値分解R(f)=ΣΛΣH(Σ=[σ1,...,σM],Λ=[λ1,...,λM])する。ここで、[*]Hは共役転置操作を、<*>τは時間フレームに関する平均操作を、σqはR(f)の固有ベクトル、λqはσqに対応する固有値で、大きいものから順にソートされている。N番目までに大きい固有値に相当する固有ベクトルは信号部分空間を張り、N+1〜M番目の固有値に相当する固有ベクトルは雑音部分空間を張る。
MUSIC法は雑音部分空間を張るN+1〜M番目の固有値に相当する固有ベクトルが必要なため、センサ数M≧信号数N+1である必要がある。すなわち、MUSIC法は、センサ数が信号数より少ない場合(M<N)には適用できない。
センサ数が信号数よりも少ない場合(M<N)にも利用できる方法としてはDUET法がある(非特許文献2参照)。
この手法は信号のスパース性を仮定する。スパースとは、信号がほとんどの時刻τにおいて0であることを示す。信号のスパース性は、例えば音声信号で確認される。信号のスパース性を仮定することで、複数の信号が存在していても、各時間周波数ポイント(f,τ)では互いに重なって観測される確率が低いことを仮定できる。よって、各時間周波数ポイント(f,τ)の各センサにおける観測信号は、その時間周波数ポイント(f,τ)でアクティブな1つの信号sk(f,τ)のみから成り、その信号kの方向情報を含むと仮定できる。このことから、DUET法では、2つのセンサ(センサ1とセンサ2とする)のみを用いて、2つのセンサにおける観測信号の複数フレームτについて、全ての時間周波数(f,τ)で次式で定義される位相差φ(f,τ)
この手法は、信号源やセンサの2次元・3次元配置に対応できない。すなわち、例えば、2つの信号源が2センサを結んだ線に対して線対称の位置にある場合に、2つの位置を推定することはできない。また、センサの高さについても推定することはできない。
大賀寿郎、山崎芳男、金田豊、「音響システムとディジタル処理」、電子情報通信学会、1995、ISBN 4−88552−128−9 S.Rickard and F.Dietrich ‘DOA estimation of many W-disjoint orthogonal sources from two mixtures using DUET,’Proc. SSAP2000,pp.311-314.
また、従来法1では、センサ数が信号数より多い場合にしか適用できず、センサ数が信号数より少ない場合には利用できなかった。しかし、実環境においてはセンサ数が信号数に比べて十分である保証はなく、信号数がセンサ数を超えることは容易に起こり得る。例えば、TV会議システムにおいて、装置のマイク数以上の話者が同時に発言することは起こり得る。
本発明は、以上の点に鑑みてなされたものであり、3個以上のセンサでかつ直線以外の配置(センサの2次元・3次元的な配置)のセンサアレイにも適用可能な到来方向推定方法を提供し、それにより2次元・3次元的に分散している信号源の到来方向推定を可能にする。さらに、センサ数が信号数より少ない場合にも適用できる信号源の到来方向推定を提供する。
また、本発明では、信号のスパース性を用いるので、センサ数が信号数より少ない場合にも利用できる。
まず、本形態の構成について説明する。
<ハードウェア構成>
図1は、本形態における信号到来方向推定装置1としてコンピュータに機能させる場合のハードウェア構成を例示したブロック図である。
図1に例示するように、この例の信号到来方向推定装置1は、CPU(Central Processing Unit)10、入力部20、出力部30、補助記憶装置40、RAM(Random Access Memory)50、ROM(Read Only Memory)60及びバス70を有している。
この例のCPU10は、読み込まれたOS(Operating System)プログラムに従い、補助記憶装置40の信号到来方向推定プログラム領域41に格納されている信号到来方向推定プログラムを、RAM50の信号到来方向推定プログラム領域51に書き込む。同様にCPU10は、補助記憶装置40のデータ領域42に格納されている時間領域の観測信号等の各種データをRAM50のデータ領域52に書き込む。さらに、CPU10は、この信号到来方向推定プログラムや各種データが書き込まれたRAM50上のアドレスをレジスタ13に格納する。そして、CPU10の制御部11は、レジスタ13に格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示すRAM50上の領域からプログラムやデータを読み出し、そのプログラムが示す演算を演算部12に順次実行させ、その演算結果をレジスタ13に格納していく。
図2に例示するように、信号到来方向推定装置1は、メモリ100、周波数領域変換部110、到来方向推定部120及び制御部140を有している。この到来方向推定部120は、観測信号ベクトル正規化部121、クラスタリング部126及び角度計算部127を有している。制御部140は一時メモリ141を有している。この観測信号ベクトル正規化部121は、偏角正規化部122及びノルム正規化部123を有している。角度計算部127は、逆行列計算部128及び積計算部129、ノルム正規化部130を有している。
ここでメモリ100は補助記憶装置40及びRAM50に、一時メモリ141はレジスタ13に相当する。また、時間周波数領域変換部110、到来方向推定部120及び制御部140は、CPU10にOSプログラムや信号到来方向推定プログラムが読み込まれ、CPU10がこれらを実行することにより機能として構成されるものである。
次に、本形態の信号到来方向推定装置1の処理について説明する。なお、以下では、N個の源信号が混合され、M個のセンサで観測された状況を取り扱う。ここで、Nは2以上の整数、Mは3以上の整数であり、M個のセンサは2次元又は3次元に配置されているものとする。また、前処理において、各センサで観測された時間領域の観測信号xq(t)(q=1,...,M)がメモリ100の記憶領域101に格納され、実数α、信号の伝達速度c、M以下の自然数から選択された基準値Q(M個のセンサから選択された基準センサの添字番号)の各パラメータ、センサ位置dq(q=1,...,M)及びセントロイドの初期値c0 k(k=1,...,N)の各パラメータが記憶領域105に格納されているものとする。
ここで、センサ間の距離は、測定対象となる音源の波長の長さ以上あるように、センサqが配置され、また、センサ位置dq(q=1,...,M)が記憶領域105に格納されているものとする。なお、センサ位置とは、センサの位置情報のことである。
図3は、本形態における信号到来方向推定装置1の処理の全体を説明するためのフローチャートである。以下、この図に沿って、本形態における信号到来方向推定装置1の処理を説明していく。
まず、周波数領域変換部110において、メモリ100の記憶領域101から時間領域の観測信号xq(t)を読み出し、これらを短時間離散フーリエ変換等によって、短時間ごとに周波数領域信号に変換された周波数ごとの時系列信号(「周波数領域観測信号」と呼ぶ。)Xq(f,τ)に変換し、メモリ100の記憶領域102に格納する(ステップS1)。ここで、上記、Xq(f,τ)において、q=1,...,M、f=0,fs/L,…,fs(L-1)/L、fsはサンプリング周波数、τは上記短時間変換をする時刻である。
次に、観測信号ベクトル正規化部121の偏角正規化部122において、メモリ100の記憶領域102から周波数領域観測信号Xq(f,τ)を読み出す。周波数領域観測信号Xq(f,τ)を読み出した偏角正規化部122は、これらからなる観測信号ベクトルX(f,τ)=[X1(f,τ),...,XM(f,τ)]Tを、観測信号ベクトルの1つの要素の位相を基準にして第1正規化ベクトルX’(f,τ)に正規化する(ステップS2)。生成された第1正規化ベクトルX’(f,τ)はメモリ100の記憶領域103に格納される。なお、ステップS2の処理の詳細については後述する。
次に、観測信号ベクトル正規化部121のノルム正規化部123において、メモリ100の記憶領域103から第1正規化ベクトルX’(f,τ)を読み込み、これらをノルムが所定の値(例えば1)になる第2正規化ベクトルX''(f,τ)に正規化する。そして、ノルム正規化部123は、生成した第2正規化ベクトルX''(f,τ)をメモリ100の記憶領域104に格納する(ステップS3)。なお、この詳細については後述する。
次に、角度計算部127の逆行列計算部128において、メモリ100の記憶領域105からセンサ位置情報dq及び基準値Qを読み込む。そして、逆行列計算部128は、センサ位置情報dq及び基準値Qを用い、Q番目のセンサ位置dQを原点として他のセンサ位置を表した行列Dを計算し、その行列Dの一般化逆行列D+を求める。そして、逆行列計算部128は、計算した一般化逆行列D+をメモリ100の記憶領域107に格納する。
次に、角度計算部127の積計算部129において、メモリ100の記憶領域106からセントロイドベクトルck及びメモリ100の記憶領域107から一般化逆行列D+を読み込み、このセントロイドベクトルck及び一般化逆行列D+から、信号到来方向ベクトルvkを計算する。角度計算部127は、計算した信号到来方向ベクトルvkをメモリ100の記憶領域109に格納する(ステップS5)。なお、この詳細については後述する。
次に、各処理の例を詳細に説明する。
観測信号ベクトル正規化部121は、偏角正規化部122及びノルム正規化部123から構成され、全ての観測信号ベクトルX(f,τ)=[X1(f,τ),...,XM(f,τ)]T(f=0,fs/L,…,fs(L-1)/L)を全ての時間周波数の要素について正規化する。この正規化は、クラスタリング部126でクラスタを形成させるために必要な手順であり、短時間フーリエ変換で用いる窓の位置や、信号原skの位相や振幅、周波数特性hqk(f)の周波数依存性を除去するためのものであり、クラスタリングを行うために必要である。正規化を適切に行わないと、クラスタが形成されない。
前述した通り、本形態における正規化は二段階からなる。第1の正規化は、偏角正規化部122において、観測信号ベクトルX(f,τ)の偏角を、短時間フーリエ変換で用いる窓の位置、信号原skの位相及び周波数特性hqk(f)の周波数依存性に依存しない第1正規化ベクトルX’(f,τ)に正規化するものである。第2の正規化は、ノルム正規化部123において、第1正規化ベクトルX’(f,τ)をノルムが所定の値(この例では1)をとる第2正規化ベクトルX''(f,τ)に正規化するものである。以下にこれらの正規化の詳細を説明する。
図4(a)は、図3に示したステップS2の処理の詳細を説明するためのフローチャートである。以下、この図に沿ってステップS2の処理の例を詳細に説明する。
まず、制御部140(図2)においてパラメータqを1に設定し、これを一時メモリ141に格納する(ステップS11)。次に、偏角正規化部122(図2)において、メモリ100の記憶領域105から前述のパラメータα,c,Qを読み込み、記憶領域102から各(f,τ)に対応する観測信号ベクトルX(f,τ)の要素Xq(f,τ)を読み込み、一時メモリ141からパラメータqを読み込む。そして、偏角正規化部122は、
次に、制御部140において、一時メモリ141に格納されたパラメータqがq=Mを満たすか否かを判断する(ステップS13)。ここでq=Mでなければ、制御部140は、q+1の演算結果を新たなパラメータqの値とし、これを一時メモリ141に格納し(ステップS14)、処理をステップS12へ戻す。一方、q=Mであれば、制御部140はステップS2の処理を終了させ、以下のステップS3の処理を実行させる。
図4(b)は、図3に示したステップS3の処理の詳細を説明するためのフローチャートである。以下、この図に沿ってステップS3の処理の詳細を説明する。
ノルム正規化部123(図2)において、メモリ100の記憶領域103から、各(f,τ)に対応する第1正規化ベクトルX'(f,τ)=[X1'(f,τ),...,XM'(f,τ)]Tを読み込む。そして、ノルム正規化部123は、
次に、ノルム正規化部123は、メモリ100の記憶領域103から各(f,τ)に対応する第1正規化ベクトルX'(f,τ)及び、一時メモリ141からノルム‖X'(f,τ)‖を読み出し、
このように生成された第2正規化ベクトルX''(f,τ)は、短時間フーリエ変換で用いる窓の位置や信号源Skの位相や振幅、周波数特性hqk(f)の周波数特性には依存せず、信号源の位置のみに依存するベクトルとなる。その結果、この第2正規化ベクトルX''(f,τ)はクラスタを形成することになる。以下にこの理由を説明する。
まず、信号源skからセンサqまでの周波数領域でのインパルス応答、すなわち、周波数応答hqk(f)を以下のように取り扱う。前述した式(3)に示される畳み込み混合モデルを平面波(遠距離場)混合モデル
また、信号のスパース性を仮定する。すなわち、各時間周波数ポイント(f,τ)の各センサにおける観測信号は、その時間周波数ポイント(f,τ)でアクティブな1つの信号sk(f,τ)のみからなり、その信号kの方向情報を含むと仮定する。このとき、各時間周波数(f,τ)において以下の関係が成り立つ。
さらに、式(10)〜式(13)より、第2正規化ベクトルX'' (f,τ)は、
前述のようにクラスタリング部126は、メモリ100の記憶領域104から第2正規化ベクトルX''(f,τ)を読み込み、これらをクラスタリングしてN個のクラスタC1,...CNを生成する。すなわち、M次元複素ベクトルである正規化された観測信号ベクトルX''(f,τ)をM次元複素空間で直接クラスタリングする。このクラスタリングは、例えば、k-means法を用いて効果的に行うことができる([参考文献]R.O.Duda,P.E.Hart,and D.G.Stock,Pattern Classification, Wiley Interscience, 2nd edition,2000.)。以下、本発明によるクラスタリング手順を説明する。
1.クラスタのセントロイドの初期値ci k(i=0、k=1,...,N)をメモリ100の記憶領域105から読み込む。セントロイドの初期値ci kは、第2正規化ベクトルX''(f,τ)と同じ次元のベクトル(M次元複素ベクトル)である。なお、セントロイドの初期値c0 kの選び方については後述する。
2.i+1を新たなiとする。
3.すべての時間周波数(f,τ)における第2正規化ベクトルX''(f,τ)を、最も近いセントロイドci−1 kで代表されるクラスタCkに割り当てる。すなわち、各第2正規化ベクトルX''(f,τ)に対して、‖X''(f,τ)−ci−1 k‖が最も小さくなるようにkを選ぶ。
4.各クラスタCkに割りあてられた第2正規化ベクトルX''(f,τ)の平均値を計算し、そのノルムを1にすることでセントロイドを更新する。すなわち、各クラスタCkに割りあてられた第2正規化ベクトルX''(f,τ)に対して、
5.セントロイドci kが収束するまで、手順2−5を繰り返す。最後に収束したセントロイドを、ck(k=1,...,N)として、メモリ100の記憶領域106に格納する。
以上が、本発明によるクラスタリング手順である。
《初期値設定方法1》
第2正規化ベクトルX''(f,τ)の中からランダムにN個のベクトルを選び、それをセントロイドの初期値c0 k(k=1,...,N)とする。
《初期値設定方法2》
セントロイドは、後述するように、式(23)のように書けるので、これを用いる。具体的には、式(23)において、センサ位置dq(q=1,...,M)は、メモリ100の記憶領域105において保持されている値を、vkとしては、式(14)のように考え、方位θkと仰角φk(k=1,...,N)を適当に与える。ここで、方位θkと仰角φkは初期値であるので、適当な値で良い。例えば、
図5は、図3に示したステップS5の処理の例の詳細を説明するためのフローチャートである。以下、この図に沿ってステップS5の処理の例の詳細を説明する。
角度計算部127において、到来方向ベクトルvkを計算する。この例では、3個以上のセンサが2次元又は3次元に任意に配置されている。まず、角度計算部127内の逆行列計算部128は、メモリ100の記憶領域105から、センサ位置情報dq(q=1,...,M)及び基準値Qを読み込み、Q番目のセンサ位置dQを原点にして正規化した行列Dを計算する。そして、この行列Dの一般化逆行列D+を計算する。ここで、一般化逆行列D+として、例えばMoore-Penroseの一般化逆行列を用いることができる(ステップS31)。
なお、後述のように、正立方体のある頂点と、それと隣り合う3つの頂点にセンサを配置した場合には、逆行列計算部128の処理を省略することができる。
上述した式(17)と式(18)により、第2正規化ベクトルの各要素が、角度情報である到来方向ベクトルvkもしくは、2つのセンサq、Qに対する到来方向Θk qQを含むことが分かる。また、式(19)から分かるように、クラスタのセントロイドckは、第2正規化ベクトルの各クラスタの平均値を与えることが分かる。このため、式(17)と式(18)により、クラスタのセントロイドckのq番目の要素{ck}qは、次のように信号の角度情報を持つことが分かる。
上記実施例の効果を示すために、到来方向推定実験を行った。実験条件は図9(b)に示す通りである。長辺が880cm、短辺が375cm、高さが240cm、残響は120msの室内において、底面の長辺から200cm、短辺から282cmの位置にセンサを配置した。センサ位置を中心に半径50cmの円上に3つの音源を、半径80cmの円上に2つの音源を配した。長辺と平行軸をx、短辺と平行軸をyとし、図中[Setup1]として示すように、3つのセンサをy軸に2個、x軸に1個、辺の長さ4cmの正三角形の頂点につまり2次元に配した場合と、[Setup2]として示すように、4つのセンサを原点に1個、原点からそれぞれ4cm離してx軸、y軸、z軸上にそれぞれ1個配した3次元配置とした場合の2種類の実験を行う。音源としては5秒間の英語の音声を用い、またセンサとしてはマイクロホンを用いた。[Setup1]および[ Setup2]の結果をそれぞれ図10(1)の表1及び表2に示す。ここでは、MUSIC法にて、予めそれぞれ1つずつ音源を鳴らして音源到来方向を推定しそれを正解とした。表1ではMUSIC(each)として示している。(注意:5音源が同時に存在する場合の推定ではない。MUSIC法はその場合適用不可。)。また、[Setup1]では、全ての仰角φk=0であるため、方位θkの値のみを示している。
図10(1)の表1及び表2より、この実施例の方法によれば、いずれの音源に対してもMUSIC(each)の測定結果とよく一致している。この発明法を用いることで信号源数>センサ数の場合でも、精度よく到来方向推定ができることが分かる、従来のMUSIC法ではこのような信号源数>マイク数の場合の到来方向推定は不可能であった。
[Setup1](図10(1)の表1)では、センサのある平面上の全ての方向の方向推定ができている。また、[Setup2](図10(1)の表2)では、仰角φkまで含めた全ての方向の方向推定ができている。これは従来のDUET法では不可能であった。
まず、図10(2)(a)(b)は、2つの信号の角度差が大きい(θ1=117°,θ2=217°)場合のMUSICスペクトルと上記実施例における方法のヒストグラムを示している。この場合、両者ともピークは2つであり2方向を推定できる。
一方、図10(2)(c)(d)は、2信号の角度差が小さい(θ1=132°,θ2=154°)場合のMUSICスペクトルと上記実施法のヒストグラムを示している。この場合、MUSIC法では、2信号が存在するにもかかわらず、スペクトルのピークが1つしか確認できない。一方、上記実施法では、ピークが2つ存在し、2信号の角度差が小さい場合にも正しく方向を推定できることが分かる。なお、この場合の到来方向推定値は、θ1=128°,θ2=156°であった。
・ 信号のスパース性に基づいた到来方向推定であるため、信号源数>センサ数の場合にも信号の到来方向推定が可能である.これは従来のMUSIC法ではできなかった。
(2)全センサの配置情報を知る必要のない正規化による特徴量を用いたクラスタリングに基づく方法であるため、不規則なセンサ配置の採用が容易である。
(3)(2)に述べたように,不規則なセンサ配置を採用できるため、センサの2次元・3次元配置が可能となり、信号が2次元・3次元に配置している場合でも全方位の到来方向推定が可能である。これは従来の2センサによるDUET法や線形アレイによる方法ではできなかった。
(4)信号のスパース性に基づいた到来方向推定であるため、従来のMUSIC法に比べて、優れた角度分解能を持つことが確認された。(なお、角度分解能は、信号のスパース性の程度に依存する。)
《変形例1》
変形例1では、偏角正規化部122において、
変形例3では、偏角正規化部122において、式(10)の代わりに、
観測信号ベクトル正規化部121内の偏角正規化部122において、式(29)ではなく式(32)の演算を行う点のみが、変形例2と異なり、その他の機能構成・処理は変形例2の場合と同一である。
変形例4においては、正立方体のある頂点と、それに隣り合う3つの頂点に、すなわち、例えば、図9(c)に示すように、[d1,d2,d3,d4]T=A[(0,0,0)T,(1,0,0)T,(0,1,0)T,(0,0,1)T]T(A:ある定数)のようにセンサを配置する。
この場合、原点(0,0,0)Tを基準Qに他のセンサ位置を正規化したベクトルDの一般化逆行列D+は、
変形例4では、観測信号ベクトル正規化部121において式(10)の後に式(12)の正規化を行った後、クラスタリング部126でクラスタリングされた結果得られたセントロイドベクトルckについて、図7(a)に示す角度計算部127bの偏角計算部131aにおいて、
なお、上記の変形例4では、式(10)を用いて観測信号ベクトルを正規化したが、式(28)を用いて正規化しても良い。
変形例5においては、変形例4の場合と同様に、正立方体のある頂点と、それに隣り合う3つの頂点に、すなわち、[d1,d2,d3,d4]T=A[(0,0,0)T,(1,0,0)T,(0,1,0)T,(0,0,1)T]T(A:ある定数)のようにセンサを配置する。
その後、観測信号ベクトル正規化部121において式(29)又は式(32)の正規化を行った後、式(12)のノルム正規化を行い、クラスタリング部126でクラスタリングされた結果得られたセントロイドベクトルckについて、図7(b)に示す角度計算部127cの偏角計算部131bにおいて、
ここまでは、全ての時間周波数(f,τ)における正規化された観測信号ベクトルをクラスタリング部126におけるクラスタリングの対象としていたが、このクラスタリングを周波数f毎に行い、その後全ての周波数での到来方向推定の結果を統合しても良い。これには例えば、全ての周波数での到来方向推定結果を再度クラスタリングし、そのセントロイドを最終的な到来方向推定結果として用いれば良い。
上述では、センサ位置情報を表す行列Dの一般化逆行列D+を用いる場合と、これを用いない場合としたが、例えば角度計算部127にセンサ配置法判定部132を設け、センサの配置状態が正立方体の頂点に配置されたものか否かを判定し、その判定結果に応じて、その後の処理を、前記一般化逆行列を求める場合と、これを用いない場合とに区別するようにしても良い。センサ配置法判定部132としては、例えば、予めセンサ配置法が知られ、正立方体頂点位置に配されているか否かを示す情報が入力部20(図1)から入力され、メモリ100のいずれかの領域に格納され、この情報からセンサ配置法を判断する。あるいは、各センサ位置情報dq(q=1,...,M)から、これらが正立方体頂点位置に配された関係にあるかを演算により判断しても良い。
また、本発明は上述の実施の形態に限定されるものではない。例えば、上述の実施の形態では、ノルム正規化部122においてノルムが1になるような正規化を行ったが、ノルムが1以外の規定値となるように正規化を行ってもよい。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD
−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、上述した実施形態とは別の実行形態として、コンピュータが可搬型記録媒体から直接このプログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
例えば、オーディオ分野に応用として、ロボット聴覚やテレビ会議システムなどがある。これらにおいては、複数の音声や音楽などが混在する状況が起こりやすく、また同時に入力マイクロホンと話者が離れた位置になりやすいため、マイクロホンが複数の音を同時に収音してしまう。このような状況でも、それぞれの音の方向を推定できることで、ロボットにおいてはロボットカメラを向けることが、テレビ会議システムにおいては話者の方向情報をも含めた情報の通信が可能となり、ステレオ受聴や会議システムのカメラを話者へ向けることが可能となる。
Claims (14)
- 複数の信号源から発せられた信号を3つ以上のセンサで観測し、観測された観測信号を用いて個々の信号の到来方向を推定する装置であって、
前記観測信号を周波数領域の周波数領域観測信号に変換する周波数領域変換手段と、
前記周波数領域観測信号から構成される観測信号ベクトルの要素の位相を、前記観測信号ベクトルの1つの要素の位相を基準として正規化し、第1正規化ベクトルを算出する偏角正規化手段と、
前記第1正規化ベクトルを、ノルムが所定の値になる第2正規化ベクトルに正規化するノルム正規化手段と、
前記第2正規化ベクトルをクラスタリングし、各クラスタのセントロイドベクトルを算出するクラスタリング手段と、
前記各セントロイドベクトルと前記センサの位置情報とを用いて、各信号の第1到来方向ベクトルを算出する角度計算手段と、
前記第1到来方向ベクトルを、ノルムが1になる第2到来方向ベクトルに正規化し、当該第2到来方向ベクトルを到来方向ベクトルとするノルム正規化手段と、
を有することを特徴とする信号到来方向推定装置。 - 請求項2又は3記載の信号到来方向推定装置であって、
前記角度計算手段が、
前記各セントロイドベクトルの偏角と前記センサの位置情報を表す行列の一般化逆行列との積を計算して各信号の第1到来方向ベクトルを求める手段である、
ことを特徴とする信号到来方向推定装置。 - 請求項4又は5記載の信号到来方向推定装置であって、
前記角度計算手段が、
前記各セントロイドベクトルと前記センサの位置情報を表す行列の一般化逆行列との積を計算して各信号の第1到来方向ベクトルを求める手段である、
ことを特徴とする信号到来方向推定装置。 - 請求項2又は3記載の信号到来方向推定装置であって、
(1)前記周波数領域変換手段が、
正立方体のある頂点とそれにとなりあう3つの頂点に配置された複数のセンサにおいて観測された観測信号を周波数領域の周波数領域観測信号に変換する周波数領域変換手段であり、
(2)前記角度計算手段が、
前記各セントロイドベクトルの偏角を計算して各信号の第1到来方向ベクトルを求める手段である、
ことを特徴とする信号到来方向推定装置。 - 請求項4又は5記載の信号到来方向推定装置であって、
(1)前記周波数領域変換手段が、
正立方体のある頂点とそれにとなりあう3つの頂点に配置された複数のセンサにおいて観測された観測信号を周波数領域の周波数領域観測信号に変換する周波数領域変換手段であり、
(2)前記角度計算手段が、
前記各セントロイドベクトルを第1到来方向ベクトルとする手段である、
ことを特徴とする信号到来方向推定装置。 - 複数の信号源から発せられた信号を3つ以上のセンサで観測し、観測された観測信号を用いて個々の信号の到来方向を推定する方法であって、
周波数領域変換手段において、前記観測信号を周波数領域の周波数領域観測信号に変換する過程と、
偏角正規化手段において、前記周波数領域観測信号から構成される観測信号ベクトルの要素の位相を、前記観測ベクトルの1つの要素の位相を基準として正規化し、第1正規化ベクトルを算出する過程と、
ノルム正規化手段において、前記第1正規化ベクトルを、ノルムが1になる第2正規化ベクトルに正規化する過程と、
クラスタリング手段において、前記第2正規化ベクトルをクラスタリングし、各クラスタのセントロイドベクトルを算出する過程と、
角度計算手段において、前記各セントロイドベクトルと前記センサの位置情報とを用いて、各信号の第1到来方向ベクトルを算出する過程と、
ノルム正規化手段において、前記第1到来方向ベクトルを、ノルムが1になる第2到来方向ベクトルに正規化し、当該第2到来方向ベクトルを到来方向ベクトルとする過程と、
を有することを特徴とする信号到来方向推定方法。 - 請求項11記載の信号到来方向推定方法であって、
前記周波数領域変換手段が、
正立方体のある頂点とそれにとなりあう3つの頂点に配置された複数のセンサにおいて観測された観測信号を周波数領域の周波数領域観測信号に変換する過程である、
ことを特徴とする信号到来方向推定方法。 - 請求項1から10の何れかに記載の信号到来方向推定装置としてコンピュータを機能させるための信号到来方向推定プログラム。
- 請求項13記載の信号到来方向推定プログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006019627A JP4676893B2 (ja) | 2006-01-27 | 2006-01-27 | 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006019627A JP4676893B2 (ja) | 2006-01-27 | 2006-01-27 | 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007198977A JP2007198977A (ja) | 2007-08-09 |
JP4676893B2 true JP4676893B2 (ja) | 2011-04-27 |
Family
ID=38453719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006019627A Active JP4676893B2 (ja) | 2006-01-27 | 2006-01-27 | 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4676893B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5503994B2 (ja) * | 2010-02-09 | 2014-05-28 | 株式会社東芝 | 信号到来方向推定方法 |
JP2014157110A (ja) * | 2013-02-18 | 2014-08-28 | Mitsubishi Electric Corp | 信号処理装置、レーダ装置および信号処理方法 |
US9389305B2 (en) * | 2013-02-27 | 2016-07-12 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for compressive array processing |
DE102014217681B4 (de) * | 2014-09-04 | 2020-12-10 | Imra Europe S.A.S. | Sirenensignalquellenerfassung, -Erkennung und -Lokalisation |
WO2019187589A1 (ja) * | 2018-03-29 | 2019-10-03 | ソニー株式会社 | 音源方向推定装置、音源方向推定方法、プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1752969A4 (en) * | 2005-02-08 | 2007-07-11 | Nippon Telegraph & Telephone | SIGNAL SEPARATION DEVICE, SIGNAL SEPARATION METHOD, SIGNAL SEPARATION PROGRAM, AND RECORDING MEDIUM |
-
2006
- 2006-01-27 JP JP2006019627A patent/JP4676893B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007198977A (ja) | 2007-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Diaz-Guerra et al. | Robust sound source tracking using SRP-PHAT and 3D convolutional neural networks | |
JP6620140B2 (ja) | 2次元センサーアレイを用いて3次元波動場の3次元波動場表現を構築するための方法、コンピューター可読記憶媒体及び装置 | |
Rafaely | Phase-mode versus delay-and-sum spherical microphone array processing | |
JP4406428B2 (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体 | |
KR102087307B1 (ko) | 잔향 환경에 강인한 음원 방향 추정을 위한 심화 신경망 기반의 앙상블 음원 방향 추정 방법 및 장치 | |
BR112016013366B1 (pt) | Extração de som reverberante utilizando redes de microfones | |
JP4676893B2 (ja) | 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 | |
JP2016537622A (ja) | 音源の位置を特定する方法、および当該方法を用いる人型ロボット | |
Rafaely et al. | Spherical microphone array beam steering using Wigner-D weighting | |
CN104898086A (zh) | 适用于微型麦克风阵列的声强估计声源定向方法 | |
Diaz-Guerra et al. | Direction of arrival estimation of sound sources using icosahedral CNNs | |
US20200196053A1 (en) | Modeling room acoustics using acoustic waves | |
Laufer-Goldshtein et al. | A study on manifolds of acoustic responses | |
KR102097641B1 (ko) | 구형 마이크로폰 어레이를 이용한 음원의 입사 방향 추정방법 | |
Salvati et al. | Incident signal power comparison for localization of concurrent multiple acoustic sources | |
JP4738284B2 (ja) | ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体 | |
JP2018077139A (ja) | 音場推定装置、音場推定方法、プログラム | |
Herzog et al. | Generalized intensity vector and energy density in the spherical harmonic domain: Theory and applications | |
JP7207539B2 (ja) | 学習データ拡張装置、学習データ拡張方法、およびプログラム | |
Torres et al. | Room acoustics analysis using circular arrays: A comparison between plane-wave decomposition and modal beamforming approaches | |
JP2007226036A (ja) | 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 | |
JP2019050492A (ja) | フィルタ係数決定装置、フィルタ係数決定方法、プログラム、および音響システム | |
Zhu et al. | IFAN: An Icosahedral Feature Attention Network for Sound Source Localization | |
JP2017130899A (ja) | 音場推定装置、その方法及びプログラム | |
Chen et al. | Sound source DOA estimation and localization in noisy reverberant environments using least-squares support vector machines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110118 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110128 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140204 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4676893 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |