JP4676893B2 - 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 - Google Patents

信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 Download PDF

Info

Publication number
JP4676893B2
JP4676893B2 JP2006019627A JP2006019627A JP4676893B2 JP 4676893 B2 JP4676893 B2 JP 4676893B2 JP 2006019627 A JP2006019627 A JP 2006019627A JP 2006019627 A JP2006019627 A JP 2006019627A JP 4676893 B2 JP4676893 B2 JP 4676893B2
Authority
JP
Japan
Prior art keywords
signal
vector
arrival direction
direction estimation
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006019627A
Other languages
English (en)
Other versions
JP2007198977A (ja
Inventor
章子 荒木
宏 澤田
良 向井
昭二 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006019627A priority Critical patent/JP4676893B2/ja
Publication of JP2007198977A publication Critical patent/JP2007198977A/ja
Application granted granted Critical
Publication of JP4676893B2 publication Critical patent/JP4676893B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、信号処理の技術分野に属し、特に、それぞれの信号を1つずつ直接観測することはできず、複数の信号が重畳されて観測されるという状況において、全ての信号の到来方向を推定する技術に関する。
ここでは、まず観測信号のモデル化を行い、到来方向推定でよく使われる周波数領域表現を定義した上で、2つの従来技術について簡単に述べる。
[観測信号]
まず、観測信号の定式化を行う。すべての信号はあるサンプリング周波数fでサンプリングされ、離散的に表現されるものとする。N個の信号が混合されてM個のセンサで観測されたとする。本発明では、信号の発生源からセンサまでの距離により信号が減衰・遅延し、また壁などにより信号が反射して伝送路歪みが発生しうる状況を扱う。このような状況での混合は、源信号s(t),k=1,...,N、からセンサxq(t)へのインパルス応答hqk(l),q=1,...,M,k=1,...,Nによる畳込み混合
Figure 0004676893
となる。ここでは、源信号s(t)やインパルス応答hqk(l)についての情報を事前に得られない状況を考える。この状況で、観測信号x(t),...,x(t)のみを用いて源信号s(t),...,s(t)の到来方向を推定する。より詳細な到来方向の定義については後述する。
[周波数領域表現]
信号の到来方向の推定は周波数領域で行われることが多い。本発明でも周波数領域において各操作を行う。そのため、センサでの観測信号x(t)にL点の短時間フーリエ変換を適用して周波数毎の時間系列
Figure 0004676893
を求める。ここで、fは周波数であり、f=0,(1/L)f,...,((L-1)/L)fと離散化されている(fはサンプリング周波数)。g(l)は、ハミング窓などの窓関数である。
式(1)で示されている時間領域での畳み込み混合は、周波数領域では、
Figure 0004676893
と各周波数での単純混合に近似表現される。ここで、hqk(f)は源信号からsからセンサxまでの周波数応答、s(f,τ)は式(2)と同様の式に従って源信号s(t)に短時間フーリエ変換を施したものである。式(3)をベクトルを用いて表記すると、
Figure 0004676893
となる。ここで、X=[X,...,Xは観測信号ベクトル、h=[h1k,...,hMkは源信号sから各センサへの周波数応答をまとめたベクトルである。
[到来方向]
従来技術では、M個のセンサを直線状に並べるセンサアレイを用いるのが一般的であった。図8(a)に従来よく用いられるセンサアレイの構成を示す。センサqの位置dは既知であるとし、そこでの観測信号をx(t)とする。また、センサの並びと垂直な方向を90°として、源信号s(t)の到来方向を0°≦θ≦180°とする。この到来方向θを全ての信号源について推定する。
次に、従来の到来方向推定方法を2つ簡単に述べる。
[従来法1]MUSIC法
広く用いられる方法としては、MUSIC(MUtiple SIgnal Classification)法がある(非特許文献1参照)。
これは、周波数f毎に方向推定を行う。まず観測信号X(f,τ)の相関行列R(f)=<X(f,τ)・X(f,τ)τを求め、これを固有値分解R(f)=ΣΛΣ(Σ=[σ,...,σ],Λ=[λ,...,λ])する。ここで、[*]は共役転置操作を、<*>τは時間フレームに関する平均操作を、σはR(f)の固有ベクトル、λはσに対応する固有値で、大きいものから順にソートされている。N番目までに大きい固有値に相当する固有ベクトルは信号部分空間を張り、N+1〜M番目の固有値に相当する固有ベクトルは雑音部分空間を張る。
次に、
Figure 0004676893
として(方向θを変数とするベクトル、cは信号の速度、dは直線状に配置されたセンサアレイにおいてある1つのセンサを基準としたときの相対距離を表す。)、雑音部分空間を張る固有ベクトルσN+1,...,σを用いて、
Figure 0004676893
を計算すると、L(θ)はN個のピークを持つ。これらのN個のピークをとるθが、N個の信号の周波数fにおける到来方向θ(f)(k=1,...,N)となる。すべての周波数の到来方向推定結果の平均値を、信号到来方向とする。
MUSIC法は雑音部分空間を張るN+1〜M番目の固有値に相当する固有ベクトルが必要なため、センサ数M≧信号数N+1である必要がある。すなわち、MUSIC法は、センサ数が信号数より少ない場合(M<N)には適用できない。
[従来法2]DUET法
センサ数が信号数よりも少ない場合(M<N)にも利用できる方法としてはDUET法がある(非特許文献2参照)。
この手法は信号のスパース性を仮定する。スパースとは、信号がほとんどの時刻τにおいて0であることを示す。信号のスパース性は、例えば音声信号で確認される。信号のスパース性を仮定することで、複数の信号が存在していても、各時間周波数ポイント(f,τ)では互いに重なって観測される確率が低いことを仮定できる。よって、各時間周波数ポイント(f,τ)の各センサにおける観測信号は、その時間周波数ポイント(f,τ)でアクティブな1つの信号s(f,τ)のみから成り、その信号kの方向情報を含むと仮定できる。このことから、DUET法では、2つのセンサ(センサ1とセンサ2とする)のみを用いて、2つのセンサにおける観測信号の複数フレームτについて、全ての時間周波数(f,τ)で次式で定義される位相差φ(f,τ)
Figure 0004676893
と、同じく次式で定義されるゲイン比α(f,τ)
Figure 0004676893
とを求め、この情報(φ(f,τ),α(f,τ))の全てのf、τにおける値のヒストグラムを作成する。そうすると、ヒストグラムはN個のピークをもつ。そのk番目のピーク(φ,α)のφを用いると、
Figure 0004676893
で求められる。ここでdは、2つのセンサの間隔である。
この手法は、信号源やセンサの2次元・3次元配置に対応できない。すなわち、例えば、2つの信号源が2センサを結んだ線に対して線対称の位置にある場合に、2つの位置を推定することはできない。また、センサの高さについても推定することはできない。
大賀寿郎、山崎芳男、金田豊、「音響システムとディジタル処理」、電子情報通信学会、1995、ISBN 4−88552−128−9 S.Rickard and F.Dietrich ‘DOA estimation of many W-disjoint orthogonal sources from two mixtures using DUET,’Proc. SSAP2000,pp.311-314.
従来法1では、直線配置アレイを、従来法2では2センサのみを使うことが一般的であり、0°≦θ≦180°の範囲の方向推定しかできなかった。すなわち、2次元・3次元的に分散している信号源(0°≦θ≦360°に分散していたり、高さが異なったりする)の到来方向推定ができなかった。
また、従来法1では、センサ数が信号数より多い場合にしか適用できず、センサ数が信号数より少ない場合には利用できなかった。しかし、実環境においてはセンサ数が信号数に比べて十分である保証はなく、信号数がセンサ数を超えることは容易に起こり得る。例えば、TV会議システムにおいて、装置のマイク数以上の話者が同時に発言することは起こり得る。
本発明は、以上の点に鑑みてなされたものであり、3個以上のセンサでかつ直線以外の配置(センサの2次元・3次元的な配置)のセンサアレイにも適用可能な到来方向推定方法を提供し、それにより2次元・3次元的に分散している信号源の到来方向推定を可能にする。さらに、センサ数が信号数より少ない場合にも適用できる信号源の到来方向推定を提供する。
本発明では上記課題を解決するために、まず、複数の信号源から発せられた信号を3つ以上のセンサで観測して、周波数領域変換手段において、周波数領域の周波数領域観測信号に変換する。そして、偏角正規化手段において、周波数領域観測信号から構成される観測信号ベクトルの要素の位相を、観測ベクトルの1つの要素の位相を基準として正規化し、第1正規化ベクトルを算出する。そして、ノルム正規化手段において、第1正規化ベクトルを、ノルムが所定の値になる第2正規化ベクトルに正規化する。そして、クラスタリング手段において、第2正規化ベクトルをクラスタリングし、各クラスタのセントロイドベクトルを算出する。その後、角度計算手段において、セントロイドベクトルと前記センサ位置情報とを用いて、各信号の到来方向を算出する。
本発明では、観測信号ベクトルX(f,τ)に対して、ある正規化をほどこした特徴量を用いている。その正規化は、センサ数や配置形状によらず、どのような場合にも適用できる。さらに、それをM次元複素空間(Mはセンサ数)において、クラスタリングをして、そのセントロイドを到来方向推定に用いている。このため、本発明では、従来法とは異なり、2次元・3次元に配置された3個以上のセンサを用いることができるため、2次元・3次元に分布した信号源の到来方向を推定することができる。
また、本発明では、信号のスパース性を用いるので、センサ数が信号数より少ない場合にも利用できる。
以下、本発明の実施の形態を図面を参照して説明する。
まず、本形態の構成について説明する。
<ハードウェア構成>
図1は、本形態における信号到来方向推定装置1としてコンピュータに機能させる場合のハードウェア構成を例示したブロック図である。
図1に例示するように、この例の信号到来方向推定装置1は、CPU(Central Processing Unit)10、入力部20、出力部30、補助記憶装置40、RAM(Random Access Memory)50、ROM(Read Only Memory)60及びバス70を有している。
この例のCPU10は、制御部11、演算部12及びレジスタ13を有し、レジスタ13に読み込まれた各種プログラムに従って様々な演算処理を実行する。また、この例の入力部20は、データが入力される入力ポート、キーボード、マウス等であり、出力部30は、データを出力する出力ポート、ディスプレイ等である。補助記憶装置40は、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、本形態の信号到来方向推定処理の各過程を実行するための信号到来方向推定プログラムを格納した信号到来方向推定プログラム領域41及びセンサで観測された時間領域の観測信号等の各種データが格納されるデータ領域42を有している。また、RAM50は、例えば、SRAM (Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等であり、信号到来方向プログラムが書き込まれる信号到来方向推定プログラム領域51及び各種データが書き込まれるデータ領域52を有している。また、この例のバス70は、CPU10、入力部20、出力部30、補助記憶装置40、RAM50及びROM60を通信可能に接続している。
<ハードウェアとソフトウェアとの協働>
この例のCPU10は、読み込まれたOS(Operating System)プログラムに従い、補助記憶装置40の信号到来方向推定プログラム領域41に格納されている信号到来方向推定プログラムを、RAM50の信号到来方向推定プログラム領域51に書き込む。同様にCPU10は、補助記憶装置40のデータ領域42に格納されている時間領域の観測信号等の各種データをRAM50のデータ領域52に書き込む。さらに、CPU10は、この信号到来方向推定プログラムや各種データが書き込まれたRAM50上のアドレスをレジスタ13に格納する。そして、CPU10の制御部11は、レジスタ13に格納されたこれらのアドレスを順次読み出し、読み出したアドレスが示すRAM50上の領域からプログラムやデータを読み出し、そのプログラムが示す演算を演算部12に順次実行させ、その演算結果をレジスタ13に格納していく。
図2は、このようにCPU10に信号到来方向推定プログラムが読み込まれることにより構成される信号到来方向推定装置1の機能構成の例示である。なお、この図における実線の矢印は実際のデータの流れを示し、破線の矢印は理論的な情報の流れを示す。また、制御部140に出入りするデータの流れに対応する矢印は省略してある。
図2に例示するように、信号到来方向推定装置1は、メモリ100、周波数領域変換部110、到来方向推定部120及び制御部140を有している。この到来方向推定部120は、観測信号ベクトル正規化部121、クラスタリング部126及び角度計算部127を有している。制御部140は一時メモリ141を有している。この観測信号ベクトル正規化部121は、偏角正規化部122及びノルム正規化部123を有している。角度計算部127は、逆行列計算部128及び積計算部129、ノルム正規化部130を有している。
ここでメモリ100は補助記憶装置40及びRAM50に、一時メモリ141はレジスタ13に相当する。また、時間周波数領域変換部110、到来方向推定部120及び制御部140は、CPU10にOSプログラムや信号到来方向推定プログラムが読み込まれ、CPU10がこれらを実行することにより機能として構成されるものである。
<処理>
次に、本形態の信号到来方向推定装置1の処理について説明する。なお、以下では、N個の源信号が混合され、M個のセンサで観測された状況を取り扱う。ここで、Nは2以上の整数、Mは3以上の整数であり、M個のセンサは2次元又は3次元に配置されているものとする。また、前処理において、各センサで観測された時間領域の観測信号x(t)(q=1,...,M)がメモリ100の記憶領域101に格納され、実数α、信号の伝達速度c、M以下の自然数から選択された基準値Q(M個のセンサから選択された基準センサの添字番号)の各パラメータ、センサ位置d(q=1,...,M)及びセントロイドの初期値c (k=1,...,N)の各パラメータが記憶領域105に格納されているものとする。
ここで、センサ間の距離は、測定対象となる音源の波長の長さ以上あるように、センサqが配置され、また、センサ位置d(q=1,...,M)が記憶領域105に格納されているものとする。なお、センサ位置とは、センサの位置情報のことである。
図3は、本形態における信号到来方向推定装置1の処理の全体を説明するためのフローチャートである。以下、この図に沿って、本形態における信号到来方向推定装置1の処理を説明していく。
[処理の全体]
まず、周波数領域変換部110において、メモリ100の記憶領域101から時間領域の観測信号xq(t)を読み出し、これらを短時間離散フーリエ変換等によって、短時間ごとに周波数領域信号に変換された周波数ごとの時系列信号(「周波数領域観測信号」と呼ぶ。)Xq(f,τ)に変換し、メモリ100の記憶領域102に格納する(ステップS1)。ここで、上記、Xq(f,τ)において、q=1,...,M、f=0,fs/L,…,fs(L-1)/L、fはサンプリング周波数、τは上記短時間変換をする時刻である。
次に、観測信号ベクトル正規化部121の偏角正規化部122において、メモリ100の記憶領域102から周波数領域観測信号Xq(f,τ)を読み出す。周波数領域観測信号Xq(f,τ)を読み出した偏角正規化部122は、これらからなる観測信号ベクトルX(f,τ)=[X1(f,τ),...,XM(f,τ)]Tを、観測信号ベクトルの1つの要素の位相を基準にして第1正規化ベクトルX’(f,τ)に正規化する(ステップS2)。生成された第1正規化ベクトルX’(f,τ)はメモリ100の記憶領域103に格納される。なお、ステップS2の処理の詳細については後述する。
次に、観測信号ベクトル正規化部121のノルム正規化部123において、メモリ100の記憶領域103から第1正規化ベクトルX’(f,τ)を読み込み、これらをノルムが所定の値(例えば1)になる第2正規化ベクトルX''(f,τ)に正規化する。そして、ノルム正規化部123は、生成した第2正規化ベクトルX''(f,τ)をメモリ100の記憶領域104に格納する(ステップS3)。なお、この詳細については後述する。
次に、到来方向推定部120のクラスタリング部126において、メモリ100の記憶領域104から第2正規化ベクトルX''(f,τ)を読み込み、これらをクラスタリングして、各クラスタのセントロイドベクトルc(k=1,…,N)を求め、これをメモリ100の記憶領域106に格納する(ステップS4)。なお、この詳細については後述する。
次に、角度計算部127の逆行列計算部128において、メモリ100の記憶領域105からセンサ位置情報d及び基準値Qを読み込む。そして、逆行列計算部128は、センサ位置情報d及び基準値Qを用い、Q番目のセンサ位置dを原点として他のセンサ位置を表した行列Dを計算し、その行列Dの一般化逆行列Dを求める。そして、逆行列計算部128は、計算した一般化逆行列Dをメモリ100の記憶領域107に格納する。
次に、角度計算部127の積計算部129において、メモリ100の記憶領域106からセントロイドベクトルc及びメモリ100の記憶領域107から一般化逆行列Dを読み込み、このセントロイドベクトルc及び一般化逆行列Dから、信号到来方向ベクトルvを計算する。角度計算部127は、計算した信号到来方向ベクトルvをメモリ100の記憶領域109に格納する(ステップS5)。なお、この詳細については後述する。
次に、各処理の例を詳細に説明する。
[観測信号ベクトル正規化部121の処理の詳細]
観測信号ベクトル正規化部121は、偏角正規化部122及びノルム正規化部123から構成され、全ての観測信号ベクトルX(f,τ)=[X1(f,τ),...,XM(f,τ)]T(f=0,fs/L,…,fs(L-1)/L)を全ての時間周波数の要素について正規化する。この正規化は、クラスタリング部126でクラスタを形成させるために必要な手順であり、短時間フーリエ変換で用いる窓の位置や、信号原sの位相や振幅、周波数特性hqk(f)の周波数依存性を除去するためのものであり、クラスタリングを行うために必要である。正規化を適切に行わないと、クラスタが形成されない。
前述した通り、本形態における正規化は二段階からなる。第1の正規化は、偏角正規化部122において、観測信号ベクトルX(f,τ)の偏角を、短時間フーリエ変換で用いる窓の位置、信号原sの位相及び周波数特性hqk(f)の周波数依存性に依存しない第1正規化ベクトルX’(f,τ)に正規化するものである。第2の正規化は、ノルム正規化部123において、第1正規化ベクトルX’(f,τ)をノルムが所定の値(この例では1)をとる第2正規化ベクトルX''(f,τ)に正規化するものである。以下にこれらの正規化の詳細を説明する。
[偏角正規化部122における処理の詳細(ステップS2の処理の詳細)]
図4(a)は、図3に示したステップS2の処理の詳細を説明するためのフローチャートである。以下、この図に沿ってステップS2の処理の例を詳細に説明する。
まず、制御部140(図2)においてパラメータqを1に設定し、これを一時メモリ141に格納する(ステップS11)。次に、偏角正規化部122(図2)において、メモリ100の記憶領域105から前述のパラメータα,c,Qを読み込み、記憶領域102から各(f,τ)に対応する観測信号ベクトルX(f,τ)の要素Xq(f,τ)を読み込み、一時メモリ141からパラメータqを読み込む。そして、偏角正規化部122は、
Figure 0004676893
の演算を行い、当該演算結果を第1正規化ベクトルX'(f,τ)=[X1'(f,τ),...,XM'(f,τ)]Tの各要素として、メモリ100の記憶領域103に格納する(ステップS12)。ここで、X(f,τ)はある選択された基準センサQの観測信号、αはある正数、cは信号の伝達速度、arg[*]は*に対する偏角、jは虚数単位を意味する。αの選び方としては、4dmax「ただし、dmaxは、選択された基準センサQと他のセンサとの距離の最大値」が最も良いが、他の数、例えば、距離単位として、m(メートル)を用いた場合には1や2πなどでも良い。
次に、制御部140において、一時メモリ141に格納されたパラメータqがq=Mを満たすか否かを判断する(ステップS13)。ここでq=Mでなければ、制御部140は、q+1の演算結果を新たなパラメータqの値とし、これを一時メモリ141に格納し(ステップS14)、処理をステップS12へ戻す。一方、q=Mであれば、制御部140はステップS2の処理を終了させ、以下のステップS3の処理を実行させる。
[ノルム正規化部123における処理の詳細(ステップS3の詳細)]
図4(b)は、図3に示したステップS3の処理の詳細を説明するためのフローチャートである。以下、この図に沿ってステップS3の処理の詳細を説明する。
ノルム正規化部123(図2)において、メモリ100の記憶領域103から、各(f,τ)に対応する第1正規化ベクトルX'(f,τ)=[X1'(f,τ),...,XM'(f,τ)]Tを読み込む。そして、ノルム正規化部123は、
Figure 0004676893
の演算を行ってそれらのノルム‖X'(f,τ)‖を求め、ノルム‖X'(f,τ)‖を一時メモリ141に格納する(ステップS21)。
次に、ノルム正規化部123は、メモリ100の記憶領域103から各(f,τ)に対応する第1正規化ベクトルX'(f,τ)及び、一時メモリ141からノルム‖X'(f,τ)‖を読み出し、
Figure 0004676893
の演算を行って第2正規化ベクトルX''(f,τ)を求める(ステップS22)。求められた第2正規化ベクトルX''(f,τ)は、メモリ100の記憶領域104に格納される。これによりステップS3の処理が終了する。
このように生成された第2正規化ベクトルX''(f,τ)は、短時間フーリエ変換で用いる窓の位置や信号源Sの位相や振幅、周波数特性hqk(f)の周波数特性には依存せず、信号源の位置のみに依存するベクトルとなる。その結果、この第2正規化ベクトルX''(f,τ)はクラスタを形成することになる。以下にこの理由を説明する。
[第2正規化ベクトルX''(f,τ)がクラスタを形成する理由]
まず、信号源sからセンサqまでの周波数領域でのインパルス応答、すなわち、周波数応答hqk(f)を以下のように取り扱う。前述した式(3)に示される畳み込み混合モデルを平面波(遠距離場)混合モデル
Figure 0004676893
を用いて近似する。すなわち、ここではセンサ間における減衰差は考えず、音源kから原点までの遅延と、音源kからセンサqまでの遅延の差c−1 のみを考える。ここで、d はセンサqの位置を表す3次元ベクトルである。また、vは、原点から見た信号源sの方向を表す大きさ1の3次元ベクトル(到来方向ベクトル)であり、図8(b)に示される方位θと仰角φを用いて、
Figure 0004676893
と書くことができる。
また、信号のスパース性を仮定する。すなわち、各時間周波数ポイント(f,τ)の各センサにおける観測信号は、その時間周波数ポイント(f,τ)でアクティブな1つの信号s(f,τ)のみからなり、その信号kの方向情報を含むと仮定する。このとき、各時間周波数(f,τ)において以下の関係が成り立つ。
Figure 0004676893
式(13)と(15)を式(6)に代入して偏角を取ると、
Figure 0004676893
となる。この式から分かるように、第1正規化ベクトルX'(f,τ)の偏角は、信号源の振幅や位相に依らなくなることが分かる。これが偏角正規化部122の役割である。
さらに、式(10)〜式(13)より、第2正規化ベクトルX'' (f,τ)は、
Figure 0004676893
又は
Figure 0004676893
となる。ここで、cosΘ qQは、センサqとQを結ぶ軸に対する信号s(t)の到来方向ベクトルであり、図9(a)において太いベクトルで示されているものである。上記式(17)及び式(18)より、第2正規化ベクトルX'' (f,τ)は、周波数応答hqk(f)が持っていた周波数依存性が無くなっていることがわかる。さらに、第2正規化ベクトルX''(f,τ)は、信号源kとセンサqの位置のみに依存することも分かる。このため、第2正規化ベクトルX''(f,τ)をクラスタリングすると、同じ信号源に対応するものが、その位置によってクラスタを形成するのである。([観測信号ベクトル正規化部121の処理の詳細・偏角正規化部122・ノルム正規化部123の処理の詳細]の説明終わり)。
[クラスタリング部126の処理の詳細(ステップS4の詳細)]
前述のようにクラスタリング部126は、メモリ100の記憶領域104から第2正規化ベクトルX''(f,τ)を読み込み、これらをクラスタリングしてN個のクラスタC,...Cを生成する。すなわち、M次元複素ベクトルである正規化された観測信号ベクトルX''(f,τ)をM次元複素空間で直接クラスタリングする。このクラスタリングは、例えば、k-means法を用いて効果的に行うことができる([参考文献]R.O.Duda,P.E.Hart,and D.G.Stock,Pattern Classification, Wiley Interscience, 2nd edition,2000.)。以下、本発明によるクラスタリング手順を説明する。
1.クラスタのセントロイドの初期値c (i=0、k=1,...,N)をメモリ100の記憶領域105から読み込む。セントロイドの初期値c は、第2正規化ベクトルX''(f,τ)と同じ次元のベクトル(M次元複素ベクトル)である。なお、セントロイドの初期値c の選び方については後述する。
2.i+1を新たなiとする。
3.すべての時間周波数(f,τ)における第2正規化ベクトルX''(f,τ)を、最も近いセントロイドci−1 で代表されるクラスタCに割り当てる。すなわち、各第2正規化ベクトルX''(f,τ)に対して、‖X''(f,τ)−ci−1 ‖が最も小さくなるようにkを選ぶ。
4.各クラスタCに割りあてられた第2正規化ベクトルX''(f,τ)の平均値を計算し、そのノルムを1にすることでセントロイドを更新する。すなわち、各クラスタCに割りあてられた第2正規化ベクトルX''(f,τ)に対して、
Figure 0004676893
の演算を行うことにより、セントロイドを更新する。ここで、E[・]は、クラスタCのメンバに対する平均操作を表す。
5.セントロイドc が収束するまで、手順2−5を繰り返す。最後に収束したセントロイドを、c(k=1,...,N)として、メモリ100の記憶領域106に格納する。
以上が、本発明によるクラスタリング手順である。
次に、セントロイドの初期値の選び方の例を説明する。
《初期値設定方法1》
第2正規化ベクトルX''(f,τ)の中からランダムにN個のベクトルを選び、それをセントロイドの初期値c (k=1,...,N)とする。
《初期値設定方法2》
セントロイドは、後述するように、式(23)のように書けるので、これを用いる。具体的には、式(23)において、センサ位置d(q=1,...,M)は、メモリ100の記憶領域105において保持されている値を、vとしては、式(14)のように考え、方位θと仰角φ(k=1,...,N)を適当に与える。ここで、方位θと仰角φは初期値であるので、適当な値で良い。例えば、
Figure 0004676893
とすると、空間的に散らばった初期値が得られる([クラスタリング部126の処理の詳細(ステップS4の詳細)]の説明終わり)。
[角度計算部127・逆行列計算部128・積計算部129・ノルム正規化部130における処理の詳細(ステップS5の処理の詳細)]
図5は、図3に示したステップS5の処理の例の詳細を説明するためのフローチャートである。以下、この図に沿ってステップS5の処理の例の詳細を説明する。
角度計算部127において、到来方向ベクトルvを計算する。この例では、3個以上のセンサが2次元又は3次元に任意に配置されている。まず、角度計算部127内の逆行列計算部128は、メモリ100の記憶領域105から、センサ位置情報d(q=1,...,M)及び基準値Qを読み込み、Q番目のセンサ位置dを原点にして正規化した行列Dを計算する。そして、この行列Dの一般化逆行列Dを計算する。ここで、一般化逆行列Dとして、例えばMoore-Penroseの一般化逆行列を用いることができる(ステップS31)。
なお、後述のように、正立方体のある頂点と、それと隣り合う3つの頂点にセンサを配置した場合には、逆行列計算部128の処理を省略することができる。
次に、角度計算部127内の積計算部129において、メモリ100の記憶領域106からセントロイドベクトルc及び記憶領域107から一般化逆行列Dを読み出し、
Figure 0004676893
の演算をする。そして、積計算部129は、この演算により求められたv’をメモリ100の記憶領域108に格納する(ステップS32)。理想的には、この演算により、到来方向ベクトルが得られる。なお、その理由については、後述する。また、後述のように、正立方体のある頂点と、それと隣り合う3つの頂点にセンサを配置した場合には、積計算部129の処理を省略することができる。
しかし、上記式(21)の右辺は計算誤差を含むことが多いので、角度計算部127内のノルム正規化部130において、第1到来方向ベクトルv’のノルムを1にする正規化を行う。すなわち、ノルム正規化部130は、メモリ100の記憶領域108から第1到来方向ベクトルv’を読み出し、
Figure 0004676893
の演算を行い、第2到来方向ベクトルvを求め、これを信号到来方向ベクトルとする(ステップS33)。
《到来方向ベクトルが求まる理由》
上述した式(17)と式(18)により、第2正規化ベクトルの各要素が、角度情報である到来方向ベクトルvもしくは、2つのセンサq、Qに対する到来方向Θ qQを含むことが分かる。また、式(19)から分かるように、クラスタのセントロイドcは、第2正規化ベクトルの各クラスタの平均値を与えることが分かる。このため、式(17)と式(18)により、クラスタのセントロイドcのq番目の要素{cは、次のように信号の角度情報を持つことが分かる。
Figure 0004676893
式(23)の偏角を考えると、
Figure 0004676893
となり、これを全てのセンサペア(q=1,...,M)について考えると、
Figure 0004676893
が得られる。この式を、vについて整理すると、
Figure 0004676893
となる。このため、一般化逆行列Dとセントロイドベクトルcの偏角の積を計算することにより、到来方向ベクトルが得られるのである([角度計算部127・逆行列計算部128・積計算部129・ノルム正規化部130における処理の詳細(ステップS5の処理の詳細)]の説明終わり)。
[実験結果]
上記実施例の効果を示すために、到来方向推定実験を行った。実験条件は図9(b)に示す通りである。長辺が880cm、短辺が375cm、高さが240cm、残響は120msの室内において、底面の長辺から200cm、短辺から282cmの位置にセンサを配置した。センサ位置を中心に半径50cmの円上に3つの音源を、半径80cmの円上に2つの音源を配した。長辺と平行軸をx、短辺と平行軸をyとし、図中[Setup1]として示すように、3つのセンサをy軸に2個、x軸に1個、辺の長さ4cmの正三角形の頂点につまり2次元に配した場合と、[Setup2]として示すように、4つのセンサを原点に1個、原点からそれぞれ4cm離してx軸、y軸、z軸上にそれぞれ1個配した3次元配置とした場合の2種類の実験を行う。音源としては5秒間の英語の音声を用い、またセンサとしてはマイクロホンを用いた。[Setup1]および[ Setup2]の結果をそれぞれ図10(1)の表1及び表2に示す。ここでは、MUSIC法にて、予めそれぞれ1つずつ音源を鳴らして音源到来方向を推定しそれを正解とした。表1ではMUSIC(each)として示している。(注意:5音源が同時に存在する場合の推定ではない。MUSIC法はその場合適用不可。)。また、[Setup1]では、全ての仰角φ=0であるため、方位θkの値のみを示している。
図10(1)の表1及び表2より、この実施例の方法によれば、いずれの音源に対してもMUSIC(each)の測定結果とよく一致している。この発明法を用いることで信号源数>センサ数の場合でも、精度よく到来方向推定ができることが分かる、従来のMUSIC法ではこのような信号源数>マイク数の場合の到来方向推定は不可能であった。
[Setup1](図10(1)の表1)では、センサのある平面上の全ての方向の方向推定ができている。また、[Setup2](図10(1)の表2)では、仰角φまで含めた全ての方向の方向推定ができている。これは従来のDUET法では不可能であった。
さらに、上記実施例では、従来最もよく用いられる方法であるMUSIC法よりも優れた角度分解能を持つことが確かめられた。図10(2)において(a)(c)はMUSICスペクトルを、(b)(d)は上記実施法における到来方向推定を全ての時間周波数(f,τ)について行った場合に得られる到来方向のヒストグラムを示している。双方とも、ピーク位置が音源方向を示す。
まず、図10(2)(a)(b)は、2つの信号の角度差が大きい(θ=117°,θ2=217°)場合のMUSICスペクトルと上記実施例における方法のヒストグラムを示している。この場合、両者ともピークは2つであり2方向を推定できる。
一方、図10(2)(c)(d)は、2信号の角度差が小さい(θ1=132°,θ2=154°)場合のMUSICスペクトルと上記実施法のヒストグラムを示している。この場合、MUSIC法では、2信号が存在するにもかかわらず、スペクトルのピークが1つしか確認できない。一方、上記実施法では、ピークが2つ存在し、2信号の角度差が小さい場合にも正しく方向を推定できることが分かる。なお、この場合の到来方向推定値は、θ1=128°,θ2=156°であった。
上記実施例の効果をまとめると以下のようになる。
・ 信号のスパース性に基づいた到来方向推定であるため、信号源数>センサ数の場合にも信号の到来方向推定が可能である.これは従来のMUSIC法ではできなかった。
(2)全センサの配置情報を知る必要のない正規化による特徴量を用いたクラスタリングに基づく方法であるため、不規則なセンサ配置の採用が容易である。
(3)(2)に述べたように,不規則なセンサ配置を採用できるため、センサの2次元・3次元配置が可能となり、信号が2次元・3次元に配置している場合でも全方位の到来方向推定が可能である。これは従来の2センサによるDUET法や線形アレイによる方法ではできなかった。
(4)信号のスパース性に基づいた到来方向推定であるため、従来のMUSIC法に比べて、優れた角度分解能を持つことが確認された。(なお、角度分解能は、信号のスパース性の程度に依存する。)
[変形例等]
《変形例1》
変形例1では、偏角正規化部122において、
Figure 0004676893
とする代わりに、観測信号ベクトルの大きさ|Xq(f,τ)|を用いずに、位相を表す項のみを用いる。すなわち、偏角正規化部122において、
Figure 0004676893
の演算を行うことにより、第1正規化ベクトルX'(f,τ)を求めることもできる。
《変形例2》
変形例2では、偏角正規化部122において、式(10)の代わりに、式(10)の指数の肩の項のみを用いて、
Figure 0004676893
の演算を行うことにより、第1正規化ベクトルX'(f,τ)を求めることもできる。
また、変形例2は、図6に示す角度計算部127aを有する。すなわち、変形例2においては、図6に示すように、角度計算部127aの積計算部129aにおいて、式(21)の演算ではなく、
Figure 0004676893
の演算を行い、第1到来方向ベクトルv’を求める。これに続けてノルム正規化部130において、
Figure 0004676893
の演算を行い、第2到来方向ベクトルvを推定する。
《変形例3》
変形例3では、偏角正規化部122において、式(10)の代わりに、
Figure 0004676893
の演算を行うことにより、第1正規化ベクトルX'(f,τ)を求める。
観測信号ベクトル正規化部121内の偏角正規化部122において、式(29)ではなく式(32)の演算を行う点のみが、変形例2と異なり、その他の機能構成・処理は変形例2の場合と同一である。
《変形例4》
変形例4においては、正立方体のある頂点と、それに隣り合う3つの頂点に、すなわち、例えば、図9(c)に示すように、[d,d,d,d=A[(0,0,0),(1,0,0),(0,1,0),(0,0,1)(A:ある定数)のようにセンサを配置する。
この場合、原点(0,0,0)を基準Qに他のセンサ位置を正規化したベクトルDの一般化逆行列Dは、
Figure 0004676893
となる。この場合、任意のM次元ベクトルaに対して、Da=a/Aとなるため、角度計算部127における逆行列演算部128と積計算部129を省略することができる。
変形例4では、観測信号ベクトル正規化部121において式(10)の後に式(12)の正規化を行った後、クラスタリング部126でクラスタリングされた結果得られたセントロイドベクトルcについて、図7(a)に示す角度計算部127bの偏角計算部131aにおいて、
Figure 0004676893
の演算をして、偏角arg[c]を求めて、その結果を第1到来方向ベクトルv’とする。そして、ノルム正規化部130において、
Figure 0004676893
の演算を行い、第2到来方向ベクトルvを求める。
なお、上記の変形例4では、式(10)を用いて観測信号ベクトルを正規化したが、式(28)を用いて正規化しても良い。
《変形例5》
変形例5においては、変形例4の場合と同様に、正立方体のある頂点と、それに隣り合う3つの頂点に、すなわち、[d,d,d,d=A[(0,0,0),(1,0,0),(0,1,0),(0,0,1)(A:ある定数)のようにセンサを配置する。
その後、観測信号ベクトル正規化部121において式(29)又は式(32)の正規化を行った後、式(12)のノルム正規化を行い、クラスタリング部126でクラスタリングされた結果得られたセントロイドベクトルcについて、図7(b)に示す角度計算部127cの偏角計算部131bにおいて、
Figure 0004676893
の演算を行い、その結果を第1到来方向ベクトルv’とする。そして、ノルム正規化部130において、式(35)の演算を行い、第2到来方向ベクトルvを求める。
《変形例6》
ここまでは、全ての時間周波数(f,τ)における正規化された観測信号ベクトルをクラスタリング部126におけるクラスタリングの対象としていたが、このクラスタリングを周波数f毎に行い、その後全ての周波数での到来方向推定の結果を統合しても良い。これには例えば、全ての周波数での到来方向推定結果を再度クラスタリングし、そのセントロイドを最終的な到来方向推定結果として用いれば良い。
《その他の変形例》
上述では、センサ位置情報を表す行列Dの一般化逆行列Dを用いる場合と、これを用いない場合としたが、例えば角度計算部127にセンサ配置法判定部132を設け、センサの配置状態が正立方体の頂点に配置されたものか否かを判定し、その判定結果に応じて、その後の処理を、前記一般化逆行列を求める場合と、これを用いない場合とに区別するようにしても良い。センサ配置法判定部132としては、例えば、予めセンサ配置法が知られ、正立方体頂点位置に配されているか否かを示す情報が入力部20(図1)から入力され、メモリ100のいずれかの領域に格納され、この情報からセンサ配置法を判断する。あるいは、各センサ位置情報d(q=1,...,M)から、これらが正立方体頂点位置に配された関係にあるかを演算により判断しても良い。
また、本発明は上述の実施の形態に限定されるものではない。例えば、上述の実施の形態では、ノルム正規化部122においてノルムが1になるような正規化を行ったが、ノルムが1以外の規定値となるように正規化を行ってもよい。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD
−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、上述した実施形態とは別の実行形態として、コンピュータが可搬型記録媒体から直接このプログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本技術により、例えば、様々な妨害信号・干渉音が存在する環境下においても、それぞれの信号の到来方向を精度よく推定することが可能となる。
例えば、オーディオ分野に応用として、ロボット聴覚やテレビ会議システムなどがある。これらにおいては、複数の音声や音楽などが混在する状況が起こりやすく、また同時に入力マイクロホンと話者が離れた位置になりやすいため、マイクロホンが複数の音を同時に収音してしまう。このような状況でも、それぞれの音の方向を推定できることで、ロボットにおいてはロボットカメラを向けることが、テレビ会議システムにおいては話者の方向情報をも含めた情報の通信が可能となり、ステレオ受聴や会議システムのカメラを話者へ向けることが可能となる。
本発明の実施形態における信号到来方向推定装置のハードウェア構成を例示したブロック図。 本発明の実施形態における信号到来方向推定装置のブロック図。 本発明の実施形態における信号到来方向推定装置の処理の全体を説明するためのフローチャート。 (a)は、図3中のステップS2の詳細例を説明するためのフローチャート、(b)は、図3中のステップS3の詳細例を説明するためのフローチャート。 図3中のステップS5の詳細例を説明するためのフローチャート。 変形例2及び変形例3における角度計算部の詳細例を示したブロック図。 (a)は、変形例4における角度計算部の詳細例を示したブロック図、(b)は、変形例5における角度計算部の詳細例を示したブロック図。 (a)は、従来の到来方向推定問題について説明する図、(b)は、本発明における信号の到来方向を定義する図。 (a)は、本発明法の信号の到来方向推定問題を定義する図、(b)は、実験条件を示した図、(c)は、変形例4及び変形例5におけるセンサ位置を表した図。 (1)及び(2)は、実験結果を示した図。
符号の説明
1 信号到来方向推定装置

Claims (14)

  1. 複数の信号源から発せられた信号を3つ以上のセンサで観測し、観測された観測信号を用いて個々の信号の到来方向を推定する装置であって、
    前記観測信号を周波数領域の周波数領域観測信号に変換する周波数領域変換手段と、
    前記周波数領域観測信号から構成される観測信号ベクトルの要素の位相を、前記観測信号ベクトルの1つの要素の位相を基準として正規化し、第1正規化ベクトルを算出する偏角正規化手段と、
    前記第1正規化ベクトルを、ノルムが所定の値になる第2正規化ベクトルに正規化するノルム正規化手段と、
    前記第2正規化ベクトルをクラスタリングし、各クラスタのセントロイドベクトルを算出するクラスタリング手段と、
    前記各セントロイドベクトルと前記センサの位置情報とを用いて、各信号の第1到来方向ベクトルを算出する角度計算手段と、
    前記第1到来方向ベクトルを、ノルムが1になる第2到来方向ベクトルに正規化し、当該第2到来方向ベクトルを到来方向ベクトルとするノルム正規化手段と、
    を有することを特徴とする信号到来方向推定装置。
  2. 請求項1記載の信号到来方向推定装置であって、
    前記偏角正規化手段が、
    Mを前記センサの数とし、q=1,...,Mとし、前記観測信号ベクトルの各要素をXq(f,τ)とし、arg(*)を*に対する偏角とし、jを虚数単位とし、cを信号の伝達速度とし、QをM以下の自然数から選択された値とし、αを正数とし、fを周波数とし、τを離散時間とした場合における、
    Figure 0004676893
    の演算を行い、
    当該演算結果を前記第1正規化ベクトルの各要素とする手段である、
    ことを特徴とする信号到来方向推定装置。
  3. 請求項1記載の信号到来方向推定装置であって、
    前記偏角正規化手段が、
    Mを前記センサの数とし、q=1,...,Mとし、前記観測信号ベクトルの各要素をXq(f,τ)とし、arg(*)を*に対する偏角とし、jを虚数単位とし、cを信号の伝達速度とし、QをM以下の自然数から選択された値とし、αを正数とし、fを周波数とし、τを離散時間とした場合における、
    Figure 0004676893
    の演算を行い、
    当該演算結果を前記第1正規化ベクトルの各要素とする手段である、
    ことを特徴とする信号到来方向推定装置。
  4. 請求項1記載の信号到来方向推定装置であって、
    前記偏角正規化手段が、
    Mを前記センサの数とし、q=1,...,Mとし、前記観測信号ベクトルの各要素をXq(f,τ)とし、arg(*)を*に対する偏角とし、jを虚数単位とし、cを信号の伝達速度とし、QをM以下の自然数から選択された値とし、αを正数とし、fを周波数とし、τを離散時間とした場合における、
    Figure 0004676893
    の演算を行い、
    当該演算結果を前記第1正規化ベクトルの各要素とする手段である、
    ことを特徴とする信号到来方向推定装置。
  5. 請求項1記載の信号到来方向推定装置であって、
    前記偏角正規化手段が、
    Mを前記センサの数とし、q=1,...,Mとし、前記観測信号ベクトルの各要素をXq(f,τ)とし、arg(*)を*に対する偏角とし、QをM以下の自然数から選択された値とし、fを周波数とし、τを離散時間とした場合における、
    Figure 0004676893
    の演算を行い、
    当該演算結果を前記第1正規化ベクトルの各要素とする手段である、
    ことを特徴とする信号到来方向推定装置。
  6. 請求項2又は3記載の信号到来方向推定装置であって、
    前記角度計算手段が、
    前記各セントロイドベクトルの偏角と前記センサの位置情報を表す行列の一般化逆行列との積を計算して各信号の第1到来方向ベクトルを求める手段である、
    ことを特徴とする信号到来方向推定装置。
  7. 請求項4又は5記載の信号到来方向推定装置であって、
    前記角度計算手段が、
    前記各セントロイドベクトルと前記センサの位置情報を表す行列の一般化逆行列との積を計算して各信号の第1到来方向ベクトルを求める手段である、
    ことを特徴とする信号到来方向推定装置。
  8. 請求項2又は3記載の信号到来方向推定装置であって、
    (1)前記周波数領域変換手段が、
    正立方体のある頂点とそれにとなりあう3つの頂点に配置された複数のセンサにおいて観測された観測信号を周波数領域の周波数領域観測信号に変換する周波数領域変換手段であり、
    (2)前記角度計算手段が、
    前記各セントロイドベクトルの偏角を計算して各信号の第1到来方向ベクトルを求める手段である、
    ことを特徴とする信号到来方向推定装置。
  9. 請求項4又は5記載の信号到来方向推定装置であって、
    (1)前記周波数領域変換手段が、
    正立方体のある頂点とそれにとなりあう3つの頂点に配置された複数のセンサにおいて観測された観測信号を周波数領域の周波数領域観測信号に変換する周波数領域変換手段であり、
    (2)前記角度計算手段が、
    前記各セントロイドベクトルを第1到来方向ベクトルとする手段である、
    ことを特徴とする信号到来方向推定装置。
  10. 請求項2,3,6,8のいずれかに記載の信号到来方向推定装置であって、
    前記クラスタリング手段が、
    Mを前記センサの数とし、dを正数とし、dをセンサqの位置情報とし、v=[cosθcosφ,sinθcosφ,sinφ]とし、θを0≦θ≦360°、φを0≦φ≦180°の範囲から選んだ値とした場合における、
    Figure 0004676893
    をk=1,...,N,q=1,...,Mについて計算し、
    当該計算結果であるcをセントロイドベクトルの初期値としてクラスタリングを行う手段である、
    ことを特徴とする信号到来方向推定装置。
  11. 複数の信号源から発せられた信号を3つ以上のセンサで観測し、観測された観測信号を用いて個々の信号の到来方向を推定する方法であって、
    周波数領域変換手段において、前記観測信号を周波数領域の周波数領域観測信号に変換する過程と、
    偏角正規化手段において、前記周波数領域観測信号から構成される観測信号ベクトルの要素の位相を、前記観測ベクトルの1つの要素の位相を基準として正規化し、第1正規化ベクトルを算出する過程と、
    ノルム正規化手段において、前記第1正規化ベクトルを、ノルムが1になる第2正規化ベクトルに正規化する過程と、
    クラスタリング手段において、前記第2正規化ベクトルをクラスタリングし、各クラスタのセントロイドベクトルを算出する過程と、
    角度計算手段において、前記各セントロイドベクトルと前記センサの位置情報とを用いて、各信号の第1到来方向ベクトルを算出する過程と、
    ノルム正規化手段において、前記第1到来方向ベクトルを、ノルムが1になる第2到来方向ベクトルに正規化し、当該第2到来方向ベクトルを到来方向ベクトルとする過程と、
    を有することを特徴とする信号到来方向推定方法。
  12. 請求項11記載の信号到来方向推定方法であって、
    前記周波数領域変換手段が、
    正立方体のある頂点とそれにとなりあう3つの頂点に配置された複数のセンサにおいて観測された観測信号を周波数領域の周波数領域観測信号に変換する過程である、
    ことを特徴とする信号到来方向推定方法。
  13. 請求項1から10の何れかに記載の信号到来方向推定装置としてコンピュータを機能させるための信号到来方向推定プログラム。
  14. 請求項13記載の信号到来方向推定プログラムを格納したコンピュータ読み取り可能な記録媒体。
JP2006019627A 2006-01-27 2006-01-27 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体 Active JP4676893B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006019627A JP4676893B2 (ja) 2006-01-27 2006-01-27 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006019627A JP4676893B2 (ja) 2006-01-27 2006-01-27 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JP2007198977A JP2007198977A (ja) 2007-08-09
JP4676893B2 true JP4676893B2 (ja) 2011-04-27

Family

ID=38453719

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006019627A Active JP4676893B2 (ja) 2006-01-27 2006-01-27 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP4676893B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5503994B2 (ja) * 2010-02-09 2014-05-28 株式会社東芝 信号到来方向推定方法
JP2014157110A (ja) * 2013-02-18 2014-08-28 Mitsubishi Electric Corp 信号処理装置、レーダ装置および信号処理方法
US9389305B2 (en) * 2013-02-27 2016-07-12 Mitsubishi Electric Research Laboratories, Inc. Method and system for compressive array processing
DE102014217681B4 (de) * 2014-09-04 2020-12-10 Imra Europe S.A.S. Sirenensignalquellenerfassung, -Erkennung und -Lokalisation
WO2019187589A1 (ja) * 2018-03-29 2019-10-03 ソニー株式会社 音源方向推定装置、音源方向推定方法、プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1942932B (zh) * 2005-02-08 2010-07-28 日本电信电话株式会社 信号分离装置和信号分离方法

Also Published As

Publication number Publication date
JP2007198977A (ja) 2007-08-09

Similar Documents

Publication Publication Date Title
Diaz-Guerra et al. Robust sound source tracking using SRP-PHAT and 3D convolutional neural networks
JP6620140B2 (ja) 2次元センサーアレイを用いて3次元波動場の3次元波動場表現を構築するための方法、コンピューター可読記憶媒体及び装置
Rafaely Phase-mode versus delay-and-sum spherical microphone array processing
JP4406428B2 (ja) 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
CN105981404B (zh) 使用麦克风阵列的混响声的提取
KR102087307B1 (ko) 잔향 환경에 강인한 음원 방향 추정을 위한 심화 신경망 기반의 앙상블 음원 방향 추정 방법 및 장치
JP4676893B2 (ja) 信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体
JP2016537622A (ja) 音源の位置を特定する方法、および当該方法を用いる人型ロボット
Rafaely et al. Spherical microphone array beam steering using Wigner-D weighting
Laufer-Goldshtein et al. A study on manifolds of acoustic responses
Diaz-Guerra et al. Direction of arrival estimation of sound sources using icosahedral CNNs
KR102097641B1 (ko) 구형 마이크로폰 어레이를 이용한 음원의 입사 방향 추정방법
Salvati et al. Incident signal power comparison for localization of concurrent multiple acoustic sources
JP4738284B2 (ja) ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体
US10986444B2 (en) Modeling room acoustics using acoustic waves
Herzog et al. Generalized intensity vector and energy density in the spherical harmonic domain: Theory and applications
JP2018077139A (ja) 音場推定装置、音場推定方法、プログラム
JP7207539B2 (ja) 学習データ拡張装置、学習データ拡張方法、およびプログラム
Dehghan Firoozabadi et al. A novel nested circular microphone array and subband processing-based system for counting and DOA estimation of multiple simultaneous speakers
Torres et al. Room acoustics analysis using circular arrays: A comparison between plane-wave decomposition and modal beamforming approaches
JP2007226036A (ja) 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体、並びに、信号到来方向推定装置、信号到来方向推定方法、信号到来方向推定プログラム及び記録媒体
JP2019050492A (ja) フィルタ係数決定装置、フィルタ係数決定方法、プログラム、および音響システム
JP2017130899A (ja) 音場推定装置、その方法及びプログラム
Chen et al. Sound source DOA estimation and localization in noisy reverberant environments using least-squares support vector machines
Zhu et al. IFAN: An Icosahedral Feature Attention Network for Sound Source Localization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110128

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140204

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4676893

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350