JP2017151220A - 音源定位装置、方法、及びプログラム - Google Patents
音源定位装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2017151220A JP2017151220A JP2016032364A JP2016032364A JP2017151220A JP 2017151220 A JP2017151220 A JP 2017151220A JP 2016032364 A JP2016032364 A JP 2016032364A JP 2016032364 A JP2016032364 A JP 2016032364A JP 2017151220 A JP2017151220 A JP 2017151220A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- sound source
- sound
- observation
- directions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】空間差分算出部22が、複数の方向の各々に対し、観測信号の差分を算出し、時間周波数展開部24が、基準のマイクロホンにより入力された前記観測信号を入力として、各周波数の観測時間周波数成分を出力すると共に、複数の方向の各々に対して算出された前記観測信号の差分を入力として、前記複数の方向の各々に対して、各周波数の観測時間周波数成分を出力する。音源位置推定部25が、音源拘束偏微分方程式の周波数領域表現を用いて定められた、複数の音源と加法雑音が存在する場合における、複数の音源の各々の位置を条件とした、基準のマイクロホンの各周波数の観測時間周波数成分、及び複数の方向の各々に対する各周波数の観測時間周波数成分の確率密度値を大きくするように、複数の音源の各々の位置を推定する。
【選択図】図3
Description
本発明の実施の形態は、上述した従来手法の利点を併せ持つ、小領域・瞬時観測による複数音源の波源定位を可能にする技術である。
次に、音源の位置を推定する原理について説明する。
図1に示すように、観測点の基準となる位置ベクトルを
とし、単一波源の位置ベクトルを
とする。波源の信号をg(t)、音速をc とし、単一点波源からの球面波伝播を仮定すると観測点における観測値は
と表される。ここで、
である。観測点から波源方向へ向かう単位ベクトルをn とすると、
であるため、f(r, t) の空間微分は、
となる。また、f(r, t) の時間微分は
となるので、式(1) と式(8) を式(7) に代入することでgが消去され、
のように、観測信号とその時間・空間微分のみを含む方程式を立てることができる。ただし、R = |r − r0|は観測点から波源までの距離である。この式を音源拘束式と呼ぶ(上記非特許文献1〜3)。以上のように音源拘束式は、任意の音源信号波形で成り立つ、音源の位置と空間の場の一意な関係を記述する偏微分方程式である。
図2のようなマイクロホンアレイで、観測信号の空間微分を空間差分で近似する場合を考える。図2に示す観測信号fの空間微分を取得するためのアレイ幾何の例では、例えばx方向のfの空間微分は、(f1,t −f2,t)/2Dで近似できる。
を得ることができる。ただし、lは離散時刻のインデックスを表す。
と表せる。ただし、nx、ny、nz はそれぞれ のx, y, z 方向の成分、T はサンプリング周期である。
が得られる。ここで、f0,l, fx,l, fy,l, fz,l を窓関数で窓掛けして取得された信号とする。切り出し区間の両端点の影響を無視できるものとすると、式(11) は周波数領域で
と表される。ただし、F0,m, Fx,m, Fy,m, Fz,m はf0,m, fx,m, fy,m, fz,m の離散Fourier 変換であり、m は離散周波数インデックスである。
のように誤差変数εx,m, εy,m, εz,m に置き換え、これらを平均が0 で互いに独立な正規確率変数(複素正規分布に従う確率変数)
と仮定する。また、観測点における観測信号の各周波数成分を平均が0、分散がσ2 0,m の正規確率変数とする。これは、
と仮定することに相当する。
とし、f0,..., fL/2 を連結したベクトルとε0,...,εL/2を連結したベクトルを
と表記すると、式(13) は
の形で書ける。ただし、θ= {R,n} であり、A(θ) は
で与えられる。式(14), (16) より、εは平均が0、分散共分散行列が
の複素正規分布
に従う。
(A(θ) は正則)であるので、f は
と表され、式(24) より、
が言える。従って、観測信号およびその空間差分が与えられた下での最尤音源位置^θは
により得られる。
以上のf の確率モデル化により、音源が複数個存在する場合、および雑音が存在する場合の観測信号の確率分布を導くことができる。音源インデックスをk とし、音源k に由来する観測信号の成分、音源位置パラメータをそれぞれf(k)、θ(k) とする。また、f(k) の周波数m の成分エネルギーをσ(k) 0,m 2 とする。式(29) より、
となる。また、加法雑音をvとし、観測信号を
とする。f(1),・・・,f(K),vが互いに独立であれば、観測信号y は
に従う。ただし、Γはvの分散共分散行列である。以上より、複数の音源と雑音が存在する場合の各音源の最尤音源位置
は、観測信号
が与えられた下で
を解くことにより得られる。
を完全データと見なすことで、以上の最尤推定問題に対しExpectation-Maximization (EM) アルゴリズムを適用することができる。完全データ対数尤度log p(x|θ) は
で与えられるので、y が与えられた下でのlog p(x|θ) のx に関する条件付き期待値(Q 関数)は
で与えられる。ただし、
はx に関係する項のみについての等号を意味する。この関数が増大するようにθを更新するステップ(M ステップ)と、更新したθをθ´に代入し、
と
を計算するステップ(E ステップ)を繰り返すことでp(y|θ) を局所的に最大にするθを求めることができる。
と書けるので、
はそれぞれ
で与えられる。以上より、以下の初期設定、Eステップ、Mステップからなるアルゴリズムを得る。
θを初期設定する。
θをθ´に代入し、式(39) により
を計算する。
下式によりθを更新する。
A(θ(k)) はC1(θ(k)),...,CL(θ(k)) を対角に並べたブロック対角行列なので、
と書かれる。ただし、
である。また、Φ(k) m はΦ(k)の4×4のブロック対角成分である。
n(k)は単位ベクトルなので、
の下で
ができるだけ小さくなるようにn(k) を更新する。この制約つき最適化問題は、
のようなラグランジアンを用いてLagrange 未定乗数法で解くことができる。i 行j 列目の要素のみが1 で残りは0 であるような4×4 行列をEi,jとすると、Cm(θ(k)) は
のようにn(k)に依存する項とそうでない項に分解できるので、L(n(k)) のn(k) に関する偏微分
を0 と置くことにより、
を得る。ただし、[・]i,j は行列のi 行j 列目の成分を表す。
より、あとはn(k) x 2+n(k) y 2+n(k) z 2= 1 となるようにγ(k)を二分法などで探索し、式(52)〜(54) に代入すれば良い。
とする。上記と同様、Cm(θ(k)) は
のようにρ(k) に依存する項とそうでない項に分解することができるので、Q(θ,θ´) のρ(k)に関する偏微分
を0 と置くことにより、
を得る。行列要素ごとの表記にすると
となる。ただし、
である。式(60) の分子における
はFast Fourier Transform (FFT) を用いて効率的に計算することができる。
上記と同様、Σ(k)-1 mを
のようにσ(k) 0,m 2 に依存する項とそうでない項に分解できるので、Q(θ,θ´) のσ(k) 0,m 2 に関する偏微分を0 と置くことにより、
を得る。
雑音の分散共分散行列を
のように、正規化分散共分散行列モデルWm と周波数mの成分エネルギーν2 mの積で表し、ν2 mを推定すべき変数とする。後述するがWm は空間無相関モデルや拡散音場モデルなどから導かれる定数行列である。Q(θ,θ´) のν2 に関する偏微分を0 と置くことにより、
を得る。
ここでは雑音の空間相関行列から正規化分散共分散行列モデルWm の設定例を述べる。図2 のような7 本のマイクロホンの配置を想定する。ここで,fi,0,...,fi,L-1のFourier 変換をFi,0,...,Fi,L-1とする。~fm = (F0,m,...,F6,m)Tおよびfm = (Fx,m, Fy,m, Fz,m, F0,m)T の関係は
と書かれることから、~fm= (F0,m,...,F6,m)T の分散共分散行列をΨm とすると、fmの分散共分散行列はBΨmBT となる。従って、例えば空間的に無相関で等しいパワーの雑音を仮定する場合、Ψm は単位行列となるため、fmの分散共分散行列Wm を
と置けば良い。
で与えられる。従って、拡散性雑音を仮定する場合、図2 のようなアレイ幾何の例では、~fm =(F0,m,...,F6,m)Tの分散共分散行列Ψm は
となる。これを用いて、fmの分散共分散行列Wm をBΨmBT と置けば良い。
次に、マイクロホンアレイにより入力された音響信号から、複数の音源の位置を推定する音源定位装置に、本発明を適用した場合を例にして、本発明の実施の形態を説明する。
を計算する。
に基づいて、Q(θ,θ´) ができるだけ大きくなるように、上記式(52)〜式(54)、式(60)、式(64)、式(66)、式(67)に従って、各音源kの方向ベクトルn(k),音源距離R(k),成分エネルギーσ(k) 0,m 2,雑音共分散行列Γ を更新する。
次に、本実施の形態に係る音源定位装置100の作用について説明する。
を計算する。
に基づいて、Q(θ,θ´) ができるだけ大きくなるように、上記式(52)〜式(54)、式(60)、式(64)、式(66)、式(67)に従って、各音源kの方向ベクトルn(k),音源距離R(k),成分エネルギーσ(k) 0,m 2,雑音共分散行列Γ を更新する。
以下の条件で残響環境下の音源定位実験を行った。
音源数: 1(+ 拡散雑音)
音源位置: マイク中心+ [-1.73; 1.0; 0.0], マイク中心+[2.0; 2.0; 0.0], マイク中心+[0.0; -2.0; 0.0]
部屋サイズ: [6.0; 10.0; 8.0] (中心にマイクを配置)
壁面の反射係数: 0.01, 0.5, 0.8(残響の影響の大きさに相当)
マイク間隔: 0.01, 0.1 [m]
フレーム幅: 16, 32, 64 [点]
実験フレーム数: 2x10(ファイル) (無音区間は含まれていない)
20 演算部
22 空間差分算出部
24 時間周波数展開部
25 音源位置推定部
26 期待値算出部
28 変数更新部
30 収束判定部
90 出力部
100 音源定位装置
Claims (7)
- マイクロホンアレイにより入力された複数の音源からの音源信号が混合された観測信号から、前記複数の音源の各々の位置を推定する音源定位装置であって、
複数の方向の各々に対し、前記マイクロホンアレイのうち、前記方向に並んだマイクロホンのペアにより入力された前記観測信号の差分を算出する空間差分算出部と、
前記マイクロホンアレイのうち、基準のマイクロホンにより入力された前記観測信号を入力として、各周波数の観測時間周波数成分を出力すると共に、前記空間差分算出部によって前記複数の方向の各々に対して算出された前記観測信号の差分を入力として、前記複数の方向の各々に対して、各周波数の観測時間周波数成分を出力する時間周波数展開部と、
前記時間周波数展開部により出力された、前記基準のマイクロホンの各周波数の観測時間周波数成分、及び前記複数の方向の各々に対する各周波数の観測時間周波数成分に基づいて、音源拘束偏微分方程式の周波数領域表現を用いて定められた、前記複数の音源と加法雑音が存在する場合における、前記複数の音源の各々の位置を条件とした、前記基準のマイクロホンの各周波数の観測時間周波数成分、及び前記複数の方向の各々に対する各周波数の観測時間周波数成分の確率密度値を大きくするように、前記複数の音源の各々の位置を推定する音源位置推定部と、
を含む音源定位装置。 - 前記確率密度値は、以下の式で表わされる請求項1記載の音源定位装置。
ただし、ymが、前記基準のマイクロホンの周波数mの観測時間周波数成分、及び前記複数の方向の各々に対する周波数mの観測時間周波数成分を表し、Γmは、前記加法雑音の周波数mの分散共分散行列であり、θ(k)は、音源kの位置を表し、σx,m (k)2、σy,m (k)2、σz,m (k)2は、音源kからの音源信号の方向x、y、zの差分における周波数mの成分エネルギーを表し、σ0,m (k)2は、音源kからの音源信号の前記基準のマイクロホンにおける周波数mの成分エネルギーを表し、Rは、音源までの距離を表し、cは、音速を表し、Lは、周波数のインデッックスを規定するための定数であり、Tは、サンプリング周期を表し、nx、ny、nzは、音源へ向かう単位ベクトルの方向x、y、zの成分を表す。 - 前記音源位置推定部は、EM(Expectation-Maximization)アルゴリズムにより、前記確率分布が大きくなるように、複数の音源kの各々までの距離R(k)、前記複数の音源kの各々へ向かう単位ベクトルn(k)、前記複数の音源kの各々の方向x、y、zの差分における周波数mの成分エネルギーσx,m (k)2、σy,m (k)2、σz,m (k)2、前記複数の音源kの各々の前記基準のマイクロホンにおける周波数mの成分エネルギーσ0,m (k)2、及び前記加法雑音の周波数mの分散共分散行列Γmを繰り返し更新することにより、前記複数の音源の各々の位置を推定する請求項2記載の音源定位装置。
- マイクロホンアレイにより入力された複数の音源からの音源信号が混合された観測信号から、前記複数の音源の各々の位置を推定する音源定位装置における音源定位方法であって、
空間差分算出部が、複数の方向の各々に対し、前記マイクロホンアレイのうち、前記方向に並んだマイクロホンのペアにより入力された前記観測信号の差分を算出し、
時間周波数展開部が、前記マイクロホンアレイのうち、基準のマイクロホンにより入力された前記観測信号を入力として、各周波数の観測時間周波数成分を出力すると共に、前記空間差分算出部によって前記複数の方向の各々に対して算出された前記観測信号の差分を入力として、前記複数の方向の各々に対して、各周波数の観測時間周波数成分を出力し、
音源位置推定部が、前記時間周波数展開部により出力された、前記基準のマイクロホンの各周波数の観測時間周波数成分、及び前記複数の方向の各々に対する各周波数の観測時間周波数成分に基づいて、音源拘束偏微分方程式の周波数領域表現を用いて定められた、前記複数の音源と加法雑音が存在する場合における、前記複数の音源の各々の位置を条件とした、前記基準のマイクロホンの各周波数の観測時間周波数成分、及び前記複数の方向の各々に対する各周波数の観測時間周波数成分の確率密度値を大きくするように、前記複数の音源の各々の位置を推定する
音源定位方法。 - 前記確率密度値は、以下の式で表わされる請求項4記載の音源定位方法。
ただし、ymが、前記基準のマイクロホンの周波数mの観測時間周波数成分、及び前記複数の方向の各々に対する周波数mの観測時間周波数成分を表し、Γmは、前記加法雑音の周波数mの分散共分散行列であり、θ(k)は、音源kの位置を表し、σx,m (k)2、σy,m (k)2、σz,m (k)2は、音源kからの音源信号の方向x、y、zの差分における周波数mの成分エネルギーを表し、σ0,m (k)2は、音源kからの音源信号の前記基準のマイクロホンにおける周波数mの成分エネルギーを表し、Rは、音源までの距離を表し、cは、音速を表し、Lは、周波数のインデッックスを規定するための定数であり、Tは、サンプリング周期を表し、nx、ny、nzは、音源へ向かう単位ベクトルの方向x、y、zの成分を表す。 - 前記音源位置推定部が推定することでは、EM(Expectation-Maximization)アルゴリズムにより、前記確率密度値が大きくなるように、複数の音源kの各々までの距離R(k)、前記複数の音源kの各々へ向かう単位ベクトルn(k)、前記複数の音源kの各々の方向x、y、zの差分における周波数mの成分エネルギーσx,m (k)2、σy,m (k)2、σz,m (k)2、前記複数の音源kの各々の前記基準のマイクロホンにおける周波数mの成分エネルギーσ0,m (k)2、及び前記加法雑音の周波数mの分散共分散行列Γmを繰り返し更新することにより、前記複数の音源の各々の位置を推定する請求項5記載の音源定位方法。
- 請求項1〜請求項3の何れか1項に記載の音源定位装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016032364A JP6529451B2 (ja) | 2016-02-23 | 2016-02-23 | 音源定位装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016032364A JP6529451B2 (ja) | 2016-02-23 | 2016-02-23 | 音源定位装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017151220A true JP2017151220A (ja) | 2017-08-31 |
JP6529451B2 JP6529451B2 (ja) | 2019-06-12 |
Family
ID=59740709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016032364A Active JP6529451B2 (ja) | 2016-02-23 | 2016-02-23 | 音源定位装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6529451B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11802932B2 (en) | 2018-03-07 | 2023-10-31 | Nec Corporation | Transmission source position estimation system, transmission source position estimation method, and transmission source position estimation program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030185410A1 (en) * | 2002-03-27 | 2003-10-02 | Samsung Electronics Co., Ltd. | Orthogonal circular microphone array system and method for detecting three-dimensional direction of sound source using the same |
JP2008070339A (ja) * | 2006-09-15 | 2008-03-27 | Univ Of Tokyo | 音源定位方法及び音源定位装置 |
JP2011179888A (ja) * | 2010-02-26 | 2011-09-15 | Nissan Motor Co Ltd | 波動源位置演算方法及び波動源位置演算装置 |
-
2016
- 2016-02-23 JP JP2016032364A patent/JP6529451B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030185410A1 (en) * | 2002-03-27 | 2003-10-02 | Samsung Electronics Co., Ltd. | Orthogonal circular microphone array system and method for detecting three-dimensional direction of sound source using the same |
JP2008070339A (ja) * | 2006-09-15 | 2008-03-27 | Univ Of Tokyo | 音源定位方法及び音源定位装置 |
JP2011179888A (ja) * | 2010-02-26 | 2011-09-15 | Nissan Motor Co Ltd | 波動源位置演算方法及び波動源位置演算装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11802932B2 (en) | 2018-03-07 | 2023-10-31 | Nec Corporation | Transmission source position estimation system, transmission source position estimation method, and transmission source position estimation program |
Also Published As
Publication number | Publication date |
---|---|
JP6529451B2 (ja) | 2019-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2017150903A (ja) | 音源定位装置、方法、及びプログラム | |
JP6623185B2 (ja) | 音源定位装置、方法、及びプログラム | |
Talmon et al. | Supervised source localization using diffusion kernels | |
Talmon et al. | Parametrization of linear systems using diffusion kernels | |
JP2018063200A (ja) | 音源位置推定装置、音源位置推定方法、及びプログラム | |
US20160086093A1 (en) | Passive Tracking of Underwater Acoustic Sources with Sparse Innovations | |
CN111123192A (zh) | 一种基于圆形阵列和虚拟扩展的二维doa定位方法 | |
Padois et al. | Time domain localization technique with sparsity constraint for imaging acoustic sources | |
JP6106571B2 (ja) | 音源位置推定装置、方法及びプログラム | |
Saqib et al. | Estimation of acoustic echoes using expectation-maximization methods | |
Annibale et al. | Closed-form estimation of the speed of propagating waves from time measurements | |
JP6529451B2 (ja) | 音源定位装置、方法、及びプログラム | |
Coutino et al. | Greedy alternative for room geometry estimation from acoustic echoes: A subspace-based method | |
Jing et al. | Acoustic source tracking based on adaptive distributed particle filter in distributed microphone networks | |
JP6488245B2 (ja) | 音源定位装置、方法、及びプログラム | |
Tichavsky et al. | Quasi-fluid-mechanics-based quasi-Bayesian Crame/spl acute/r-Rao bounds for deformed towed-array direction finding | |
Diao et al. | High-resolution DOA estimation achieved by a single acoustic vector sensor under anisotropic noise | |
EP4323806A1 (en) | System and method for estimating direction of arrival and delays of early room reflections | |
Madadi et al. | Three-dimensional localization of multiple acoustic sources in shallow ocean with non-Gaussian noise | |
Michalopoulou et al. | Sediment sound speed inversion with time-frequency analysis and modal arrival time probability density functions | |
Gburrek et al. | On source-microphone distance estimation using convolutional recurrent neural networks | |
US11886996B2 (en) | Training data extension apparatus, training data extension method, and program | |
Schwartz et al. | Blind microphone geometry calibration using one reverberant speech event | |
Kijima et al. | DOA estimation by 3-D microphone array in the presence of spatial aliasing | |
Guo et al. | Sound source localization by iterative Bayesian focusing algorithm in the inhomogeneous medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171211 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190514 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6529451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |