JP6531050B2 - 音源定位装置、方法、及びプログラム - Google Patents
音源定位装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6531050B2 JP6531050B2 JP2016032365A JP2016032365A JP6531050B2 JP 6531050 B2 JP6531050 B2 JP 6531050B2 JP 2016032365 A JP2016032365 A JP 2016032365A JP 2016032365 A JP2016032365 A JP 2016032365A JP 6531050 B2 JP6531050 B2 JP 6531050B2
- Authority
- JP
- Japan
- Prior art keywords
- source
- sound
- sound source
- sound sources
- observation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
本発明の実施の形態は、上述した従来手法の利点を併せ持つ、小領域・瞬時観測による複数音源の波源定位を可能にする技術である。
次に、音源の位置を推定する原理について説明する。
図1に示すように、観測点の基準となる位置ベクトルを
とし、単一波源の位置ベクトルを
とする。波源の信号をg(t)、音速をc とし、単一点波源からの球面波伝播を仮定すると観測点における観測値は
と表される。ここで、
である。観測点から波源方向へ向かう単位ベクトルをn とすると、
であるため、f(r, t) の空間微分は、
となる。また、f(r, t) の時間微分は
となるので、式(1) と式(8) を式(7) に代入することでgが消去され、
のように、観測信号とその時間・空間微分のみを含む方程式を立てることができる。ただし、R = |r − r0|は観測点から波源までの距離である。この式を音源拘束式と呼ぶ(上記非特許文献1〜3)。以上のように音源拘束式は、任意の音源信号波形で成り立つ、音源の位置と空間の場の一意な関係を記述する偏微分方程式である。
図2のようなマイクロホンアレイで、観測信号の空間微分を空間差分で近似する場合を考える。図2に示す観測信号fの空間微分を取得するためのアレイ幾何の例では、例えばx方向のfの空間微分は、(f1,t −f2,t)/2Dで近似できる。
を得ることができる。ただし、lは離散時刻のインデックスを表す。
と表せる。ただし、nx、ny、nz はそれぞれ のx, y, z 方向の成分、T はサンプリング周期である。
が得られる。式(11) の右辺は雑音の存在や差分近似に伴う誤差により実際には必ずしも厳密に0 にはならない。そこで、式(11) の右辺を
のように誤差変数εx,l, εy,l, εz,l に置き換え、これらを平均が0 で互いに独立な正規確率変数(複素正規分布に従う確率変数)
と仮定する。また、観測点における観測信号を、平均が0、分散がσ2 0の正規確率変数とする。これは、
と仮定することに相当する。
とし、f0,0, f1,..., fL を連結したベクトルとε0,0, ε1,...,εL を連結したベクトルを
と表記すると、式(12) は
の形で書ける。ただし、θ= {R,n} であり、A(θ) は
で与えられる。式(13), (15) より、εは平均が0、分散共分散行列が
の複素正規分布
に従う。
(A(θ) は正則)であるので、f は
と表され、式(27) より、
が言える。従って、観測信号およびその空間差分が与えられた下での最尤音源位置^θは
により得られる。
以上のf の確率モデル化により、音源が複数個存在する場合、および雑音が存在する場合の観測信号の確率分布を導くことができる。音源インデックスをk とし、音源k に由来する観測信号の成分、音源位置パラメータをそれぞれf(k)、θ(k) とする。また、f(k) の分散をσ(k) 0 2 とする。式(32) より、
となる。また、加法雑音をvとし、観測信号を
とする。f(1),・・・,f(K),vが互いに独立であれば、観測信号y は
に従う。ただし、Γはvの分散共分散行列である。以上より、複数の音源と雑音が存在する場合の各音源の最尤音源位置
は、観測信号yが与えられた下で
を解くことにより得られる。
を完全データと見なすことで、以上の最尤推定問題に対しExpectation-Maximization (EM) アルゴリズムを適用することができる。完全データ対数尤度log p(x|θ) は
で与えられるので、y が与えられた下でのlog p(x|θ) のx に関する条件付き期待値(Q 関数)は
で与えられる。ただし、
はx に関係する項のみについての等号を意味する。この関数が増大するようにθを更新するステップ(M ステップ)と、更新したθをθ´に代入し、
と
を計算するステップ(E ステップ)を繰り返すことでp(y|θ) を局所的に最大にするθを求めることができる。
と書けるので、
はそれぞれ
で与えられる。以上より、以下の初期設定、Eステップ、Mステップからなるアルゴリズムを得る。
θを初期設定する。
θをθ´に代入し、式(41) により
を計算する。
下式によりθを更新する。
Mステップでは、
ができるだけ大きくなるように
を更新する。
を最大にする
の同時最適解を解析的に求めることは難しいが、座標勾配法によりそれぞれの変数に関して
が最大となるように反復更新することで
を局所最大化することができる(EM アルゴリズムでは、M ステップで補助関数が単調に増大することが保証されていれば収束性は保証される)。以下に、M ステップの更新方法を2例示す。
<n(k)の更新式>
n(k)は単位ベクトルなので、
の下で
ができるだけ小さくなるようにn(k) を更新する。この制約つき最適化問題は、例えば、
のようなラグランジアンを用いてLagrange 未定乗数法で解くことができる。A(θ(k)) は
のようにn(k)に依存する項とそうでない項に分解できるので、L(n(k)) のn(k) に関する偏微分を0 と置くことにより、
を得る。ただし、Ei,jは、i 行j 列目の要素のみが1 で残りは0 であるような4×4 行列である。
より、あとは
となるようにγ(k)を二分法などで探索し、式(52)に代入すれば良い。
とする。上記と同様、A(θ(k)) は
のようにρ(k) に依存する項とそうでない項に分解することができるので、Q(θ,θ´) のρ(k)に関する偏微分を0 と置くことにより、
を得る。
上記と同様、Σ(k)-1を
のようにσ(k) 0,m 2 に依存する項とそうでない項に分解できるので、Q(θ,θ´) のσ(k) 0 2 に関する偏微分を0 と置くことにより、
を得る。
雑音の分散共分散行列を
のように、正規化分散共分散行列モデルW と雑音のエネルギーν2の積で表し、ν2 mを変数とする。W は空間無相関モデルや拡散音場モデルなどから導かれる定数行列である。Q(θ,θ´) のν2 に関する偏微分を0 と置くことにより、
を得る。
<音源位置ベクトルr(k)の更新式>
この例では例1と到来方向の更新の仕方のみが異なる。この例では
を変数とする。この場合はノルムの制約は不要なので、制約なし最適化問題として、Q(θ,θ´) を最大にするr(k) を求めれば良い。A(θ(k))は
のようにr(k) に依存する項とそうでない項に分解できるので,Q(θ,θ´)のr(k) に関する偏微分を0と置くことにより、
を得る。音源距離R(k)の更新式、σ(k) 0 2 の更新式、雑音分散共分散行列Γの更新式は例1と同様である。
式(41) より、Eステップでは
の逆行列計算が必要である。ここでは点音源が一つと雑音源が一つの場合と、点音源が二つの場合にこの逆行列計算が効率的に行えることを示す。
1音源と1雑音源の場合、(HΛHT)-1 は
と書ける。ここで、Woodbury の公式
を用いると、式(61)は
と書ける。Γはブロック対角行列、V1は帯行列(ブロック三重対角行列)なので、Γ-1+V1 は帯行列となり、(Γ-1+V1)V1 の計算はCholesky 分解を用いて効率的に行うことができる。
2音源の場合,(HΛHT)-1 は
と書ける。上記同様、Woodbury の公式を用いると、式(65) は
と書ける。V1 とV2 はいずれも帯行列なので、V2+V1も帯行列となり、(V2+V1)‐1V1の計算はCholesky 分解を用いて効率的に行うことができる。
次に、マイクロホンアレイにより入力された音響信号から、複数の音源の位置を推定する音源定位装置に、本発明を適用した場合を例にして、本発明の実施の形態を説明する。
を計算する。
に基づいて、Q(θ,θ´) ができるだけ大きくなるように、上記式(52)、式(54)、式(56)〜式(58)に従って、各音源kの方向ベクトルn(k),音源距離R(k),分散σ(k) 0 2,雑音共分散行列Γ を更新する。なお、上述した例2のように、上記式(60)、式(54)、式(56)〜式(58)に従って、各音源kの位置ベクトルr(k),音源距離R(k),分散σ(k) 0 2,雑音共分散行列Γ を更新する。
次に、本実施の形態に係る音源定位装置100の作用について説明する。
を計算する。
に基づいて、Q(θ,θ´) ができるだけ大きくなるように、上記式(52)、式(54)、式(56)〜式(58)に従って、に従って、各音源kの方向ベクトルn(k),音源距離R(k),分散σ(k) 0 2,雑音共分散行列Γ を更新する。
図5のように単一音源とマイクロホンアレイを配置し,以下の条件で雑音・残響環境下の音源定位実験を行った。
音源数: 1
部屋の反響を考慮した反射係数: 0.01, 0.5, 0.8
観測時間長: 64 点(4ms)
マイク間隔: 1cm
音源数: 2
部屋の反響を考慮した反射係数:0.01
観測時間長: 64 点(4ms)
マイク間隔: 1cm
20 演算部
22 空間差分算出部
25 音源位置推定部
26 期待値算出部
28 変数更新部
30 収束判定部
90 出力部
100 音源定位装置
Claims (5)
- マイクロホンアレイにより入力された複数の音源からの音源信号が混合された観測信号から、前記複数の音源の各々の位置を推定する音源定位装置であって、
複数の方向の各々に対し、前記マイクロホンアレイのうち、前記方向に並んだマイクロホンのペアにより入力された前記観測信号の差分を算出する空間差分算出部と、
前記マイクロホンアレイのうち、基準のマイクロホンにより入力された前記観測信号と、前記複数の方向の各々に対して算出された前記観測信号の差分とに基づいて、音源拘束偏微分方程式を用いて定められた、前記複数の音源と加法雑音が存在する場合における、前記複数の音源の各々の位置を条件とした、前記基準のマイクロホンの各時刻の観測信号、及び前記複数の方向の各々に対する各時刻の観測信号の差分の確率密度値を大きくするように、前記複数の音源の各々の位置を推定する音源位置推定部と、
を含み、
前記確率密度値は、以下の式で表わされる音源定位装置。
ただし、f(k)が、音源kからの観測される音源信号を表し、Γは、前記加法雑音の分散共分散行列であり、θ (k) は、音源kの位置を表し、σ x (k)2 、σ y (k)2 、σ z (k)2 は、音源kからの観測される音源信号の方向x、y、zの差分における分散を表し、σ 0 (k)2 は、音源kからの観測される音源信号の前記基準のマイクロホンにおける分散を表し、Rは、音源までの距離を表し、cは、音速を表し、Tは、サンプリング周期を表し、n x 、n y 、n z は、音源へ向かう単位ベクトルの方向x、y、zの成分を表す。 - 前記音源位置推定部は、EM(Expectation-Maximization)アルゴリズムにより、前記確率密度値が大きくなるように、複数の音源kの各々までの距離R(k)、前記複数の音源kの各々へ向かう単位ベクトルn(k)、前記複数の音源kの各々の前記基準のマイクロホンにおける分散0 (k)2、及び前記加法雑音の分散共分散行列Γを繰り返し更新することにより、前記複数の音源の各々の位置を推定する請求項1記載の音源定位装置。
- マイクロホンアレイにより入力された複数の音源からの音源信号が混合された観測信号から、前記複数の音源の各々の位置を推定する音源定位装置における音源定位方法であって、
空間差分算出部が、複数の方向の各々に対し、前記マイクロホンアレイのうち、前記方向に並んだマイクロホンのペアにより入力された前記観測信号の差分を算出し、
音源位置推定部が、前記マイクロホンアレイのうち、基準のマイクロホンにより入力された前記観測信号と、前記複数の方向の各々に対して算出された前記観測信号の差分とに基づいて、音源拘束偏微分方程式を用いて定められた、前記複数の音源と加法雑音が存在する場合における、前記複数の音源の各々の位置を条件とした、前記基準のマイクロホンの各時刻の観測信号、及び前記複数の方向の各々に対する各時刻の観測信号の差分の確率密度値を大きくするように、前記複数の音源の各々の位置を推定し、
前記確率密度値は、以下の式で表わされる音源定位方法。
ただし、f(k)が、音源kからの観測される音源信号を表し、Γは、前記加法雑音の分散共分散行列であり、θ (k) は、音源kの位置を表し、σ x (k)2 、σ y (k)2 、σ z (k)2 は、音源kからの観測される音源信号の方向x、y、zの差分における分散を表し、σ 0 (k)2 は、音源kからの観測される音源信号の前記基準のマイクロホンにおける分散を表し、Rは、音源までの距離を表し、cは、音速を表し、Tは、サンプリング周期を表し、n x 、n y 、n z は、音源へ向かう単位ベクトルの方向x、y、zの成分を表す。 - 前記音源位置推定部が推定することでは、EM(Expectation-Maximization)アルゴリズムにより、前記確率密度値が大きくなるように、複数の音源kの各々までの距離R(k)、前記複数の音源kの各々へ向かう単位ベクトルn(k)、前記複数の音源kの各々の前記基準のマイクロホンにおける分散0 (k)2、及び前記加法雑音の分散共分散行列Γを繰り返し更新することにより、前記複数の音源の各々の位置を推定する請求項3記載の音源定位方法。
- 請求項1又は2に記載の音源定位装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016032365A JP6531050B2 (ja) | 2016-02-23 | 2016-02-23 | 音源定位装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016032365A JP6531050B2 (ja) | 2016-02-23 | 2016-02-23 | 音源定位装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017150903A JP2017150903A (ja) | 2017-08-31 |
JP6531050B2 true JP6531050B2 (ja) | 2019-06-12 |
Family
ID=59741663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016032365A Active JP6531050B2 (ja) | 2016-02-23 | 2016-02-23 | 音源定位装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6531050B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109870694B (zh) * | 2019-02-21 | 2023-03-14 | 哈尔滨工程大学 | 基于多无人艇平台的高精度长基线定位系统 |
CN109946643B (zh) * | 2019-03-18 | 2022-08-26 | 西安电子科技大学 | 基于music求解的非圆信号波达方向角估计方法 |
CN110793625A (zh) * | 2019-12-18 | 2020-02-14 | 中国安全生产科学研究院 | 声场测量装置及方法 |
CN113376576A (zh) * | 2020-07-23 | 2021-09-10 | 郑州大学 | 基于小孔径麦克风阵列的声源定位传感器的定位方法 |
CN113674762A (zh) * | 2021-08-02 | 2021-11-19 | 大连理工大学 | 一种基于多重信号分类算法的噪声源识别系统及工作方法 |
WO2023073861A1 (ja) * | 2021-10-28 | 2023-05-04 | 日本電気株式会社 | 信号源位置推定装置、システム、方法、及び非一時的なコンピュータ可読媒体 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3863306B2 (ja) * | 1998-10-28 | 2006-12-27 | 富士通株式会社 | マイクロホンアレイ装置 |
JP4066197B2 (ja) * | 2005-02-24 | 2008-03-26 | ソニー株式会社 | マイクロフォン装置 |
JP2008070339A (ja) * | 2006-09-15 | 2008-03-27 | Univ Of Tokyo | 音源定位方法及び音源定位装置 |
JP2008145610A (ja) * | 2006-12-07 | 2008-06-26 | Univ Of Tokyo | 音源分離定位方法 |
-
2016
- 2016-02-23 JP JP2016032365A patent/JP6531050B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017150903A (ja) | 2017-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6531050B2 (ja) | 音源定位装置、方法、及びプログラム | |
Dai et al. | Sparse Bayesian learning approach for outlier-resistant direction-of-arrival estimation | |
US9384447B2 (en) | Passive tracking of underwater acoustic sources with sparse innovations | |
US9658318B2 (en) | Sparsity-driven passive tracking of acoustic sources | |
Swartling et al. | Source localization for multiple speech sources using low complexity non-parametric source separation and clustering | |
CN111123192A (zh) | 一种基于圆形阵列和虚拟扩展的二维doa定位方法 | |
KR20160095008A (ko) | 음향 에코 제거를 위한 룸 임펄스 응답을 추정하는 방법 | |
JP6623185B2 (ja) | 音源定位装置、方法、及びプログラム | |
Padois et al. | Time domain localization technique with sparsity constraint for imaging acoustic sources | |
Moreira et al. | A graph signal processing approach to direction of arrival estimation | |
Jia et al. | Multistatic sonar localization with a transmitter | |
JP6106571B2 (ja) | 音源位置推定装置、方法及びプログラム | |
EP2716074B1 (en) | Method for self-calibrating a set of acoustic sensors, and corresponding system | |
Zhang et al. | Fast implementation of sparse iterative covariance-based estimation for array processing | |
Zhai et al. | A grid-free global optimization algorithm for sound sources localization in three-dimensional reverberant environments | |
Singh et al. | Kernel minimum error entropy based estimator for MIMO radar in non-Gaussian clutter | |
JP6529451B2 (ja) | 音源定位装置、方法、及びプログラム | |
Chen et al. | Two-dimensional DOA estimation of coherent sources for acoustic vector-sensor array using a single snapshot | |
Tichavsky et al. | Quasi-fluid-mechanics-based quasi-Bayesian Crame/spl acute/r-Rao bounds for deformed towed-array direction finding | |
Madadi et al. | Three-dimensional localization of multiple acoustic sources in shallow ocean with non-Gaussian noise | |
Li et al. | DOA estimation for sparse nested MIMO radar with velocity receive sensor array | |
Shi et al. | Two-step sparse representation based 2D doa estimation with single moving acoustic vector sensor | |
JP6488245B2 (ja) | 音源定位装置、方法、及びプログラム | |
Zhuang et al. | FFT-based adaptive 2-D DOA estimation for arbitrary array structures | |
Nascimento et al. | Acoustic image estimation using fast transforms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190308 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6531050 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |