JP2007081455A - 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体 - Google Patents

音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体 Download PDF

Info

Publication number
JP2007081455A
JP2007081455A JP2005262691A JP2005262691A JP2007081455A JP 2007081455 A JP2007081455 A JP 2007081455A JP 2005262691 A JP2005262691 A JP 2005262691A JP 2005262691 A JP2005262691 A JP 2005262691A JP 2007081455 A JP2007081455 A JP 2007081455A
Authority
JP
Japan
Prior art keywords
sound
sound source
source position
delay time
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005262691A
Other languages
English (en)
Other versions
JP4422662B2 (ja
Inventor
Kazunori Kobayashi
和則 小林
Kenichi Furuya
賢一 古家
Yoichi Haneda
陽一 羽田
Akitoshi Kataoka
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005262691A priority Critical patent/JP4422662B2/ja
Publication of JP2007081455A publication Critical patent/JP2007081455A/ja
Application granted granted Critical
Publication of JP4422662B2 publication Critical patent/JP4422662B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 少ないマイクロホン数と音源数とから正確な音源位置を推定できる音源位置推定方法を提供する。
【解決手段】 収音手段対ごとに観測される受音信号間の遅延時間差の観測値と、事前に既知であり、事前設定された1つ以上の受音位置間距離とから、繰り返し演算を用いて音源位置と受音位置を推定する方法であり、まず、推定音源位置と推定受音位置の初期値を設定する。次に、事前設定された受音位置間距離の設定値と推定受音位置から計算される受音位置間距離の推定値間の2乗誤差が減少し、かつ前記受音信号間の遅延時間差の観測値と推定音源位置と推定受音位置から計算される受音信号間遅延時間差の推定値間の2乗誤差が減少するように、音源位置と受音位置の推定値を繰り返し更新する。更新量と事前に設定した収束閾値を比較し、更新量が閾値以下となった場合に収束と判断し、繰り返し演算を停止する。
【選択図】図1

Description

この発明は、複数の収音手段を用いた雑音抑圧収音や話者位置に自動追従するテレビカメラ制御に利用するための音源位置・受音位置推定方法および装置に関する。
図16は、従来の音源位置・受音位置推定装置を示すブロック図である。従来技術の音源位置・受音位置推定装置はマイクロホン11〜11Mと、受音信号間遅延時間差推定部12と、音源位置・受音位置推定部101により構成される。
従来の音源位置・受音位置推定装置は、位置が分からない音源から発せられた音を、位置がわからない複数のマイクロホンにより受音し、その信号から受音信号間の遅延時間差を求め、その遅延時間差から、音源位置、受音位置の両方を同時に推定する。
まず、全てのマイクロホン対間の受音信号間遅延時間差は、受音信号間遅延時間差推定部12で、マイクロホンで受音された信号の相互相関をとり、そのピークを検出することで求める。
次に、求められた受音信号間遅延時間差から音源位置・受音位置推定部101により、音源位置、受音位置の両方を同時に推定する。
以下に音源位置・受音位置推定の方法を示す。
マイクロホン数をM、音源数をNとする。k番目音源から音が発せられている場合に、i番目マイクロホンとj番目マイクロホンで受音された信号より求められる受音信号間遅延時間差をτijkとする。m番目の推定受音位置を(x^,y^,z^)、n番目の推定音源位置を(x^,y^,z^)と表す。座標は1番目受音位置を原点として、2番目受音位置と3番目受音位置とを通る平面をx−y平面として定義される。これによりx^=0,y^=0,z^=0,y^=0,z^=0,z^=0となり、これらは定数となる。
これらの位置pから求められる推定受音信号間遅延時間差τ^ijk(p)は、式(1)で表される。ただし、p=(x^,…,x^,y^,…,y^,z^,…,z^,X^,…,X^,Y^,…,Y^,Z^,…,Z^)であり、3M+3N−6個の要素を持つベクトルを表す。
Figure 2007081455
ただし、cは音速である。
次に、受音信号間遅延時間差τijk,τ^ijk(p)に音速cを乗じ距離に換算したものを、それぞれ受音信号間距離差dijk,d^ijk(p)とし、測定値dijkと推定値d^ijk(p)の二乗平均誤差e(p)を求めれば、式(2)となる。
Figure 2007081455
式(2)の二乗平均誤差e′(p)を最小化する解を逐次修正を用いた数値解析により求め、位置を推定する。
その修正式は式(3)である。
Figure 2007081455
ただし、αは修正のステップサイズ、p(u)は、u回修正後のpを表し、gradは勾配を表し、式(4)〜(11)で表される。
Figure 2007081455
初期位置を設定し、式(3)の修正式を用いて繰り返し計算をすることにより、推定受音位置、推定音源位置を求められる。
受音位置と音源位置を正確に求めるための条件は以下である。Mはマイクロホン数、Nは音源数である。
受音位置、音源位置が全く未知の場合は式(12)となる。
Figure 2007081455
この条件は、マイクロホンの高さが既知の場合は式(13)となる。
Figure 2007081455
さらに、マイクロホンの高さおよび音源の高さが既知の場合は式(14)となる。
Figure 2007081455
式(12)〜(14)をまとめれば、図11に示す()内の数となる。
以上が、従来技術による受音位置、音源位置を推定方法と、位置推定するためのマイクロホン数、音源数の条件である。
しかし、この従来技術では、図11に示したように、位置推定するためにはマイクロホン数、音源数の条件があり、この条件を満たさない場合には、音源位置と受音位置を正確に推定することはできない。
特開2004−64697号公報
従来技術の音源位置受音位置推定装置では、位置推定するためのマイクロホン数と音源数の条件があり、音源位置と受音位置を正確に推定するためには、多くのマイクロホンと音源が必要となる。
この発明は、このような問題を解決するためになされたもので、位置推定するためのマイクロホン数と音源数の条件を緩和し、従来技術よりも少ないマイクロホン数と音源数で位置推定を実現することを目的とする。
配置位置が未知であるが少なくとも2つの配置位置間の距離が既知であるM個(Mは3以上の整数)の収音器にそれぞれ収音された受音信号間の遅延時間差を推定する受音信号間遅延時間差推定段階と、上記受音信号間の遅延時間差の推定値と、対応する推定音源位置及び推定受音位置から計算される受音信号間遅延時間差との2乗誤差を最小化し、かつ上記既知の配置位置間の距離と、対応する上記推定受音位置間の距離の2乗誤差とを最小にすることにより音源位置及び受音位置を推定する音源位置・受音位置推定段階とを有する。
この発明による音源位置受音位置推定方法によれば、収音手段対ごとに観測される受音信号間の遅延時間差の観測値と、事前に既知であり事前設定された1つ以上の受音位置間距離とから、繰り返し演算を用いて音源位置と受音位置を推定するので、従来の技術よりも少ないマイクロホン数と音源数であっても、音源位置と受音位置の正確な推定が行える。
以下、この発明の実施例を示し、図面を参照して説明する。
図1は、この発明の第1の実施例である音響結合量推定装置のブロック図である。この実施例の音響結合量推定装置は、複数のマイクロホン11〜11の出力信号が入力される受音信号間遅延時間差推定部12と、その出力信号が入力される音源位置・受音位置推定部14と、いくつかのマイクロホン間距離を既知に設定する受音位置間距離設定部13とにより構成される。
受音信号間遅延時間差推定部12は、マイクロホン11〜11Mでそれぞれ受音された音源10〜10からの受音信号間の遅延時間差を推定する。図2に受音信号間遅延時間差推定部の一例をブロック図で示す。FFT部111〜111Mは、マイクロホン11〜11からの受音信号を周波数領域信号に変換する。白色化部112〜112Mは、周波数領域に変換された受音信号を、周波数スペクトルで、白色化(フラット)する。次に、マイクロホン対選択部113は、白色化部112〜112Mの出力信号うち2つを選択する。このとき、すべてのマイクロホンペアの組み合わせについて以下の処理が実施されるようスイッチの切替が行われる。乗算部114はマイクロホン対選択部113で選ばれた信号のうち一方だけ共役をとり、2つの信号を周波数成分ごとに乗算し、クロススペクトルを求める。乗算部114の出力信号を、IFFT部115により、時間領域に変換し、白色化相互相関を求める。次に、最大ピーク検出部116で、IFFT部115出力の相互相関の最大ピークを検出し、その最大ピークの地点を受音信号間遅延時間差として、音源位置受音位置推定部14に出力する。
音源位置受音位置推定部14は、受音位置間距離設定部13で設定された1つ以上のマイクロホン間距離と、マイクロホンにより受音された信号から観測される受音信号間時間差から、音源位置と受音位置を推定し、出力する。マイクロホン間距離のいくつかが既知であることで、従来技術に比べ、より少ないマイクロホン数、音源数での位置推定が可能である。
以下に、この実施例の処理の詳細を述べる。まず、1つ以上のマイクロホン間距離が既知である場合のマイクロホンと音源位置の同時推定方法について述べ、次に、位置推定のためのマイクロホン数と音源数の条件を示す。
M個のマイクロホンとN個の音源があるとし、マイクロホン間の距離のうちQ個が既知であるとする。k番目音源から音が発せられている場合に、i番目マイクロホンとj番目マイクロホンで受音された信号より求められるマイクロホン間遅延時間差をτijkとする。ただし、i=1,…,M−1 j=1,…,M(j>i) k=1,…,Nである。これは、マイクロホンで受音された信号の相互相関のピーク検出などにより求めることができる。
次に、m番目の推定マイクロホン位置を(x^,y^,z^)、n番目の推定音源位置を(X^,Y^,Z^)と表す。ただし、マイクロホン位置および音源位置の全てが未知であるので、位置を推定する前に、座標の基準位置を設ける必要がある。ここでは、1番目マイクロホン位置を原点として、2番目マイクロホンと3番目マイクロホンと通る平面をx−y平面として座標を定義する。このようにすれば、x^=0,y^=0,z^=0,y^=0,z^=0,z^=0となり、これらは定数となる。
これらの位置から求められる推定受音信号間遅延時間差τ^ijk(p)は、式(15)で表される。
Figure 2007081455
ただし、cは音速であり、pは3M+3N−6個の要素を持つ推定位置のベクトルでp=(x^,…,x^,y^,…,y^,z^,…,z^,X^,…,X^,Y^,…,Y^,Z^,…,Z^)で表される。
次に、推定受音信号間遅延時間差τijk,τ^ijk(p)に音速cを乗じ距離に換算したものを、それぞれ受音信号間距離差dijk,d^ijk(p)とし、実測値dijkと推定値d^ijk(p)の二乗誤差の和e′(p)を求めれば、式(16)となる。
Figure 2007081455
次に、マイクロホン間の距離のうちQ個が既知であるとし、その受音位置間距離をDF(q)G(q)とする。ただし、F(q)とG(q)は、q番目の既知である受音位置間距離のマイクロホン番号のペアを表す。受音位置間距離の真値DF(q)G(q)と推定位置pから計算される値D^F(q)G(q)(p)の関係は、式(17)で表される。
Figure 2007081455
ここで、受音位置と音源位置を推定するには、式(17)の制約条件下で式(16)を最小化すればよい。そこで、式(17)と式(16)を変形して、1つの最小化問題に置き換えれば、式(18)となる。
Figure 2007081455
ただし、λは任意の乗数であり、事前に設定される。λが大きいほど式(17)が厳密に満たされる解が求まる。λは、1〜100程度の値を取り、10程度が好ましい。
式(18)の二乗誤差e(p)を最小化する解を求めれば、受音信号間遅延時間差の測定値と推定値の誤差が最小となる推定受音位置、推定音源位置を求めることができる。ただし、式(18)は非線形連立方程式となっており、解析的に解くことは困難であり、ここでは、逐次修正を行う繰り返し演算を用いた数値解析により求める。式(18)を最小化する推定マイクロホン位置(x^,y^,z^)と、推定音源位置(X^,Y^,Z^)を求めるには、ある点における勾配を求め、誤差が小さくなる方向に、推定受音位置、推定音源位置を修正していき、勾配が0となる点を求めればよいので、修正式は式(19)のようになる。
Figure 2007081455
ただし、αは修正のステップサイズ、p(u)は、u回修正後のpを表し、gradは勾配を表し、grade(p)は式(20)〜(27)で表される。
Figure 2007081455
以上、示した方法により、従来技術よりも少ないマイクロホン数と音源数であっても音源位置と受音位置を推定することができる。
また、この発明では、繰り返し演算を用いて音源位置と受音位置を推定する際に、受音位置間距離に関する誤差と、前記受音信号間遅延時間差に関する誤差の、いずれを重視して推定音源位置と推定受音位置を更新するかの乗数を、更新量の大きさに応じて変化させる。収束が進むにつれて乗数に大きな値に設定することで、より確実な情報である受音位置間距離の誤差を重視した音源位置と受音位置を推定し、推定精度を向上させることができる。
上述では、推定受音信号間距離差d^ijk(p)と実測受音信号間距離差dijkとの2乗誤差を最小化したが、d^ijk(p),dijkは、それぞれ音速c(定数)で除算すれば推定受音信号間遅延時間差τijk、実測受音信号間遅延時間差τ^ijk(p)となる。よってτijkとτ^ijk(p)との2乗誤差を最小化しても同様に音源位置、マイクロホン位置を推定することができる。したがって、特許請求の範囲では、これらを代表して推定受音信号間遅延時間差τ^ijk(p)、受音信号間遅延時間差τijkとにより表現した。
図3に、この発明の第2の実施例である音源位置・受音位置推定装置の音源位置・受音位置推定部14のブロック図を示す。第2の実施例は、この発明の第1の実施例に含まれる音源位置・受音位置推定部14を、音源位置・受音位置更新量計算部21と、音源位置・受音位置初期値設定部22と、推定音源位置記憶部23と、推定受音位置記憶部24と、収束判定部25で構成した装置である。他の構成は図1と同じであり、参照符号を同一にして説明は省略する。図4に音源位置・受音位置推定部14の動作フローチャートを示す。
音源位置・受音位置初期値設定部22は、初期化段階で推定音源位置記憶部23と、推定受音位置記憶部24に任意の初期値を設定する(ステップS1)。続いて、音源位置・受音位置更新量計算部21は、推定音源位置記憶部23と、推定受音位置記憶部24に設定されている音源の位置と、受音信号間遅延時間差と、受音位置間距離とを読み込む(ステップS2)。続いて更新量を式(19)により計算する(ステップS3)。次に、読み込んだ推定音源位置と推定受音位置に、更新量を加算し更新後の推定音源位置と推定受音位置を求め、更新量の総和を計算する(ステップS4)。この一連の動作を収束判定部25が、ステップ5で収束と判定するまで繰り返す。
収束判定部25は、音源位置・受音位置更新量計算部21で計算される更新量が十分に小さいかを判定し、十分小さければ収束と判定する。例えば、推定位置の更新量grad
e(p)の総和Σ|grade(p)|と事前に設定された閾値Tcを比較し、TcよりもΣ|grade(p)|が小さくなったときに収束と判定する。閾値Tcは、例えば10-5以下の値にすると精度が高くなる。粗くても概略の位置を速く知りたい場合には10-5以上にしてもよい。
収束後の音源位置と受音位置が出力となる(ステップS6)。
これら以外の部分に関しては、第1の実施例と同じであるので、説明を省略する。
この発明の第3の実施例である音源位置・受音位置推定装置は、実施例2の構成に乗数設定部41を付加したものである。図3に乗数設定部41を破線で示す。
乗数設定部41は、式(18)に含まれる乗数λに値を逐次設定するものである。設定は以下のようにして行われる。
まず、受音信号間距離差の実測値dijkは音の到来時間差推定から求めるので誤差を含むが、受音位置間距離の真値DF(q)G(q)はフレーム等で固定されたマイクロホン間の距離であるので、ほとんど誤差を含まない。したがって、式(18)の乗数λを大きな値に設定し、式(17)の条件を厳密に満たすような推定位置pを求めることが望ましい。ただし、逐次修正の初期段階からλを大きな値に設定すると、式(18)右辺第1項の最小化が十分に行われないうちに、収束とみなされてしまう可能性がある。そこで、λを収束が進むにつれて大きな値に設定する。
図5Aに、このように動作する乗数設定部の具体的機能構成例をブロック図で示す。乗数設定部41は、複数の閾値T(i)から成る閾値群41bと、複数の乗数λ(i)から成る乗数値群41dと、閾値群41bから大きな値の閾値T(i)から順に選択して比較器41aに伝達するセレクタ41cと、その逆に閾値T(i)と対応して小さい値から順に乗数λ(i)を選択して音源位置・受音位置更新量計算部21に提供するセレクタ41eと、から構成される。
この乗数設定部41が動作を開始すると、セレクタ41cは、値の大きな閾値T(i)から比較器41aに伝達するので、更新量総和計算部25aから比較部41aに入力された更新量総和計算値は大きな閾値から評価される。このとき、乗数λ(i)は逆に小さい値が選択される。例えばT(1)=1.0,T(2)=0.1, T(3)=0.01,・・・・
λ(1)=2.0, λ(2)=4.0, λ(2)=8.0,・・・・・である。
動作フローチャートを図5Bに示す。ステップS21bにおいて閾値T(i)と更新量総和計算値が評価される。大きな閾値T(i)よりも更新量総和計算値が小さくなると、ステップS21cにおいて、より小さな閾値の閾値T(i+1)、乗数はより大きな乗数λ(i+1)に変更される。以降、更新量総和計算(ステップS21a)、更新量総和計算値の評価(ステップS21b)、閾値減少と乗数増大の変更(ステップS21c)の動作が、収束判定部25が収束と判定するまで繰り返される。このようにすることで、収束が進むにつれて乗数λの値を小から大に変化させることができる。
ここで、λ(i)はT(i)が小さくなるほど、大きくなる例で説明したが、この関係はこの動作を記述したプログラム又は、回路設計によって変わってくるので、逆でもかまわない。
以上のように乗数を変化させることにより、正確な情報である受音位置間距離を重視して音源位置と受音位置を推定でき、その推定精度を向上させることができる。
これら以外の部分に関しては第1または第2の実施例と同じであるので、説明を省略する。
図6にこの発明の実施例4を示す。実施例4は、これまでの実施例に受音信号間遅延時間差記憶部61を追加したものである。
受音信号間遅延時間差記憶部61は、受音信号間遅延時間差を記憶する。図6の受音信号遅延時間差記憶部61の中に示す表は、使用するマイクロホンの数を増やしていった場合に増加するマイクロホン間遅延時間差データを表している。マイクロホンが2本の場合、得られるマイクロホン間遅延時間差はτ12の1個であり、3本でτ12, τ12, τ23の3個、4本でτ12, τ12, τ2314, τ24, τ34の6個と増える。この発明ではマイクロホンが4本以上からN個の音源が推定可能であり、それを保存音源数Nで表している。
また、マイクロホンの数が増えるとNも、N+1、N+2と増加する。これはN加算部61aでカウントされる。
音源位置・受音位置推定部14は、保存されたN個の音源に対する受音信号間遅延時間差と、受音位置間距離設定部13で設定された1つ以上のマイクロホン間距離と測定に用いたマイクロホンに応じて決まる受音信号間時間差から、この発明の第1から第3の実施例と同様の方法を用いて音源位置と受音位置を推定し、出力する。
このように受音信号間遅延時間差を記憶することで、過去の受音信号間遅延時間差を有効に活用できる。
これら以外の部分に関しては、第1から第3の実施例と同じであるので、説明を省略する。
図7は、この発明の第5の実施例及び第6の実施例における新音源位置検出部71(72)の具体的機能構成例を示すブロック図である。
新音源位置検出部71は、現在の受音信号間遅延時間差τvpと、受音信号間遅延時間差記憶部61に記憶されている過去の受音信号間遅延時間差τvsを比較し、その値が大きく異なる場合に音源位置の移動を検出する。
受音信号間遅延時間差記憶部61は、音源位置検出部71で音源位置の移動(異なる位置から発せられた音)が検出されたときのみ、受音信号間遅延時間差推定部12で推定された受音信号間遅延時間差を新たに保存し、保存音源数Nに1を加算する。音源位置にして、例えば10cm程度の距離の移動が検出できるようにする。
図8Aに動作フローチャートを示し動作を説明する。受音信号間遅延時間差推定部12からの現在の受音信号間遅延時間差推定値τvpと、受音信号間遅延時間差記憶部61に記憶された前回の受音信号間遅延時間差推定値τvsとが、ベクトル間距離計算部71aに入力され、それぞれの遅延時間差推定値に基づいて音源位置が計算される(ステップS22a)。今回と前回の音源位置の計算結果の差Δτvと、基準値Tp71cとが比較部71bで比較され(ステップS22b)、基準値Tp71cよりも音源位置の計算結果の差が大きい場合、受音信号間遅延時間差記憶部61内のN加算部61aを+1し(ステップS22c)、ゲート71dが現在の受音信号間遅延時間差推定値を、セレクタ72bに通過させる。セレクタ72bは、比較部71bの比較結果が音源位置の計算結果の差が大のとき、受音信号間遅延時間差記憶部61の新たな記憶領域に、現在の受音信号間遅延時間差推定値を記憶させる。基準値71cよりも音源位置の計算結果の差が小さい場合は、受音信号間遅延時間差記憶部61への新たなデータの書き込みは行われない。
このように、音源位置の移動を検出したときのみ、受音信号間遅延時間差を保存することで、同じ音源に対する受音信号間遅延時間差を複数個保存することがなくなり、必要最小限の保存数で位置推定を行うことができる。これにより、メモリ量が少なくなる。
これら以外の部分に関しては、第4の実施例と同じであるので、説明を省略する。
図7に示すこの発明の第6の実施例における新音源位置検出部72の動作を説明する。新音源位置検出部72は、この発明の第5の実施例と同様にして音源位置の移動を検出する。
受音信号間遅延時間差記憶部61は、新音源位置検出部72で音源位置の移動が検出されたときに、受音信号間遅延時間差推定部12で推定された受音信号間遅延時間差を新たに保存し、保存音源数Nに1を加算する。新音源位置検出部72で音源位置の移動が検出されないときは、受音信号間遅延時間差推定部12で推定された受音信号間遅延時間差と、記憶されている受音信号間遅延時間差を平均して、同じ記憶領域に上書きする。
先に説明した実施例5と異なる点は、今回と前回の音源位置の計算結果の差が小さい場合に、受音信号間遅延時間差を平均して、受音信号間遅延時間差記憶部61同じ記憶領域に上書きする点である。
図8Aの動作フローチャートを参照してその動作を説明する。ステップS22bにおいて、基準値Tp71cよりも音源位置の計算結果の差が小さいと判定されると、受音信号間遅延時間差推定部12からの現在の受音信号間遅延時間差推定値と、受音信号間遅延時間差記憶部61に記憶された前回の受音信号間遅延時間差推定値とが、入力される平均化部72aが、その2つの推定値を平均しセレクタ72bに出力する。
セレクタ72bは、比較部71bの比較結果が音源位置の計算結果の差が小のとき、受音信号間遅延時間差記憶部61の前回の受音信号間遅延時間差推定値が記憶されている同一の記憶領域に、平均した受音信号間遅延時間差推定値を記憶させる。
このように、音源位置の移動を検出しないとき(同じ音源の場合)に、推定された受音信号間遅延時間差と、記憶されている受音信号間遅延時間差を平均することで、より精度の高い受音信号間遅延時間差とすることができ、精度の高いで位置推定を行うことができる。これら以外の部分に関しては、第5の実施例と同じであるので、説明を省略する。
図9は、この発明の第7の実施例である音源位置・受音位置推定装置の新音源位置検出部73のブロック図である。第7の実施例は、この発明の第5、第6の実施例に含まれる新音源位置検出部71,72を、二乗誤差計算部91と閾値比較部92で構成した装置である。
二乗誤差計算部91は、受音信号間遅延時間差推定部12の出力である現在の受音信号間遅延時間差と、受音信号間遅延時間差記憶部61に記憶されている過去の受音信号間遅延時間差を減算して、二乗平均する。次に、閾値比較部92は、二乗誤差計算部91の出力が事前に設定した閾値以上である場合に、音源位置が移動したとして検出する。
二乗誤差は例えば以下のように求められる。i番目マイクロホンとj番目マイクロホン間の現在の受音信号間遅延時間差をτij,NEWとし、過去の受音信号間遅延時間差をτij,OLDとし、マイクロホン数をMとした場合、二乗誤差計算部91の出力eは、式(34)で表される。
Figure 2007081455
現在の音源位置と、過去の音源位置がほぼ同じであれば、式(34)は、ほぼ0となり、現在の音源位置と、過去の音源位置が異なれば、式(34)は、正の大きな値をとる。したがって、式(34)を事前に設定した閾値と比較することにより、音源の移動が検出できる。これら以外の部分に関しては、第5〜第6の実施例と同じであるので、説明を省略する。
図10Aは、この発明の第8の実施例である音源位置・受音位置推定装置のブロック図である。第8の実施例は、この発明の第1〜第7の実施例に、有音・雑音検出部81を追加した構成である。
有音・雑音検出部81は、マイクロホン受音信号から有音と無音を検出する。検出方法の一例を以下に示す。まず、マイクロホン受音信号を加算部81aで加算した信号をx(t)とし、この信号を短時間平均部81bで短時間平均したものをX(t)とする。X(t)のノイズレベルは、落ち込みホールド部81cでX(t)ディップホールド処理することで推定することができ、式(33)を用いて計算される。
N(t) = X(t) N(t)≧X(t)の場合
N(t) = u・N(t-1)+(1-u)・X(t) N(t)<X(t)の場合 式(33)
ここで、uは1未満の定数であり事前に設定する。uは推定ノイズレベル上昇時の平滑化係数であり0<u<1の値をとる。uが1に近いと緩やかなノイズレベル上昇となり、ディップホールドの効果が得られる。次に、有音区間と雑音区間の検出は、ノイズレベルN(t)にあらかじめ設定した定数81eを乗算部81dで乗じた閾値TN(t)と、短時間平均部81bの出力X(t)を比較することで行う。TN(t) >X(t)であれば雑音区間と検出し、TN(t) < X(t)であれば有音区間と検出する。
落ち込みホールド部81cの機能構成例を図10Bに示す。落ち込みホールド部81cは、短時間平均部81bの出力信号X(t)と、落ち込みホールド部81cの過去の出力信号N(t-1)とを比較する比較部82aと、X(t)と1から平均化係数uを減じた(1−u)とを乗算する乗算部82bと、N(t-1)とuとを乗算する乗算部82cと、乗算部82bと82cの出力信号を加算する加算部82dと、短時間平均部81bの出力信号X(t)が落ち込みホールド部81cの過去の出力信号N(t-1)よりも大のときに加算部82dの出力信号を選択し、小のときに短時間平均部81bの出力信号X(t)を選択して落ち込みホールド部81cの出力信号とするセレクタ82eとで構成できる。
以上述べた有音・雑音検出部81で有音と検出されたときのみに、受音信号間遅延時間差推定部12が受音信号間遅延時間差の推定を行う。
このようにすることで、雑音の位置を推定しないようにすることができる。
これら以外の部分に関しては、第1〜第7の実施例と同じであるので、説明を省略する。
この発明の第9の実施例は、この発明の第4〜第7の実施例の受音信号間遅延時間差記憶部61において、保存できる受音信号間遅延時間差の最大個数の制限を与えた装置である。受音信号間遅延時間差記憶部61において保存されている受音信号間遅延時間差数が、事前設定された保存数最大値まで達していて、受音信号間遅延時間差を新たに保存する場合には、最も古く保存された受音信号間遅延時間差を破棄し、保存数が事前設定された保存数最大値を超えないようにする。
これにより、受音信号間遅延時間差記憶部61を少ないメモリで構成できる。
これら以外の部分に関しては、第4〜第7の実施例と同じであるので、説明を省略する。
以上、実施例を示して説明したこの発明による音源位置受音位置推定方法によれば、収音手段対ごとに観測される受音信号間の遅延時間差の観測値と、事前に既知であり事前設定された1つ以上の受音位置間距離とから、繰り返し演算を用いて音源位置と受音位置を推定するので、従来の技術よりも少ないマイクロホン数と音源数であっても、音源位置と受音位置の正確な推定を行うことができる。
なお、各実施例に示した装置及びその装置を用いて行われる方法は、プログラムが記憶されるROM(Read Only Memory)と、プログラムやデータを記憶するハードディスクとこれらのプログラムを実行するCPU(Central Processing Unit)と、CPUが用いるデータ等を記憶するRAM(Random Access Memory)とから構成される一般的なコンピュータで実現できるものである。プログラムは、CD-ROM等の記録媒体に記録可能であり、CD-ROMに記録された、例えばこの発明による音響結合量推定装置プログラムを、今まで他の用途に使用していたコンピュータ装置のROMにインストールすることで、そのコンピュータ装置をこの発明による音響結合量推定装置に変えることが出来る。もちろん、専用のハードウェアでこの発明による各装置を実現することも容易である。
〔実施例1の効果〕
次に、この発明の実施例1で示した音源位置と受音位置を推定する方法関して、正確に求めるための条件について検討する。理論検討のために受音信号間距離差の測定値dijkに誤差がないと仮定すると、式(28)と式(29)に示す連立方程式の解が受音位置と音源位置となる。式(28)と式(29)の解を厳密に求めるための条件は、独立な式の数が未知変数の数よりも大きくなることである。
Figure 2007081455
式(28)の式の数はN・M(M−1)/2であるが、d13k=d12k+d23kのようにiとjが連続していない式は、全て独立ではないので、独立な式の数は、最大でN・(M−1)となる。式(29)の独立な式は最大でQであるので、これらをあわせると、独立な式の数は最大でN・(M−1)+Qとなる。
受音位置、音源位置が全く未知の場合、未知変数の数は、3M+3N−6であるので、独立な式の数が未知変数の数よりも大きくなる条件は式(30)となる。
Figure 2007081455
この条件は、マイクロホンの高さが既知の場合、未知変数の数が2M+3N−3となるので、式(31)となる。
Figure 2007081455
さらに、マイクロホンの高さおよび音源の高さが既知の場合、未知変数の数が2M+2N−3となるので、式(32)となる。
Figure 2007081455
この発明の一例として、マイクロホンが2つずつフレームで固定されている場合を想定しQ=[M/2]と設定した場合([]は小数点以下切り捨てを表す)を想定した場合に、必要となるマイクロホン数と音源数の関係を図11に示す。hMICはマイクロホンの高さ、hSoucは音源の高さであり、マイクロホンが2個ずつフレーム(スタンド)で固定されている場合に必要な音源数を、マイクロホンの数と対応して表した図である。図11には、従来技術の場合に必要となるマイクロホン数と音源数も(**)で合わせて示している。図11より、この発明は、従来技術に比べ少ないマイクロホン数と音源数で位置推定が可能であることが確認できる。
次に、この発明の効果を示すために、シミュレーションの結果を示す。
図12にマイクロホンおよび音源の配置を示す。マイクロホンは直径1.5mの円周上に配置され、その高さは0〜0.5m(ただし、マイクロホンの高さ、音源の高さが既知の場合は0m固定)とした。音源は、直径2.5mの円周上に配置し、その高さは、0.5m〜1.0m(ただし、マイクロホンの高さ、音源の高さが既知の場合は0.5m固定)とした。この発明で既知であるマイクロホン間距離は、マイクロホン11−11、11−11、11−11、11−11間の距離とした。各マイクロホンの対である11−11はスタンド2、11−11はスタンド2、11−11はスタンド2、11−11はスタンド2でそれぞれ上記した位置に固定した。
この条件で、マイクロホン数と記憶音源数を変化させ位置推定を行った。マイクロホン、音源の初期位置はランダムとして10回位置推定を行い、その位置推定誤差の平均を求めた。この結果を図13〜15に示す。図13〜図15のAは従来技術による位置推定結果であり、Bはこの発明による位置推定結果である。
これら図と、図11に示した推定に必要なマイクロホン数、音源数の関係を比較する。図11に示した推定に必要なマイクロホン数、記憶音源数を満たす場合において、図13〜15の位置推定誤差は非常に小さく、精度よく推定が行えていることが確認できる。Aの従来技術による位置推定結果と、Bのこの発明による位置推定結果を比較すると、この発明のほうが少ないマイクロホン数、音源数で位置推定が行えていること確認できる。
以上より、この実施例によれば、従来技術よりも少ないマイクロホン数と音源数で、音源位置と受音位置を推定することができる。
この発明の実施例1の機能構成例を示すブロック図である。 実施例1中の受音信号時間差推定部の具体的機能構成例を示すブロック図である。 この発明の実施例2の機能構成例を示すブロック図である。 実施例2中の音源位置受音位置推定部の処理手順の例を示すフローチャート。 Aはこの発明の実施例3における乗数設定部の具体的機能構成例を示すブロック図、Bはその処理手順の例を示すフローチャートである。 この発明の実施例4の機能構成例を示すブロック図である。 この発明の実施例5及び6における新音源位置検出部71(72)の具体的機能構成例を示すブロック図である。 この発明の実施例5及び6における新音源位置検出部71(72)の処理手順の例を示す流れ図である。 この発明の実施例7新音源位置検出部73の具体的機能構成例を示すブロック図である。 Aはこの発明の実施例8における有音・雑音検出部81の具体的機能構成例を示すブロック図、Bはその落込みホールド部81cの具体的機能構成例を示すブロック図である。 実施例1の効果としてマイクロホンの数Mと必要な音源数との関係を示す図である。 シミュレーションにおける音源位置と受音位置とを示す図。 音源の高さが未知で、マイクロホンの高さが未知の場合の位置推定誤差のシミュレーション結果を示すグラフであり、Aは従来技術、Bはこの発明である。 音源の高さが未知で、マイクロホンの高さが既知の場合の位置推定誤差のシミュレーション結果を示すグラフであり、Aは従来技術、Bはこの発明である。 音源の高さが既知で、マイクロホンの高さが既知の場合の位置推定誤差のシミュレーション結果を示すグラフであり、Aは従来技術、Bはこの発明である。 従来の音源位置推定装置の機能構成を示すブロック図である。

Claims (10)

  1. 配置位置が未知であるが少なくとも2つの配置位置間の距離が既知であるM個(Mは4以上の整数)の収音器にそれぞれ収音された受音信号間の遅延時間差を推定する受音信号間遅延時間差推定段階と、
    上記受音信号間の遅延時間差の推定値と、対応する推定音源位置及び推定受音位置から計算される受音信号間遅延時間差との2乗誤差を最小化し、かつ上記既知の配置位置間の距離と、対応する上記推定受音位置間の距離の2乗誤差とを最小にすることにより音源位置及び受音位置を推定する音源位置・受音位置推定段階と
    を有する音源位置・受音位置推定方法。
  2. 請求項1記載の方法において、
    上記音源位置・受音位置推定段階は、
    初期設定された音源位置及び受音位置を上記推定音源位置及び上記推定受音位置とする初期値設定段階と、
    上記受音信号間の遅延時間差の推定値と、対応する上記推定音源位置及び上記推定受音位置から計算された受音信号間遅延時間差との2乗誤差を減少し、かつ上記既知の配置位置間距離と対応する上記推定受音位置間の距離の2乗誤差を減少するように上記音源位置及び上記受音位置を更新する音源位置・受音位置更新段階と、
    上記音源位置・受音位置更新段階で更新した更新量と閾値とを比較し、更新量が閾値を越えれば上記音源位置・受音位置更新段階に戻り、更新量が閾値以下であれば上記2つの2乗誤差が共に最小化されたと判定する収束判定段階とを有することを特徴とする音源位置・受音位置推定方法。
  3. 請求項2記載の方法において、
    上記音源位置・受音位置更新段階は、上記受音信号間遅延時間差に関する2乗誤差と上記受音位置間距離に関する2乗誤差との一方に乗数を乗算してこれら2乗誤差の和を減少させるように上記音源位置及び上記受音位置を更新し、その更新量の大きさが小さくなるに従って、上記受音位置間距離に関する2乗誤差が重視されるように上記乗数の大きさを変化させる乗数設定段階を含む、
    ことを特徴とする音源位置・受音位置推定方法。
  4. 請求項1〜3のいずれかに記載の方法において、
    上記遅延時間差推定段階は上記受音信号間遅延時間差を記憶部に記憶する受音信号間遅延時間差記憶段階を含み、
    上記現に推定された受音信号間遅延時間差と、前回の推定受音信号間遅延時間差を検出し、その検出した差が大きければ新たな音源位置が生じたと判定する新たな音源位置検出段階を有する
    ことを特徴とする音源位置・受音位置推定方法。
  5. 受音位置間の距離を設定することができる受音位置間距離設定部と、
    配置位置が未知であるが少なくとも2つの配置位置間の距離が上記受音位置間距離設定部により設定されたM個(Mは4以上の整数)の収音器にそれぞれ収音された受音信号が入力され、これら受音信号間の遅延時間差を推定する受音信号間遅延時間差推定部と、
    上記推定された受音信号間の遅延時間差と上記設定された受音位置間距離が入力され、上記受音信号間の遅延時間差の推定値と、対応する推定音源位置及び推定受音位置から計算される受音信号間遅延時間差との2乗誤差を最小化し、かつ上記入力された配置位置間の距離と、対応する上記推定受音位置間の距離の2乗誤差とを最小にすることにより音源位置及び受音位置を推定する音源位置・受音位置推定部と
    を具備する音源位置・受音位置推定装置。
  6. 請求項5記載の装置において、
    上記音源位置・受音位置推定部は、
    上記受音信号間の遅延時間差の推定値と、対応する上記推定音源位置及び上記推定受音位置から計算された受音信号間遅延時間差との2乗誤差を減少し、かつ上記入力された配置位置間距離と対応する上記推定受音位置間の距離との2乗誤差を減少するように上記音源位置及び上記受音位置を更新する音源位置・受音位置更新部を含み、
    上記音源位置・受音位置更新部で更新した更新量と閾値とを比較し、更新量が閾値を越えれば上記音源位置・受音位置更新推定部に上記更新処理を行わせ、更新量が閾値以下であれば上記2つの2乗誤差が共に最小化されたと判定する収束判定部を備えることを特徴とする音源位置・受音位置推定装置。
  7. 請求項6記載の装置において、
    上記音源位置・受音位置更新部は、上記受音信号間遅延時間差に関する2乗誤差と上記受音位置間距離に関する2乗誤差との一方に乗数を乗算してこれら2乗誤差の和を減少させるように上記音源位置及び上記受音位置を更新するものであり、
    その更新量の大きさが小さくなるに従って、上記受音位置間距離に関する2乗誤差が重視されるように上記乗数の大きさを変化させる乗数設定部を備える
    ことを特徴とする音源位置・受音位置推定装置。
  8. 請求項5〜7のいずれかに記載の装置において、
    上記遅延時間差推定部は上記受音信号間遅延時間差が記憶される記憶部を含み、
    上記現に推定された受音信号間遅延時間差と、上記記憶部より取出された前回の推定受音信号間遅延時間差を検出し、その検出した差が閾値より大きければ新たな音源位置が生じたと判定する新たな音源位置検出部を有する
    ことを特徴とする音源位置・受音位置推定装置。
  9. 請求項1〜4のいずれかに記載された音源位置・受音位置推定方法の各段階をコンピュータに実行させるための音源位置・受音位置推定プログラム。
  10. 請求項9記載の音源位置・受音位置推定プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2005262691A 2005-09-09 2005-09-09 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体 Expired - Fee Related JP4422662B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005262691A JP4422662B2 (ja) 2005-09-09 2005-09-09 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005262691A JP4422662B2 (ja) 2005-09-09 2005-09-09 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体

Publications (2)

Publication Number Publication Date
JP2007081455A true JP2007081455A (ja) 2007-03-29
JP4422662B2 JP4422662B2 (ja) 2010-02-24

Family

ID=37941347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005262691A Expired - Fee Related JP4422662B2 (ja) 2005-09-09 2005-09-09 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体

Country Status (1)

Country Link
JP (1) JP4422662B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009052928A (ja) * 2007-08-24 2009-03-12 Nippon Telegr & Teleph Corp <Ntt> 位置推定装置、その方法、そのプログラム、およびその記録媒体
JP2010021854A (ja) * 2008-07-11 2010-01-28 Internatl Business Mach Corp <Ibm> 音源の位置検出方法及びシステム
JP2010026361A (ja) * 2008-07-23 2010-02-04 Internatl Business Mach Corp <Ibm> 音声収集方法、システム及びプログラム
JP2010203785A (ja) * 2009-02-27 2010-09-16 Kumagai Gumi Co Ltd 音源推定方法
JP2012161071A (ja) * 2011-01-28 2012-08-23 Honda Motor Co Ltd 音源位置推定装置、音源位置推定方法、及び音源位置推定プログラム
JP2014075756A (ja) * 2012-10-05 2014-04-24 Nippon Telegr & Teleph Corp <Ntt> 遅延推定方法とその方法を用いたエコー消去方法と、それらの装置とプログラムとその記録媒体
US9319788B2 (en) 2011-12-20 2016-04-19 Panasonic Intellectual Property Management Co., Ltd. Sound processing device, and sound processing method
JP2020043456A (ja) * 2018-09-10 2020-03-19 本田技研工業株式会社 音響処理装置、音響処理方法およびプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009052928A (ja) * 2007-08-24 2009-03-12 Nippon Telegr & Teleph Corp <Ntt> 位置推定装置、その方法、そのプログラム、およびその記録媒体
JP2010021854A (ja) * 2008-07-11 2010-01-28 Internatl Business Mach Corp <Ibm> 音源の位置検出方法及びシステム
JP2010026361A (ja) * 2008-07-23 2010-02-04 Internatl Business Mach Corp <Ibm> 音声収集方法、システム及びプログラム
JP2010203785A (ja) * 2009-02-27 2010-09-16 Kumagai Gumi Co Ltd 音源推定方法
JP2012161071A (ja) * 2011-01-28 2012-08-23 Honda Motor Co Ltd 音源位置推定装置、音源位置推定方法、及び音源位置推定プログラム
US9319788B2 (en) 2011-12-20 2016-04-19 Panasonic Intellectual Property Management Co., Ltd. Sound processing device, and sound processing method
US9326065B2 (en) 2011-12-20 2016-04-26 Panasonic Intellectual Property Management Co., Ltd. Sound processing device, and sound processing method
JP2014075756A (ja) * 2012-10-05 2014-04-24 Nippon Telegr & Teleph Corp <Ntt> 遅延推定方法とその方法を用いたエコー消去方法と、それらの装置とプログラムとその記録媒体
JP2020043456A (ja) * 2018-09-10 2020-03-19 本田技研工業株式会社 音響処理装置、音響処理方法およびプログラム

Also Published As

Publication number Publication date
JP4422662B2 (ja) 2010-02-24

Similar Documents

Publication Publication Date Title
JP4422662B2 (ja) 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体
US9909863B2 (en) Determination of a room dimension estimate
KR101831078B1 (ko) 보이스 활성화 탐지 방법 및 장치
KR101910679B1 (ko) 마이크로폰 어레이를 위한 잡음 적응형 빔 형성 기법
JP4248445B2 (ja) マイクロホンアレイ方法及びシステム、並びにこれを用いた音声認識方法及び装置
JP4937622B2 (ja) 位置標定モデルを構築するコンピュータ実施方法
JP2016218078A (ja) マルチセンサ音源定位
RU2011104085A (ru) Способ и устройство частотного анализа данных
JP5277887B2 (ja) 信号処理装置およびプログラム
CN104363554A (zh) 一种扬声器异常音检测方法
JP2004078021A (ja) 収音方法、収音装置、および収音プログラム
CN106782618B (zh) 基于二阶锥规划的目标方向语音检测方法
CN113160846A (zh) 噪声抑制方法和电子设备
JP2014194437A (ja) 音声処理装置、音声処理方法および音声処理プログラム
JP5387442B2 (ja) 信号処理装置
US8150062B2 (en) Determination of the adequate measurement window for sound source localization in echoic environments
JP3720795B2 (ja) 音源受音位置推定方法、装置、およびプログラム
CN114141224A (zh) 信号处理方法和装置、电子设备、计算机可读介质
JP6891144B2 (ja) 生成装置、生成方法及び生成プログラム
JP6716933B2 (ja) 雑音推定装置、プログラム及び方法、並びに、音声処理装置
JP6633579B2 (ja) 音響信号処理装置、方法及びプログラム
CN112530450A (zh) 频域中的样本精度延迟识别
JP4113169B2 (ja) 信号源数の推定方法、推定装置、推定プログラム及び記録媒体
KR102295993B1 (ko) 음성 스펙트럼 감쇠율들의 통계치를 이용한 잔향시간 추정 방법
CN112889299B (zh) 评估传声器阵列一致性的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121211

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131211

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees