JP2011149782A - パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法 - Google Patents
パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法 Download PDFInfo
- Publication number
- JP2011149782A JP2011149782A JP2010010438A JP2010010438A JP2011149782A JP 2011149782 A JP2011149782 A JP 2011149782A JP 2010010438 A JP2010010438 A JP 2010010438A JP 2010010438 A JP2010010438 A JP 2010010438A JP 2011149782 A JP2011149782 A JP 2011149782A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- mobile robot
- dimensional sound
- particle filtering
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
【課題】移動ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことができる2次元音源地図作成方法を提供する。
【解決手段】移動ロボットに搭載された遅延和ビームフォーミング法により最適化されたマイクアレイにより音源からの音声データを断続的に取得し、取得した音声データに対し、周波数帯域選択法を利用したパーティクルフィルタリングにより、方位単独SLAM(Bearing only Simultaneous Localization and Mapping)を行い、2次元音源地図を作成することを特徴とする。
【選択図】図1
【解決手段】移動ロボットに搭載された遅延和ビームフォーミング法により最適化されたマイクアレイにより音源からの音声データを断続的に取得し、取得した音声データに対し、周波数帯域選択法を利用したパーティクルフィルタリングにより、方位単独SLAM(Bearing only Simultaneous Localization and Mapping)を行い、2次元音源地図を作成することを特徴とする。
【選択図】図1
Description
本発明は、移動ロボットに搭載したマイクアレイの短時間の方位角計測の結果から、パーティクルフィルタを用いて2次元音源地図作成を行う方法に関するものである。
音源地図作成機能は、人間環境の中で動作するロボットにとって非常に重要である。近年、光学カメラを用いた方位単独SLAM(Bearing only Simultaneous Localization and Mapping)技術が精力的に研究されている(例えば、非特許文献1)。SLAMとは、各種センサから取得した情報から、ロボットが自己位置推定と地図作成を同時に行う方法である。しかしながら、音声信号は2つの点、すなわち音源の定位と特性において非常に異なっている。定位の困難性は、残響、回折、共鳴、干渉等に起因している。 他方、特性の困難性は、音源により生成される音が通常未知であり、常に時間とともに変化し、ある場合には消失してしまうことによる。
パーティクルフィルタは、環境、地図やロボット位置を推定するために雑音入力を扱うロボット工学における認識の分野で広く使用されている。定位やマイクを中心とする座標系における追跡を行うため、パーティクルフィルタを用いたいくつかの方法が提案されている。地図作成機能について言えば、部屋の中とロボットの両方に取り付けたマイクアレイから、パーティクルフィルタを用いて音源位置を地図化する方法が提案されている(非特許文献2)。
ところが、従来の方位単独SLAMでは、センサデータが継続的に取得できるものを取り扱っており、とくにロボット本体だけで断続的なセンサデータをもとに取り組んだものはなかった。
しかしながら、未来のロボットの展開としては、ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことが強く望まれる。
S. Thrun, W. Burgard, and D. Fox, "Probabilistic Robotics (Intelligent Robotic and Autonomous Agents), The MIT Press, September 2005
H. Asoh, I. Hara, and H.Asano, "Tracking human speech events using a particle filter", in In Proceedings International Conference on Audio, Speech and Signal Processing, 2005, pp.II/1153-1156
本発明は、以上のような従来技術の実情に鑑みてなされたもので、移動ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことができる、パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法を提供することを課題とする。
上記課題を解決するため、本発明は、移動ロボットに搭載された遅延和ビームフォーミング法により最適化されたマイクアレイにより音源からの音声データを断続的に取得し、取得した音声データに対し、周波数帯域選択法を利用したパーティクルフィルタリングにより、方位単独SLAM(Bearing only Simultaneous Localization and Mapping)を行い、2次元音源地図を作成することを特徴とする、パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法を提供する。
本発明によれば、上記手法を採用したので、パーティクルフィルタリングを利用して、移動ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことができる2次元音源地図作成が可能となった。また、本発明は、2次元音源地図作成のほか、自己位置推定や周辺音響環境理解などにも応用可能である。
以下、本発明について詳述する。
本発明は、移動ロボットのみに取り付けたマイクアレイを用いて2次元音源地図作成を行うものである。本発明では、音源は方位角と距離のそれぞれに独立したガウス分布に従うと仮定したモデルによりパーティクルフィルタの分散を決定する。また、本発明においては、方位単独状態推定技術を利用することにより、2次元音源推定を行う。
先ず、2次元音源推定について述べる。個々のパーティクルフィルタは座標系上の分布を表わすパーティクルの集合により、1つのパーティクル音源の位置推定を保持するために使用される。ある環境に未知の個数の音源を存在させ、音源推定を生成させ、必要に応じて削除することにより、音源推定の数を管理する。図1に、本発明による一例の音源推定管理のフローチャートを示す。ここでは、断続的なセンサデータとして、移動ロボットに取付けたマイクアレイからの音源定位データを用いる。
観察された音源の方位データが入力すると、その方位データは予め定めた関数Fiに変換され、以前の方位データのFとの関連付けが行われる。ここで、Fiが以前の方位データと一致していれば、推定方位データFi(θ)を更新する。Fiが以前の方位データと不一致であれば、新たな推定方位データFN(θ)が加えられる。次に、各推定の方位データFjについて減衰状態が判定される。減衰状態にあれば、次のステップでその減衰率が閾値を越えているか判定され、閾値を越えていればその推定方位データFjが削除される。以上のような推定方位データFの生成、削除が行われることにより、音源推定の数が管理される。
より具体的に述べると、時刻kに特定の方位θkにおいて新しい音源Obsが観測されると、新しいパーティクルフィルタFNが生成され、現在のロボット位置から、パーティクルがデフォルト距離rDで推定方位θkにわたり2次元ガウス分布の広がりで初期化される。分布に関連する分散は、方位音源の推定値σθデフォルトの距離の分散σrとの誤差により決定され、方位単独観測における距離情報がないことを反映する。
初期化後、次のようになる。
1.音源Obs(k)=θk
2.ロボットの姿勢(x,y,θ)RからパーティクルS={s0…sNp−1}を初期化する。
2.ロボットの姿勢(x,y,θ)RからパーティクルS={s0…sNp−1}を初期化する。
Sにおける全てのsiに対して、
・ri=rD+G(σr),α=θk+G(σθ)
ここでG(σ)は偏差σ2でガウス分布するランダム値に回帰する関数である
・si=((xR+ri)cos(α+θR)
(yR+ri)cos(α+θR))
次に、フィルタは音源位置の確率密度関数を表わすパーティクルを次のように伝播させる。
・ri=rD+G(σr),α=θk+G(σθ)
ここでG(σ)は偏差σ2でガウス分布するランダム値に回帰する関数である
・si=((xR+ri)cos(α+θR)
(yR+ri)cos(α+θR))
次に、フィルタは音源位置の確率密度関数を表わすパーティクルを次のように伝播させる。
1.(x,y,θ)Rから音源Obs(k)=θkを観測
2.Sを分散si(k)=si(k−1)+ω
ここでωはランダムな動き
3.p(si(k))=SM(si(k),θk(x,y,θ)R)となるようにSを観測
4.p(si(k))を基に置換によりSを再サンプリング
ただし、SM(si(k),θk(x,y,θ)R)は現在のロボット位置から角度θkでの位置si(k)における音源位置が観測される確率に回帰するモデルである。
2.Sを分散si(k)=si(k−1)+ω
ここでωはランダムな動き
3.p(si(k))=SM(si(k),θk(x,y,θ)R)となるようにSを観測
4.p(si(k))を基に置換によりSを再サンプリング
ただし、SM(si(k),θk(x,y,θ)R)は現在のロボット位置から角度θkでの位置si(k)における音源位置が観測される確率に回帰するモデルである。
本発明の音源地図作成方法は、方向定位のノイズを取り扱う。しかし、ノイズは統計的には小さい。従って、方向定位システムはフォールスポジティブ検出に対してロバストでなければならない。このため、本発明者らは、遅延和ビームフォーミング(Delay and Sum Beam Forming;以下DSBFと称する)法により最適化された低サイドローブ・マイクアレイを設計、開発した。すなわち、未知の周波数を持つ音声入力に対する音源の方位を検出するため、マイクアレイ&ファイアワイヤ・インタフェースボードを開発した。このマイクアレイの直径は移動ロボットのサイズのため33cmに制限した。音圧分布のシミュレーションにより、サイドローブを最小化するマイク配置は経験的に決定した。図2の左側に、一例として、等脚台形の形状を有する8つの4chマイクボードの配置を示し、図2の右側にその写真を示す。本システムでは16bit、16kHzの条件でサンプリングを行うようになっている。
図3に、1000、1400、2000[Hz]でのビームフォーミングのシミュレーションの結果を示す。各周波数においてサイドローブと対比した焦点方位ゲインは最小12[dB]、平均16[dB](700〜2500[dB])であった。
図4に、このマイクアレイのシミュレートしたパターンと測定したパターンを示す。水平軸は方位であり、アレイは0(deg)の方向に収束している。垂直軸は焦点方位と対比した信号ゲイン[dB])である。下方のパターンはシミュレーションによるもので、上方のパターンは測定したものである。
本発明では、周波数帯域選択(Frequency Band Selection、以下FBSと称する)法を利用するが、この手法は性能が限定されており、特に特定音源からの音声信号以外の信号は完全に除去できず、減少させるだけである。そこで、本発明では、複数音源の検出のために、FBS法の適用の前にDSBF法を適用する。FBSは一種のバイナリ・マスクであり、共通の対象音源から判断される周波数成分を選択することにより混合音から対象音源を分離する。Xa(ωj)とXb(ωj)をそれぞれ対象音源とノイズ音源のDSBF誘起信号の周波数成分とすると、選択された周波数成分Xas(ωj)は式(1)で表わされる。
Xa(ωj)≧Xb(ωj)のとき、Xas(ωj)=Xa(ωj)
それ以外のとき、Xas(ωj)=0 ・・・(1)
このプロセスは、DSBF誘起信号からの減衰したノイズ信号を受け付けない。分離された波形はXas(ωj)の逆フーリエ変換により得られる。
それ以外のとき、Xas(ωj)=0 ・・・(1)
このプロセスは、DSBF誘起信号からの減衰したノイズ信号を受け付けない。分離された波形はXas(ωj)の逆フーリエ変換により得られる。
各信号の周波数成分が独立している場合,FSBは所望の音源を分離することができる。これは人の声や短時間の日常音に対して通常有効である。
図5に、FBSの手順を示す。第1のステップでは、FBSにより入力する各マイクロホンの平均信号(遅延信号でない)にフィルタをかけ、空間スペクトルから最も大きな音を検出する。この平均信号の周波数成分が各方位からのあらゆるDSBF誘起信号より大きい場合には、システムはその周波数のスペクトルにフィルタをかける。このプロセスは、種々の方位ノイズ音は受け付けない。
第2のステップでは、FBSによる第1の音声信号にフィルタをかけ、スペクトルから第2番目に強い音声を検出する。第1の音声の方位のDSBF誘起信号の周波数成分が他のあらゆる方位の周波数成分より大きい場合、システムは各周波数でのスペクトルにフィルタをかける。
2以上の音が存在すると、システムは第2番目に強い音信号にフィルタをかけた後、第3番目に強い音信号に検出し、以下同様なプロセスを行う。この方法は各タイムステップにおいて最も大きいパワー強度から最も小さいパワー強度まで複数音を定位する。そして、システムは多数の音源を連続的に定位し移動中に各音源を分離する。
本発明によれば、以上のようにして、パーティクルフィルタリングを利用して、移動ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMを行うことができる2次元音源地図作成を可能とする。
次に、本発明の実施例を述べる。
本実施例では、図6に示す構造を有する移動ロボット用いて実験を行った。4つのスピーカを移動ロボットのマイクの高さにセットした。マイクとしては、本発明者らが作成してきたビームフォーミング用の32ch低サイドローブ・マイクアレイを用いた。このサイドローブ・マイクアレイは、DSBF法により最適化されたものである。また、12台のカメラを有する市販の動画キャプチャーシステム(Motion Analysis Eagle)により正解データ(ground truth)として240[Hz]でロボット位置を測定した。このMACAPシステムにより測定したロボット位置の標準偏差は、並進で0.042[mm]、回転で1.09×e−5[deg]であった。マイクアレイは12[Hz]近傍で音源方位に配置させた。残響時間T60は500[msec]であり、バックグランドノイズのレベルは50[dBA](主にファンのノイズ)であった。信号ノイズ比は20[dBA]であった。音源は音楽、男性の声及び女性の声とした。測定手法としては、上記のDSBF法により最適化された低サイドローブ・マイクアレイと、帯域選択(FBS)法を組み合わせた音源定位手法を用いた。
図7に、本実施例による4つの音源の定位の結果を示す。図7a)で、は○が実際の位置、+が推定位置を示し、黄色のドットは音源の付近に収束した、関連付けられたパーティクルを示す。青の軌跡はロボットの動きを示す。図7b)は定位プロセスの収束性と残留誤差を示す。100のサンプリング(8秒)の後、本システムにより2次元地図作成を行った。その結果、ロボット本体だけで断続的に取得したセンサデータをもとに方位単独SLAMが行えることが確認された。
また、スピーカの高さ位置を異ならせて上記と同様の実験を行った結果、±50cm程度の精度で方位単独SLAMが行えることが確認された。
Claims (1)
- 移動ロボットに搭載された遅延和ビームフォーミング法により最適化されたマイクアレイにより音源からの音声データを断続的に取得し、取得した音声データに対し、周波数帯域選択法を利用したパーティクルフィルタリングにより、方位単独SLAM(Bearing only Simultaneous Localization and Mapping)を行い、2次元音源地図を作成することを特徴とする、パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010010438A JP2011149782A (ja) | 2010-01-20 | 2010-01-20 | パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010010438A JP2011149782A (ja) | 2010-01-20 | 2010-01-20 | パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011149782A true JP2011149782A (ja) | 2011-08-04 |
Family
ID=44536905
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010010438A Pending JP2011149782A (ja) | 2010-01-20 | 2010-01-20 | パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011149782A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014137226A (ja) * | 2013-01-15 | 2014-07-28 | Advanced Telecommunication Research Institute International | 移動体、音響源マップ作成システムおよび音響源マップ作成方法 |
WO2014156292A1 (ja) * | 2013-03-29 | 2014-10-02 | 日産自動車株式会社 | 音源探査用マイクロホン支持装置 |
US9989626B2 (en) | 2013-04-12 | 2018-06-05 | Hitachi, Ltd. | Mobile robot and sound source position estimation system |
US10424320B2 (en) | 2017-03-28 | 2019-09-24 | Casio Computer Co., Ltd. | Voice detection, apparatus, voice detection method, and non-transitory computer-readable storage medium |
-
2010
- 2010-01-20 JP JP2010010438A patent/JP2011149782A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014137226A (ja) * | 2013-01-15 | 2014-07-28 | Advanced Telecommunication Research Institute International | 移動体、音響源マップ作成システムおよび音響源マップ作成方法 |
WO2014156292A1 (ja) * | 2013-03-29 | 2014-10-02 | 日産自動車株式会社 | 音源探査用マイクロホン支持装置 |
US9462362B2 (en) | 2013-03-29 | 2016-10-04 | Nissan Motor Co., Ltd. | Microphone support device for sound source localization |
US9989626B2 (en) | 2013-04-12 | 2018-06-05 | Hitachi, Ltd. | Mobile robot and sound source position estimation system |
US10424320B2 (en) | 2017-03-28 | 2019-09-24 | Casio Computer Co., Ltd. | Voice detection, apparatus, voice detection method, and non-transitory computer-readable storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brandstein et al. | A practical methodology for speech source localization with microphone arrays | |
Zotkin et al. | Accelerated speech source localization via a hierarchical search of steered response power | |
CN104106267B (zh) | 在增强现实环境中的信号增强波束成形 | |
TWI556654B (zh) | 用以推衍方向性資訊之裝置與方法和系統 | |
Keyrouz | Advanced binaural sound localization in 3-D for humanoid robots | |
Brutti et al. | Multiple source localization based on acoustic map de-emphasis | |
CN107534725A (zh) | 一种语音信号处理方法及装置 | |
Youssef et al. | A learning-based approach to robust binaural sound localization | |
Badali et al. | Evaluating real-time audio localization algorithms for artificial audition in robotics | |
Youssef et al. | A binaural sound source localization method using auditive cues and vision | |
EP3721187A1 (en) | An apparatus and method for processing volumetric audio | |
Nguyen et al. | Multilevel B-splines-based learning approach for sound source localization | |
Kallakuri et al. | Probabilistic approach for building auditory maps with a mobile microphone array | |
Nguyen et al. | Autonomous sensorimotor learning for sound source localization by a humanoid robot | |
JP2011149782A (ja) | パーティクルフィルタリングによる移動ロボットからの2次元音源地図作成方法 | |
Li et al. | Improvement of acoustic fall detection using Kinect depth sensing | |
Lee et al. | Estimation of multiple sound source directions using artificial robot ears | |
Ding et al. | DOA estimation of multiple speech sources by selecting reliable local sound intensity estimates | |
Kagami et al. | 2D sound source mapping from mobile robot using beamforming and particle filtering | |
EP2757811A1 (en) | Modal beamforming | |
Magassouba | Aural servo: towards an alternative approach to sound localization for robot motion control | |
Đurković | Localization, tracking, and separation of sound sources for cognitive robots | |
Reddy et al. | Robotics audition using kinect | |
Thomsen et al. | A heuristic approach for a social robot to navigate to a person based on audio and range information | |
Geng et al. | Sound-source localization system based on neural network for mobile robots |