JP2011146871A - 音源探索装置及び音源探索方法 - Google Patents

音源探索装置及び音源探索方法 Download PDF

Info

Publication number
JP2011146871A
JP2011146871A JP2010005225A JP2010005225A JP2011146871A JP 2011146871 A JP2011146871 A JP 2011146871A JP 2010005225 A JP2010005225 A JP 2010005225A JP 2010005225 A JP2010005225 A JP 2010005225A JP 2011146871 A JP2011146871 A JP 2011146871A
Authority
JP
Japan
Prior art keywords
sound source
sound
program
source search
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010005225A
Other languages
English (en)
Other versions
JP5408621B2 (ja
Inventor
Takashi Sumiyoshi
貴志 住吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2010005225A priority Critical patent/JP5408621B2/ja
Publication of JP2011146871A publication Critical patent/JP2011146871A/ja
Application granted granted Critical
Publication of JP5408621B2 publication Critical patent/JP5408621B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】異常音探索を効率的に実施できる音源探索装置等を提供する。
【解決手段】プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインターフェースと、を備え、音の音源を探索する音源探索装置であって、前記音の信号が入力される音入力部と、入力された前記音の信号に基づいて、前記音の信号が入力されたときの前記音入力部の位置を基準とした前記音源の方向を推定する音源方向推定部と、前記音源方向推定部による推定の信頼度の高低を判定する方向信頼度判定部と、前記信頼度が高いと判定された場合には、推定された前記音源の方向に前記音源があると判定し、前記信頼度が低いと判定された場合には、前記音源方向推定部と異なる推定方法によって前記音源の方向を推定する音源探索部と、を備える。
【選択図】図1

Description

本発明は、異常音の音源を探索する音源探索装置及び音源探索方法に関する。
近年、人間の生活を支援する数多くのロボットが開発されてきている。このようなロボットの一種であるヒューマノイドは、人間と同じ形をしているロボットである。ヒューマノイドは、このような形をしているため、人とのコミュニケーションをとる上で有利であり、人間用に設計された生活空間にうまく適応することができる。
ヒューマノイドの応用例としては、エンターテイメント、オフィス業務の遂行、監視、見守り等が挙げられる。これらの一つ又は複数実行させるために、ヒューマノイドには人間の身体に相当するハードウェア(足に相当する移動装置、目に相当するカメラ、耳に相当するマイク等)が搭載される。その他、人間の身体に相当しない超音波レーダー等が搭載される場合もある。
ここで、ヒューマノイドを用いた監視業務の一例として、ある空間において異常音等の音が発生したときにその音を検出して外部に通報する業務に着目する。例えば、工場において機械の異常音を検出して外部に通報する調査ロボット、夜間のオフィスにおいて不審な音を検出して外部に通報する警備ロボット等が挙げられる。この監視業務においては、ヒューマノイドが適切に異常音等の音を検出することが重要である。
特許文献1には、音を検出する技術に関連して、音源からの音声を周波数成分毎に分解し、分解された周波数成分毎の音声の度数を分散して加算し、最も大きい加算値の位相に基づいて音源の方向を検出する技術が開示されている。また、特許文献2には、複数のマイクを搭載したロボットによって音源を検出する技術が開示されている。
特開2009−86055号公報 特開2009−71510号公報
ところで、ロボットが監視業務を実行する場合には、そのロボットは少なくとも人間と同等以上の機動力、判断力、通報力を備える必要がある。特に、異常音等の音が発生したときにその原因を早く突き止めて外部に通報する監視業務においては、ロボット自身が異常音の音源に近づき、情報を収集する必要がある。なお、ロボットが自身のマイクを用いて異常音を検出しながら異常音の音源に近づくプロセスを、以後「異常音探索」という。
しかしながら、特許文献1及び特許文献2に開示された技術では、この異常音探索については考慮されておらず、ロボット自身が異常音の音源を検出しながらその音源に近づくことはできなかった。
本発明は、上述した課題を考慮したものであって、異常音探索を効率的に実施することができる音源探索装置及び音源探索方法を提供することを目的とする。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインターフェースと、を備え、音の音源を探索する音源探索装置であって、前記音の信号が入力される音入力部と、入力された前記音の信号に基づいて、前記音の信号が入力されたときの前記音入力部の位置を基準とした前記音源の方向を推定する音源方向推定部と、前記音源方向推定部による推定の信頼度の高低を判定する方向信頼度判定部と、前記信頼度が高いと判定された場合には、推定された前記音源の方向に前記音源があると判定し、前記信頼度が低いと判定された場合には、前記音源方向推定部と異なる推定方法によって前記音源の方向を推定する音源探索部と、を備えたことを特徴とする。
本発明の代表的な実施の形態によれば、音源の方向を推定した後に、推定の信頼度の高低に応じて動作態様を切り替えることによって、異常音探索を効率的に実施することができる。
本発明の実施の形態に係る音源探索装置の構成を示す図である。 本発明の実施の形態に係るメインプログラムの制御ロジックを示すフローチャートである。 本発明の実施の形態に係る内部状態の状態遷移図である。 本発明の実施の形態に係る巡回プログラムの制御ロジックを示すフローチャートである。 本発明の実施の形態に係る巡回経路の一例を示す図である。 本発明の実施の形態に係る音源探索プログラムの制御ロジックを示すフローチャートである。 本発明の実施の形態に係る地図情報の一例を示す図である。
以下、本発明の実施の形態について図面を参照して説明する。
(装置の構成)
図1は、本発明の実施の形態に係る音源探索装置10の構成を示す図である。図1に示す音源探索装置10は、一般的なコンピュータが備える中央演算装置20、記憶装置30、バス40、入出力デバイスとしての通信装置50、音声入力装置60、画像入力装置70、移動制御装置80、及び、移動装置81を備える。
中央演算装置20は、記憶装置30に記憶された各種プログラムに記述された計算処理を実行するプロセッサである。
記憶装置30は、DRAM等の揮発性のデータ記憶装置、HDD等の不揮発性のデータ記憶装置又はこれらの組み合わせである。記憶装置30には、地図情報31、音声バッファ32、画像バッファ33、音響マップ34、位置バッファ36、内部状態37、巡回経路38、巡回インデックス39、メインプログラム310、巡回プログラム311、音源探索プログラム312、音源対応プログラム313、巡回復帰プログラム314が記憶される。記憶装置30に記憶される各データ及び各プログラムについては後述する。
バス40は、中央演算装置20、記憶装置30、通信装置50、音声入力装置60、画像入力装置70、移動制御装置80を相互に接続するデータの伝送路である。各装置は、このバス40を介して相互にデータを通信する。
通信装置50は、外部から音源探索装置10にアクセスするための装置である。この通信装置50は、外部から地図情報データを受信して、受信した地図情報データを記憶装置30の地図情報31に書き込む。また通信装置50は、音声バッファ32、画像バッファ33に記憶された音声データ、画像データを外部に送信する。さらに通信装置50は、各種プログラム310から314が任意のデータを送受信するために利用される。
音声入力装置60は、マイク61及び62によって取得された音響信号が入力され、入力された音響信号に対してサンプリング処理、量子化処理(A/D変換)を施す。各々の処理が施された音響信号は、音声バッファ32に記録される。なお、図1は一つの音声入力装置60が設けられた構成を示しているが、この場合には限らない。複数の音声入力装置60(各々の音声入力装置60は複数のマイク61及び62を含む)が設けられた構成でもよい。
画像入力装置70は、カメラ71及び72によって取得された画像信号を入力し、画素列に変換する。画素列に変換された画像は、画像バッファ33に記録される。
移動制御装置80は、中央演算装置20によって設定された移動プロセスに従って移動装置81の移動(駆動)を制御する。移動装置81が2足歩行用の脚である場合には、移動制御装置80は移動装置81のアクチュエータの駆動を制御する。なお、移動装置81は、2足歩行用の脚の代わりに、タイヤ、脚、モータ、ステアリング等であってもよい。この場合には、移動制御装置80はそれぞれの移動(駆動)を適切に制御する。
以下、記憶装置30に記憶される各データ及び各プログラムについて簡単に説明する。
地図情報31は、音源探索装置10の移動領域と、その移動領域内で音源探索装置10が実際に移動可能な各地点を表す格子点と、を含む地図情報である(図7参照)。その詳細については後述する。
音声バッファ32には、マイク61及び62によって取得された音声情報が音声入力装置60によって逐次書き込まれる。この音声バッファ32は、常に一定時間以内の過去の音声情報が格納され、参照可能な状態となっている。
画像バッファ33には、カメラ71及び72によって取得された画像情報が画像入力装置70によって逐次書き込まれる。この画像バッファ33は、常に一定時間以内の過去の画像情報が格納され、参照可能な状態となっている。
音響マップ34は、地図情報31(図7参照)の各地点における音の大きさ(音量)、残響情報等の音響情報を記録するマップである。その詳細については後述する。
位置バッファ36には、音源探索装置10の現在の位置情報が逐次書き込まれる。この位置バッファ36は、常に一定時間以内の過去の位置情報が格納され、参照可能な状態となっている。なお、音源探索装置10の現在の位置情報は、移動制御装置80によって移動速度の積分値及び初期値を基に算出される。算出精度を向上させるために、GPS(Global Positioning System)や外部センサを用いた位置取得システムを用いてもよい。また、以降の説明においては、位置バッファ36に記録される現在の位置情報が2次元情報(X,Y)である場合を説明するが、この場合には限らない。位置バッファ36に記録される現在の位置情報は3次元情報(X,Y,Z)であってもよい。
内部状態37には、音源探索装置10の動作態様を決定するための情報が記憶される。具体的には、「巡回」、「音源探索」、「音源対応」、「巡回復帰」のいずれかの状態を示す情報が記憶される(図3参照)。その詳細については後述する。
巡回経路38には、音源探索装置10が地図情報31に示される移動領域を巡回する際の経路情報が記憶される(図5参照)。巡回インデックス39は、巡回経路38に経路情報を記録する際に経路情報に付与するインデックス(索引)に関する情報が記憶される(図5参照)。これら巡回経路38及び巡回インデックス39の詳細については後述する。
メインプログラム310は、音源探索装置10が起動すると最初に実行されるプログラムである。このメインプログラム310は、内部状態37に記憶された情報に応じて、各サブプログラム311から314のいずれかを起動する。その詳細については後述する。
巡回プログラム311は、内部状態37が「巡回」状態の場合には、メインプログラム310によって起動される。この巡回プログラム311は、音源探索装置10の巡回動作を制御する。その詳細については後述する。
音源探索プログラム312は、内部状態37が「音源探索」状態の場合には、メインプログラム310によって起動される。この音源探索プログラム312は、音源探索装置10が異常音の音源を探索する動作を制御する。その詳細については後述する。
音源対応プログラム313は、内部状態37が「音源対応」状態の場合には、メインプログラム310によって起動される。この音源対応プログラム313は、音源探索装置10が異常音の音源に到達したときの対応動作を制御する。その詳細については後述する。
巡回復帰プログラム314は、内部状態37が「巡回復帰」状態の場合には、メインプログラム310によって起動される。この巡回復帰プログラム314は、音源探索装置10の巡回動作への復帰を制御する。その詳細については後述する。
(メインプログラム310の制御ロジック)
図2は、本発明の実施の形態に係るメインプログラム310の制御ロジックを示すフローチャートである。メインプログラム310は、観測周期L(=10ミリ秒)の間隔で起動して図2に示す制御ロジックを繰り返す。
まずステップS1において、メインプログラム310は、音声バッファ32、画像バッファ33、位置バッファ36を更新する(S1)。ステップS1では、メインプログラム310は、音声バッファ32、画像バッファ33、位置バッファ36に記憶された各データを更新する。その結果、例えば音声バッファ32には、2チャネル(マイク61及び62)の観測周期L分の音声データx1(τ,t)、x2(τ,t)が記憶された状態になる。ここで、xC(τ,t)とは、チャネルCのフレーム番号τにおけるtサンプル目の振幅値である。サンプリング周波数がS(=16000)である場合には、1フレームのサンプル数NはS×L(=160)である。
次にステップS2に進んで、メインプログラム310は、内部状態37に記録された状態に基づきサブプログラムを起動する(S2)。ステップS2では、メインプログラム310は、内部状態37に記憶された情報を参照し、参照した情報に応じてサブプログラム311から314のいずれかを起動する。すなわち、内部状態37が「巡回」状態の場合には巡回プログラム311を、「音源探索」状態の場合には音源探索プログラム312を、「音源対応」状態の場合には音源対応プログラム313を、「巡回復帰」状態の場合には巡回復帰プログラム314をそれぞれ起動する。内部状態37について図3を用いて説明する。
図3は、本発明の実施の形態に係る内部状態37の状態遷移図である。前述のように、記憶装置30の内部状態37には、「巡回」、「音源探索」、「音源対応」、「巡回復帰」のいずれかの状態を示す情報が記憶される。
そして、内部状態37が「巡回」状態の場合に音源探索装置10が異常音を検出すると、内部状態37は「巡回」状態から「音源探索」状態に移行する。内部状態37が「音源探索」状態の場合に音源探索装置10が異常音の音源に到達すると、内部状態37は「音源探索」状態から「音源対応」状態に移行する。内部状態37が「音源対応」状態の場合に音源探索装置10の音源対応が完了すると、内部状態37は「音源対応」状態から「巡回復帰」状態に移行する。内部状態37が「巡回復帰」状態の場合に音源探索装置10の巡回復帰が完了すると、内部状態37は「巡回復帰」状態から「巡回」状態に移行する。
(巡回プログラム311の制御ロジック)
図4は、本発明の実施の形態に係る巡回プログラム311の制御ロジックを示すフローチャートである。巡回プログラム311は、図4に示す制御ロジックを実行することによって、音源探索装置10の巡回動作を制御する。
この巡回プログラム311は、図2のステップS2において、内部状態37が「巡回」状態である場合にメインプログラム310によって起動される。以下、巡回プログラム311の制御ロジックを説明する。
まずステップS101において、巡回プログラム311は、音声バッファ32から音声データを取得する(S101)。ここでは、巡回プログラム311は、音声バッファ32から2チャネルの観測周期L分の音声データx1(τ,t)、x2(τ,t)を取得する。
次にステップS102に進んで、巡回プログラム311は、観測した音声のパワーP(τ)を計算する(S102)。ここでは、巡回プログラム311は、ステップS101で取得した音声データに基づいて、パワーP(τ)を計算する。例えばマイク61のチャネルにおける音声データの二乗和をパワーP(τ)と定義すると、P(τ)は式(1)で示される。
その後ステップS103に進んで、巡回プログラム311は、音声判別条件を満たすか否か判定する(S103)。ここでいう音声判別条件とは、ステップS101で取得された音声データが、過去FフレームにおいてパワーがA以上のフレームがGフレーム以上であるという条件式を満たすような音声データであるという判別条件である。この判別条件は、すなわち、ある程度(パワーA)以上の音量が一定時間(FフレームのうちのGフレームの間)継続的又は断続的に発生していることを意味している。
音声判別条件を満たす場合には(S103でYES)、ステップS104に進んで、巡回プログラム311は、内部状態37を「音源探索」状態にセットする(S104)。一方、音声判別条件を満たさない場合には(S103でNO)、ステップS105に進んで、巡回プログラム311は、巡回経路38に基づき移動経路を設定する(S105)。巡回経路38について図5を用いて説明する。
図5は、本発明の実施の形態に係る巡回経路38の一例を示す図である。巡回経路38は図5に示すようなテーブルであり、各項目はインデックスと位置座標(X,Y)とを含む。巡回インデックス39の値iに対応する巡回経路38の座標を(Xi,Yi)とする。位置バッファ36に格納されている現在の位置情報が(Xi,Yi)である場合には、巡回インデックス39の値を1増やしてi+1にする(ただし、巡回インデックス39の値が巡回経路38の最大インデックス(図5では99)を超えた場合には、巡回インデックス39の値を0にする)。その後、現在位置(Xi,Yi)から巡回インデックス39の値i+1に対応する巡回経路38の座標(X(i+1),Y(i+1))へ向かう経路が移動経路として設定される。
図4に戻り、ステップS106に進んで、巡回プログラム311は、ステップS105で設定された移動経路の情報を移動制御装置80に通知する(S106)。その後、巡回プログラム311は処理を終了する。移動制御装置80は、通知された移動経路に従い、移動装置81を用いて音源探索装置10を移動させる。
以上に示す制御ロジックにより、巡回プログラム311は、原則的には巡回経路38に基づき設定された移動経路に従って音源探索装置10を移動させる(S105及びS106)。ただし、一定量以上の音声を検出した場合には(S103でYES)、内部状態37を「音源探索」状態に移行させる(S104)。
(音源探索プログラム312の制御ロジック)
図6は、本発明の実施の形態に係る音源探索プログラム312の制御ロジックを示すフローチャートである。音源探索プログラム312は、図6に示す制御ロジックを実行することによって、音源探索装置10が異常音の音源を探索する動作を制御する。
この音源探索プログラム312は、図2のステップS2において、内部状態37が「音源探索」状態である場合にメインプログラム310によって起動される。以下、音源探索プログラム312の制御ロジックを説明する。
まずステップS201において、音源探索プログラム312は、音声バッファ32から音声データを取得する(S201)。ここでは、音源探索プログラム312は、音声バッファ32から2チャネルの観測周期L分の音声データx1(τ,t)、x2(τ,t)を取得する。
次にステップS202に進んで、音源探索プログラム312は、ステップS201で取得された音声データx1(τ,t)、x2(τ,t)に基づいて、音源方向を推定する(S202)。
ステップS202では、まず音源探索プログラム312は、GCC(Generalized Cross Correlation)法を用いて、ステップS201で取得された音声データのチャネル間の一般的な相互相関Gcc(τ,θ)を算出する(式(2)参照)。
式(2)において、X1(τ,f)、X2(τ,f)は、それぞれ音声データx1(τ,t)、x2(τ,t)のフーリエ変換である。また、相互相関Gcc(τ,θ)は、音声データx1(τ,t)、x2(τ,t)の相関(類似性の度合い)である。その後音源探索プログラム312は、Gcc(τ,θ)に基づき、音源方向の推定値θ(τ)を算出する(式(3)参照)。
式(3)において、θ(τ)は、相互相関Gcc(τ,θ)が最大値をとるときのθの値である。
その後ステップS203に進んで、音源探索プログラム312は、方向推定信頼度L(τ)を計算する(S203)。ここでいう方向推定信頼度L(τ)とは、ステップS202で算出されたθ(τ)の信頼度が高いか否か(又は、θ(τ)が信頼できるか否か)を示す指標である。音源探索プログラム312は、このような方向推定信頼度L(τ)を、例えば式(4)によって算出する。
式(4)において、L(τ)は、関数Gcc(τ,θ)の最大値と、θを変化させたときの関数Gcc(τ,θ)の値の総和との比である。すなわち、このL(τ)は、関数Gcc(τ,θ)の分散の度合いを無次元で示すものである。このL(τ)は、一定方向のみから異常音が検出された場合は大きい値をとる。他方、反射音等の影響で他の多くの方向から異常音が検出された場合は小さな値をとる。
なお、式(4)に示すL(τ)は、相互相関Gcc(τ,θ)の時間変化を考慮していない。そのため、異常音が時間変化しない継続的な音(連続音)である場合に特に有効である。もちろん、異常音は断続的な音であってもよい。
ステップS203では、音源探索プログラム312は、さらに、観測した音声のパワーP(τ)(式(1)参照)を計算する。
その後ステップS204に進んで、音源探索プログラム312は、ステップS202からS203によって算出したθ(τ)、L(τ)、P(τ)と、位置バッファ36に記録されている音源探索装置10の位置座標(X(τ),Y(τ)) と、を対応付けて音響マップ34に[θ(τ),L(τ),P(τ),X(τ),Y(τ)]として記録する(S204)。このステップS204は、地図情報31(図7参照)において音源探索装置10がそれまで通過してきた各地点における音源方向の推定値θ(τ)、方向推定信頼度L(τ)、パワーP(τ)等の音響情報を記録するための処理である。
その後ステップS205に進んで、音源探索プログラム312は、ステップS203で算出されたL(τ)が閾値α以上であるか否かを判定する(S205)。このステップS205では、音源探索プログラム312は、ステップS202で算出されたθ(τ)の信頼度が高いか否かを判定している。なお、音源探索プログラム312は、音源探索装置10が音源に近い位置にあるか又は遠い位置にあるかを判定していると言い換えてもよい。
L(τ)が閾値α以上である場合には(S205でYES)、音源探索プログラム312は、ステップS202で算出されたθ(τ)の信頼度が高いと判定する。すなわち、θ(τ)の方向へ移動すれば音源に到達できると判定する。そこでステップS206に進んで、音源探索プログラム312は、θ(τ) の方向への移動が可能か否かを調べる(S206)。ここでは、音源探索プログラム312は、図7の地図情報31を参照してθ(τ)の方向に移動可能か否かを、障害物の有無等によって調べる。
移動可能である場合には(S206でYES)、音源探索プログラム312は、θ(τ)の方向を移動経路として設定する(S207)。移動不可である場合には(S206でNO)、音源探索プログラム312は、音源に到達したと判定する(S208)。ステップS208では、音源探索プログラム312は、さらに内部状態37を「音源対応」状態にセットする。ステップS207又はS208の処理が終了すると、ステップS213に進む。
一方、L(τ)が閾値αより小さい場合には(S205でNO)、音源探索プログラム312は、ステップS202で算出されたθ(τ)の信頼度が低いと判定する。そこで、音源探索プログラム312は、音響マップ34を用いて、以下に説明する手順によって音源の位置を推定する。ただし、フレーム数τの値が小さい場合には、音響マップ34を用いて音源の位置を推定するには情報が不足している。そこで、まずステップS209に進んで、音源探索プログラム312は、フレーム数τの値が一定値γ以上であるか否かを調べる(S209)。
フレーム数τの値が一定値γ以上である場合には(S209でYES)、ステップS210に進んで、音源探索プログラム312は、音響マップ34に基づき音源の位置(Xo,Yo)を推定する(S210)。ステップS210では、音源探索プログラム312は、音源の位置(Xo,Yo)を、例えば式(5)、(6)によって算出する。
式(6)において、音源の位置が(X,Y)であると仮定した場合には、f(X(j),Y(j))は、音源探索装置10が既に通過した地点(X(j),Y(j))における音量分布を示す。この式(6)は、各地点における音の大きさが音源からの距離の2乗に反比例するという仮定に基づいている。一方、式(5)において、音源の位置(Xo,Yo)は、式(6)に示す音量分布f(X(j),Y(j))に重みβを付けたものと、位置(X(j),Y(j))における音声のパワーP(j)(式(1)参照)と、の差分の2乗和が最小となる(X,Y)であって、地図情報31における全座標又は音源が存在しうる座標の集合Sに含まれる(X,Y)である。これにより、地図情報31(図7参照)上の例えば50cm間隔のグリッド上の有限点が、音源の位置(Xo,Yo)として算出される。以上のように、ステップS210では、音源探索プログラム312は、音響マップ34に記録された各地点における音響情報に基づいて音源の位置(Xo,Yo)を推定している。
一方、フレーム数τの値が一定値γより小さい場合には(S209でNO)、ステップS211に進んで、音源探索プログラム312は、未探索地点の位置(Xo,Yo)を目的地に設定する(S211)。ステップS211では、音源探索プログラム312は、未探索地点の位置(Xo,Yo)を、例えば式(7)によって算出する。
式(7)において、未探索地点の位置(Xo,Yo)は、音源探索装置10が既に通過した各地点(X(j),Y(j))との間の距離の和が最大となる(X,Y)であって、観測周期Lの間に音源探索装置10が到達可能な座標の集合Rに含まれている(X,Y)である。つまり、式(7)によって算出される(Xo,Yo)とは、音源探索装置10が未だ探索していない(音響マップ34に登録されていない)地点(X,Y)のうちの、音源探索装置10が既に探索した(音響マップ34に登録されている)各地点(X(j),Y(j))から最も離れている地点(X,Y)である。
ステップS210(又はS211の処理)が終了すると、S212に進んで、音源探索プログラム312は、ステップS210で推定された音源位置(又はステップS211で設定された目的地)までの移動経路を、地図情報31を用いて設定する(S212)。地図情報31及びステップS212の具体例について図7を用いて説明する。
図7は、本発明の実施の形態に係る地図情報31の一例を示す図である。図7の丸印は、音源探索装置10が実際に移動可能な各地点を表す格子点である。音源探索装置10は隣接する格子点の間を移動可能である。また、全ての隣接する格子点間の距離は等距離にするとよい。
ステップS210からステップS212に進んだときに、音源探索装置10の現在位置がP1、ステップS210で推定された音源位置がP2(図7参照)である場合を考える。この場合には、音源探索プログラム312は、音源位置であるP2に最も近い格子点P3を地図情報31から求め、P1からP3に到る最短の経路P4を移動経路として設定する。ただし、音源探索装置10が実際に移動する距離は、観測周期Lの間に移動可能な距離までである。
一方、ステップS211からステップS212に進んだときに、音源探索装置10の現在位置がP1、ステップS211で設定された目的地がP5(図7参照)である場合を考える。この場合、音源探索プログラム312は、現在位置P1から目的地P5に至る経路P6を移動経路として設定する。なお、目的地P5に移動すると、音源探索プログラム312は、図6に示す制御ロジックを繰り返してもよい。これにより、未探索の地点P5に対応する音響情報を音響マップ34に新たに追加した上で、再び音源方向を推定したり方向推定信頼度を計算したりすることが可能になる。
図6に戻り、ステップS213に進むと、音源探索プログラム312は、ステップS207又はS212で設定された移動経路の情報を、移動制御装置80に通知する(S213)。その後、音源探索プログラム312は処理を終了する。移動制御装置80は、通知された移動経路に従い、移動装置81を用いて音源探索装置10を移動させる。
以上に示す制御ロジックにより、音源探索プログラム312は、まず音源方向を推定し(S202)、その後方向推定信頼度を計算する(S203)。その後、方向推定信頼度の高低に応じて動作態様を切り替える(S205からS213)。特に、方向推定信頼度がなく、且つ、音響マップ34を用いて音源位置を推定するのに十分な情報がある場合には(S205でNO、S209でYES)、音響マップ34に基づいて音源位置を推定している(S210)。このような音源位置の推定は、残響が大きく正確な音源の推定が困難な環境において特に有効である。
(音源対応プログラム313の制御ロジック)
音源対応プログラム313は、音源探索装置10が異常音の音源に到達したときの対応動作を制御する。この音源探索プログラム313は、図2のステップS2において、内部状態37が「音源対応」状態である場合にメインプログラム310によって起動される。以下、音源対応プログラム313の制御ロジックを説明する。
音源対応プログラム313は、定められた一定時間(例えば1分)、音声バッファ32、画像バッファ33、位置バッファ36に記憶されたデータを、通信装置50を用いて外部に送信する。このとき、音源対応プログラム313は、さらに音響マップ34に記憶されたデータを送信してもよい。これにより、音源探索装置10は、異常音の音源を特定し得る音声や画像等のデータを外部に発報することができる。その後、音源対応プログラム313は、一定時間の経過後、内部状態37を「巡回復帰」状態にセットする。
なお、音源対応プログラム313は、外部に上記のデータを送信中に、巡回プログラム311の制御ロジック(図4参照)を実行してもよい。そして、巡回プログラム311の制御ロジックを実行中に異常音を検出した場合には、一定時間の経過前であってもただちに内部状態37を「巡回復帰」状態にセットしてよい。
以上に示す制御ロジックにより、音源対応プログラム313は、音源探索装置10が異常音の音源に到達したときに、異常音の音源を特定し得る音声や画像等のデータを外部に発報する。
(巡回復帰プログラム314の制御ロジック)
巡回復帰プログラム314は、音源探索装置10の巡回動作への復帰を制御する。この巡回復帰プログラム314は、図2のステップS2において、内部状態37が「巡回復帰」状態である場合にメインプログラム310によって起動される。以下、巡回復帰プログラム314の制御ロジックを説明する。
巡回復帰プログラム314は、まず巡回インデックス39の値を、巡回経路38の各項目の座標のうち、音源探索装置10の現在位置に最も近い座標のインデックスの値にセットする。例えば、音源探索装置10の現在位置が(20,90)である場合には、図5に示す巡回経路38の各項目の座標のうち、(20,90)に最も近い座標のインデックスは2である。この場合、巡回インデックス39には2がセットされる。
巡回復帰プログラム314は、次に現在位置から(Xi,Yi)への最短経路を移動経路として設定する。ここで、iは巡回インデックス39の値、Xi,Yiはそれぞれ巡回経路38のインデックスiにおけるX座標、Y座標である。
その後巡回復帰プログラム314は、設定された移動経路の情報を移動制御装置80に通知する。その後、巡回復帰プログラム314は、内部状態37を「巡回」状態にセットして処理を終了する。移動制御装置80は、通知された移動経路に従い、移動装置81を用いて音源探索装置10を移動させる。
以上に示す制御ロジックにより、巡回復帰プログラム314は、音源探索装置10を巡回状態に復帰させる。
以上説明した本実施の形態の音源探索装置及び音源探索方法は、工場で機械の異常音を検出し通報する調査ロボット、夜間のオフィスでの不審な音を検出し通報する警備ロボットなどへ適用することができる。1台のロボットによって広い空間をカバーでき、また既存のロボットへソフトウェアとして機能追加できる。そのため、マイクやカメラを各所に配置するよりも低コストである。
また、本実施の形態の音源探索装置及び音源探索方法によれば、まず音源方向を推定し(図6のS202)、その後方向推定信頼度を計算する(S203)。その後、方向推定信頼度の高低に応じて動作態様を切り替える(S205からS213)。具体的には、方向推定信頼度が高いと判定された場合には(S205でYES)、推定された音源の方向に音源があると判定する(S206からS208)。一方、方向推定信頼度が低いと判定された場合には(S205でNO)、音響マップ34に基づいて音源の方向を推定する又は未探索地点において再び音源の方向を推定する(S209からS211)。特に、各地点における残響情報、音の大きさ等の音響情報が記憶された音響マップ34を用いることで、残響の影響が大きく正確な音源の推定が困難な環境においても効率的に異常音探索を実施することができる。
なお、以上説明した本実施の形態の音源探索装置及び音源探索方法は、音源探索装置10が音声入力装置60を備えた構成であるが、この場合には限らない。音源探索装置10と音声入力装置60とは別構成であってもよい。この場合、例えば複数の音声入力装置60が各地点に配置される。そして、音源探索装置10は、各地点において各々の音声入力装置60が入力した音響信号に基づいて上記の音源探索方法によって音源の方向を推定する。
10 音源探索装置
32 音声バッファ
34 音響マップ
36 位置バッファ
60 音声入力装置
61、62 マイク
310 メインプログラム
311 巡回プログラム
312 音源探索プログラム
313 音源対応プログラム
314 巡回復帰プログラム

Claims (7)

  1. プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインターフェースと、を備え、音の音源を探索する音源探索装置であって、
    前記音の信号が入力される音入力部と、
    入力された前記音の信号に基づいて、前記音の信号が入力されたときの前記音入力部の位置を基準とした前記音源の方向を推定する音源方向推定部と、
    前記音源方向推定部による推定の信頼度の高低を判定する方向信頼度判定部と、
    前記信頼度が高いと判定された場合には、推定された前記音源の方向に前記音源があると判定し、前記信頼度が低いと判定された場合には、前記音源方向推定部と異なる推定方法によって前記音源の方向を推定する音源探索部と、
    を備えたことを特徴とする音源探索装置。
  2. 入力された前記音の信号に基づいて、前記音の信号が入力されたときの前記音入力部の位置における音の大きさを測定する音量測定部と、
    前記音量測定部によって測定された音の大きさを、前記音入力部の位置毎に記録する音響マップと、をさらに備え、
    前記音源探索部は、前記信頼度が低いと判定された場合には、前記音響マップに基づいて前記音源の方向を推定することを特徴とする請求項1に記載の音源探索装置。
  3. 前記音源探索部は、前記信頼度が低いと判定された場合には、前記音入力部によって前記音の信号が取得されていない位置のうち、前記音入力部の位置から最も離れた位置において、当該位置を基準とした前記音源の方向を推定すること特徴とする請求項1又は2に記載の音源探索装置。
  4. 推定された前記音源の方向に当該音源探索装置を移動させる移動装置をさらに備えたことを特徴とする請求項1に記載の音源探索装置。
  5. マイクが取得した音の信号を入力する音入力装置と、前記音の音源を探索する音源探索装置と、を備えたシステムにおける音源探索方法であって、
    前記音源探索装置は、プログラムを実行するプロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、前記プロセッサに接続されたインターフェースとを備え、
    前記方法は、
    前記プロセッサが、入力された前記音の信号に基づいて、前記音入力装置の位置を基準とした前記音源の方向を推定する第1手順と、
    前記プロセッサが、前記推定の信頼度の高低を判定する第2手順と、
    前記プロセッサが、前記信頼度が高いと判定された場合には、推定された前記音源の方向に前記音源があると判定し、前記信頼度が低いと判定された場合には、前記第1手順と異なる推定方法によって前記音源の方向を推定する第3手順と、
    を含むことを特徴とする音源探索方法。
  6. 前記方法は、
    前記プロセッサが、入力された前記音の信号に基づいて、前記音入力装置の位置における音の大きさを測定する第4手順をさらに含み、
    前記音源探索装置は、
    前記第4手順によって測定された音の大きさを、前記音入力装置の位置毎に記録する音響マップをさらに備え、
    前記第3手順において、前記プロセッサは、前記信頼度が低いと判定された場合には、前記音響マップに基づいて前記音源の方向を推定することを特徴とする請求項5に記載の音源探索方法。
  7. 前記第3手順において、前記プロセッサは、前記音入力装置によって前記音の信号が取得されていない位置のうち、前記音入力装置の位置から最も離れた位置において、当該位置を基準とした前記音源の方向を推定すること特徴とする請求項5又は6に記載の音源探索方法。
JP2010005225A 2010-01-13 2010-01-13 音源探索装置及び音源探索方法 Expired - Fee Related JP5408621B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010005225A JP5408621B2 (ja) 2010-01-13 2010-01-13 音源探索装置及び音源探索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010005225A JP5408621B2 (ja) 2010-01-13 2010-01-13 音源探索装置及び音源探索方法

Publications (2)

Publication Number Publication Date
JP2011146871A true JP2011146871A (ja) 2011-07-28
JP5408621B2 JP5408621B2 (ja) 2014-02-05

Family

ID=44461348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010005225A Expired - Fee Related JP5408621B2 (ja) 2010-01-13 2010-01-13 音源探索装置及び音源探索方法

Country Status (1)

Country Link
JP (1) JP5408621B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5939480B1 (ja) * 2015-12-25 2016-06-22 富士ゼロックス株式会社 端末装置、診断システムおよびプログラム
CN111527461A (zh) * 2018-01-09 2020-08-11 索尼公司 信息处理装置、信息处理方法和程序

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005048239A1 (ja) * 2003-11-12 2005-05-26 Honda Motor Co., Ltd. 音声認識装置
JP2008158868A (ja) * 2006-12-25 2008-07-10 Toyota Motor Corp 移動体、及びその制御方法
JP2009199158A (ja) * 2008-02-19 2009-09-03 Hitachi Ltd 音響ポインティングデバイス、音源位置のポインティング方法及びコンピュータシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005048239A1 (ja) * 2003-11-12 2005-05-26 Honda Motor Co., Ltd. 音声認識装置
JP2008158868A (ja) * 2006-12-25 2008-07-10 Toyota Motor Corp 移動体、及びその制御方法
JP2009199158A (ja) * 2008-02-19 2009-09-03 Hitachi Ltd 音響ポインティングデバイス、音源位置のポインティング方法及びコンピュータシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5939480B1 (ja) * 2015-12-25 2016-06-22 富士ゼロックス株式会社 端末装置、診断システムおよびプログラム
WO2017110111A1 (ja) * 2015-12-25 2017-06-29 富士ゼロックス株式会社 端末装置、診断システム、診断方法およびプログラム
CN111527461A (zh) * 2018-01-09 2020-08-11 索尼公司 信息处理装置、信息处理方法和程序
CN111527461B (zh) * 2018-01-09 2024-03-22 索尼公司 信息处理装置、信息处理方法和程序

Also Published As

Publication number Publication date
JP5408621B2 (ja) 2014-02-05

Similar Documents

Publication Publication Date Title
US10791397B2 (en) Locating method, locating system, and terminal device
US10228693B2 (en) Generating simulated sensor data for training and validation of detection models
CN106796434B (zh) 地图生成方法、自身位置推定方法、机器人系统和机器人
KR101203897B1 (ko) 이동체(mobile body)를 위한 셀?기반 경로 계획 장치 및 방법
Wang et al. Acoustic robot navigation using distributed microphone arrays
US20130218395A1 (en) Autonomous moving apparatus and method for controlling the same
KR20170042546A (ko) 자동 로봇을 위한 장애물의 존재 및 부재 중 하나의 확률 맵 구축 방법
US20220057232A1 (en) Time-aware occupancy grid mapping for robots in dynamic environments
Worley et al. Acoustic echo-localization for pipe inspection robots
CN105283775A (zh) 移动机器人以及音源位置推定系统
JP2011209203A (ja) 自己位置推定装置および自己位置推定方法
Song et al. Fast optical flow estimation and its application to real-time obstacle avoidance
WO2017038012A1 (ja) 地図生成方法、自己位置推定方法、ロボットシステム、およびロボット
JP2019012504A (ja) 自律移動装置、自律移動方法及びプログラム
Andersson et al. Robot phonotaxis with dynamic sound-source localization
JP5408621B2 (ja) 音源探索装置及び音源探索方法
Jiang et al. Robot-assisted smartphone localization for human indoor tracking
Pillutla et al. An Efficient two Dimensional Mapping of External Surroundings for Robotics and Drones
JP2020052977A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2009178782A (ja) 移動体、環境地図生成装置、及び環境地図生成方法
JP2019075037A (ja) 情報処理装置、情報処理方法、およびプログラム
US10215852B1 (en) Robotic radar assistance
JP2021135473A (ja) 捜索支援システム、捜索支援方法
Martinson et al. Robotic discovery of the auditory scene
Emaduddin et al. Accurate floor detection and segmentation for indoor navigation using RGB+ D and stereo cameras

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120309

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120614

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131029

R150 Certificate of patent or registration of utility model

Ref document number: 5408621

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees