以下、適宜図面を参照しながら、本発明に係るモニタリングシステム及びモニタリング方法を具体的に開示した実施形態(以下、本実施形態という)を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。以下、モニタリングシステムの一例として、モニタリング対象のエリアにおいて収音された音声が異常音又は警戒音であった場合に、異常音又は警戒音の音源方向を示す音源方向画像を監視モニタに表示する監視制御システムを説明する。但し、本発明に係るモニタリングシステム及びモニタリング方法は、人物等の対象物の状態を監視するための用途に限定されず、所定のエリアにおける状態を把握するために観測や測定を行うことや、製品又はサービスについての感想や評価を調べることの各用途に適用されてもよい。
図1は、本実施形態の監視制御システム10の内部構成の一例を詳細に示すブロック図である。監視制御システム10は、カメラ装置CAと、マイクアレイ装置MAと、指向性制御装置30と、照明装置50と、レコーダ装置60とを含む構成である。カメラ装置CA、マイクアレイ装置MA、指向性制御装置30、照明装置50及びレコーダ装置60は、ネットワークNWを介して相互にデータ通信可能に接続されている。ネットワークNWは、有線ネットワーク(例えばイントラネット、インターネット)でもよいし、無線ネットワーク(例えば無線LAN(Local Area Network))でもよい。
また、マイクアレイ装置MA、カメラ装置CA及び照明装置50は、店舗、倉庫や工場等の撮像対象のエリア(例えば監視エリア5)内に設置される。一方、指向性制御装置30及びレコーダ装置60は、監視エリア5のバックヤードに相当する事務所又は控室(例えば監視室8)に設置される。
撮像部の一例としてのカメラ装置CAは、例えばパン方向の移動、チルト方向の移動及びズーム処理が自在なPTZ(Pan Tilt Zoom)カメラであり、室内の天井又は壁等の平坦面に設置され、自装置が設置された監視エリア5を任意の方向に撮像可能な監視カメラとして機能する。
なお、カメラ装置CAは、監視エリア5の全方位(つまり、360度の方向)の状況を全方位画像として撮像可能な全方位カメラでもよい。カメラ装置CAが全方位カメラの場合、カメラ装置CAは、全方位画像の一例として、監視エリア5の全方位が映る円形形状の全方位画像データを生成してもよいし、この円形形状の全方位画像データに対し公知の2次元パノラマ変換処理を行い、パノラマ画像データを生成してもよい。
また、カメラ装置CAは、1台のカメラではなく、それぞれ異なる画角が固定的に設定された複数の固定カメラにより構成されてもよい。カメラ装置CAが複数の固定カメラの場合、指向性制御装置30に対するユーザ(例えば監視員)の操作により、複数の固定カメラからいずれか1つの固定カメラが任意に選択可能である。
カメラ装置CAは、画像を撮像した時刻(つまり、撮像時刻)を画像データと対応付けて記憶し、撮像時刻のデータを含む画像データを、ネットワークNWを介して指向性制御装置30に送信する。以下、カメラ装置CA(例えばPTZカメラ、全方位カメラ、又は複数の固定カメラのうち選択されたいずれかの固定カメラ)が監視エリア5を撮像したことによって得られた画像を「撮像画像」という。従って、本実施形態では、詳細は後述するが、図6に示すように、撮像画像GZと、撮像画像GZと種々の音源方向画像sd1,sd2,sd3,sd4とが重畳された音声ヒートマップ画像MPとは異なるデータとして区別する。
収音部の一例としてのマイクアレイ装置MAは、例えば室内の天井等の平坦面に設置され、自装置が設置された監視エリア5における全方位の音声を無指向で収音する。マイクアレイ装置MAは、中央に開口部が形成された筐体を有し、更に、この開口部の周囲に円周方向に沿って同心円状に配置された複数のマイクロホンユニットを有する。それぞれのマイクロホンユニットは、等間隔で配置されている。マイクロホンユニット(以下、単にマイクロホンと称する)には、例えば高音質小型エレクトレットコンデンサーマイクロホン(ECM:Electret Condenser Microphone)が用いられる。
マイクアレイ装置MAは、収音により得られた音声データを、収音した時刻(つまり、収音時刻)と対応付けて記憶するとともに、収音時刻のデータを含む音声データを、ネットワークNWを介して、指向性制御装置30に送信する。
また、監視制御システム10では、カメラ装置CAが全方位カメラである場合、カメラ装置CAとマイクアレイ装置MAとは同軸上に配置されてもよい。これにより、カメラ装置CAの光軸とマイクアレイ装置MAの筐体の中心軸とが一致することで、カメラ装置CAの撮像可能領域の座標系とマイクアレイ装置MAの収音可能領域の座標系とが略同一となる。言い換えると、カメラ装置CAから見た被写体の位置とマイクアレイ装置MAから見た音源の位置とが同じ座標で表現可能となる。従って、被写体の位置と音源の位置との対応関係が明確となり、指向性制御装置30は、マイクアレイ装置MAにより収音された音声データに対し、ユーザの指定に基づく指向方向(後述参照)に指向性を形成する際に、ユーザの指定に基づいてカメラ装置CAにより得られた方向を示す座標を、マイクアレイ装置MAから見た指向方向として用いることができ、指向方向の算出を容易に行うことができる。ユーザの指定に基づいてカメラ装置CAにより得られた方向を示す座標は、カメラ装置CAにより撮像された撮像画像のデータが表示された監視モニタ36の画面上の位置がユーザにより指定され、かつ指向性制御装置30が指定位置の座標のデータをカメラ装置CAに送信した場合に、カメラ装置CAがその座標に対応する実際の空間上の位置に向かう方向を算出した座標である。
指向性制御装置30は、例えばマイクアレイ装置MA及びカメラ装置CAが設置された室内(例えば監視エリア5)の外(例えば監視室8)に設置される据置型のPC(Personal Computer)を用いて構成される。指向性制御装置30は、カメラ装置CAにより撮像された画像データが表示された監視モニタ36上の位置がユーザ(例えば監視員)の操作により指定されると、マイクアレイ装置MAにより無指向で収音された全方位の音声に対し、マイクアレイ装置MAから、指定された画像データ上の位置に対応する音源位置に向かう方向(以下、指向方向という)に指向性を形成し、その指向方向の音声を強調する。
また、指向性制御装置30は、マイクアレイ装置MAにより収音された音声データを基に、監視エリア5内の音の発生源を示す位置(以下、単に「音源位置」という)を推定する。なお、指向性制御装置30は、PCの代わりに、携帯電話機、タブレット端末、スマートフォン等の通信端末を用いて構成されてもよい。
ここで、指向性制御装置30の具体的な構成について説明する。図1に示す指向性制御装置30は、通信部31と、操作部32と、信号処理部33と、監視モニタ36と、スピーカ装置37と、メモリ38と、設定管理部39とを含む構成である。信号処理部33は、音源検出部34及び出力制御部35を有する。なお、監視モニタ36は、指向性制御装置30の構成として含まれているが、外部ディスプレイとして、指向性制御装置30とは別体となるように指向性制御装置30に接続されてもよい。同様に、スピーカ装置37も、指向性制御装置30の構成として含まれているが、外部スピーカとして、指向性制御装置30とは別体となるように指向性制御装置30に接続されてもよい。
設定管理部39は、カメラ装置CAにより撮像された監視エリア5の画像データが表示された監視モニタ36に対し、ユーザによって指定された画像データ上の位置を示す座標を、マイクアレイ装置MAから、ユーザによって指定された画像データ上の位置に対応する実際の音源位置に向かう指向方向を示す座標に変換する座標変換式を有する。この座標変換処理では、設定管理部39は、上記座標変換式を用いて、マイクアレイ装置MAから、ユーザによって指定された位置に対応する音源位置に向かう指向方向を示す座標(θMAh,θMAv)を算出する。この座標算出処理の詳細については、例えば特開2015−029241号公報に記載されている。ここで、θMAhはマイクアレイ装置MAから音源位置に向かう指向方向の水平角を表し、θMAvはマイクアレイ装置MAから音源位置に向かう指向方向の垂直角を表す。音源位置は、監視モニタ36に表示された画像データに対し、ユーザの指又はスタイラスペンの操作によって操作部32から指定された位置に対応する実際の音源の位置である。なお、上記座標変換処理は、設定管理部39ではなく、信号処理部33により行われてもよい。
また、設定管理部39は、後述する音源検出部34により算出された画素毎の音圧pと比較される閾値(具体的には、音源検出部34により使用される音源検出閾値(後述参照)、更に、出力制御部35が音源方向画像を生成する際に出力制御部35により使用される第1閾値、第2閾値及び第3閾値)をメモリ39zに記憶して保持する。ここで、音圧pは、音源に関する音パラメータの一例として使用されており、マイクアレイ装置MAにより収音される音の大きさ又はその絶対値を表しており、スピーカ装置37から出力される音の大きさを表す音量とは区別している。音源検出閾値、第1閾値、第2閾値及び第3閾値は、監視エリア5内で発生した音声の音圧と比較される値であり、例えばユーザが不審な異常音又は警戒音(つまり、要注意音)と判断する任意の値として、大小関係が規定された上で設定される。例えば、第1閾値>第2閾値>第3閾値≧音源検出閾値である。ここで、音源は、音を実際に発している音源だけでなく、この音源から伝播された結果として音が聞こえる箇所を含む広義の音源である。また、予め設定される閾値の数は、3つに限定されず、1つ、2つもしくは4つ以上であってもよい。
通信部31は、カメラ装置CAにより送信された画像データ、及びマイクアレイ装置MAにより送信された音声データを受信して信号処理部33に出力する。また、通信部31は、ユーザの指又はスタイラスペンを用いた操作により操作部32から指定情報(後述参照)を、信号処理部33を介して取得すると、指定情報をカメラ装置CAに送信する。
操作部32は、ユーザの入力操作の内容を信号処理部33に通知するためのユーザインターフェース(UI:User Interface)であり、例えばマウス、キーボード等のポインティングデバイスで構成される。また、操作部32は、例えば監視モニタ36の画面に対応して配置され、ユーザの指やスタイラスペンによってタッチ入力操作が可能なタッチパネル又はタッチパッドを用いて構成されてもよい。操作部32は、ユーザの操作によって、監視モニタ36に表示された音源撮像画像の一例としての音声ヒートマップ画像MP(図6参照)のデータ上の任意の位置が指定されると、指定された位置を示す座標データを取得して信号処理部33に出力する。
メモリ38は、例えばRAM(Random Access Memory)を用いて構成され、指向性制御装置30が動作する際、指向性制御装置30の動作を規定するプログラム及びそのプログラムの実行時に使用されるデータを記憶するためのプログラムメモリ、指向性制御装置30の動作時に一時的にデータを記憶して保持するためのワークメモリとして機能する。また、メモリ38は音声ヒートマップ画像MPを記憶する。
信号処理部33は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)又はDSP(Digital Signal Processor)を用いて構成され、指向性制御装置30の各部の動作を全体的に統括するための制御処理、他の各部との間のデータの入出力処理、データの演算(計算)処理及びデータの記憶処理を行う。
なお上記したように、信号処理部33は、設定管理部39により保持される座標変換式を用いて、カメラ装置CAにより撮像された撮像画像データ上のユーザ指定位置を示す座標を基に、マイクアレイ装置MAから、撮像画像データ上のユーザ指定位置に対応する音源位置に向かう方向(つまり、指向方向)を算出してもよい。言い換えると、信号処理部33は、マイクアレイ装置MAから、監視モニタ36に表示された撮像画像データ上の座標(X,Y)で表される位置に対応する音源位置に向かう指向方向の座標(θMAh,θMAv)を算出する。
信号処理部33内の音源検出部34は、カメラ装置CAにより撮像される撮像画像データを構成する一つ一つの画素のサイズに関する情報とマイクアレイ装置MAにより収音された音声データとを基に、撮像画像データを構成する一つ一つの画素毎に音圧を算出する。これにより、音源検出部34は、撮像画像データを構成する一つ一つの画素毎に、該当する画素の位置に音圧の算出値を割り当てた音圧マップデータを生成する。音圧マップデータは撮像画像データを構成するそれぞれの画素の位置とその位置(つまり画素)における音圧の算出値とが対応付けられたデータである。なお、音源検出部34は、一つ一つの画素毎の音圧の算出値を基に音声マップデータを生成すると説明したが、一つ一つの画素毎の音圧の算出値を用いず、所定数(例えば4個)の画素からなる画素ブロック毎の音圧の算出値の平均値、最大値又は最小値を用いて、音圧マップデータを生成してもよい。
また、音源検出部の一例としての音源検出部34は、マイクアレイ装置MAにより収音された音声データを基に、その音声データにおける音源方向を検出する。音源検出部34における音源検出処理は公知技術であり、詳細な説明は割愛する。音源検出部34は、例えば監視エリア5を複数のブロックに分割し、マイクアレイ装置MAからブロック毎に向かう方向に音声の指向性を形成し、指向性が形成された方向の音声に既定の音源検出閾値を超える音声があるか否かを判定することで、監視エリア5内の音源方向を推定する。この音源方向を推定する方法は、例えば『論文「マイクロホンアレーを用いたCSP法に基づく複数音源位置推定」西浦敬信等、電子情報通信学会論文誌D−11 Vol.J83−D−11 No.8 pp.1713−1721 2000年8月』の文献に記載されている。
音源検出部34は、検出した音源方向における音声が監視制御システム10において不審なイベントに基づく異常音又は警戒音であるか否かを判定する。不審なイベントは、例えば監視エリア5に対して不審者が侵入する際に、監視エリア5の関係者の悲鳴、監視エリア5に設けられた窓又は扉のこじ開け若しくは破壊等である。具体的には、音源検出部34は、音源方向における音声の音圧が異常音又は警官音を定めるための既定の音源検出閾値を超えるか否かを判定する。
信号処理部33内の出力制御部35は、監視モニタ36及びスピーカ装置37の動作を制御するとともに、カメラ装置CAから送信された撮像画像データを監視モニタ36に出力して表示させ、マイクアレイ装置MAから送信された音声データをスピーカ装置37に音声出力させる。また、出力制御部35は、照明装置50における照明の点灯又は消灯の動作を制御してもよい。
また、出力制御部35は、マイクアレイ装置MAにより収音された音声データと信号処理部33又は設定管理部39により算出された指向方向の座標(θMAh,θMAv)とを用いて、マイクアレイ装置MAにより収音された音声データの指向性の形成処理を行うことで、指向方向の音声データを強調処理する。音声データの指向性形成処理は、例えば特開2015−029241号公報に記載されている公知の技術である。
また、出力制御部35は、音源検出部34により生成された音圧マップデータを用いて、音圧pの算出値と閾値(具体的には、第1閾値、第2閾値、第3閾値)との比較結果に基づく音源方向画像を生成する。音源方向画像は、音源検出部34により算出された音圧pの算出値と第1閾値、第2閾値、第3閾値との比較結果とに応じて、異常音又は警戒音の音源の存在を示す画像である。音圧pの算出値と第1閾値、第2閾値、第3閾値との比較結果に基づく音源方向画像の詳細については、図6を参照して後述する。
更に、出力制御部35は、生成した音源方向画像とカメラ装置CAにより撮像された撮像画像データとを重畳した音声ヒートマップ画像MP(例えば図6参照)を生成し、音声ヒートマップ画像MPのデータを監視モニタ36に出力して表示させる。
音声出力部の一例としてのスピーカ装置37は、マイクアレイ装置MAが収音した音声データ、又はマイクアレイ装置MAが収音し信号処理部33によって指向性が形成された音声データを音声出力する。なお、スピーカ装置37は、指向性制御装置30とは別体の装置として構成されてもよい。
照明装置50は、監視エリア5内の所定の空間の一部又は全体を照らすことが可能な装置である。照明装置50は、例えば首振り機構を有し、後述するようにマイクアレイ装置MA又は指向性制御装置30から点灯方向の指示を受けると、その点灯方向に照明ランプを向けて照明する。また、照明装置50は、監視エリア5内の複数の箇所に設置された複数の照明ランプを有し、マイクアレイ装置MA又は指向性制御装置30から指示を受けた点灯方向を照明可能な照明ランプを選択して点灯させてもよい。また、照明装置50は、監視エリア5全体の空間を照明可能な単一の照明ランプであり、マイクアレイ装置MA又は指向性制御装置30から点灯指示を受けると、撮像エリア全体を照明してもよい。更に、照明装置50は、段階的に照明の光量を調節可能な調光機能を有し、マイクアレイ装置MA又は指向性制御装置30からの点灯指示により初期値の光量で発光した後、次の指示を受けた場合に、光量アップ若しくは光量ダウンを行うようにしてもよい。照明ランプの光としては、白色灯、LED照明、ハロゲン照明等が挙げられる。
レコーダ装置60は、データの記録等の各処理を制御するための制御部(不図示)と、カメラ装置CAにより撮像された撮像画像データ及びマイクアレイ装置MAにより収音された音声データを対応付けて格納するための記録部(不図示)とを含む構成である。また、レコーダ装置60への録画開始若しくは録画終了は、マイクアレイ装置MA若しくは指向性制御装置30からの指示に従って行われる。また、レコーダ装置60は、上記した音声ヒートマップ画像MPのデータを記憶してもよい。
図2は、本実施形態のマイクアレイ装置MAの内部構成の一例を詳細に示すブロック図である。マイクアレイ装置MAは、複数のマイクロホンMA1、MA2、…、MAn、アンプ231,232,…,23n、A/D変換器241,242,243,…,24n、CPU25、符号化部28及び通信部29を有する。
アンプ231,232,…,23nは、複数のマイクロホンMA1、MA2、…、MAnで収音した音声信号を増幅する。A/D変換器241,242,243,…,24nは、それぞれアンプ231,232,…,23nによって増幅された音声信号をデジタル音声データに変換する。
CPU25は、マイクアレイ装置MAの各部の動作を全体的に統括するための制御処理、他の各部との間のデータの入出力処理、データの演算(計算)処理及びデータの記憶処理を行う。なお、マイクアレイ装置MAにおいて、CPU25の代わりに、MPU又はDSP等のプロセッサが設けられてもよい。
CPU25は、複数のマイクロホンMA1、MA2、…、MAnで収音し、A/D変換器241,242,243,…,24nによって変換された音声データを入力し、これらの音声データを基に、音声出力処理を行う。
符号化部28は、CPU25から出力される音声データを符号化し、ネットワークNWで伝送可能な音声パケットを生成する。通信部29は、符号化部28によって符号化された音声データを、ネットワークNWを介して指向性制御装置30に送信する。
マイクアレイ装置MAでは、CPU25は、通信部29において、指向性制御装置30から異常音又は警戒音が発生した音源方向の座標を含む指定情報を受信すると、照明装置50に対する点灯指示を照明装置50に送信し、更に、カメラ装置CAに対する撮像開始の指示をカメラ装置CAに送信する。更に、マイクアレイ装置MAのCPU25は、カメラ装置CAに対して撮像開始の指示を通信部29から送信させた後、カメラ装置CAの撮像方向が調整された後に、レコーダ装置60に対する録画開始の指示を通信部29からレコーダ装置60に送信させる。
なお本実施形態において、カメラ装置CAが複数の固定カメラにより構成されている場合に、ユーザ(例えば監視員)の操作により指向性制御装置30からいずれか一つの固定カメラが選択された旨の情報が上記指定情報に含まれ、この場合、マイクアレイ装置MAは、指向性制御装置30により選択された固定カメラに対し、撮像開始の指示を送信する。これにより、カメラ装置CAが全方位カメラやPTZカメラではなく、例えば既設の複数の固定カメラにより構成されている場合でも、マイクアレイ装置MAは、ユーザ(例えば監視員)により選択された最適な固定カメラに対し、異常音又は警戒音が発生した後の監視エリア5の状況を適切に撮像させることが可能となる。
なお、本実施形態では、指向性制御装置30が、マイクアレイ装置MAにより収音された音声が異常音又は警戒音であるか否かを判定し、更に、その異常音又は警戒音の音源方向を推定していたが、マイクアレイ装置MAが異常音が発生したか否かを判定し、その音源位置を推定するようにしてもよい。
図3は、本実施形態のマイクアレイ装置MAにより収音された音声に対して、特定の方向に指向性を形成する原理の一例の説明図である。指向性制御装置30は、マイクアレイ装置MAから送信された音声データを用いて、音声データの指向性制御処理によって各々のマイクロホンMA1〜MAnにより収音された各音声データを加算し、マイクアレイ装置MAの各マイクロホンMA1〜MAnの位置から特定の方向への音声(音量レベル)を強調(増幅)するために、特定方向への指向性を形成した音声データを生成する。特定の方向とは、マイクアレイ装置MAから操作部32で指定された音声位置に向かう方向である。なお、マイクアレイ装置MAによって収音される音声の指向性を形成するための音声データの指向性制御処理に関する技術は、例えば特開2014−143678号公報や特開2015−029241号公報(特許文献1)等に示されるように、公知の技術である。
図3では、説明を分かり易くするため、マイクロホンは直線上に一次元配列としている。この場合、指向性は面内の二次元空間になるが、三次元空間で指向性を形成するためには、マイクロホンを二次元配列にして同様な処理方法を行えば良い。
音源80から発した音波は、マイクアレイ装置MAに内蔵される各マイクロホンMA1,MA2,MA3,〜,MA(n−1),MAnに対し、ある一定の角度(入射角=(90−θ)[度])で入射する。入射角θは、マイクアレイ装置MAから音声位置に向かう指向方向の水平角θMAhでも垂直角θMAvでもよい。
音源80は、例えばマイクアレイ装置MAが収音する収音方向に存在するカメラ装置CAの被写体である人物の会話であり、マイクアレイ装置MAの筐体21の面上に対し、所定角度θの方向に存在する。また、各マイクロホンMA1,MA2,MA3,…,MA(n−1),MAn間の間隔dは一定とする。
音源80から発した音波は、最初にマイクロホンMA1に到達して収音され、次にマイクロホンMA2に到達して収音され、同様に次々に収音され、最後にマイクロホンMAnに到達して収音される。
マイクアレイ装置MAは、各マイクロホンMA1,MA2,MA3,…,MA(n−1),MAnが収音したアナログの音声データを、A/D変換器241,242,243,〜,24(n−1),24nにおいてデジタルの音声データにAD変換する。
更に、マイクアレイ装置MAは、遅延器251,252,253,〜,25(n−1),25nにおいて、各々のマイクロホンMA1,MA2,MA3,…,MA(n−1),MAnにおける到達時間差に対応する遅延時間を与えて全ての音波の位相をそろえた後、加算器26において遅延処理後の音声データを加算する。これにより、マイクアレイ装置MAは、各マイクロホンMA1,MA2,MA3,…,MA(n−1),MAnに、所定角度θの方向に音声データの指向性を形成する。
このように、マイクアレイ装置MAは、遅延器251,252,253,〜,25(n−1),25nに設定される遅延時間D1,D2,D3,〜,Dn−1,Dnを変更することで、収音した音声データの指向性を簡易に形成することができる。
図4は、本実施形態のカメラ装置CAの内部構成の一例を詳細に示すブロック図である。カメラ装置CAは、CPU41、通信部42、電源管理部44、イメージセンサ45、メモリ46及びネットワークコネクタ47を有する。
CPU41は、カメラ装置CAの各部の動作を全体的に統括するための制御処理、他の各部との間のデータの入出力処理、データの演算(計算)処理及びデータの記憶処理を行う。なお、カメラ装置CAにおいて、CPU41の代わりに、MPU又はDSP等のプロセッサが設けられてもよい。
イメージセンサ45は、例えばCMOS(相補性金属酸化膜半導体)センサで構成され、監視エリア5の状況を撮像して画像データを取得する。なお、CMOSセンサの代わりに、CCD(電荷結合素子)センサが用いられてもよい。
メモリ46は、動作プログラムや設定値のデータが格納されたROM46z、画像データやワークデータを記憶するRAM46y、及びカメラ装置CAに挿抜自在に接続され、各種データが記憶されるメモリカード46xを有する。
通信部42は、ネットワークコネクタ47を介して接続されるネットワークNWとのデータ通信を制御するネットワークインタフェース(I/F)である。
電源管理部44は、カメラ装置CAの各部に直流電源を供給し、また、ネットワークコネクタ47を介してネットワークNWに接続される機器に直流電源を供給する。ネットワークコネクタ47は、画像データ等の通信データを伝送し、また、ネットワークケーブルを介して給電可能なコネクタである。
上記構成を有する監視制御システム10における監視動作について説明する。
図5は、本実施形態の監視制御システム10における監視動作の手順を説明するシーケンス図である。図5において、まず、ユーザhmが指向性制御装置30に対し操作部32を介して音源監視開始を指示する(T1)。指向性制御装置30は、電源オンで起動しており、この音源監視開始が指示されると、指向性制御装置30内の信号処理部33は、マイクアレイ装置MAに対する音声出力の要求を通信部31からマイクアレイ装置MAに送信させる(T2)。ステップT2に続けて、信号処理部33の音源検出部34は、音源検出を開始する(T3)。この音源検出の処理は、例えば音源検出部34による音源の方向及び音圧を求める動作であり、例えば指向性制御装置30の電源がオンしている間は、マイクアレイ装置MAから音声データが送信されると継続的に行われる。
マイクアレイ装置MAは、電源オンによって収音動作を開始しており、指向性制御装置30からの音声出力の要求を受けると、指向性制御装置30に対し繰り返し音声データを送信する(T4)。
指向性制御装置30は、マイクアレイ装置MAから音声データを受信すると、指向性制御装置30内の信号処理部33の音源検出部34は、カメラ装置CAにより撮像される撮像画像データを構成する一つ一つの画素のサイズに関する情報とマイクアレイ装置MAにより収音された音声データとを基に、撮像画像データを構成する一つ一つの画素毎に音圧を算出する。また、音源検出部34は、撮像画像データを構成する一つ一つの画素毎に、該当する画素の位置に音圧の算出値を割り当てた音圧マップデータを生成する。出力制御部35は、音圧マップデータを用いて、音圧pの算出値と閾値(具体的には、第1閾値、第2閾値、第3閾値)との比較結果に基づく音源方向画像を生成する。出力制御部35は、生成した音源方向画像とカメラ装置CAにより撮像された撮像画像データとを重畳した音声ヒートマップ画像MP(例えば図6参照)を生成し、音声ヒートマップ画像MPのデータを監視モニタ36に出力して表示させる(T5)。
監視モニタ36は、音声ヒートマップ画像のデータを入力すると、音声ヒートマップ画像MPのデータを表示する(T6)。なお、ステップT6以降では、ステップT5において随時、指向性制御装置30から出力される音声ヒートマップ画像のデータが表示されることで、音声ヒートマップ画像MPが時間的に連なる映像として表示される。
ここで、音声マップデータに所定の条件(例えば音圧が音源検出閾値を超える)を満たす音源が無い場合、監視モニタ36は、何も映っていない映像(例えば画面が黒いままの画像)を表示する(T7)。なお、所定の条件を満たす音源とは、音圧が音源検出閾値を超えるものに限らず、高音域或いは低音域の音声を発するもの、楽音或いは騒音を発するもの等、種々の音源が挙げられる。
音圧が音源検出閾値を超えるような異常音又は警戒音が発生すると(T8)、マイクアレイ装置MAは、その異常音又は警戒音を含む音声データを指向性制御装置30に送信する(T9)。指向性制御装置30は、異常音又は警戒音が発生した音源の方向を求め、異常音の音源方向画像を含む音声ヒートマップ画像MPのデータを監視モニタ36に出力する(T10)。監視モニタ36は、マイクアレイ装置MAから見て異常音又は警戒音が発生した音源方向及び音圧値を示す音源方向画像を、マイクアレイ装置MAから見て他の方向とは異なる表示形態で描画した音声ヒートマップ画像MPを表示する(T11)。なお、音声ヒートマップ画像MPは、指向性制御装置30の信号処理部33の出力制御部35により生成される。
図5では、監視モニタ36の画面の左側には、異常音又は警戒音が発生した音源の音源方向画像sdとして、異なる大きさの楕円形が重なるように描画されている。画素毎の音圧は、異常音又は警戒音を判定するための、3つの閾値(第1閾値>第2閾値>第3閾値)と比較される。例えば最も内側の楕円形で囲まれる音圧方向画像は、第1閾値を超えて最も高く、赤色で塗り潰される。また、最も外側の楕円形で囲まれる音圧方向画像は、第3閾値を超えるが第2閾値以下で最も低く、青色で塗り潰される。なお、ここでは、異常音を発生させた音源の音源方向画像sdは、異なる色で表現されたが、異なる模様等、他の表示形態で表現することも可能である。
指向性制御装置30は、異常音又は警戒音に対する音源検出部34の検出結果(つまり、マイクアレイ装置MAから見て異常音又は警戒音が発生した音源方向に関する情報)をマイクアレイ装置MAに送信する(T12)。マイクアレイ装置MAは、指向性制御装置30から送信された、異常音又は警戒音に対する音源検出部34の検出結果を受信すると、照明装置50に対し点灯指示を送信する(T13)。この点灯指示には、マイクアレイ装置MAから見て異常音又は警戒音が発生した音源の方向に関する情報が含まれている。例えば、照明装置50は、マイクアレイ装置MAから見た音源の方向と照明装置50がどのエリアを照明すれば良いかを示す情報とを対応付けて保持しており、上記点灯指示に含まれる、マイクアレイ装置MAから見て異常音又は警戒音が発生した音源の方向に関する情報を基に、その音源の方向のエリアの照明を点灯することができる。
照明装置50は、点灯指示を受信すると、照明装置50から見て異常音又は警戒音の音源方向を含む監視エリア5内の空間を照明する(T14)。なお、ここでは、異常音又は警戒音が発生した音源方向の検出は、指向性制御装置30が行っていたが、指向性制御装置30の代わりに、例えば音源検出部34と同一の構成を有するマイクアレイ装置MAが行ってもよい。また、照明装置50への点灯指示は、マイクアレイ装置MAではなく、指向性制御装置30が行ってもよい。
マイクアレイ装置MAは、照明装置50に点灯指示を行った後、カメラ装置CAに対し撮像開始の指示を送信する(T15)。つまり、マイクアレイ装置MAは、指向性制御装置30内の音源検出部34によって検出された音源方向がカメラ装置CAから見た方向に置き換わった方向への撮像開始の指示を送信する。この撮像開始の指示には、マイクアレイ装置MAから見て異常音又は警戒音が発生した音源の方向がカメラ装置CAから見てどの方向であるかに関する情報が含まれている。この異常音又は警戒音が発生した音源の方向がカメラ装置CAから見た方向に変換される処理は、マイクアレイ装置MAにより行われてもよいし、指向性制御装置30の設定管理部39又は信号処理部33により行われてもよい。ここでは、カメラ装置CAがPTZカメラであれば、マイクアレイ装置MAは、パン・チルト・ズームの動作をカメラ装置CAに指示する。また、カメラ装置CAが複数の固定カメラで構成される場合、マイクアレイ装置MAは、いずれの固定カメラを指定する。また、カメラ装置CAが全方位カメラである場合、マイクアレイ装置MAは、単に撮像開始の指示を送信する。この場合、カメラ装置CAは、撮像開始の指示に含まれる切り出し方向に従って、全方位カメラにより撮像された円形画像(つまり、360度の方位を含む全方位画像)に対しパノラマ変換を行い、パノラマ画像を生成してもよい。
カメラ装置CAは、撮像した画像データを監視モニタ36に送信し、その表示開始を指示する(T17)。以後、カメラ装置CAで撮像された画像データは、監視モニタ36に表示される。同時に、カメラ装置CAは、撮像した画像データをレコーダ装置60に送信する(T18)。監視モニタ36は、カメラ装置CAで撮像された画像データの表示を開始する(T19)。この場合、撮像エリアは、照明装置50によって照明されているので、監視モニタ36の画面には、照明された撮像エリア内の画像データが映し出されている。ただし、この段階では、カメラ装置CAの向きが調整前である(言い換えると、異常音又は警戒音が発生した音源の方向に光軸が向いていない)ので、監視モニタ36の画面には、異常音が発生した音源の方向とは異なる方向の撮像画像が映し出されている。
カメラ装置CAは、撮像開始後、マイクアレイ装置MA又は指向性制御装置30から指示された音源方向に撮像方向を調整する(T20)。
マイクアレイ装置MAは、撮像方向の調整済みと判断される時間の経過後、レコーダ装置60に対し録画開始を指示する(T21)。レコーダ装置60は、この録画開始指示を受けると、起動して録画を開始する(T22)。撮像方向の調整後に録画を開始することで、調整前の画像データを録画しなくて済み、有効な画像データだけを記録することが可能となる。
なお、マイクアレイ装置MAは、カメラ装置CAに対する撮像開始指示後の所定時間が経過すると、撮像方向の調整済みと判断したが、カメラ装置CAからの応答信号(Ack)を待ち、応答信号があった場合、撮像方向の調整済みと判断してもよい。
また、カメラ装置CAが撮像方向の調整を終えると、監視モニタ36は、マイクアレイ装置MAから指示された音源方向の画像データを表示する(T23)。この段階では、マイクアレイ装置MAにより収音された異常音又は警戒音の音源方向と、カメラ装置CAで撮像される撮像方向(つまり、光軸方向)とは、一致する。監視モニタ36の画面には、異常音又は警戒音が発生した音源方向で、不審人物hbが窓wdを割ろうとしている画像データが映し出されている。
また、ユーザhmが、監視モニタ36に表示されている画像データを見ながら、例えば指向性制御装置30の操作部32を介して、画像データが表示された監視モニタ36上の任意の位置を指定する(T24)。なお、監視モニタ36がタッチパネルで構成される場合、ユーザhmは監視モニタ36の画面に直接タッチすることで、画像上の任意の位置を指定してもよい。指向性制御装置30内の信号処理部33の出力制御部35は、マイクアレイ装置MAから、ユーザhmにより指定された位置に対応する音源位置に向かう方向(つまり、指向方向)に音声の指向性を形成し(T25)、指向方向に強調された音声をスピーカ装置37に送る(T26)。スピーカ装置37は、出力制御部35からの指向方向に強調された音声を出力する(T27)。これにより、ユーザhmは、異常音又は警戒音が発生した箇所の画像データを確認できるだけでなく、その音源方向の音声も聞くことができる。従って、ユーザhmは、本実施形態の監視制御システム10により、万全な監視が可能となる。
図6は、監視エリア5の撮像画像GZのデータに種々の音源方向画像sd1,sd2,sd3,sd4が重畳された音声ヒートマップ画像MPのデータを示す図である。図6では、合計4箇所の音源方向画像が示されているが、音源方向画像は1箇所でもよい。また、図6では、図5に示すステップT23の時点において監視モニタ36に表示された音声ヒートマップ画像MPの一例として説明するが、図6に示す音声ヒートマップ画像MPはステップT23の時点における画像に限定されない。例えば図6に示すそれぞれの異常音又は警戒音が発生した時点で検出されたそれぞれの音源方向のエリアが既に照明装置50により照明されている状況の音声ヒートマップ画像MPでもよい。
図6において、音声ヒートマップ画像MPには、4か所で異常音と判定された音源方向画像sd1,sd2,sd3,sd4が描画されている。それぞれの音源方向画像sd1,sd2,sd3,sd4は、指向性制御装置30の信号処理部33の出力制御部35により生成される。音源方向画像sd1では、通路にいる人物が携帯電話を使用して話している音声が音源として描画される。音源方向画像sd2では、デスクに置かれた固定電話が鳴動する音声が音源として描画される。音源方向画像sd3,sd4では、2人の人物が会話している音声が音源として描画される。
これらの音源方向の音圧pは、前述したように、出力制御部35において、3つの閾値(第1閾値>第2閾値>第3閾値)と比較され、各比較結果に応じた音源方向画像が生成され、楕円形で示される。例えば、出力制御部35は、音源方向画像sd1において、音圧pの算出値が第1閾値を超える音源方向画像sd11を、赤色(濃いドット表示)で描画した上で生成する。出力制御部35は、音圧pの算出値が第1閾値以下でありかつ第2閾値を超える音源方向画像sd12を、黄色(通常のドット表示)で描画した上で生成する。出力制御部35は、音圧pの算出値が第2位置以下でありかつ第3閾値を超える音源方向画像sd13を、青色(薄いドット表示)で描画した上で生成する。なお、音圧pの算出値が第3閾値以下の音源方向画像は透明のままで特に描画されないが、特定の色で描画されてもよく、この場合、明示的に音圧が小さいことが分かるようになる。また、音源方向画像は、色の他、模様や濃淡等で表現されてもよい。
また、監視モニタ36の画面に表示された、例えば異常音と判定された音源方向画像sd1〜sd4のいずれかをタッチ操作で指定すると、その音源方向の音声がスピーカ装置37から出力される。これにより、ユーザhmは、監視エリア5の画像を見ながら、異常音又は警戒音と判定された、気になる音源方向の音声を聞くことができ、万全な監視を行うことが可能である。
以上により、本実施形態の監視制御システム10では、カメラ装置CAは、撮像対象のエリアの一例としての監視エリア5の状況を映像として撮像し、マイクアレイ装置MAは、同監視エリア5内の音声を収音する。監視モニタ36は、カメラ装置CAにより撮像されたエリアの画像データ(映像データ)を表示する。指向性制御装置30内の音源検出部34は、マイクアレイ装置MAにより収音された音声の音源方向を検出する。指向性制御装置30内の出力制御部35は、音源検出部34により検出された、異常音又は警戒音の音源方向を示す音源方向画像を生成する。マイクアレイ装置MAにより収音された音声の音圧pが閾値(つまり、音源検出閾値)を超える場合、照明装置50は、マイクアレイ装置MA又は指向性制御装置30の指示により、監視エリア5のうち異常音又は警戒音が発生した音源方向のエリアを照明する。監視モニタ36は、出力制御部35により生成された音源方向画像を、カメラ装置CAにより撮像された画像(撮像画像)に重畳して表示する。
これにより、監視制御システム10は、監視エリア5が薄暗い場所又は夜間に不審な異常音又は警戒音が発生した場合でも、音源検出部34により算出された音圧pが第1閾値〜第3閾値のうち少なくともいずれか1つを超えれば、監視エリア5が照明装置50により照明された後にカメラ装置CAによりその監視エリア5の状況を撮像するので、その監視エリア5で発生した不審な異常音又は警戒音の原因が何であるかをユーザhm(例えば監視員)にとって容易に視認、判別させ易くすることができる。また、音声ヒートマップ画像MPにおいて、音源方向画像sd1,sd2,sd3,sd4が他の画像部分と異なる表示形態で表示されるので、ユーザhmは、視覚的に音源方向を分かり易くなる。
また、本実施形態の監視制御システム10では、異常音又は警戒音の信号レベル(例えば音圧の大きさ)に応じて、音源方向画像が異なる複数の表示形態で表示される。ここでは、第1閾値を超える音源方向画像sd11は、赤色で描画される。第1閾値以下でありかつ第2閾値を超える音源方向画像sd12は、黄色で描画される。第2位置以下でありかつ第3閾値を超える音源方向画像sd13は、青色で描画される。従って、音源が発する音圧の大きさも大まかに分かる。これにより、音源についてより多くの情報が得られる。
また、本実施形態の監視制御システム10では、指向性制御装置30は、異常音又は警戒音が発生したと判定した場合に、異常音の音源方向のエリアが撮像された画像データをレコーダ装置60において記録する。これにより、ユーザhmは、異常音又は警戒音が発生した場合に、事後的に異常音又は警戒音が発生した音源を確認する作業を容易に行うことができ、監視業務効率を向上することができる。
また、本実施形態の監視制御システム10では、監視モニタ36に表示された音源方向画像sdがユーザhmの操作により指定されると、指向性制御装置30は、音源方向画像sdが示す音源方向を、マイクアレイ装置MAからの指向方向(つまり、マイクアレイ装置MAから、音源方向画像sdに対応する実際の音源位置に向かう方向)に方向を示す座標(θMAh,θMAv)を置換処理し、置換処理後の座標を用いて音声の指向性を形成して音声を出力する。これにより、ユーザhmは、注目したい音源から発せられる音声を聞くことができる。これにより、万全な監視を行うことが可能となる。
また、本実施形態の監視制御システム10では、マイクアレイ装置MAにより収音された音声の中で異常音又は警戒音が複数発生した場合に、指向性制御装置30の出力制御部35は、異常音毎又は警戒音毎に、異なる音源方向画像sd1,sd2,sd3,sd4を生成する。監視モニタ36は、異なる音源方向画像sd1,sd2,sd3,sd4を、カメラ装置CAにより撮像された撮像画像に重畳して表示する。これにより、ユーザhmは、複数の異常音又は警戒音が監視エリア5の中で発生した場合でも、カメラ装置CAにより撮像された撮像画像に異なる音源方向画像sd1,sd2,sd3,sd4が重畳されるので、カメラ装置CAにより撮像された撮像画像の中で個々の異常音又は警戒音の音源の有無を視覚的かつ直感的に把握することができ、監視エリア5の監視業務の効率化を向上することができる。
以上、図面を参照しながら実施の形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
例えば、上記実施形態では、指向性制御装置が、音源方向を検出し、その音圧を算出し、音圧が閾値を超えるような異常音を判定していたが、これらの機能をマイクアレイ装置が備えるようにしてもよい。これにより、指向性制御装置が行う処理の負荷を軽減できる。