(第1実施形態)
以下、図面を参照しながら、画像特定システムおよび画像特定方法の実施形態について詳細に説明する。まず、第1実施形態の画像特定システムおよび画像特定方法について図1から図15を用いて説明する。
図1の符号1は、第1実施形態の画像特定システムである。この画像特定システム1は、作業現場に居る作業者Wが所持する現場端末2と、作業者Wの監視または支援を行う管理者Mが扱う管理コンピュータ3とを備える。
本実施形態の作業現場としては、発電プラント、化学プラント、工場などがある。これらの作業現場には、機密に関する情報または忌避すべき情報などを含む秘匿情報が管理されている場合がある。秘匿情報には、この管理エリア内に設けられる施設または機器に関する情報が含まれる。例えば、対象部分としての監視カメラなどの対象機器4(図4参照)の設置場所などの情報が含まれる。
保安上のリスク低減または技術情報の漏洩防止を目的として、秘匿情報に関するものを管理エリア内の所定の撮影場所にて撮影したときに、その画像を管理エリア外へ持ち出すことを禁止している場合がある。特に、撮影機材を持ち出す際には、内部メモリをチェックして情報管理をしている。
しかしながら、作業者Wが作業現場にて点検作業などを行っているときに、現場端末2で撮影した画像に秘匿情報に関するものが写り込んでしまう場合がある。そこで、画像特定システム1では、管理コンピュータ3を用いて、秘匿情報に関するものが写っている画像ファイルと、秘匿情報に関するものが写っていない画像ファイルとを選別(スクリーニング)する。そして、秘匿情報に関するものが写っている画像ファイルを公開の対象から除外し、秘匿情報に関するものが写っていない画像のみを他者に公開できるようにする。
管理コンピュータ3は、画像をチェックするチェックエリアに設けられる。そして、管理者Mが管理コンピュータ3を操作して、画像ファイルの選別を行う。なお、管理者Mを置かずに管理コンピュータ3が自動的に画像ファイルの選別をしても良い。
なお、本実施形態では、撮影制限の対象(非公開の対象)となっている対象部分としての対象機器4を監視カメラとして例示しているが、その他の態様であっても良い。例えば、対象部分としての対象機器4は、計器でも良いし、操作スイッチでも良いし、バルブでも良いし、配管でも良いし、装置でも良いし、センサでも良い。
また、本実施形態では、対象部分として対象機器4を例示しているが、対象部分は建物の所定の部分、例えば、窓、扉、壁、天井、床、通路、壁の開口部、室内空間の一部の範囲であっても良い。また、巨大な1つの装置の一部が対象部分であっても良い。さらに、1つの装置の複数箇所が対象部分であっても良い。
画像特定システム1では、対象機器4の位置が予め特定されている。そして、現場端末2の位置と撮影方向と画角とに基づいて、撮影された画像に対象機器4が写っているか否かを管理コンピュータ3により判定するようにしている。このようにすれば、管理者Mが目視で画像を選別する必要がなく、見落としなどのミスを防ぐことができる。また、画像に対象機器4が明りょうに写っていなくても、対象機器4が写っている可能性がある場合には、その画像を選別することができる。
なお、作業者Wは、現場端末2を用いて作業現場で撮影を行い、その画像が管理コンピュータ3に送信される。本実施形態の画像は、いわゆる映像であって、ビデオ映像(動画像)または静止画像のいずれでも良い。また、「画像ファイル」には、静止画像を含むファイルのみならず、動画像を含むファイルが含まれるものとして説明する。
作業者Wが扱う移動可能な現場端末2は、例えば、ディスプレイ6(図2参照)を備えるスマートフォン7で構成されている。このスマートフォン7には、現場の状況を撮影するためのカメラ8(図2参照)が搭載されている。なお、スマートフォン7のディスプレイ6は、画像を表示する装置であるとともに、入力装置としてのタッチパネルを兼ねる。本実施形態の入力操作には、タッチパネルを用いたタッチ操作が含まれる。
また、他の作業者Wが扱う異なるタイプの現場端末2は、この作業者Wが装着する透過型ヘッドマウントディスプレイ9を備えるウェアラブルコンピュータ10(スマートグラス)で構成されている。このウェアラブルコンピュータ10は、透過型ヘッドマウントディスプレイ9と分離した構造でも良い。このウェアラブルコンピュータ10にも現場の状況を撮影するカメラが搭載されている。
なお、現場端末2は、タブレット型PCまたはノートPCで構成されても良い。その他、撮影機能、通話機能、通信機能を持つ機器で構成されるものであり、それぞれの機能を持つ複数の機器で構成されるものでも良い。
スマートフォン7およびウェアラブルコンピュータ10のシステム構成は、ほぼ同一であるため、以下の説明では、スマートフォンで構成される現場端末2を例示する。なお、本実施形態は、ウェアラブルコンピュータ10にも適用可能である。
管理者Mが扱う管理コンピュータ3は、例えば、デスクトップPC、ノートPC、またはタブレット型PCなどの所定のコンピュータで構成される。本実施形態では、デスクトップPCを例示する。管理コンピュータ3は、コンピュータ本体11と、管理者Mが視認を行うディスプレイ12と、現場端末2と無線通信を行う無線通信装置13を備える。ここでは、無線通信を行う例を記載しているが、有線での通信とすることも可能である。なお、ディスプレイ12はコンピュータ本体11と別体であっても良いし、一体であっても良い。
本実施形態において、現場端末2は、自位置および自姿勢を特定することができる。例えば、GPS(Global Positioning System)などの位置測定システムを有していても良い。
また、現場端末2の自位置および自姿勢の変位の算出に用いる位置推定技術には、SLAM(Simultaneous Localization and Mapping)、SfM(Structure from Motion)などの公知の技術を用いることができる。
本実施形態の現場端末2は、VSLAM(Visual Simultaneous Localization and Mapping)を用いて、現場端末2で撮影された画像に基づいて、その位置および姿勢の変位を算出する。つまり、現場端末2は、例えば、屋内などのGPSが使用できない場所でも自己位置を推定することができる。
VSLAM技術では、現場端末2のカメラ8およびセンサなどの所定のデバイスで取得した情報を用いて、周囲の物体の特徴点を抽出する。そして、カメラ8で撮影した動画像を解析し、物体の特徴点(例えば、角などの物体の部分)をリアルタイムに追跡する。そして、現場端末2の位置または姿勢の3次元情報を推定する。
図3に示すように、作業者Wが作業を行う作業現場として所定の建物14を例示する。例えば、発電プラントにおける所定の区画に設けられた建物14が作業現場となっている。この作業現場は、壁で囲まれた複数の部屋15がある。これら複数の部屋15のうち、1つの部屋15が作業現場として予め設定される。つまり、この部屋15が、現場端末2が画像の取得が許可されている許可エリア16として予め設定される。なお、許可エリア16以外では、画像の取得が許可されていないもの(非許可エリア)として説明する。
建物14の出入口17は、現場端末2の位置を推定する基準となる基準点として設定される。この建物14の出入口17には、本実施形態の特定被写体としてのマーカ5が配置される。また、それぞれの部屋15の出入口18も、現場端末2の位置を推定する基準となる基準点として設定される。これらの部屋15の出入口18にも、マーカ5が配置される。なお、マーカ5は、出入口17,18の近傍の壁面に設けられても良いし、出入口17,18の扉面に設けられても良い。
作業者Wは、作業を開始するときに、まず、建物14の出入口17でマーカ5を撮影する。ここで、現場端末2は、マーカ5が写った撮影画像に基づいて、自位置および自姿勢を推定する。なお、建物14の出入口17でマーカ5の撮影を開始し、移動中も撮影を継続することで、基準点から現場端末2が移動した移動経路19を推定できる。
なお、マーカ5は、画像認識が可能な図形である。例えば、マトリックス型2次元コード、所謂QRコード(登録商標)をマーカ5として用いる。また、建物14または建物14に設置されている対象機器4などの場所を特定できる情報を特定被写体(マーカ)として用いても良い。例えば、出入口17の銘板、部屋15の銘板、対象機器4の機器番号または名称を記載した銘板などを特定被写体として用いても良い。銘板とは、小型の平板に銘柄を表示したものである。マーカ5および銘板は、所定の位置に固定された状態で設けられている。
また、マーカ5には、対応するマーカ5を個々に識別可能なマーカIDを示す情報が含まれる。このようにすれば、複数のマーカ5をそれぞれ識別することができる。なお、銘板には、番号(例えば、シリアル番号)または名称などの銘板を個々に識別可能な情報が記載されている。銘板の形状または記載されている文字などを画像認識させることで、個々の銘板を識別することができる。さらに、それぞれの銘板に対応して銘板IDが予め付与されている。
管理コンピュータ3には、例えば、それぞれの部屋15の出入口18に設けられたマーカ5のマーカIDに対応して対象機器4に関する情報が登録される。なお、部屋15の出入口18のマーカ5を撮影して基準点を取得しなければ、部屋15の内部で画像の撮影を行えないように制御しても良い。
作業者Wは、部屋15の出入口18に到着したら、まず、現場端末2でマーカ5を読み取る。そして、マーカ5に基づいて取得される基準点の座標と、部屋15に対応して予め設定されている基準点の座標とを一致させる。そして、現場端末2で画像の保存をした場合に、その撮影時の位置情報と方向情報とを、基準点の座標に基づいて取得する。
例えば、読み込んだマーカ5の座標と現場端末2の座標との相対位置を特定し、現場端末2の撮影時の位置情報と方向情報とを取得する。つまり、現場端末2の座標は、マーカ5の座標を原点としたもので示される。本実施形態では、それぞれの部屋15の出入口18に設けられたマーカ5を原点として現場端末2の座標(相対座標)を取得する。つまり、現場端末2の座標は、部屋15ごとに取得されるものとなっている。なお、建物14の出入口17に設けられた1つのマーカ5を原点として、それぞれの部屋15の内部における現場端末2の座標(絶対座標)を取得しても良い。
本実施形態では、マーカ5または銘板の少なくともいずれか一方を用いて現場端末2の座標を取得する。なお、マーカ5による現場端末2の座標の取得と、銘板による現場端末2の座標の取得との両態様を混在させても良い。
マーカ5を設ける態様としては、例えば、マーカ5が印刷されたパネルを作成し、このパネルを、作業開始前に作業現場の壁面などに配置しておく。なお、壁面などにマーカ5を直接印刷しても良い。また、銘板は、装置などに取り付けられている既存のものを利用することができる。このようにすれば、既に部屋15または装置などに設けられている銘板により基準点を取得することができるため、マーカ5を設置する手間を省略することができる。なお、予め銘板を撮影し、画像認識ができるように銘板の画像の特徴量を取得しておく。マーカ5または銘板に関する情報は、管理コンピュータ3に記憶される。
また、現場端末2を制御する端末制御部28(図2参照)は、現場端末2で画像の保存をした場合に、撮影時のカメラ8の設定情報を取得する。この設定情報は、絞り値情報とシャッタースピード情報とISO感度情報と画角情報と倍率情報との少なくともいずれかを含む。ここで、絞り値情報は、カメラ8による画像の撮影時の絞り値を特定可能な情報である。シャッタースピード情報は、カメラ8による画像の撮影時のシャッタースピードを特定可能な情報である。ISO感度情報は、カメラ8による画像の撮影時のISO感度(明度)を特定可能な情報である。画角情報は、カメラ8による画像の撮影時の画角を特定可能な情報である。倍率情報は、カメラ8による画像の撮影時の倍率(拡大率)を特定可能な情報である。
図4に示すように、許可エリア16において、作業者Wが現場端末2を用いて様々な撮影を行う。このときに撮影された画像は、画像ファイルとして現場端末2に記憶される。なお、現場端末2にて記憶される画像ファイルには、撮影時の現場端末2の位置(座標)と撮影方向と撮影時のカメラ8の設定情報とを含む撮影情報(図8参照)が対応付けられる。
ここで、撮影時の現場端末2の位置は、建物14またはマーカ5を基準とする3次元座標に基づいて特定される。撮影方向は、撮影時の位置での水平面内の方位(ヨー角)と現場端末2のピッチ角、ロール角に基づいて求められる。また、画角は、現場端末2のカメラ8の撮影角(実際に写る範囲を角度で表したもの)であり、拡大率を含んでいる。なお、撮影情報には、その他の情報が含まれていても良い。例えば、端末ID、撮影者の情報、撮影日時などの情報が含まれていても良い。
また、現場端末2で撮影された画像を含む画像ファイルは、管理コンピュータ3に送信される。なお、管理コンピュータ3に対する画像の送信タイミングは、作業中であっても良いし、作業終了後であっても良い。また、管理コンピュータ3に送信を完了したときに、現場端末2に記憶されている画像を消去しても良い。
本実施形態では、撮影情報が画像を含む画像ファイルの属性として記録される。このようにすれば、画像ファイルと撮影情報とを直接的に対応付けることができる。例えば、画像をExif(Exchangeable image file format)の形式で保存した場合には、そのプロパティ(属性)として撮影情報を記録することができる。画像ファイルを移動しても一緒に撮影情報も移動されるため、画像ファイルの管理が容易になる。
例えば、図8に示すように、画像ファイルのプロパティには、ファイル名(画像ID)と端末IDとユーザIDと撮影日時(撮影時刻)と撮影ID(撮影情報)と対象機器ID(対象情報)と基準点IDとマーカIDと位置情報(座標数値)と方向情報(角度数値)と絞り値情報とシャッタースピード情報とISO感度情報と画角情報(角度数値)と倍率情報とが記録される。
なお、管理コンピュータ3において、画像に撮影制限の対象となっている対象機器4が写っているか否かの判定が行われた場合には、その判定結果を示す判定情報も記録される。この判定情報は、外部への公開が制限される制限ファイルであるか、外部への公開が制限されない非制限ファイルであるかを示すものである。このように、画像ファイルのプロパティには、各種情報が追記可能となっている。さらに、その他の情報を画像ファイルのプロパティに追記しても良い。
図8では、静止画像の画像ファイルのプロパティを例示している。ここで、ファイル名は、画像ファイルの名称である。端末IDは、複数の現場端末2を個々に識別可能な識別情報である。画像ファイルのプロパティには、作業現場で撮影に用いた現場端末2の端末IDが記録される。
ユーザIDは、複数の作業者Wを個々に識別可能な識別情報である。なお、ユーザIDは、現場端末2にログインするときに使用するものであっても良いし、それぞれの作業者Wが所持するIDカードに登録されるものであっても良い。画像ファイルのプロパティには、作業現場で撮影を行った作業者WのユーザIDが記録される。
撮影日時(時間情報)は、現場端末2で撮影を行った日付と時刻である。なお、動画像の画像ファイルの撮影日時は、録画の開始時でも良いし、録画の終了時でも良い。
撮影IDは、現場端末2を用いた撮影態様を個々に識別可能な撮影態様識別情報である。1つの撮影IDは、1つの位置情報と1つの方向情報とに対応付けられる。カメラ8で取得した画像が静止画像である場合には、1つの撮影IDが対応付けられる。また、カメラ8で取得した画像が動画像である場合には、1フレームごとに1つの撮影IDが対応付けられる。なお、動画像のトラックに撮影IDを対応付けても良い。
例えば、動画像の撮影時にカメラ8が移動または動作している場合には、現場端末2の位置およびカメラ8の向きが変化するため、1つの画像ファイルに複数の撮影IDが対応付けられる。一方、動画像の撮影時にカメラ8が固定されている場合には、現場端末2の位置およびカメラ8の向きが変化することがないため、1つの画像ファイルに対応付けられる撮影IDが1つでも良い。なお、カメラ8で取得した画像が動画像である場合には、1フレームごとに絞り値情報とシャッタースピード情報とISO感度情報と画角情報と倍率情報とが対応付けられる。
また、撮影情報は、予め規定された識別子として生成しても良い。識別子とは、例えば、所定の計算関数に撮影情報のそれぞれの値を入力すると、所定の数式として出力されるものである。そして、識別子に基づいて撮影情報を再現できるようにする。このようにすれば、撮影情報を識別子という規定化された態様で記録することができる。例えば、画像ファイルの属性に識別子を記録しても良い。
また、識別子を画像に含ませる態様で記録しても良い。このようにすれば、画像そのものに撮影情報を含ませることができる。そのため、画像の管理が容易になる。なお、識別子を画像に含ませる態様とは、例えば、識別子をマトリックス型2次元コードとして生成し、この2次元コードを画像に合成する態様でも良い。また。識別子を電子透かしとして画像に含める態様でも良い。
また、撮影情報が、画像を含む画像ファイルとは異なる記録ファイルに記録されても良い。例えば、画像ファイル20と同一のファイル名を有する記録ファイル21を生成し(図9参照)、この記録ファイル21に撮影情報を記録しても良い。このようにすれば、撮影情報のデータ量が多くなる場合であっても、その記録を行うことができる。例えば、動画の場合には、撮影情報のデータ量が多くなるが、この場合でも撮影情報を記録することができる。
なお、本実施形態では、ファイル名により画像ファイル20と記録ファイル21とを対応付けているが、その他の態様であっても良い。例えば、画像ファイル20を特定可能な特定IDを生成し、この特定IDを記録ファイル21に記録することで、画像ファイル20と対応付けても良い。また、コンピュータのファイルシステムを用いて画像ファイル20と記録ファイル21とを対応付けても良い。
次に、画像特定システム1のシステム構成を図2に示すブロック図を参照して説明する。
本実施形態の現場端末2および管理コンピュータ3は、CPU、ROM、RAM、HDDなどのハードウェア資源を有し、CPUが各種プログラムを実行することで、ソフトウェアによる情報処理がハードウェア資源を用いて実現されるコンピュータで構成される。さらに、本実施形態の画像特定方法は、各種プログラムをコンピュータに実行させることで実現される。
現場端末2は、カメラ8と加速度センサ22と角速度センサ23と3次元測定センサ24とディスプレイ6と操作入力部25と通信部26と画像記憶部27と端末制御部28とを備える。
カメラ8は、現場端末2に搭載され、現場端末2の周辺の物体を可視光により撮影する。例えば、カメラ8は、レンズ付きの撮像素子を備えている。なお、カメラ8で撮影された画像は、端末制御部28に入力される。
加速度センサ22は、現場端末2に搭載され、この現場端末2が移動したときに生じる加速度を検出する。また、この加速度センサ22により重力加速度の検出も行える。例えば、3軸の加速度センサ22とすることで、現場端末2の姿勢に応じた各軸の加速度を検出することが可能となる。なお、この加速度センサ22で検出された加速度の値を示す加速度情報は、端末制御部28に入力される。
角速度センサ23(ジャイロセンサ)は、現場端末2に搭載され、この現場端末2の筐体の姿勢が変化したときに生じる角速度を検出する。この角速度センサ23の値と加速度センサ22の値とを合わせて、この現場端末2の筐体の姿勢を特定することで、カメラ8の撮影方向を把握することができる。なお、この角速度センサ23で検出された角速度の値を示す角速度情報は、端末制御部28に入力される。
撮影方向は、例えば、現場端末2の水平方向および垂直方向の傾きの測定に基づいて取得される。また、現場端末2の筐体に向きが異なる2つ以上のカメラ8が搭載されている場合には、撮影に使用するカメラ8の筐体における位置および向きを設定し、このカメラ8の撮影方向を取得する。
なお、慣性センサ(3軸加速度センサと3軸角速度センサ)と3軸地磁気センサを組み合わせた9軸センサであるモーションセンサを現場端末2に搭載しても良い。
3次元測定センサ24は、現場端末2の周辺の物体の3次元形状を測定する。3次元測定センサ24としては、例えば、深度センサが用いられる。なお、3次元測定センサ24として赤外線センサまたはLiDARなどのレーザセンサを用いても良い。
3次元測定センサ24は、現場端末2の筐体において、カメラ8が設けられている背面側に設けられる。この3次元測定センサ24は、例えば、物体にレーザを投光してその反射光を受光素子により受光することで、現場端末2から物体までの距離を測定することができる。本実施形態では、3次元測定センサ24は、投光パルスに対する受光パルスの遅れ時間を距離に換算するToF(Time of Flight)方式を用いて、現場端末2から周辺の物体までの距離を測定して3次元点群化する。なお、カメラ8による撮像方向と3次元測定センサ24による測定方向は一致している。
現場端末2のディスプレイ6は、カメラ8で撮影された撮影画像を表示する。なお、その他の所定の情報をディスプレイ6に表示させても良い。
操作入力部25は、作業者Wにより操作され、所定の情報の入力操作が行えるようにしたデバイスである。本実施形態では、操作入力部25がディスプレイ6と一体的に設けられるタッチパネルで構成される。なお、現場端末2としてウェアラブルコンピュータ10を用いる場合は、操作入力部25が作業者Wの手元に配置され、入力操作が適宜可能となっている。
通信部26は、通信回線を介して管理コンピュータ3と通信を行う。本実施形態の通信部26には、ネットワーク機器、例えば、無線LANのアンテナが含まれる。その他にも、LANケーブルまたはUSBケーブルを用いて通信を行う場合もある。この通信部26を介して現場端末2は、管理コンピュータ3にアクセスする。
画像記憶部27は、カメラ8で撮影した画像を含む画像ファイルを記憶する。なお、画像記憶部27に記憶される画像は、動画像であっても良いし、静止画像であっても良い。また、画像ファイルとともに、画像ファイルに対応付けられた記録ファイルを記憶しても良い。さらに、画像ファイルに関連する所定のデータを記憶しても良い。
端末制御部28は、現場端末2を統括的に制御する。この端末制御部28は、位置姿勢推定部29と基準取得部30とエリア識別部31と画像取得制御部32と位置情報取得部33と方向情報取得部34と画角情報取得部35と撮影情報記録部36と識別子生成部37とを備える。これらは、メモリまたはHDDに記憶されたプログラムがCPUによって実行されることで実現される。
位置姿勢推定部29は、撮影画像と加速度情報と角速度情報とに基づいて現場端末2の位置および姿勢を推定する制御を行う。つまり、現場端末2に搭載されたデバイスにより得られた情報に基づいて現場端末2の位置および姿勢を推定する。この位置姿勢推定部29は、現場端末2の位置および姿勢の推定と同時に現場端末2の周辺環境の情報を含む環境地図の作成を行う。つまり、位置姿勢推定部29では、VSLAM技術を用いている。このようにすれば、画像の撮影時の位置および方向の取得精度を向上させることができる。
VSLAM技術では、現場端末2のカメラ8および3次元測定センサ24で取得した情報を用いて、現場端末2の周辺の物体の特徴点を抽出することができる。なお、現場端末2のカメラ8で取得した情報のみを用いて、現場端末2の周辺の物体の特徴点を抽出する場合もある。このような特徴点の集合させたものを3次元特徴点群データと称する。そして、カメラ8で撮影した撮影画像(動画像)を解析し、物体の特徴点(例えば、箱状の物体の辺または角の部分)をリアルタイムに追跡する。この3次元特徴点群データに基づいて、現場端末2の位置および姿勢の3次元情報を推定することができる。
また、現場端末2の周辺の物体の3次元特徴点群データを所定の時間毎に検出し、時系列において前後する3次元特徴点群データ間の変位に基づいて、現場端末2の位置および姿勢の変位を算出することができる。また、時系列に得られる一連の自位置および自姿勢から、現在位置および現在姿勢に先立つ現場端末2の移動経路19が得られる。
つまり、位置姿勢推定部29は、基準点から現場端末2が移動するときに連続的に撮影された撮影画像に基づいて、現場端末2の位置および姿勢を推定する制御を行う。このようにすれば、基準点から現場端末2が移動した経路19(図3参照)を画像により推定できるので、現場端末2の位置および姿勢の推定精度を向上させることができる。
なお、本実施形態では、カメラ8および3次元測定センサ24で取得した情報に基づいて、現場端末2の位置および姿勢を推定するVSLAM技術を例示しているが、その他の態様であっても良い。例えば、ステレオカメラ、魚眼カメラ、ジャイロセンサ、赤外線センサで取得した情報に基づいて、現場端末2の位置および姿勢を推定するVSLAM技術を用いても良い。このVSLAM技術は、屋内での位置計測が可能であり、ビーコンまたは歩行者自律航法(PDR:Pedestrian Dead Reckoning)などの屋内で使用可能な位置情報計測技術の中で、最も精度よく3次元座標を算出することができる。
なお、現場端末2の位置および姿勢は、それぞれ算出または更新された時点の時刻と対応付けて記録される。
基準取得部30は、撮影場所(対象機器4)に対応して予め設けられたマーカ5をカメラ8で撮影したときに3次元空間の基準点を取得する。なお、マーカ5の位置を基準点としても良いし、マーカ5から離れた所定の位置を基準点としても良い。このようにすれば、作業現場にマーカ5を設ける簡便な作業、およびマーカ5を撮影する簡素な処理で取得精度を向上させることができる。
エリア識別部31は、現場端末2の現在位置に基づいて、現場端末2が画像の取得が許可されている許可エリア16にあるか否かを識別する。なお、現場端末2に対応付けられた許可エリア16は、作業開始前に予め管理コンピュータ3にアクセスすることで設定される。
画像取得制御部32は、現場端末2が撮影許可エリア16にある場合に画像の取得を許可し、現場端末2が撮影許可エリア16にない場合に画像の取得を許可しない制御を行う。つまり、作業現場において、撮影機能を限定する制御を行う。なお、撮影機能とは、現場端末2のカメラ8を用いて撮影した画像を画像記憶部27に記憶させる機能をいう。
例えば、現場端末2が撮影許可エリア16にあるときに、現場端末2のカメラ8で撮影をした場合には、その画像はディスプレイ6に表示され、画像記憶部27に記憶されることがない。なお、画像は、動画像を例示する。ここで、作業者Wがディスプレイ6に表示された撮影ボタン(録画ボタン)をタッチ操作すると、そのときにカメラ8で撮影されていた画像が画像記憶部27に記憶される。例えば、静止画像の撮影の場合には、撮影ボタンをタッチ操作した時点の画像が画像記憶部27に記憶される。また、動画像の撮影の場合には、撮影ボタン(録画ボタン)をタッチ操作した時点から録画が開始され、その動画像が画像記憶部27に記憶される。
一方、現場端末2が撮影許可エリア16にないときに、作業者Wが撮影操作を行った場合には、「このエリアで撮影は禁止されています。」などの撮影禁止メッセージがディスプレイ6に表示され、画像が画像記憶部27に記憶されることがない。
このようにすれば、撮影制限の対象となっている対象機器4が写った画像の取得を制限することができる。そのため、不必要な画像の取得を防止し、管理コンピュータ3で判定しなければならない画像の枚数を低減させることができる。
本実施形態において、「画像の取得」という用語には、「画像の保存」または「画像の転送」という意味とが含まれる。また、「画像の取得を許可しない」という用語には、「画像の保存(記憶)を禁止すること」または「画像の撮影を禁止すること」の意味が含まれる。さらに、画像の取得は、現場端末2が行うものでも良いし、管理コンピュータ3が行うものでも良い。
なお、撮影ボタンの表示の有無により、撮影機能の可否の切り換えを行っても良い。例えば、現場端末2が撮影許可エリア16にあるときには、ディスプレイ6に撮影ボタンを表示し、現場端末2が撮影許可エリア16にないときには、ディスプレイ6に撮影ボタンを表示しないようにしても良い。
位置情報取得部33は、カメラ8による画像の撮影時の位置を特定可能な位置情報を取得する。例えば、位置姿勢推定部29がVSLAM技術を用いて作成した環境地図に基づいて、位置情報取得部33が画像の撮影時の位置の取得を行うことができる。また、基準取得部30が取得した基準点に基づいて、位置情報取得部33が画像の撮影時の位置の取得を行うことができる。
方向情報取得部34は、カメラ8による画像の撮影時の方向を特定可能な方向情報を取得する。例えば、位置姿勢推定部29がVSLAM技術を用いて作成した環境地図に基づいて、方向情報取得部34が画像の撮影時の方向の取得を行うことができる。また、基準取得部30が取得した基準点に基づいて、方向情報取得部34が画像の撮影時の方向の取得を行うことができる。
なお、環境地図に基づく位置情報または方向情報と、基準点に基づく位置情報または方向情報とに誤差がある場合には、基準点に基づく位置情報または方向情報を優先的に適用しても良い。このようにすれば、作業者Wが作業現場にてマーカ5を撮影することで、情報の補正を行うことができる。VSLAM技術は、相対的な移動量を算出する手法であるため、長時間の使用により誤差が蓄積されてしまう場合がある。そこで、基準点となるマーカ5を現場端末2で読み込むことで、エリア16における位置情報を正確に把握することができる。
画角情報取得部35は、カメラ8による画像の撮影時の画角を特定可能な画角情報を取得する。画角情報は、カメラ8の設定に基づいて取得される。また、画角情報には、拡大率(スケール)などの情報も含まれる。
撮影情報記録部36は、位置情報と方向情報と画角情報とを含む撮影情報を画像に対応付けて記録する。撮影情報は、画像ファイルの属性として記録しても良いし、画像ファイルとは異なる記録ファイルに記録しても良い。なお、作業者Wは、いずれの方式で記録するかを事前に設定することができる。
管理コンピュータ3は、画像に対応付けて記録された撮影情報に基づいて、撮影制限の対象となっている対象機器4が写った画像を正確に選別することができる。そのため、その画像が外部に漏洩されてしまうことを抑制することができる。
識別子生成部37は、撮影情報に基づいて、識別子を生成する。なお、作業者Wは、撮影情報を識別子として記録するか否かを事前に設定することができる。識別子が生成される設定の場合には、撮影情報記録部36が識別子を画像に対応付けて記録する。なお、撮影情報記録部36が識別子を画像に含ませる態様で記録しても良い。
図2に示すように、管理コンピュータ3は、対象情報データベース38とディスプレイ12と操作入力部39と通信部40と画像記憶部41と管理制御部42とを備える。
本実施形態の管理コンピュータ3のシステム構成は、必ずしも1つのコンピュータに設ける必要はない。例えば、ネットワークで互いに接続された複数のコンピュータを用いて1つのシステムを実現しても良い。例えば、対象情報データベース38を管理コンピュータ3とは異なる他のコンピュータに設けても良い。
対象情報データベース38は、メモリまたはHDDに記憶され、検索または蓄積ができるよう整理された情報の集まりである。対象情報データベース38には、撮影制限の対象となっている対象機器4の3次元位置を特定可能な対象情報が予め記憶されている。また、作業現場となるプラントの設計情報が記憶されている。例えば、設計情報に関する3D−CADデータが予め記憶されている。この3D−CADデータには、対象機器4が配置されている位置(座標)に関する情報が含まれている。さらに、対象機器4の形状または寸法に関する情報も含まれている。また、建物14の部屋15の配置に関する情報も含まれている。
なお、撮影制限の対象となる対象機器4は、3D−CADデータを用いて設定しても良いし、管理コンピュータ3のディスプレイ12にデータを表示して個々に選択または指定しても良い。さらに、3D−CADデータが有している対象機器4の名称または型式などの情報に基づいて、自動的に選択または指定しても良い。
ディスプレイ12は、画像判定結果(図9参照)などの出力を行う装置である。つまり、管理コンピュータ3は、ディスプレイ12に表示される画像の制御を行う。なお、ネットワークを介して接続される他のコンピュータが備えるディスプレイに表示される画像の制御を管理コンピュータ3が行っても良い。
なお、本実施形態では、画像を表示する装置としてディスプレイ12を例示するが、その他の態様であっても良い。例えば、プロジェクタを用いて情報の表示を行っても良い。さらに、紙媒体に情報を印字するプリンタをディスプレイ12の替りとして用いても良い。つまり、管理コンピュータ3が制御する対象としてプロジェクタまたはプリンタが含まれても良い。
操作入力部39は、管理者Mの操作に応じて所定の情報を入力するために用いられるマウスまたはキーボードなどの入力装置などで構成される。本実施形態の入力操作には、マウスを用いたクリック操作、またはタッチパネルを用いたタッチ操作が含まれる。つまり、これら入力装置の操作に応じて所定の情報が管理コンピュータ3に入力される。
通信部40は、通信回線を介して現場端末2と通信を行う。この通信部40は、無線通信装置13に搭載されている。また、通信部40は、所定のネットワーク機器、例えば、無線LANアクセスポイントまたはアンテナに搭載されても良い。なお、通信部40は、WAN(Wide Area Network)、インターネット回線、または携帯通信網を介して現場端末2と通信を行っても良い。その他にも、LANケーブルまたはUSBケーブルにより現場端末2と接続して通信を行っても良い。
画像記憶部41は、現場端末2から受信した画像ファイルを記憶する。なお、画像記憶部41に記憶される画像は、動画像であっても良いし、静止画像であっても良い。また、画像ファイルとともに、画像ファイルに対応付けられた記録ファイルを記憶しても良い。さらに、画像ファイルに関連する所定のデータを記憶しても良い。
管理制御部42は、管理コンピュータ3を統括的に制御する。この管理制御部42は、画像判定部43と判定情報記録部44と判定結果表示部45と対象情報設定部46とを備える。これらは、メモリまたはHDDに記憶されたプログラムがCPUによって実行されることで実現される。
画像判定部43は、画像ファイルに対応付けられた撮影情報と、対象情報データベース38に記憶された対象情報とに基づいて、画像に対象機器4(対象部分)が写っているか否かを判定する。このようにすれば、カメラ8による画像の撮影時の位置、方向、画角により撮影された範囲を特定し、対象機器4の3次元位置との関係により、画像に対象部分が写っているか否を判定することができる。また、カメラ8と対象部分との3次元的な位置関係により判定を行えるため、画像の選別を正確に行うことができる。画像に写っている対象機器を人手または人工知能などを用いて識別させる場合と比較して、より高い精度で判定を行うことができる。
現場端末2では、画像の撮影時に基準点の座標に基づいて位置情報と方向情報とを取得する。ここで、位置情報、方向情報、画角に基づいて撮影範囲を算出する。例えば、対象情報データベース38の3D−CADデータを参照し、部屋15の中における現場端末2の位置(座標)と対象機器4の位置(座標)を算出する。現場端末2の位置を算出したら、その地点で現場端末2の撮影方向を計算し、その方位におけるカメラ8の画角を考慮して撮影範囲を計算する。この撮影範囲内に対象機器4が含まれるか否かを判定する。なお、この判定結果に基づいて、画像ファイルごとに制限の可否を表示しても良いし、画像ファイルの保存場所を分けても良い。
なお、カメラ8の撮影範囲に対象機器4が含まれているが、対象機器4の手前に所定の構造物(遮蔽物)がある場合は、対象機器4が構造物に隠れてしまって、カメラ8で撮影された画像に写り込まないことが想定される。このような撮影範囲と対象機器4と構造物の位置関係に対応するために、対象情報データベース38の3D−CADデータに構造物の設計情報(位置、形状および寸法を示す情報を含む)を登録しておいても良い。そして、この3D−CADデータを参照し、対象機器4の手前の構造物の位置関係に基づいて、画像に対象機器4が映り込んでいるか否かを判定するようにしても良い。
判定情報記録部44は、画像判定部43による判定結果を特定可能な判定情報を画像ファイルに対応付けて記録する。本実施形態では、判定情報として、外部への公開が制限される制限ファイルであるか、外部への公開が制限されない非制限ファイルであるかを示す情報が記録される(図8参照)。
このようにすれば、画像ファイルに撮影制限の対象となっている対象機器4(対象部分)が写っているか否かを判定情報により特定することができる。例えば、管理コンピュータ3以外のコンピュータで画像ファイルを参照する場合であっても、その画像ファイルに対象機器4(対象部分)が写っているか否かを、判定情報に基づいて把握することができる。
判定結果表示部45は、画像判定部43による判定結果を識別可能にディスプレイ12に表示させる。例えば、図9に示すように、管理コンピュータ3のディスプレイ12には、画像判定結果画面47が表示される。この画像判定結果画面47には、制限ファイル表示領域48と非制限ファイル表示領域49とが並べて設けられている。
制限ファイル表示領域48には、対象機器4が写っている画像を含む画像ファイル20であって、外部への公開が制限される制限ファイルのファイル名が表示される。非制限ファイル表示領域49には、対象機器4が写っていない画像を含む画像ファイル20であって外部への公開が制限されない非制限ファイルのファイル名が表示される。
このようにすれば、制限ファイル表示領域48と非制限ファイル表示領域49とが分けられ、かつ同時に並べて表示されることで、画像ファイル20の管理者Mが、対象機器4が写っている画像ファイル20と対象機器4が写っていない画像ファイル20とを容易に識別することができる。
なお、画像ファイル20をアイコンで表示する場合に、画像ファイル20の表示色を制限ファイルと非制限ファイルとで異なるものとしても良い。また、画像ファイル20の拡張子を制限ファイルと非制限ファイルとで異なるものとしても良い。
なお、管理者Mがファイル名をマウスカーソル50によりクリックすることで、画像ファイルに含まれる画像を表示させることができる。そして、管理者Mが目視で対象機器4が写っているか否かを確認することができる。
管理者Mは、制限ファイルを制限ファイル表示領域48から非制限ファイル表示領域49にドラッグすることができる。非制限ファイル表示領域49にドラッグされた制限ファイルは、非制限ファイルとして判定情報が書き換えられる。また、管理者Mは、非制限ファイルを非制限ファイル表示領域49から制限ファイル表示領域48にドラッグすることができる。制限ファイル表示領域48にドラッグされた非制限ファイルは、制限ファイルとして判定情報が書き換えられる。なお、画像ファイル20に対応する記録ファイル21がある場合には、画像ファイル20の移動とともに記録ファイル21も移動される。
図2に示すように、対象情報設定部46は、対象情報データベース38に対象情報を記憶させる設定を行う。例えば、基準点を管理する基準点管理テーブルと、対象機器4を管理する対象機器管理テーブルと、現場端末2を管理する端末管理テーブルとに、各種情報を記憶させる設定を行う。
図5に示すように、基準点管理テーブルには、基準点IDに対応付けて、3D位置情報とマーカIDと対象機器IDとが登録されている。
基準点IDは、複数の基準点を個々に識別可能な識別情報である。なお、1つの基準点に対して1つの基準点IDが付与される。
基準点管理テーブルに登録される3D位置情報は、基準点が設けられた位置を指定する3次元座標の情報である。なお、座標の情報には、水平方向(X軸,Y軸)と垂直方向(Z軸)の位置を指定する情報を含む。また、この3D位置情報には、基準点の姿勢または向きに関する情報が含まれる。
本実施形態では、例えば、建物14の出入口17に設けられた1つのマーカ5を基準点(原点、起点)として座標を設定する。また、部屋15の出入口18に設けられた1つのマーカ5を基準点として座標を設定しても良いし、出入口17の銘板、部屋15の銘板、対象機器4の銘板を基準点として座標を設定しても良い。なお、座標は、マーカ5または銘板を基準点としなくても良く、建物14の所定の位置を座標の基準点としても良い。また、3D位置情報は、建物14の設計段階で作成された3次元CADに基づいて構成されても良い。
基準点管理テーブルに登録されるマーカID(銘板ID)は、複数のマーカ5(銘板)を個々に識別可能な識別情報である。なお、1つのマーカ5に対して1つのマーカIDが付与される。さらに、基準点管理テーブルでは、1つの基準点に対して1つのマーカIDが付与される。
対象機器IDは、複数の対象機器4を個々に識別可能な識別情報である。なお、1つの対象機器4に対して1つの対象機器IDが付与される。
基準点管理テーブルでは、1つの基準点IDに対応して複数の対象機器IDが登録されても良い。例えば、建物14の出入口17のマーカ5のマーカIDに対応付けて、その建物14の内部に配置された全ての対象機器4の対象機器IDが登録されても良い。また、部屋15の出入口18のマーカ5のマーカIDに対応付けて、その部屋15の内部に配置された全ての対象機器4の対象機器IDが登録されても良い。
図6に示すように、対象機器管理テーブルには、対象機器IDに対応付けて、3D位置情報が登録されている。なお、対象機器管理テーブルには、対象機器4の形状または寸法に関する情報が登録されても良い。
対象機器管理テーブルに登録される3D位置情報は、対象機器4の位置を指定する座標を示す位置情報である。なお、水平方向(X軸,Y軸)と垂直方向(Z軸)の位置を指定する情報を含む。また、この3D位置情報には、対象機器4の姿勢または向きに関する情報が含まれる。
このように、対象情報データベース38には、対象機器4に対応付けて作業現場(撮影場所)の建物14に予め設けられたマーカ5に関する位置情報が登録される。さらに、対象機器4の位置情報も登録される。このようにすれば、対象情報データベース38を用いて対象機器4に関する対象情報を一元的に管理できる。
図7に示すように、端末管理テーブルには、端末IDに対応付けて、ユーザIDと許可エリアとが登録されている。
端末IDは、複数の現場端末2を個々に識別可能な識別情報である。対象機器管理テーブルには、対象機器IDに対応付けて、対応する対象機器4のサポート情報の提供が許可されている現場端末2の端末IDが登録される。
ユーザIDは、複数の作業者Wを個々に識別可能な識別情報である。対象機器管理テーブルには、端末IDに対応付けて、対応する現場端末2の使用が許可されている作業者WのユーザIDが登録される。なお、ユーザIDは、現場端末2にログインするときに使用するものであっても良いし、それぞれの作業者Wが所持するIDカードに登録されるものであっても良い。
許可エリアの項目には、端末IDに対応する現場端末2により画像の取得が許可されているエリア名が登録される。管理者Mは、作業計画などの情報に基づいて、許可エリアの項目を設定することで、それぞれの現場端末2を一元的に管理できる。現場端末2は、作業開始前に予め管理コンピュータ3にアクセスすることで許可エリアが設定される。なお、許可エリアに対応する作業時刻を設定しても良い。このようにすれば、作業者Wが作業とは関係のない不必要な場所で画像を取得することを抑制できる。そのため、画像の持ち出し管理を効率的に行うことができる。
管理コンピュータ3では、基準点ID、対象機器ID、端末ID、マーカIDに基づいて、対象情報データベース38に登録された各種データを検索することができる。
図2に示すように、画像判定部43は、機械学習部51を備える。機械学習部51は、対象機器4が写った画像と対象機器4が写っていない画像とを機械学習により識別することができる。つまり、本実施形態では、撮影情報に基づく画像の判定のみならず、この判定に重畳して、機械学習部51を用いて画像を解析することができる。このようにすれば、カメラ8による画像の撮影時の撮影情報のみならず、画像に対象機器4が写っているか否かを機械学習により補助的に識別するため、より高い精度で判定を行うことができる。なお、作業者Wは、機械学習部51で画像を解析するか否かを事前に設定することができる。
機械学習部51は、人工知能(AI:Artificial Intelligence)を備えている。本実施形態のコンピュータを用いた解析には、人工知能の学習に基づく解析技術を用いることができる。例えば、ニューラルネットワークによる機械学習により生成された学習モデル、その他の機械学習により生成された学習モデル、深層学習アルゴリズム、回帰分析などの数学的アルゴリズムを用いることができる。また、機械学習の形態には、クラスタリング、深層学習などの形態が含まれる。
本実施形態の画像特定システム1は、機械学習を行う人工知能を備えるコンピュータを含む。例えば、ニューラルネットワークを備える1台のコンピュータで画像特定システム1を構成しても良いし、ニューラルネットワークを備える複数台のコンピュータで画像特定システム1を構成しても良い。
ここで、ニューラルネットワークとは、脳機能の特性をコンピュータによるシミュレーションによって表現した数学モデルである。例えば、シナプスの結合によりネットワークを形成した人工ニューロン(ノード)が、学習によってシナプスの結合強度を変化させ、問題解決能力を持つようになるモデルを示す。さらに、ニューラルネットワークは、深層学習(Deep Learning)により問題解決能力を取得する。
例えば、ニューラルネットワークには、6層のレイヤーを有する中間層が設けられる。この中間層の各レイヤーは、300個のユニットで構成されている。また、多層のニューラルネットワークに学習用データを用いて予め学ばせておくことで、回路またはシステムの状態の変化のパターンの中にある特徴量を自動で抽出することができる。なお、多層のニューラルネットワークは、ユーザインターフェース上で、任意の中間層数、任意のユニット数、任意の学習率、任意の学習回数、任意の活性化関数を設定することができる。
なお、学習対象となる各種情報項目に報酬関数が設定されるとともに、報酬関数に基づいて価値が最も高い情報項目が抽出される深層強化学習をニューラルネットワークに用いても良い。
例えば、画像認識で実績のあるCNN(Convolution Neural Network)を用いる。このCNNでは、中間層が畳み込み層とプーリング層で構成される。畳み込み層は、前の層で近くにあるノードにフィルタ処理を施すことで特徴マップを取得する。プーリング層は、畳込み層から出力された特徴マップを、さらに縮小して新たな特徴マップとする。この際に特徴マップにおいて着目する領域に含まれる画素の最大値を得ることで、特徴量の位置の多少のずれも吸収することができる。
畳み込み層は、画像の局所的な特徴を抽出し、プーリング層は、局所的な特徴をまとめる処理を行う。これらの処理では、入力画像の特徴を維持しながら画像を縮小処理する。つまり、CNNでは、画像の持つ情報量を大幅に圧縮(抽象化)することができる。そして、ニューラルネットワークに記憶された抽象化された画像イメージを用いて、入力される画像を認識し、画像の分類を行うことができる。
なお、深層学習には、オートエンコーダ、RNN(Recurrent Neural Network)、LSTM(Long Short-Term Memory)、GAN(Generative Adversarial Network)などの各種手法がある。これらの手法を本実施形態の深層学習に適用しても良い。
本実施形態では、予め機械学習部51に様々なパターンの対象機器4が写った画像と対象機器4が写っていない画像とを大量に学習させる。これらの学習用の画像は、実際にカメラ8で撮影した画像でも良いし、コンピュータグラフィックス(CG)で合成した画像でも良い。このように対象機器4の形状などを識別可能な状態になるまで、大量の画像を機械学習部51に予め学習させておく。
本実施形態の機械学習の方法は、大きく2つの処理に分けられる。まず、学習用画像を生成する第1処理を行う。この第1処理では、学習用画像を取得し、その学習用画像に含まれる対象機器4の像を特徴ごとに分類する。そして、1つの学習用画像を、種類の異なる像が1つ以上含まれるように調整する。次に、学習モデルを作成する第2処理を行う。この第2処理では、学習用画像をニューラルネットワークに学習させて、画像学習モデルを作成する。この学習用モデルを画像の判定用にセットする。
次に、画像特定システム1が実行する処理について図10から図15のフローチャートを用いて説明する。なお、図2に示すブロック図を適宜参照する。
管理コンピュータ3は、図10に示す管理制御処理を実行する。現場端末2は、図12に示す端末制御処理を実行する。これら処理は、一定時間毎に繰り返される処理である。これらの処理が繰り返されることで、画像特定システム1で画像特定方法が実行される。
管理コンピュータ3が実行する管理制御処理について図10のフローチャートを用いて説明する。
まず、ステップS11において、管理制御部42は、メイン制御処理を実行する。このメイン制御処理では、管理コンピュータ3のディスプレイ12などの各種デバイスを制御する処理が行われる。また、現場端末2からアクセスがあった場合に所定の情報の送受信を行う。例えば、現場端末2から画像ファイルの送信があった場合には、その画像ファイルを画像記憶部41に記憶する処理を行う。
次のステップS12において、管理制御部42は、操作受付処理を実行する。この操作受付処理では、操作入力部39により所定の入力操作を受け付ける処理が行われる。
次のステップS13において、対象情報設定部46は、事前登録処理を実行する。この事前登録処理では、対象情報データベース38に対象情報を記憶させる処理が行われる。例えば、基準点管理テーブル(図5参照)に基準点に関する情報の登録が行われる。また、対象機器管理テーブル(図6参照)に対象機器4に関する情報の登録が行われる。さらに、端末管理テーブル(図7参照)に現場端末2に関する情報の登録が行われる。
次のステップS14において、画像判定部43は、後述する画像判定処理(図11参照)を実行する。この画像判定処理では、現場端末2から受信した画像に対象機器4(対象部分)が写っているか否かを判定する。
次のステップS15において、判定結果表示部45は、画像判定結果表示処理を実行する。この画像判定結果表示処理では、画像判定部43による判定結果を識別可能にディスプレイ12に表示させる処理(図9参照)が行われる。そして、管理制御処理を終了する。
次に、現場端末2が実行する端末制御処理について図12のフローチャートを用いて説明する。
まず、ステップS31において、端末制御部28は、メイン制御処理を実行する。このメイン制御処理では、現場端末2に搭載されるディスプレイ6などの各種デバイスを制御する処理が行われる。
次のステップS32において、端末制御部28は、操作受付処理を実行する。この操作受付処理では、操作入力部25により所定の入力操作を受け付ける処理が行われる。
次のステップS33において、端末制御部28は、データベースアクセス処理を実行する。このデータベースアクセス処理では、管理コンピュータ3の対象情報データベース38にアクセスし、各種データのダウンロード処理が行われる。例えば、基準点管理テーブルのデータがダウンロードされる。
次のステップS34において、端末制御部28は、後述するマーカ認識処理(図13参照)を実行する。このマーカ認識処理では、カメラ8で撮影された撮影画像に基づいて、マーカ5を認識する処理が行われる。
次のステップS35において、端末制御部28は、後述する自己位置推定処理(図14参照)を実行する。この自己位置推定処理では、撮影画像と加速度情報と角速度情報とに基づいて現場端末2の位置および姿勢を推定する処理が行われる。この自己位置推定処理が実行されるときには、カメラ8が起動して撮影が開始される。
次のステップS36において、端末制御部28は、後述する撮影制御処理(図15参照)を実行する。この撮影制御処理では、カメラ8による撮影の制御を行う。
次のステップS37において、端末制御部28は、画像送信処理を実行する。この画像送信処理では、画像記憶部27に記憶されている画像ファイルを管理コンピュータ3に送信する処理が行われる。なお、画像ファイルを送信する処理は、作業者Wの操作に基づいて行っても良いし、一定時間ごとに自動的に行っても良い。そして、端末制御処理を終了する。
次に、現場端末2が実行するマーカ認識処理について図13のフローチャートを用いて説明する。
まず、ステップS41において、端末制御部28は、カメラ8により撮影された撮影画像を取得する。
次のステップS42において、端末制御部28は、取得した撮影画像にマーカ5が写っているか否かを判定する。ここで、撮影画像にマーカ5が写っていない場合(ステップS42にてNOの場合)は、マーカ認識処理を終了する。一方、撮影画像にマーカ5が写っている場合(ステップS42にてYESの場合)は、ステップS43に進む。
次のステップS43において、端末制御部28は、マーカ5の図形に含まれるマーカIDを読み取る。
次のステップS44において、基準取得部30は、予め管理コンピュータ3の対象情報データベース38からダウンロードされた基準点管理テーブルのデータに基づいて、読み取ったマーカIDに対応する基準点IDの3D位置情報を特定する。この基準点の3D位置情報に基づいて、現場端末2の位置情報の取得または補正を行う。そして、マーカ認識処理を終了する。
次に、現場端末2が実行する自己位置推定処理について図14のフローチャートを用いて説明する。
まず、ステップS51において、位置姿勢推定部29は、座標の原点となる基準点の設定に基づく座標の確認処理を行う。例えば、建物14の出入口17に設けられた1つのマーカ5を原点として基準点を設定する。また、部屋15の出入口18に設けられた1つのマーカ5を原点として基準点を設定しても良い。なお、マーカ5の撮影画像が取得されるまでの間、ディスプレイ6にマーカ5の撮影を促す旨の表示を行っても良い。
次のステップS52において、端末制御部28は、カメラ8により撮影された撮影画像を取得する。
次のステップS53において、位置姿勢推定部29は、加速度センサ22で検出された加速度の値を示す加速度情報を取得する。
次のステップS54において、位置姿勢推定部29は、角速度センサ23で検出された角速度の値を示す角速度情報を取得する。
次のステップS55において、位置姿勢推定部29は、カメラ8の撮影画像に基づいて現場端末2の周辺の物体の3次元形状を測定する。また、3次元測定センサ24の測定に基づいて現場端末2の周辺の物体の3次元形状を取得しても良い。
次のステップS56において、位置姿勢推定部29は、現場端末2の周辺環境の情報を含む環境地図を作成する。
次のステップS57において、位置姿勢推定部29は、基準点から現場端末2が移動するときに連続的に撮影された撮影画像に基づいて、現場端末2の位置および姿勢を推定する。この移動中の現場端末2の位置および姿勢を時刻情報とともに記録することで、現場端末2の移動経路19(図3参照)が記録される。また、部屋15の内部における移動経路が記録されても良い。
次のステップS58において、位置姿勢推定部29は、現場端末2の現在の位置および姿勢を推定する。そして、自己位置推定処理を終了する。
次に、現場端末2が実行する撮影制御処理について図15のフローチャートを用いて説明する。
まず、ステップS61において、端末制御部28は、カメラ8が既に起動しているか否かを判定する。ここで、カメラ8が起動中でない場合(ステップS61にてNOの場合)は、撮影制御処理を終了する。一方、カメラ8が起動中である場合(ステップS61にてYESの場合)は、ステップS62に進む。
次のステップS62において、端末制御部28は、カメラ8により撮影された画像をディスプレイ6に表示する。
次のステップS63において、画像取得制御部32は、カメラ8により撮影された画像を画像記憶部27に保存する操作である、撮影操作を受け付けたか否かを判定する。なお、撮影操作とは、例えば、撮影ボタンをタッチ操作することである。ここで、撮影操作を受け付けていない場合(ステップS63にてNOの場合)は、撮影制御処理を終了する。一方、撮影操作を受け付けた場合(ステップS63にてYESの場合)は、ステップS64に進む。
次のステップS64において、エリア識別部31は、位置姿勢推定部29が推定した現場端末2の現在位置に基づいて、現場端末2が画像の取得が許可されている許可エリア内にあるか否かを判定する。ここで、許可エリア内にない場合(ステップS64にてNOの場合)は、ステップS65に進む。一方、許可エリア内である場合(ステップS64にてYESの場合)は、ステップS66に進む。
ステップS65において、画像取得制御部32は、ディスプレイ6に撮影禁止メッセージを表示する。そして、撮影制御処理を終了する。
ステップS66において、位置情報取得部33は、カメラ8による画像の撮影時の位置を特定可能な位置情報を取得する。
次のステップS67において、方向情報取得部34は、カメラ8による画像の撮影時の方向を特定可能な方向情報を取得する。
次のステップS68において、画角情報取得部35は、カメラ8による画像の撮影時の画角を特定可能な画角情報を取得する。
次のステップS69において、撮影情報記録部36は、位置情報と方向情報と画角情報とを含む撮影情報を画像に対応付けて記録する。なお、識別子生成部37が撮影情報に基づいて識別子を生成し、この識別子を画像に対応付けて記録しても良い。ここで、画像ファイルは、画像記憶部27に記憶される。そして、撮影制御処理を終了する。
次に、管理コンピュータ3が実行する画像判定処理について図11のフローチャートを用いて説明する。
まず、ステップS21において、管理制御部42は、画像記憶部41に未判定の画像ファイルがあるか否かを判定する。ここで、未判定の画像ファイルがない場合(ステップS21にてNOの場合)は、画像判定処理を終了する。一方、未判定の画像ファイルがある場合(ステップS21にてYESの場合)は、ステップS22に進む。
次のステップS22において、画像判定部43は、未判定の画像ファイルに対応付けられた撮影情報に含まれる位置情報に基づいて、カメラ8による画像の撮影位置を特定する。
次のステップS23において、画像判定部43は、未判定の画像ファイルに対応付けられた撮影情報に含まれる方向情報に基づいて、カメラ8による画像の撮影方向を特定する。
次のステップS24において、画像判定部43は、未判定の画像ファイルに対応付けられた撮影情報に含まれる画角情報に基づいて、カメラ8による画像の撮影時の画角を特定する。
次のステップS25において、画像判定部43は、画像ファイルに対応付けられた撮影情報と、対象情報データベース38に記憶された対象情報とに基づいて、画像に対象機器4(対象部分)が写っているか否かを判定する。ここで、画像に対象機器4が写っている場合(ステップS25にてYESの場合)は、ステップS26に進む。一方、画像に対象機器4が写っていない場合(ステップS25にてNOの場合)は、ステップS27に進む。
ステップS26において、画像判定部43は、画像ファイルを制限ファイルに設定する。そして、ステップS28に進む。
ステップS27において、画像判定部43は、画像ファイルを非制限ファイルに設定する。
次のステップS28において、判定情報記録部44は、判定結果を示す判定情報を画像ファイルに対応付けて記録する。
次のステップS29において、画像判定部43は、機械学習部51により画像の判定を行う設定がなされているか否かを判定する。ここで、機械学習部51による判定の設定中でない場合(ステップS29にてNOの場合)は、画像判定処理を終了する。一方、機械学習部51による判定の設定中である場合(ステップS29にてYESの場合)は、ステップS30に進む。
次のステップS30において、画像判定部43は、機械学習部51により画像の判定を行う機械学習判定処理を行う。この機械学習判定処理では、画像に対象機器4が写っているか否かを機械学習部51により解析する。なお、機械学習部51による判定結果と前述のステップS25における判定結果とが一致する場合には、画像判定処理を終了する。一方、一致しない場合には、機械学習部51による判定結果を優先して、判定情報を更新しても良いし、管理者Mに目視で確認するようにメッセージを表示しても良い。そして、画像判定処理を終了する。
(第2実施形態)
次に、第2実施形態の画像特定システム1Aおよび画像特定方法について図16から図18を用いて説明する。なお、前述した実施形態に示される構成部分と同一構成部分については同一符号を付して重複する説明を省略する。
図16に示すように、第2実施形態の画像特定システム1Aでは、第1実施形態の場合(図2参照)と異なり、現場端末2Aに画像記憶部27と撮影情報記録部36と識別子生成部37とが設けられていない。その替りに、管理コンピュータ3Aに撮影情報記録部52と識別子生成部53とが設けられている。
第2実施形態では、現場端末2Aが管理コンピュータ3Aと常時接続が可能な通信環境に設けられている。そして、作業者Wが、現場端末2Aを用いて撮影操作を行った場合に、取得された画像がリアルタイムで管理コンピュータ3Aに転送される。なお、撮影時の位置情報と方向情報と画角情報とを含む撮影情報も同時に転送される。そして、管理コンピュータ3Aの画像記憶部41に記憶される。このように第2実施形態では、現場端末2Aには、画像が保存されないため、現場端末2Aが外部に持ち出された場合であっても、画像が持ち出されないで済む。
管理コンピュータ3Aの撮影情報記録部52は、現場端末2Aから画像を受信したときに、位置情報と方向情報と画角情報とを含む撮影情報を画像に対応付けて記録する。撮影情報は、画像ファイルの属性として記録しても良いし、画像ファイルとは異なる記録ファイルに記録しても良い。なお、管理者Mは、いずれの方式で記録するかを事前に設定することができる。
管理コンピュータ3Aの識別子生成部53は、受信した撮影情報に基づいて、識別子を生成する。なお、管理者Mは、撮影情報を識別子として記録するか否かを事前に設定することができる。識別子が生成される設定の場合には、撮影情報記録部52が識別子を画像に対応付けて記録する。なお、撮影情報記録部52が識別子を画像に含ませる態様で記録しても良い。
次に、現場端末2Aが実行する撮影制御処理について図18のフローチャートを用いて説明する。なお、第2実施形態の撮影制御処理は、ステップS69Aのみが、第1実施形態の撮影制御処理(図15参照)と異なり、ステップS61からステップS68までは、第1実施形態の撮影制御処理と同様である。
図18に示すように、ステップS68の次に進むステップS69Aにおいて、端末制御部28は、カメラ8で撮影した画像、および位置情報と方向情報と画角情報とを含む撮影情報を、管理コンピュータ3Aに送信する。そして、撮影制御処理を終了する。
次に、管理コンピュータ3Aが実行する画像判定処理について図17のフローチャートを用いて説明する。なお、第2実施形態の画像判定処理は、ステップS21AとステップS21Bのみが、第1実施形態の画像判定処理(図11参照)と異なり、ステップS22からステップS30までは、第1実施形態の画像判定処理と同様である。
図17に示すように、まず、ステップS21Aにおいて、管理制御部42は、現場端末2Aから画像を受信したか否かを判定する。ここで、画像を受信していない場合(ステップS21AにてNOの場合)は、画像判定処理を終了する。一方、画像を受信した場合(ステップS21AにてYESの場合)は、ステップS21Bに進む。
次のステップS21Bにおいて、撮影情報記録部52は、現場端末2Aから画像とともに受信した撮影情報を、画像に対応付けて記録する。なお、識別子生成部53が撮影情報に基づいて識別子を生成し、この識別子を画像に対応付けて記録しても良い。ここで、画像ファイルは、画像記憶部41に記憶される。そして、ステップS22に進む。
(第3実施形態)
次に、第3実施形態の画像特定システム1および画像特定方法について図19を用いて説明する。なお、前述した実施形態に示される構成部分と同一構成部分については同一符号を付して重複する説明を省略する。さらに、図2のブロック図を参照する。
図19に示すように、第3実施形態の画像特定システム1では、第1実施形態の場合と異なり、レイアウト図面54のような2D−CADデータに基づいて、画像に対象機器4(対象部分)が写っているか否かを判定する。レイアウト図面54は、例えば、それぞれの部屋15の平面図でも良いし、建物14のそれぞれのフロアの平面図でも良い。
第3実施形態の対象情報には、撮影場所のレイアウト図面54(平面図)が含まれている。そして、レイアウト図面54におけるカメラ8(現場端末2)と対象機器4(対象部分)の2次元の座標情報に基づいて、対象機器4が写った画像を特定する。なお、現場端末2の機能は、前述の第1実施形態と同じであり、現場端末2により記録された画像には、撮影位置、方位、画角に関する情報が記録されている。
対象情報データベース38に登録されている設計情報には、レイアウト図面54が含まれている。レイアウト図面54には、対象機器4の位置、形状または寸法に関する情報が含まれている。さらに、対象機器4の周囲に配置される所定の構造物55の位置、形状または寸法に関する情報も含まれている。なお、構造物55は、部屋15に設置されている装置でも良いし、壁または柱などの建物14の一部でも良い。また、基準点管理テーブルに登録される位置情報は、基準点が設けられた位置を指定する2次元座標の情報である。この座標の情報には、水平方向(X軸,Y軸)の位置を指定する情報を含む。
画像判定部43(図2参照)は、画像ファイルに対応付けられた撮影情報と、対象情報データベース38に記憶された対象情報および設計情報とに基づいて、画像に対象機器4(対象部分)が写っているか否かを判定する。第3実施形態では、カメラ8の水平方向の撮影方向のみに基づいて、対象機器4が写っているか否かの判定を行う。つまり、カメラ8の上下方向の傾きを考慮する必要がなく、大凡の撮影範囲56が把握できれば良い。
なお、カメラ8の撮影範囲56に対象機器4が含まれているが、対象機器4の手前に所定の構造物55(遮蔽物)がある場合は、対象機器4が構造物55に隠れてしまって、カメラ8で撮影された画像に写り込まないことが想定される。そこで、レイアウト図面54(2D−CADデータ)を参照し、対象機器4の手前の構造物55の位置関係に基づいて、画像に対象機器4が映り込んでいるか否かを判定する。
第3実施形態では、2次元の座標情報を用いて処理を行うため、3次元の座標情報の処理を行う場合と比較して、画像に撮影制限の対象となっている対象機器4が写っているか否かを判定する処理を簡素化することができる。つまり、情報量の少ない2D−CADデータを用いて判定が行えるため、情報量の多い3D−CADデータを準備せずに済むようになる。
また、対象情報データベース38には、対象機器4以外の構造物55の位置を特定可能な情報を含む設計情報が記憶されており、撮影情報と対象情報と設計情報に基づいて、対象機器4が写った画像を特定する。このようにすれば、カメラ8の撮影範囲56に対象機器4が含まれていても、対象機器4が構造物55に隠れてしまって画像に写り込まない場合に、その判定を行うことができる。
(第4実施形態)
次に、第4実施形態の画像特定システム1および画像特定方法について図20から図21を用いて説明する。なお、前述した実施形態に示される構成部分と同一構成部分については同一符号を付して重複する説明を省略する。
第4実施形態では、動画像を対象とした処理を説明する。動画像の撮影の場合は、撮影中にカメラ8の位置が移動する場合がある。撮影開始時に、対象部分としての対象機器4が写り込んでいない場合であっても、撮影中にカメラ8が移動することにより対象機器4が動画像に写り込んでしまう場合がある。このような場合でも、動画像中に対象機器4が写り込んでいるか否かを判定する。
まず、動画像の撮影時の時刻、位置、方位、画角など撮影情報を、静止画像におけるExifと同様に、動画ファイルの属性情報として記録する。動画像の場合には、決められた時間間隔で連続的に映像を記録するため、撮影情報も動画像のそれぞれのフレームに対応付けて記録する必要がある。例えば、それぞれのフレームに対応する撮影情報を動画ファイルとは別のファイルに記録しても良い。また、動画像の音声またはテキストデータを記録するトラックに撮影情報を記録しても良い。
第4実施形態の画像判定部43(図2参照)の判定においては、記録された動画像の属性に記録された画角情報とそれぞれのフレームにおける撮影位置と撮影方向に基づいて、カメラ8の撮影範囲を算出する。次に、対象情報データベース38に登録された対象情報に基づいて、カメラ8と対象機器4の位置関係から対象機器4が動画像に写り込んでいるか否かを判定する。この判定結果を示す判定情報は、動画像のフレームまたはトラックに記録する。
管理者Mが動画を編集する際には、例えば、図20に示すように、管理コンピュータ3のディスプレイ12に動画編集画面57が表示される。この動画編集画面57には、動画ファイルを表示させるファイル表示領域58と、編集中の動画像が表示されるプレビュー領域59と、動画像のトラックの内容を表示させる複数のトラック表示領域60とが設けられている。
所定のトラックには、動画像のそれぞれの場面が記録される。そして、この動画像のトラックに対応して、音声を記録するトラック、テキストデータを記録するトラックが設けられる。さらに、画像判定部43の判定結果を示す判定情報を記録するトラックが設けられる。
判定情報のトラックには、動画像のいずれの時刻の場面(所定の再生期間)またはフレームに対象機器4が写り込んでいるか否かを示す情報が記録される。例えば、対象機器4が写り込んでいる場面またはフレームに対応して、外部への公開が制限されている旨を示す制限情報61が記録される。この制限情報61は、動画編集画面57のトラック表示領域60に表示される。なお、管理者Mは、動画編集画面57を用いて任意に制限情報61を設定しても良い。なお、公開が制限されていない場面またはフレームに対応して、非制限情報を記録しても良い。
動画像を再生するときには、制限情報61に対応する場面、つまり、対象機器4が写り込んでいる場面がカット(削除)された状態で再生される。なお、対象機器4が写り込んでいるフレームをモザイク処理またはマスク処理して再生しても良い。
第4実施形態の撮影情報記録部36(図2参照)は、動画像のトラックとフレームの少なくともいずれか一方に撮影情報を対応付けて記録する。このようにすれば、動画像に撮影制限の対象となっている対象機器4が写っているか否かを選別することができる。
また、動画像を再生するときに、撮影制限の対象となっている対象機器4が写っている場面を再生の対象から除外するようにしている。対象機器4をマスクで隠すなどの処理をした場合には、マスクの部分に対象機器4が存在することが分かってしまうが、対象機器4が写っている場面を再生しないようにすることで、対象機器4の存在を秘匿にすることができる。
なお、制限情報を記録する態様は、その他の態様でも良い。例えば、図21の変形例に示すように、動画像のそれぞれのトラックには、フレーム(画像)と音声とテキストデータと判定情報とが記録される。ここで、判定情報のトラックには、それぞれのフレームごとに制限情報62が記録される。
制限情報62は、対象機器4が写り込んでいるフレームに対応付けて記録される。なお、対象機器4が写り込んでいないフレーム、つまり、公開が制限されていないフレーム(または場面)に対応付けて、疑似的な制限情報63を記録しても良い。この疑似的な制限情報63が対応付けられるフレームは、判定情報記録部44(図2参照)がランダムに設定しても良いし、管理者Mが任意に設定しても良い。そして、動画像を再生するときには、制限情報62および疑似的な制限情報63が対応付けられたフレーム(場面)を再生の対象から除外するようにする。
動画像の再生中に所定の場面がカットされて再生されると、そのカットされた部分に対象機器4が存在することが推測されてしまう。そこで、疑似的な制限情報63を記録して、公開が制限されていない場面についても部分的(ランダム)にカットして再生することで、対象機器4の存在が推測されないようにできる。
本実施形態に係る画像特定システムおよび画像特定方法を第1実施形態から第4実施形態に基づいて説明したが、いずれか1の実施形態において適用された構成を他の実施形態に適用しても良いし、各実施形態において適用された構成を組み合わせても良い。
なお、本実施形態のフローチャートにおいて、各ステップが直列に実行される形態を例示しているが、必ずしも各ステップの前後関係が固定されるものでなく、一部のステップの前後関係が入れ替わっても良い。また、一部のステップが他のステップと並列に実行されても良い。
本実施形態のシステムは、専用のチップ、FPGA(Field Programmable Gate Array)、GPU(Graphics Processing Unit)、またはCPU(Central Processing Unit)などのプロセッサを高集積化させた制御装置と、ROM(Read Only Memory)またはRAM(Random Access Memory)などの記憶装置と、HDD(Hard Disk Drive)またはSSD(Solid State Drive)などの外部記憶装置と、ディスプレイなどの表示装置と、マウスまたはキーボードなどの入力装置と、通信インターフェースとを備える。このシステムは、通常のコンピュータを利用したハードウェア構成で実現できる。
なお、本実施形態のシステムで実行されるプログラムは、ROMなどに予め組み込んで提供される。もしくは、このプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD、フレキシブルディスク(FD)などのコンピュータで読み取り可能な非一過性の記憶媒体に記憶されて提供するようにしても良い。
また、このシステムで実行されるプログラムは、インターネットなどのネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせて提供するようにしても良い。また、このシステムは、構成要素の各機能を独立して発揮する別々のモジュールを、ネットワークまたは専用線で相互に接続し、組み合わせて構成することもできる。
なお、本実施形態では、VSLAM技術を用いて現場端末2の位置情報を取得しているが、その他の態様であっても良い。例えば、GPSを利用して位置情報を取得しても良い。Wi−Fi(登録商標)などの無線通信を利用して位置情報を取得しても良い。加速度センサなどを利用するPDRにより位置情報を取得しても良い。
なお、現場端末2が魚眼レンズ付カメラを備えても良い。例えば、2つの魚眼レンズ付カメラを用いて作業者Wの上下左右全方位の360度パノラマ画像である全天球画像の同時撮影を行っても良い。そして、全天球画像に対象機器4が写っているか否かを判定しても良い。その場合には、撮影方向および設定情報を参照せずに、位置情報のみに基づいて判定を行っても良い。
なお、本実施形態の現場端末2は、作業者が持運びできる大きさおよび重さであれば良い。例えば、作業現場において、三脚などの固定器具を用いて現場端末2を固定的に設置して使用しても良い。
なお、本実施形態のカメラ8は、ステレオカメラであっても良い。例えば、カメラ8がレンズ付きの2つの撮像素子を備えていても良い。このステレオカメラは、物体を複数の異なる2つの方向から同時に撮影することにより、その物体までの奥行き方向の情報が取得可能となっている。また、ステレオカメラのそれぞれの撮像素子により取得される画像は2次元画像であるが、これら2つの2次元画像に写る像の差異に基づいて、立体的な空間把握が可能な立体写真の生成が可能になっている。なお、ディスプレイ6には、レンズ付きの2つの画像素子のうち、いずれか一方の画像素子で撮影した撮影画像を表示すれば良い。
以上説明した少なくとも1つの実施形態によれば、位置情報と方向情報と画角情報とを含む撮影情報を画像に対応付けて記録する撮影情報記録部を備えることにより、撮影制限の対象となっている対象部分が写った画像を正確に選別し、その画像が外部に漏洩されてしまうことを抑制することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更、組み合わせを行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。