WO2024018973A1

WO2024018973A1 - 情報処理方法、情報処理装置、及び情報処理プログラム

Info

Publication number: WO2024018973A1
Application number: PCT/JP2023/025796
Authority: WO
Inventors: 智司松井; 正真遠間; 光波中
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2022-07-20
Filing date: 2023-07-12
Publication date: 2024-01-25

Abstract

画像処理装置は、カメラによって撮影された画像を取得し、画像内に含まれる複数のマーカを認識し、複数のマーカが認識された場合、認識した複数のマーカに囲まれた撮影可能領域を特定し、複数のマーカが認識されなかった場合、過去に特定された撮影可能領域内の撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定し、画像内の撮影可能領域の外側の領域をマスクしたマスク画像を作成し、マスク画像を出力する。

Description

情報処理方法、情報処理装置、及び情報処理プログラム

　本開示は、画像内の撮影可能領域以外をマスクする技術に関する。

　例えば、特許文献１には、作業領域において、遠隔支援作業者との映像共有が許可される撮像可能領域が設定されており、撮像可能領域ではない作業領域をマスキングしたマスキング映像を遠隔支援作業者向けの遠隔地端末に送信する映像制御装置が開示されている。従来の映像制御装置は、映像データ内に含まれるマーカを検出し、検出したマーカから、撮像可能領域を示すマーカ情報を抽出し、映像データのうち撮像可能領域の外にあると判断される映像領域を、共有不可映像領域として決定し、共有不可映像領域をマスキングして、マスキング映像を生成している。

　しかしながら、上記従来の技術では、複数のマーカが認識されない場合、複数のマーカに囲まれた撮像可能領域がマスクされた画像が出力されるので、現場にいる作業者は、遠隔地にいる作業者による支援を受けられなくなるおそれがあり、更なる改善が必要とされていた。

特開２０２１－１５０８６６号公報

　本開示は、上記の問題を解決するためになされたもので、複数のマーカが認識されない場合であっても、複数のマーカに囲まれた撮影可能領域以外をマスクした画像を出力することができる技術を提供することを目的とするものである。

　本開示に係る情報処理方法は、コンピュータにおける情報処理方法であって、カメラによって撮影された画像を取得し、前記画像内に含まれる複数のマーカを認識し、前記複数のマーカが認識された場合、認識した前記複数のマーカに囲まれた撮影可能領域を特定し、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定し、前記画像内の前記撮影可能領域の外側の領域をマスクしたマスク画像を作成し、前記マスク画像を出力する。

　本開示によれば、複数のマーカが認識されない場合であっても、複数のマーカに囲まれた撮影可能領域以外をマスクした画像を出力することができる。

本開示の実施の形態１における作業支援システムの構成の一例を示す図である。本実施の形態１における作業空間の一例を示す図である。本実施の形態１における画像処理装置の構成の一例を示す図である。本実施の形態１において、全てのマーカが映るようにカメラによって撮影された画像の一例を示す図である。本実施の形態１における初期撮影可能画像の一例を示す図である。本実施の形態１において、図４に示す画像に基づいて作成されたマスク画像の一例を示す図である。本実施の形態１において、支援対象装置に接近したカメラによって撮影された画像の一例を示す図である。本実施の形態１において、図７に示す画像に基づいて作成されたマスク画像の一例を示す図である。本実施の形態１において、撮影範囲が右に移動したカメラによって撮影された画像の一例を示す図である。本実施の形態１において、図９に示す画像に基づいて作成されたマスク画像の一例を示す図である。本開示の実施の形態１における画像処理装置による作業支援処理について説明するための第１のフローチャートである。本開示の実施の形態１における画像処理装置による作業支援処理について説明するための第２のフローチャートである。本実施の形態２における画像処理装置の構成の一例を示す図である。本開示の実施の形態２における画像処理装置による作業支援処理について説明するための第１のフローチャートである。本開示の実施の形態２における画像処理装置による作業支援処理について説明するための第２のフローチャートである。本実施の形態３における画像処理装置の構成の一例を示す図である。本実施の形態３において、最初に複数のマーカ全てが認識された際にカメラによって撮影された画像の一例を示す図である。本実施の形態３において、カメラが初期位置から支援対象装置に接近した際に作成されたマスク画像の一例を示す図である。本実施の形態３において、カメラが初期位置から支援対象装置に接近するとともに撮影範囲が右に移動した際に作成されたマスク画像の一例を示す図である。本開示の実施の形態３における画像処理装置による作業支援処理について説明するための第１のフローチャートである。本開示の実施の形態３における画像処理装置による作業支援処理について説明するための第２のフローチャートである。本開示の実施の形態３における画像処理装置による作業支援処理について説明するための第３のフローチャートである。

　（本開示の基礎となった知見）
　現場にいる作業者が、遠隔地にいる作業者からの業務支援を効率的に受けるためには、現場の状況を撮影した映像を遠隔地にいる作業者と共有することが効果的である。

　遠隔地に映像が伝送される際、映像に秘匿情報が映り込む可能性がある。そこで、映像伝送により秘匿情報が外部に漏洩するのを防ぐため、映像伝送可能な対象物又は秘匿情報である対象物を特定して、映像内の秘匿情報に対応する領域をマスクする処理が行われる。

　例えば、現場にいる作業者は、映像を伝送してもよい領域、すなわち秘匿情報が含まれない領域を囲むように複数のマーカを配置する。撮影された映像内の複数のマーカが認識され、認識された複数のマーカに囲まれた撮像可能領域の外側の領域がマスクされることで秘匿情報が漏洩するのを防止することができる。しかしながら、カメラが移動することで、複数のマーカの一部又は全部がカメラの撮影範囲外になった場合、撮像可能領域を決定することができず、映像の全画素がマスク処理されてしまい、所望の映像が伝送できなくなるおそれがある。

　上記の従来技術では、複数のマーカそれぞれは、マーカ情報を有する二次元コードである。そのため、従来の映像制御装置は、複数のマーカのうち、１つ以上のマーカがカメラの視野内にあれば、検出した１つ以上のマーカから、撮像可能領域を示すマーカ情報を抽出することができる。そして、従来の映像制御装置は、映像データのうち撮像可能領域の外にあると判断される映像領域を、共有不可映像領域として決定し、共有不可映像領域をマスキングして、マスキング映像を生成することができる。

　しかしながら、従来技術では、全てのマーカがカメラの視野外にある場合、撮像可能領域の決定は困難である。また、複数のマーカが二次元コードではなく、複数のマーカのうちの一部がカメラの視野外にある場合、撮像可能領域の決定は困難である。

　以上の課題を解決するために、下記の技術が開示される。

　（１）本開示の一態様に係る情報処理方法は、コンピュータにおける情報処理方法であって、カメラによって撮影された画像を取得し、前記画像内に含まれる複数のマーカを認識し、前記複数のマーカが認識された場合、認識した前記複数のマーカに囲まれた撮影可能領域を特定し、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定し、前記画像内の前記撮影可能領域の外側の領域をマスクしたマスク画像を作成し、前記マスク画像を出力する。

　この構成によれば、画像内に含まれる複数のマーカが認識された場合、認識された複数のマーカに囲まれた撮影可能領域が特定される。一方、複数のマーカが認識されなかった場合、過去に特定された撮影可能領域内の撮影可能画像と一致する、今回取得された画像内の領域が撮影可能領域として特定される。そして、画像内の撮影可能領域の外側の領域をマスクしたマスク画像が作成され、マスク画像が出力される。

　したがって、複数のマーカが認識されない場合であっても、複数のマーカに囲まれた撮影可能領域以外をマスクしたマスク画像を出力することができる。この結果、現場にいる作業者は、遠隔地にいる作業者から効率的な作業支援を受けることができる。

　（２）上記（１）記載の情報処理方法において、前記マスク画像の作成において、前記撮影可能領域が特定されなかった場合、前記画像内の全てをマスクした前記マスク画像を作成してもよい。

　この構成によれば、撮影可能領域が特定されなかった場合、画像内の全てをマスクしたマスク画像が作成されるので、秘匿するべき情報を含む画像が出力されるのを確実に防止することができる。

　（３）上記（１）又は（２）記載の情報処理方法において、前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の前記撮影可能画像と、今回取得された前記画像とを比較し、前記撮影可能画像と一致する前記画像内の領域を前記撮影可能領域として特定してもよい。

　この構成によれば、複数のマーカが認識されなかった場合、過去に特定された撮影可能領域内の前記撮影可能画像と、今回取得された画像とのマッチング処理が行われることにより、今回取得された画像内における撮影可能領域を特定することができる。

　（４）上記（３）記載の情報処理方法において、さらに、最初に前記複数のマーカが認識された場合、前記画像内の前記撮影可能領域内の前記撮影可能画像を初期撮影可能画像としてメモリに記憶し、前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、前記初期撮影可能画像と、今回取得された前記画像とを比較し、前記初期撮影可能画像と一致する前記画像内の領域を前記撮影可能領域として特定してもよい。

　この構成によれば、複数のマーカが認識されなかった場合、最初に複数のマーカが認識された際に得られた初期撮影可能画像と、今回取得された画像とのマッチング処理が行われることにより、今回取得された画像内における撮影可能領域を特定することができる。

　（５）上記（４）記載の情報処理方法において、さらに、最初に前記複数のマーカが認識された場合、前記カメラの位置及び姿勢を表す第１センシング値を第１初期センシング値として前記メモリに記憶し、さらに、前記撮影可能領域が特定されなかった場合、前記第１初期センシング値と、現在の前記第１センシング値とを取得し、さらに、前記第１初期センシング値及び現在の前記第１センシング値に基づいて推定される、前記カメラの初期位置及び初期姿勢に対する前記カメラの現在位置及び現在姿勢に基づいて、前記初期撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定してもよい。

　この構成によれば、過去に特定された撮影可能領域内の撮影可能画像と一致する、今回取得された画像内の領域が撮影可能領域として特定されなかった場合、カメラの初期位置及び初期姿勢に対するカメラの現在位置及び現在姿勢に基づいて、今回取得された画像内の撮影可能領域を特定することができる。

　（６）上記（３）記載の情報処理方法において、前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、１フレーム前に特定された前記撮影可能領域内の前記撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定してもよい。

　この構成によれば、複数のマーカが認識されなかった場合、１フレーム前に特定された撮影可能領域内の撮影可能画像と、今回取得された画像とのマッチング処理が行われることにより、今回取得された画像内における撮影可能領域を特定することができる。

　（７）上記（６）記載の情報処理方法において、さらに、メモリに記憶されている１フレーム前に推定された前記撮影可能領域内の前記撮影可能画像と、今回取得された現在フレームの前記画像とを比較し、前記撮影可能画像と一致する前記画像内の領域を前記現在フレームの前記撮影可能領域として推定し、さらに、推定した前記現在フレームの前記撮影可能領域内の前記撮影可能画像を前記メモリに記憶し、前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、推定した前記現在フレームの前記撮影可能領域を前記撮影可能領域として特定してもよい。

　この構成によれば、１フレーム毎に撮影可能領域が推定されるので、複数のマーカが認識されなかった場合、推定された現在フレームの撮影可能領域を、今回取得された画像内における撮影可能領域として特定することができる。

　（８）上記（７）記載の情報処理方法において、さらに、１フレーム毎に前記カメラの位置及び姿勢を表す第１センシング値を取得し、取得した前記第１センシング値を前記メモリに記憶し、さらに、前記撮影可能領域が特定されなかった場合、１フレーム前の前記第１センシング値と、現在の前記第１センシング値とを取得し、さらに、１フレーム前の前記第１センシング値及び現在の前記第１センシング値に基づいて推定される、１フレーム前の前記カメラの位置及び姿勢に対する前記カメラの現在位置及び現在姿勢に基づいて、１フレーム前の前記撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定してもよい。

　この構成によれば、過去に特定された撮影可能領域内の撮影可能画像と一致する、今回取得された画像内の領域が撮影可能領域として特定されなかった場合、１フレーム前のカメラの位置及び姿勢に対するカメラの現在位置及び現在姿勢に基づいて、今回取得された画像内の撮影可能領域を特定することができる。

　（９）上記（１）又は（２）記載の情報処理方法において、さらに、最初に前記複数のマーカが認識された場合、初期フレームの前記画像内の前記撮影可能領域内の前記撮影可能画像を初期撮影可能画像としてメモリに記憶し、さらに、１フレーム前の前記画像と現在フレームの前記画像とを比較し、１フレーム前の前記画像の撮影範囲と現在フレームの前記画像の撮影範囲との変化量を１フレーム毎に算出し、さらに、前記初期フレームから前記現在フレームまでの前記変化量の累積値を算出し、前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、前記初期撮影可能領域と前記累積値とに基づいて、前記現在フレームの前記撮影可能領域を特定してもよい。

　この構成によれば、初期フレームから現在フレームまでの画像の撮影範囲の変化と、初期フレームの画像内における初期撮影可能画像とに基づいて、現在フレームの撮影可能領域を特定することができる。

　（１０）上記（１）又は（２）記載の情報処理方法において、さらに、最初に前記複数のマーカが認識された場合、前記画像内の前記撮影可能領域内の前記撮影可能画像を初期撮影可能画像としてメモリに記憶し、さらに、最初に前記複数のマーカが認識された場合、前記初期撮影可能画像内の画素毎の前記カメラから物体までの各距離を第２初期センシング値として前記メモリに記憶し、さらに、前記撮影可能領域が特定されなかった場合、前記第２初期センシング値と、今回取得された前記画像内の画素毎の前記カメラから物体までの距離を表す第２センシング値とを取得し、さらに、今回取得された前記画像内の複数の画素の前記第２センシング値が、前記第２初期センシング値のうちの最も長い距離以下である領域を前記撮影可能領域として特定してもよい。

　この構成によれば、今回取得された画像内において、初期撮影可能画像内にある物体よりも遠くにある物体はマスクされるので、秘匿するべき情報を含む画像が出力されるのを簡単に防止することができる。

　また、本開示は、以上のような特徴的な処理を実行する情報処理方法として実現することができるだけでなく、情報処理方法が実行する特徴的な処理に対応する特徴的な構成を備える情報処理装置などとして実現することもできる。また、このような情報処理方法に含まれる特徴的な処理をコンピュータに実行させるコンピュータプログラムとして実現することもできる。したがって、以下の他の態様でも、上記の情報処理方法と同様の効果を奏することができる。

　（１１）本開示の他の態様に係る情報処理装置は、カメラによって撮影された画像を取得する取得部と、前記画像内に含まれる複数のマーカを認識する認識部と、前記複数のマーカが認識された場合、認識した前記複数のマーカに囲まれた撮影可能領域を特定し、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定する特定部と、前記画像内の前記撮影可能領域の外側の領域をマスクしたマスク画像を作成する作成部と、前記マスク画像を出力する出力部と、を備える。

　（１２）本開示の他の態様に係る情報処理プログラムは、カメラによって撮影された画像を取得し、前記画像内に含まれる複数のマーカを認識し、前記複数のマーカが認識された場合、認識した前記複数のマーカに囲まれた撮影可能領域を特定し、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定し、前記画像内の前記撮影可能領域の外側の領域をマスクしたマスク画像を作成し、前記マスク画像を出力するようにコンピュータを機能させる。

　（１３）本開示の他の態様に係る非一時的なコンピュータ読み取り可能な記録媒体は、情報処理プログラムを記録し、前記情報処理プログラムは、カメラによって撮影された画像を取得し、前記画像内に含まれる複数のマーカを認識し、前記複数のマーカが認識された場合、認識した前記複数のマーカに囲まれた撮影可能領域を特定し、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定し、前記画像内の前記撮影可能領域の外側の領域をマスクしたマスク画像を作成し、前記マスク画像を出力するようにコンピュータを機能させる。

　以下添付図面を参照しながら、本開示の実施の形態について説明する。なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また全ての実施の形態において、各々の内容を組み合わせることもできる。

　（実施の形態１）
　図１は、本開示の実施の形態１における作業支援システムの構成の一例を示す図である。図１に示す作業支援システムは、カメラ１、画像処理装置２、及び遠隔端末３を備える。

　カメラ１は、例えば、現場の作業者の頭部に装着されるウェアラブルカメラである。作業者は、カメラ１を装着して作業を行う。このとき、現場の作業者は、現場の作業空間にある支援対象装置をカメラ１で撮影しながら、遠隔地の作業者から業務支援を受ける。遠隔地の作業者は、現場から伝送される画像を見ながら、支援対象装置の操作及び修理などの支援を行う。

　図２は、本実施の形態１における作業空間の一例を示す図である。

　図２に示すように、作業空間１００には、支援対象装置１０１が設置されている。現場の作業者は、カメラ１を用いて支援対象装置１０１を撮影する。カメラ１により撮影された画像は、遠隔地の作業者が操作する遠隔端末３に送信される。このとき、撮影した画像に秘匿情報が映り込む可能性がある。そこで、秘匿情報が含まれる画像が送信されるのを防ぐため、特定の作業領域以外を画像処理（マスク処理）により隠す。現場の作業者は、支援対象装置１０１の秘匿情報が含まれない作業領域を囲むように複数のマーカ１１１，１１２，１１３，１１４を貼り付ける。複数のマーカ１１１，１１２，１１３，１１４は、例えば、粘着物質又はマグネットなどにより撮影可能な作業領域を囲むように直接貼り付けられる。

　カメラ１は、撮影した画像を近距離無線通信により画像処理装置２に送信する。カメラ１は、所定のフレームレートで画像を画像処理装置２に送信する。そのため、動画像が、カメラ１から画像処理装置２に送信される。なお、カメラ１は、画像処理装置２と無線接続されているが、画像処理装置２と有線接続されていてもよい。

　なお、カメラ１は、スマートフォン又はタブレット型コンピュータなどのカメラ付きの端末であってもよい。また、カメラ１は、デジタルカメラであってもよい。

　画像処理装置２は、例えば、現場の作業者によって操作されるパーソナルコンピュータである。画像処理装置２は、遠隔端末３とネットワーク４を介して互いに通信可能に接続されている。ネットワーク４は、例えば、インターネットである。

　図３は、本実施の形態１における画像処理装置２の構成の一例を示す図である。

　図３に示す画像処理装置２は、プロセッサ２１、メモリ２２及び通信部２３を備える。

　プロセッサ２１は、例えば、ＣＰＵ（中央演算処理装置）である。プロセッサ２１により、画像取得部２１１、マーカ認識部２１２、領域特定部２１３、マスク画像作成部２１４、及び出力部２１５が実現される。

　メモリ２２は、例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）又はフラッシュメモリ等の各種情報を記憶可能な記憶装置である。

　なお、画像処理装置２が情報処理装置の一例に相当し、画像取得部２１１が取得部の一例に相当し、マーカ認識部２１２が認識部の一例に相当し、領域特定部２１３が特定部の一例に相当し、マスク画像作成部２１４が作成部の一例に相当し、出力部２１５が出力部の一例に相当する。

　通信部２３は、カメラ１によって送信された画像を受信する。通信部２３は、受信した画像をプロセッサ２１に出力する。通信部２３は、所定のフレームレートで送信された動画像を受信し、１フレーム毎に画像をプロセッサ２１に出力する。

　画像取得部２１１は、カメラ１によって撮影された画像を取得する。画像取得部２１１は、１フレーム毎に画像を取得する。

　マーカ認識部２１２は、画像取得部２１１によって取得された画像内に含まれる複数のマーカを認識する。本実施の形態１では、種類の異なる４つのマーカ１１１，１１２，１１３，１１４が用いられる。図２に示すように、４つのマーカ１１１，１１２，１１３，１１４は、矩形状であり、それぞれ異なる図柄を有している。

　現場にいる作業者は、撮影可能な作業領域１５０の左上にマーカ１１１を貼り付け、撮影可能な作業領域１５０の左下にマーカ１１２を貼り付け、撮影可能な作業領域１５０の右上にマーカ１１３を貼り付け、撮影可能な作業領域１５０の右下にマーカ１１４を貼り付ける。なお、４つのマーカ１１１，１１２，１１３，１１４が配置される位置は特に決められていない。４つのマーカ１１１，１１２，１１３，１１４は、撮影可能な作業領域１５０の左上、左下、右上、及び右下のいずれに配置されてもよい。

　マーカ認識部２１２は、パターンマッチングにより、画像内に含まれる４つのマーカ１１１，１１２，１１３，１１４を認識する。すなわち、マーカ認識部２１２は、メモリ２２に予め記憶されている複数のマーカの図柄と、画像内に含まれる４つのマーカ１１１，１１２，１１３，１１４の図柄とを照合することにより、画像内における４つのマーカ１１１，１１２，１１３，１１４を認識する。

　なお、マーカ認識部２１２は、正面から撮影されたマーカだけでなく、斜め方向から撮影されたマーカも認識可能である。

　また、本実施の形態１では、４つのマーカが用いられるが、本開示は特にこれに限定されず、３つのマーカが用いられてもよく、５つ以上のマーカが用いられてもよい。

　領域特定部２１３は、マーカ認識部２１２によって複数のマーカ１１１，１１２，１１３，１１４が認識された場合、認識された複数のマーカ１１１，１１２，１１３，１１４に囲まれた撮影可能領域を特定する。また、領域特定部２１３は、マーカ認識部２１２によって複数のマーカ１１１，１１２，１１３，１１４が認識されなかった場合、過去に特定された撮影可能領域内の撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定する。

　すなわち、領域特定部２１３は、複数のマーカ１１１，１１２，１１３，１１４の全てが認識された場合、認識された複数のマーカ１１１，１１２，１１３，１１４に囲まれた撮影可能領域を特定する。また、領域特定部２１３は、複数のマーカ１１１，１１２，１１３，１１４のうちの少なくとも１つが認識されなかった場合、過去に特定された撮影可能領域内の撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定する。

　領域特定部２１３は、４つのマーカ１１１，１１２，１１３，１１４が認識された場合、左上のマーカ１１１の左上の頂点と、左下のマーカ１１２の左下の頂点と、右上のマーカ１１３の右上の頂点と、右下のマーカ１１４の右下の頂点とを直線で結んだ撮影可能領域を特定する。

　なお、領域特定部２１３は、４つのマーカ１１１，１１２，１１３，１１４が認識された場合、左上のマーカ１１１の右下の頂点と、左下のマーカ１１２の右上の頂点と、右上のマーカ１１３の左下の頂点と、右下のマーカ１１４の左上の頂点とを直線で結んだ撮影可能領域を特定してもよい。また、領域特定部２１３は、４つのマーカ１１１，１１２，１１３，１１４が認識された場合、４つのマーカ１１１，１１２，１１３，１１４それぞれの中心点を直線で結んだ撮影可能領域を特定してもよい。

　なお、４つのマーカのうちの１つが認識されなかった場合であっても、領域特定部２１３は、認識されなかった１つのマーカの位置を予測し、４つのマーカに囲まれた撮影可能領域を特定してもよい。

　また、領域特定部２１３は、複数のマーカが認識されなかった場合、過去に特定された撮影可能領域内の撮影可能画像と、今回取得された画像とを比較し、撮影可能画像と一致する画像内の領域を撮影可能領域として特定する。

　より具体的には、領域特定部２１３は、最初に複数のマーカが認識された場合、画像内の撮影可能領域内の撮影可能画像を初期撮影可能画像としてメモリ２２に記憶する。そして、領域特定部２１３は、複数のマーカが認識されなかった場合、初期撮影可能画像と、今回取得された画像とを比較し、初期撮影可能画像と一致する画像内の領域を撮影可能領域として特定する。このとき、領域特定部２１３は、初期撮影可能画像の複数の特徴点を抽出するとともに、今回取得された画像の複数の特徴点を抽出し、初期撮影可能画像の複数の特徴点と、今回取得された画像の複数の特徴点とを対応付け、初期撮影可能画像の複数の特徴点と同じ特徴点を有する画像内の領域を撮影可能領域として特定する。

　マスク画像作成部２１４は、画像内の領域特定部２１３によって特定された撮影可能領域の外側の領域をマスクしたマスク画像を作成する。マスク画像作成部２１４は、領域特定部２１３によって撮影可能領域が特定されなかった場合、画像内の全てをマスクしたマスク画像を作成してもよい。

　メモリ２２は、最初に複数のマーカが認識された際に特定された初期撮影可能画像を記憶する。

　出力部２１５は、マスク画像作成部２１４によって作成されたマスク画像を出力する。出力部２１５は、マスク画像を通信部２３に出力する。通信部２３は、マスク画像を遠隔端末３に送信する。

　図４は、本実施の形態１において、全てのマーカが映るようにカメラ１によって撮影された画像１２１の一例を示す図である。また、図５は、本実施の形態１における初期撮影可能画像１７１の一例を示す図である。なお、図４では、説明を分かりやすくするため、マーカが実際よりも大きく図示されている。

　画像１２１は、４つのマーカ１１１，１１２，１１３，１１４を全て含んでいる。マーカ認識部２１２は、画像取得部２１１によって取得された画像１２１内に含まれる４つのマーカ１１１，１１２，１１３，１１４を認識する。領域特定部２１３は、４つのマーカ１１１，１１２，１１３，１１４の全てが認識された場合、認識された４つのマーカ１１１，１１２，１１３，１１４に囲まれた撮影可能領域１３１を特定する。また、領域特定部２１３は、最初に４つのマーカ１１１，１１２，１１３，１１４が認識された場合、画像１２１内の撮影可能領域１３１内の撮影可能画像１６１を初期撮影可能画像１７１としてメモリ２２に記憶する。

　図５に示すように、初期撮影可能画像１７１は、最初に４つのマーカ１１１，１１２，１１３，１１４の全てが認識された際に得られた画像であり、４つのマーカ１１１，１１２，１１３，１１４に囲まれた撮影可能領域１３１内の画像である。

　図６は、本実施の形態１において、図４に示す画像１２１に基づいて作成されたマスク画像１４１の一例を示す図である。

　マスク画像作成部２１４は、画像１２１内の撮影可能領域１３１の外側の領域１３２をマスクしたマスク画像１４１を作成する。マスク画像作成部２１４は、画像１２１内の撮影可能領域１３１の外側の領域１３２に対してマスク処理を施す。マスク処理は、例えば、黒色、白色、又は灰色などの所定の色で領域１３２を塗りつぶす処理でもよいし、領域１３２にぼかし加工を施す処理でもよいし、領域１３２にモザイク加工を施す処理でもよい。図６に示すマスク画像１４１では、撮影可能領域１３１内の撮影可能画像１６１は視認可能となっており、撮影可能領域１３１以外の領域１３２は秘匿されている。

　図７は、本実施の形態１において、支援対象装置１０１に接近したカメラ１によって撮影された画像１２２の一例を示す図である。

　カメラ１が支援対象装置１０１に接近した場合、カメラ１の撮影範囲は、図４の領域１５１に変化する。この場合、４つのマーカ１１１，１１２，１１３，１１４が画像１２２内に含まれなくなる。画像１２２は、４つのマーカ１１１，１１２，１１３，１１４を含んでいない。そのため、マーカ認識部２１２は、画像取得部２１１によって取得された画像１２２からはマーカを認識しない。領域特定部２１３は、４つのマーカ１１１，１１２，１１３，１１４のうちの少なくとも１つが認識されなかった場合、初期撮影可能画像１７１と、今回取得された画像１２２とを比較し、初期撮影可能画像１７１と一致する画像１２２内の領域を撮影可能領域として特定する。図７では、カメラ１が支援対象装置１０１に接近したため、４つのマーカ１１１，１１２，１１３，１１４が画像１２２内に含まれていない。しかしながら、今回取得された画像１２２は、図５に示す初期撮影可能画像１７１の領域１９１と一致する。したがって、領域特定部２１３は、今回取得された画像１２２全体を撮影可能領域１３１として特定する。

　図８は、本実施の形態１において、図７に示す画像１２２に基づいて作成されたマスク画像１４２の一例を示す図である。

　マスク画像作成部２１４は、画像１２２内の撮影可能領域１３１の外側の領域１３２をマスクしたマスク画像１４２を作成する。図８に示すマスク画像１４２では、今回取得された画像１２２全体が撮影可能領域１３１であるため、マスク画像１４２全体が視認可能となっている。

　図９は、本実施の形態１において、撮影範囲が右に移動したカメラ１によって撮影された画像１２３の一例を示す図である。

　カメラ１の撮影範囲が右に移動した場合、カメラ１の撮影範囲は、図４の領域１５２に変化する。この場合、４つのマーカ１１１，１１２，１１３，１１４のうち、２つのマーカ１１１，１１２が画像１２２内に含まれなくなる。画像１２３は、４つのマーカ１１１，１１２，１１３，１１４のうち、２つのマーカ１１１，１１２を含んでいない。そのため、マーカ認識部２１２は、画像取得部２１１によって取得された画像１２３内に含まれる２つのマーカ１１３，１１４を認識し、画像１２３内に含まれない２つのマーカ１１１，１１２を認識しない。領域特定部２１３は、４つのマーカ１１１，１１２，１１３，１１４のうちの少なくとも１つが認識されなかった場合、初期撮影可能画像１７１と、今回取得された画像１２３とを比較し、初期撮影可能画像１７１と一致する画像１２３内の領域１８１を撮影可能領域１３１として特定する。図９では、カメラ１の撮影範囲が右方向に移動したため、２つのマーカ１１１，１１２が画像１２３内に含まれていない。しかしながら、今回取得された画像１２３内の領域１８１は、図５に示す初期撮影可能画像１７１の領域１９２と一致する。したがって、領域特定部２１３は、初期撮影可能画像１７１と一致する画像１２３内の領域１８１を撮影可能領域１３１として特定する。

　図１０は、本実施の形態１において、図９に示す画像１２３に基づいて作成されたマスク画像１４３の一例を示す図である。

　マスク画像作成部２１４は、画像１２３内の撮影可能領域１３１の外側の領域１３２をマスクしたマスク画像１４３を作成する。マスク画像作成部２１４は、画像１２３内の撮影可能領域１３１の外側の領域１３２に対してマスク処理を施す。図１０に示すマスク画像１４３では、撮影可能領域１３１内の撮影可能画像１６１は視認可能となっており、撮影可能領域１３１以外の領域１３２は秘匿されている。

　図１０に示すように、４つのマーカ１１１，１１２，１１３，１１４のうちの一部が認識されていなくても、取得された画像１２３全体をマスクするのではなく、撮影可能領域１３１内をマスクしないマスク画像１４３を作成することができる。

　なお、本実施の形態１では、画像処理装置２は、現場に配置されているが、本開示は特にこれに限定されず、画像処理装置２は、クラウド上に設けられたサーバであってもよい。この場合、画像処理装置２は、カメラ１とネットワーク４を介して互いに通信可能に接続される。

　遠隔端末３は、例えば、遠隔地の作業者によって操作されるパーソナルコンピュータ、スマートフォン、又はタブレット型コンピュータである。遠隔端末３は、画像処理装置２によって送信されたマスク画像を受信する。遠隔端末３は、受信したマスク画像を表示する。画像処理装置２は、所定のフレームレートでマスク画像を遠隔端末３に送信する。そのため、動画像が、画像処理装置２から遠隔端末３に送信される。

　遠隔地の作業者は、遠隔端末３に表示されたマスク画像を見ながら、現場の作業者の作業を支援することができる。なお、画像処理装置２及び遠隔端末３は画像データだけでなく、音声データを互いに送信及び受信してもよい。

　続いて、本開示の実施の形態１における画像処理装置２による作業支援処理について説明する。

　図１１は、本開示の実施の形態１における画像処理装置２による作業支援処理について説明するための第１のフローチャートであり、図１２は、本開示の実施の形態１における画像処理装置２による作業支援処理について説明するための第２のフローチャートである。

　まず、ステップＳ１において、画像取得部２１１は、カメラ１によって撮影された画像を取得する。なお、カメラ１の電源がオンされた場合、又は画像処理装置２に設けられたマスク画像の送信を開始するためのボタンが押下された場合、カメラ１から画像が取得される。

　次に、ステップＳ２において、マーカ認識部２１２は、メモリ２２に記憶されている初期化フラグがオンであるか否かを判定する。ここで、初期化フラグがオンではない、すなわち、初期化フラグがオフであると判定された場合（ステップＳ２でＮＯ）、ステップＳ３において、マーカ認識部２１２は、画像取得部２１１によって取得された画像内に含まれる複数のマーカを認識する。

　次に、ステップＳ４において、領域特定部２１３は、マーカ認識部２１２によって全てのマーカが認識されたか否かを判定する。なお、画像認識に用いられる複数のマーカの数は、予め決められている。メモリ２２は、複数のマーカの数を予め記憶している。本実施の形態１では、複数のマーカの数は４つである。領域特定部２１３は、マーカ認識部２１２によって４つのマーカが認識されたか否かを判定する。

　ここで、全てのマーカが認識されていないと判定された場合、すなわち、複数のマーカのうちの少なくとも１つが認識されていないと判定された場合（ステップＳ４でＮＯ）、ステップＳ１に処理が戻る。

　一方、全てのマーカが認識されたと判定された場合（ステップＳ４でＹＥＳ）、ステップＳ５において、領域特定部２１３は、マーカ認識部２１２によって認識された複数のマーカに囲まれた撮影可能領域を特定する。

　次に、ステップＳ６において、領域特定部２１３は、画像内の撮影可能領域内の撮影可能画像を初期撮影可能画像としてメモリ２２に記憶する。

　次に、ステップＳ７において、領域特定部２１３は、メモリ２２に記憶されている初期化フラグをオンにする。初期化フラグがオンにされた後、ステップＳ１に処理が戻る。

　一方、初期化フラグがオンであると判定された場合（ステップＳ２でＹＥＳ）、ステップＳ８において、マーカ認識部２１２は、画像取得部２１１によって取得された画像内に含まれる複数のマーカを認識する。

　次に、ステップＳ９において、領域特定部２１３は、マーカ認識部２１２によって全てのマーカが認識されたか否かを判定する。

　ここで、全てのマーカが認識されていないと判定された場合、すなわち、複数のマーカのうちの少なくとも１つが認識されていないと判定された場合（ステップＳ９でＮＯ）、ステップＳ１０において、領域特定部２１３は、初期撮影可能画像と今回取得された画像とのマッチング処理により撮影可能領域を特定する。すなわち、領域特定部２１３は、初期撮影可能画像と、今回取得された画像とを比較し、初期撮影可能画像と一致する画像内の領域を撮影可能領域として特定する。なお、初期撮影可能画像と一致する画像内の領域がない場合、領域特定部２１３は、撮影可能領域を特定しない。

　次に、ステップＳ１１において、領域特定部２１３は、撮影可能領域が特定されたか否かを判定する。ここで、撮影可能領域が特定されたと判定された場合（ステップＳ１１でＹＥＳ）、ステップＳ１４に処理が移行する。

　一方、撮影可能領域が特定されていないと判定された場合（ステップＳ１１でＮＯ）、ステップＳ１２において、領域特定部２１３は、メモリ２２に記憶されている初期化フラグをオフにする。初期化フラグがオフにされた後、ステップＳ１に処理が戻る。

　一方、全てのマーカが認識されたと判定された場合（ステップＳ９でＹＥＳ）、ステップＳ１３において、領域特定部２１３は、マーカ認識部２１２によって認識された複数のマーカに囲まれた撮影可能領域を特定する。

　次に、ステップＳ１４において、マスク画像作成部２１４は、画像内の領域特定部２１３によって特定された撮影可能領域の外側の領域をマスクするマスク処理によりマスク画像を作成する。

　次に、ステップＳ１５において、出力部２１５は、マスク画像作成部２１４によって作成されたマスク画像を、通信部２３を介して遠隔端末３に送信する。遠隔端末３は、画像処理装置２によって送信されたマスク画像を受信する。遠隔端末３は、受信したマスク画像を表示する。

　次に、ステップＳ１６において、出力部２１５は、マスク画像の送信を終了するか否かを判定する。なお、カメラ１の電源がオフされた場合、又は画像処理装置２に設けられたマスク画像の送信を終了するためのボタンが押下された場合、マスク画像の送信が終了する。

　ここで、マスク画像の送信を終了すると判定された場合（ステップＳ１６でＹＥＳ）、ステップＳ１７において、出力部２１５は、マスク画像の送信を終了する。

　一方、マスク画像の送信を終了しないと判定された場合（ステップＳ１６でＮＯ）、ステップＳ１に処理が戻る。

　このように、画像内に含まれる複数のマーカが認識された場合、認識された複数のマーカに囲まれた撮影可能領域が特定される。一方、複数のマーカが認識されなかった場合、過去に特定された撮影可能領域内の撮影可能画像と一致する、今回取得された画像内の領域が撮影可能領域として特定される。そして、画像内の撮影可能領域の外側の領域をマスクしたマスク画像が作成され、マスク画像が出力される。

　（実施の形態２）
　上記の実施の形態１では、最初に複数のマーカが認識された際に、画像内の撮影可能領域内の撮影可能画像が初期撮影可能画像としてメモリ２２に記憶され、以降、取得された画像から複数のマーカが認識されなかった場合、初期撮影可能画像と、今回取得された画像とが比較され、初期撮影可能画像と一致する画像内の領域が撮影可能領域として特定される。

　これに対し、実施の形態２では、最初に複数のマーカが認識された際に、画像内の撮影可能領域内の撮影可能画像が初期撮影可能画像としてメモリ２２に記憶され、以降、１フレーム前の画像内の撮影可能画像と、今回取得された画像とが１フレーム毎に比較され、１フレーム前の撮影可能画像と一致する画像内の領域が撮影可能領域として推定される。そして、取得された画像から複数のマーカが認識されなかった場合、推定された撮影可能領域が、取得された画像の撮影可能領域として特定される。

　図１３は、本実施の形態２における画像処理装置２Ａの構成の一例を示す図である。なお、本実施の形態２において、画像処理装置２Ａ以外の作業支援システムの構成は、実施の形態１における作業支援システムと同じである。

　図１３に示す画像処理装置２Ａは、プロセッサ２１Ａ、メモリ２２及び通信部２３を備える。なお、本実施の形態２において、実施の形態１と同じ構成については、同じ符号を付し、説明を省略する。

　プロセッサ２１Ａにより、画像取得部２１１、マーカ認識部２１２、領域特定部２１３Ａ、マスク画像作成部２１４、出力部２１５、及び領域推定部２１６が実現される。

　領域推定部２１６は、メモリ２２に記憶されている１フレーム前に推定された撮影可能領域内の撮影可能画像と、今回取得された現在フレームの画像とを比較し、撮影可能画像と一致する画像内の領域を現在フレームの撮影可能領域として推定する。領域推定部２１６は、１フレーム毎に現在フレームの画像内の撮影可能領域を推定する。領域推定部２１６は、推定した現在フレームの撮影可能領域内の撮影可能画像をメモリ２２に記憶する。

　メモリ２２は、１フレーム前の画像から推定された撮影可能画像と、現在フレームの画像から推定された撮影可能画像とを記憶する。

　領域特定部２１３Ａは、複数のマーカが認識されなかった場合、１フレーム前に特定された撮影可能領域内の撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定する。領域特定部２１３Ａは、複数のマーカが認識されなかった場合、領域推定部２１６によって推定された現在フレームの撮影可能領域に基づいて撮影可能領域を特定する。

　続いて、本開示の実施の形態２における画像処理装置２Ａによる作業支援処理について説明する。

　図１４は、本開示の実施の形態２における画像処理装置２Ａによる作業支援処理について説明するための第１のフローチャートであり、図１５は、本開示の実施の形態２における画像処理装置２Ａによる作業支援処理について説明するための第２のフローチャートである。

　ステップＳ２１～ステップＳ２６の処理は、図１１に示すステップＳ１～ステップＳ６の処理と同じであるので、説明を省略する。

　次に、ステップＳ２７において、マスク画像作成部２１４は、画像内の領域特定部２１３Ａによって特定された撮影可能領域の外側の領域をマスクするマスク処理によりマスク画像を作成する。

　次に、ステップＳ２８において、領域特定部２１３Ａは、メモリ２２に記憶されている初期化フラグをオンにする。初期化フラグがオンにされた後、ステップＳ３７に処理が移行する。

　一方、初期化フラグがオンであると判定された場合（ステップＳ２２でＹＥＳ）、ステップＳ２９において、領域特定部２１３Ａは、メモリ２２に記憶されている１フレーム前に推定された撮影可能画像と今回取得された現在フレームの画像とのマッチング処理により撮影可能領域を推定する。すなわち、領域特定部２１３Ａは、１フレーム前の撮影可能画像と、今回取得された現在フレームの画像とを比較し、１フレーム前の撮影可能画像と一致する現在フレームの画像内の領域を撮影可能領域として推定する。なお、１フレーム前の撮影可能画像と一致する現在フレームの画像内の領域がない場合、領域特定部２１３Ａは、撮影可能領域を推定しない。

　なお、現在フレームが、全てのマーカが最初に認識された画像の次のフレームである場合、領域推定部２１６は、メモリ２２に記憶されている初期撮影可能画像と、今回取得された現在フレームの画像とを比較し、初期撮影可能画像と一致する現在フレームの画像内の領域を現在フレームの撮影可能領域として推定する。以降、領域推定部２１６は、１フレーム毎に、１フレーム前の撮影可能画像と、現在フレームの画像とのマッチング処理を実施し、１フレーム前の撮影可能画像と一致する現在フレームの画像内の領域を現在フレームの撮影可能領域として推定する。

　領域推定部２１６は、現在のフレームの撮影可能領域を推定した場合、推定した現在フレームの撮影可能領域内の撮影可能画像をメモリ２２に記憶する。

　次に、ステップＳ３０において、マーカ認識部２１２は、画像取得部２１１によって取得された画像内に含まれる複数のマーカを認識する。

　次に、ステップＳ３１において、領域特定部２１３Ａは、マーカ認識部２１２によって全てのマーカが認識されたか否かを判定する。

　ここで、全てのマーカが認識されていないと判定された場合、すなわち、複数のマーカのうちの少なくとも１つが認識されていないと判定された場合（ステップＳ３１でＮＯ）、ステップＳ３２において、領域特定部２１３Ａは、領域推定部２１６によって現在フレームの撮影可能領域が推定されているか否かを判定する。なお、メモリ２２に現在フレームの撮影可能画像が記憶されている場合、領域特定部２１３Ａは、現在フレームの撮影可能領域が推定されていると判定してもよい。メモリ２２に現在フレームの撮影可能画像が記憶されていない場合、領域特定部２１３Ａは、現在フレームの撮影可能領域が推定されていないと判定してもよい。

　ここで、現在フレームの撮影可能領域が推定されていると判定された場合（ステップＳ３２でＹＥＳ）、ステップＳ３３において、領域特定部２１３Ａは、領域推定部２１６によって推定された現在フレームの撮影可能領域に基づいて撮影可能領域を特定する。すなわち、領域特定部２１３Ａは、領域推定部２１６によって推定された現在フレームの撮影可能領域を、今回取得された画像の撮影可能領域として特定する。

　一方、現在フレームの撮影可能領域が推定されていないと判定された場合（ステップＳ３２でＮＯ）、ステップＳ３４において、領域特定部２１３Ａは、メモリ２２に記憶されている初期化フラグをオフにする。初期化フラグがオフにされた後、ステップＳ２１に処理が戻る。

　一方、全てのマーカが認識されたと判定された場合（ステップＳ３１でＹＥＳ）、ステップＳ３５において、領域特定部２１３Ａは、マーカ認識部２１２によって認識された複数のマーカに囲まれた撮影可能領域を特定する。

　ステップＳ３６～ステップＳ３９の処理は、図１２に示すステップＳ１４～ステップＳ１７の処理と同じであるので、説明を省略する。

　実施の形態１のように、最初に複数のマーカが認識された際の初期撮影可能画像と、現在フレームの画像とのマッチング処理では、初期位置からのカメラ１の移動量が大きい場合、マッチング処理が困難になるおそれがあり、撮影可能領域を特定する精度が低下するおそれがある。

　これに対し、本実施の形態２では、１フレーム毎に、１フレーム前の撮影可能領域内の撮影可能画像と、現在フレームの画像とのマッチング処理が行われるので、撮影可能領域を特定する精度を向上させることができる。

　なお、本実施の形態２において、領域特定部２１３Ａは、最初に複数のマーカが認識された場合、初期フレームの画像内の撮影可能領域内の撮影可能画像を初期撮影可能画像としてメモリ２２に記憶してもよい。また、領域特定部２１３Ａは、１フレーム前の画像と現在フレームの画像とを比較し、１フレーム前の画像の撮影範囲と現在フレームの画像の撮影範囲との変化量を１フレーム毎に算出してもよい。なお、変化量は、例えば、１フレーム前の撮影範囲に対する現在フレームの撮影範囲の移動方向及び移動量を示す。また、領域特定部２１３Ａは、初期フレームから現在フレームまでの変化量の累積値を算出してもよい。累積値は、メモリ２２に記憶される。領域特定部２１３Ａは、複数のマーカが認識されなかった場合、初期撮影可能領域と累積値とに基づいて、現在フレームの撮影可能領域を特定してもよい。

　この場合、累積値から、初期フレームから現在フレームまでの画像の撮影範囲の変化量が分かる。そのため、初期フレームの画像内における初期撮影可能領域と累積値とに基づいて、現在フレームの画像内における撮影可能領域を特定することができる。

　（実施の形態３）
　実施の形態３では、カメラ１の位置及び姿勢を表す第１センシング値を取得し、初期撮影可能画像と今回取得された画像とのマッチング処理により撮影可能領域が特定されない場合、又は１フレーム毎の撮影可能画像と今回取得された現在フレームの画像とのマッチング処理により現在フレームの撮影可能領域が特定されていない場合、取得した第１センシング値を用いて、撮影可能領域が特定される。

　図１６は、本実施の形態３における画像処理装置２Ｂの構成の一例を示す図である。なお、本実施の形態３において、カメラ１及び画像処理装置２Ｂ以外の作業支援システムの構成は、実施の形態１における作業支援システムと同じである。

　カメラ１は、カメラ１の位置及び姿勢を検出する第１センサをさらに備える。第１センサは、例えば、加速度センサ及びジャイロセンサであり、カメラ１の３軸方向の並進運動（ｘ，ｙ，ｚ）及び回転運動（ロール角、ピッチ角、ヨー角）を検出する。カメラ１は、画像を画像処理装置２に送信するとともに、第１センサによって検出されたカメラ１の位置及び姿勢を表す第１センシング値を画像処理装置２に送信する。

　図１６に示す画像処理装置２Ｂは、プロセッサ２１Ｂ、メモリ２２及び通信部２３を備える。なお、本実施の形態３において、実施の形態１及び実施の形態２と同じ構成については、同じ符号を付し、説明を省略する。

　プロセッサ２１Ｂにより、画像取得部２１１、マーカ認識部２１２、領域特定部２１３Ｂ、マスク画像作成部２１４、出力部２１５、領域推定部２１６、及びセンシング値取得部２１７が実現される。

　通信部２３は、カメラ１によって送信された画像及び第１センシング値を受信する。通信部２３は、受信した画像及び第１センシング値をプロセッサ２１に出力する。通信部２３は、所定のフレームレートで送信された動画像及び所定のサンプリング周期で送信された第１センシング値を受信し、１フレーム毎に画像及び１サンプリング毎に第１センシング値をプロセッサ２１に出力する。

　センシング値取得部２１７は、１フレーム毎にカメラ１の位置及び姿勢を表す第１センシング値を取得する。一般的に、ジャイロセンサなどのセンサのサンプリング周期は、画像のフレームレートよりも高く、高いサンプリング周期でセンシング値を取得することで、高周波の変化も検出することができる。そのため、第１センサは可能な限り高いサンプリング周期で第１センシング値を取得して信号処理を行う。例えば、ジャイロセンサの信号処理は、ドリフトノイズを除去する処理、及び角速度を積分して角度に変換する処理などである。そして、センシング値取得部２１７は、画像フレームと時間が一致する又は最も近い第１センシング値を取得する。

　領域特定部２１３Ｂは、複数のマーカが認識されなかった場合、１フレーム前に特定された撮影可能領域内の撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定する。領域特定部２１３Ｂは、複数のマーカが認識されなかった場合、領域推定部２１６によって推定された現在フレームの撮影可能領域に基づいて撮影可能領域を特定する。

　領域特定部２１３Ｂは、最初に複数のマーカが認識された場合、画像内の撮影可能領域内の撮影可能画像を初期撮影可能画像としてメモリ２２に記憶するとともに、カメラ１の位置及び姿勢を表す第１センシング値を第１初期センシング値としてメモリ２２に記憶する。そして、領域特定部２１３Ｂは、複数のマーカが認識されなかった場合、初期撮影可能画像と、今回取得された画像とを比較し、初期撮影可能画像と一致する画像内の領域を撮影可能領域として特定する。

　また、領域特定部２１３Ｂは、領域推定部２１６によって推定された現在フレームの撮影可能領域に基づいて撮影可能領域が特定されなかった場合、メモリ２２に記憶されている第１初期センシング値と、現在の第１センシング値とを取得する。領域特定部２１３Ｂは、第１初期センシング値及び現在の第１センシング値に基づいて推定される、カメラ１の初期位置及び初期姿勢に対するカメラ１の現在位置及び現在姿勢に基づいて、初期撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定する。

　領域特定部２１３Ｂは、第１初期センシング値で表されるカメラ１の初期位置及び初期姿勢に対する相対的なカメラ１の現在位置及び現在姿勢を算出し、算出結果に基づいて撮影可能領域を特定する。領域特定部２１３Ｂは、カメラ１の初期位置及び初期姿勢とカメラ１の現在位置及び現在姿勢とから、初期撮影可能画像に対するカメラ１の現在の撮影範囲を推定する。領域特定部２１３Ｂは、初期撮影可能画像に対する現在の撮影範囲から、初期撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定する。

　すなわち、第１初期センシング値及び現在の第１センシング値から、カメラ１の初期位置及び初期姿勢からの移動方向及び移動距離が算出される。そして、算出された移動方向及び移動距離からカメラ１の現在位置及び現在姿勢が推定される。推定されたカメラ１の現在位置及び現在姿勢から、初期撮影可能画像に対するカメラ１の現在の撮影範囲が推定され、初期撮影可能画像と一致する、今回取得された画像内の領域が撮影可能領域として特定される。

　メモリ２２は、最初に複数のマーカが認識された際に特定された初期撮影可能画像を記憶する。また、メモリ２２は、最初に複数のマーカが認識された際に取得された第１初期センシング値を記憶する。

　図１７は、本実施の形態３において、最初に複数のマーカ全てが認識された際にカメラ１によって撮影された画像１２１の一例を示す図である。なお、図１７では、説明を分かりやすくするため、マーカが実際よりも大きく図示されている。

　画像１２１は、４つのマーカ１１１，１１２，１１３，１１４を全て含んでいる。マーカ認識部２１２は、画像取得部２１１によって取得された画像１２１内に含まれる４つのマーカ１１１，１１２，１１３，１１４を認識する。領域特定部２１３Ｂは、４つのマーカ１１１，１１２，１１３，１１４の全てが認識された場合、認識された４つのマーカ１１１，１１２，１１３，１１４に囲まれた撮影可能領域１３１を特定する。また、領域特定部２１３Ｂは、最初に４つのマーカ１１１，１１２，１１３，１１４が認識された場合、画像１２１内の撮影可能領域１３１内の撮影可能画像１６１を初期撮影可能画像１７１としてメモリ２２に記憶するとともに、カメラ１の位置及び姿勢を表す第１センシング値を第１初期センシング値としてメモリ２２に記憶する。

　図１８は、本実施の形態３において、カメラ１が初期位置から支援対象装置１０１に接近した際に作成されたマスク画像１４４の一例を示す図である。

　カメラ１の初期位置及び初期姿勢における撮影範囲は、図１７の画像１２１である。カメラ１が初期位置から支援対象装置１０１に接近した場合、カメラ１の現在位置及び現在姿勢において撮影されたカメラ１の撮影範囲は、図１７の領域１５３に変化する。領域特定部２１３Ｂは、カメラ１の初期位置及び初期姿勢と、カメラ１の現在位置及び現在姿勢とから、初期撮影可能画像に対するカメラ１の現在の撮影範囲を推定する。

　マスク画像作成部２１４は、今回取得された画像内の撮影可能領域１３１の外側の領域をマスクしたマスク画像１４４を作成する。図１８に示すマスク画像１４４では、今回取得された画像全体が撮影可能領域１３１であるため、マスク画像１４４全体が視認可能となっている。

　図１９は、本実施の形態３において、カメラ１が初期位置から支援対象装置１０１に接近するとともに撮影範囲が右に移動した際に作成されたマスク画像１４５の一例を示す図である。

　カメラ１の初期位置及び初期姿勢における撮影範囲は、図１７の画像１２１である。カメラ１が初期位置から支援対象装置１０１に接近するとともに撮影範囲が右に移動した場合、カメラ１の現在位置及び現在姿勢において撮影されたカメラ１の撮影範囲は、図１７の領域１５４に変化する。領域特定部２１３Ｂは、カメラ１の初期位置及び初期姿勢と、カメラ１の現在位置及び現在姿勢とから、初期撮影可能画像に対するカメラ１の現在の撮影範囲を推定する。

　マスク画像作成部２１４は、今回取得された画像内の撮影可能領域１３１の外側の領域１３２をマスクしたマスク画像１４５を作成する。マスク画像作成部２１４は、今回取得された画像内の撮影可能領域１３１の外側の領域１３２に対してマスク処理を施す。図１９に示すマスク画像１４５では、撮影可能領域１３１内の撮影可能画像１６１は視認可能となっており、撮影可能領域１３１以外の領域１３２は秘匿されている。

　続いて、本開示の実施の形態３における画像処理装置２Ｂによる作業支援処理について説明する。

　図２０は、本開示の実施の形態３における画像処理装置２Ｂによる作業支援処理について説明するための第１のフローチャートであり、図２１は、本開示の実施の形態３における画像処理装置２Ｂによる作業支援処理について説明するための第２のフローチャートであり、図２２は、本開示の実施の形態３における画像処理装置２Ｂによる作業支援処理について説明するための第３のフローチャートである。

　ステップＳ４１の処理は、図１４に示すステップＳ２１の処理と同じであるので、説明を省略する。

　次に、ステップＳ４２において、センシング値取得部２１７は、カメラ１の位置及び姿勢を表す第１センシング値を取得する。センシング値取得部２１７は、カメラ１によって測定された第１センシング値を取得する。

　ステップＳ４３～ステップＳ４８の処理は、図１４に示すステップＳ２２～ステップＳ２７の処理と同じであるので、説明を省略する。

　次に、ステップＳ４９において、領域特定部２１３Ｂは、最初に全てのマーカが認識された際のカメラ１の位置及び姿勢を表す第１センシング値を第１初期センシング値としてメモリ２２に記憶する。

　次に、ステップＳ５０において、領域特定部２１３Ｂは、メモリ２２に記憶されている初期化フラグをオンにする。初期化フラグがオンにされた後、ステップＳ６２に処理が移行する。

　ステップＳ５１～ステップＳ５４の処理は、図１４及び図１５に示すステップＳ２９～ステップＳ３２の処理と同じであるので、説明を省略する。

　ここで、現在フレームの撮影可能領域が推定されていると判定された場合（ステップＳ５４でＹＥＳ）、ステップＳ５９に処理が移行する。ステップＳ５９の処理は、図１５に示すステップＳ３３の処理と同じであるので、説明を省略する。

　一方、現在フレームの撮影可能領域が推定されていないと判定された場合（ステップＳ５４でＮＯ）、ステップＳ５５において、領域特定部２１３Ｂは、メモリ２２に記憶されている第１初期センシング値と、センシング値取得部２１７によって取得された現在の第１センシング値とを取得する。

　次に、ステップＳ５６において、領域特定部２１３Ｂは、領域特定部２１３Ｂは、第１初期センシング値及び現在の第１センシング値に基づいて推定される、カメラ１の初期位置及び初期姿勢に対するカメラ１の現在位置及び現在姿勢に基づいて、初期撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定する。

　次に、ステップＳ５７において、領域特定部２１３Ｂは、第１初期センシング値と現在の第１センシング値とを用いて撮影可能領域が特定されたか否かを判定する。

　ここで、撮影可能領域が特定されていないと判定された場合（ステップＳ５７でＮＯ）、ステップＳ５８において、領域特定部２１３Ｂは、メモリ２２に記憶されている初期化フラグをオフにする。初期化フラグがオフにされた後、ステップＳ４１に処理が戻る。

　一方、撮影可能領域が特定されたと判定された場合（ステップＳ５７でＹＥＳ）、ステップＳ５９に処理が移行する。

　一方、全てのマーカが認識されたと判定された場合（ステップＳ５３でＹＥＳ）、ステップＳ６０において、領域特定部２１３Ｂは、マーカ認識部２１２によって認識された複数のマーカに囲まれた撮影可能領域を特定する。

　ステップＳ６１～ステップＳ６４の処理は、図１５に示すステップＳ３６～ステップＳ３９の処理と同じであるので、説明を省略する。

　実施の形態２のように、１フレーム毎に、１フレーム前の撮影可能領域内の撮影可能画像と、現在フレームの画像とのマッチング処理が行われたとしても、支援対象装置１０１に光が当たったり、影ができたりした場合、マッチング処理が困難になるおそれがあり、撮影可能領域を推定することができなくなるおそれがある。

　これに対し、本実施の形態３では、第１初期センシング値と現在の第１センシング値とを用いて撮影可能領域が特定されるので、撮影可能領域を特定する精度を向上させることができる。

　なお、本実施の形態３において、カメラ１が、被写体を拡大又は縮小するズーム機能を有している場合、第１センシング値は、ズーム倍率に関する情報を含んでもよい。ズーム機能は、光学的に被写体を拡大又は縮小してもよいし、画像処理により被写体を拡大又は縮小してもよい。

　また、本実施の形態３では、第１初期センシング値と現在の第１センシング値とを用いて撮影可能領域が特定されるが、本開示は特にこれに限定されない。領域特定部２１３Ｂは、領域推定部２１６によって推定された現在フレームの撮影可能領域に基づいて撮影可能領域が特定されなかった場合、１フレーム前の第１センシング値と、現在の第１センシング値とを取得してもよい。領域特定部２１３Ｂは、１フレーム前の第１センシング値及び現在の第１センシング値に基づいて推定される、１フレーム前のカメラ１の位置及び姿勢に対するカメラ１の現在位置及び現在姿勢に基づいて、１フレーム前の撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定してもよい。

　この場合、領域特定部２１３Ｂは、最初に全てのマーカが認識された際に第１初期センシング値をメモリ２２に記憶した後、１フレーム毎にカメラ１の位置及び姿勢を表す第１センシング値を取得し、取得した第１センシング値をメモリ２２に記憶する。これにより、最初に全てのマーカが認識された際にメモリ２２に記憶された第１初期センシング値が、１フレーム毎に更新される。領域特定部２１３Ｂは、１フレーム前の第１センシング値及び現在の第１センシング値に基づいて推定される、１フレーム前のカメラ１の位置及び姿勢に対するカメラ１の現在位置及び現在姿勢に基づいて、１フレーム前の撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定する。

　領域特定部２１３Ｂは、１フレーム前の第１センシング値で表されるカメラ１の位置及び姿勢に対する相対的なカメラ１の現在位置及び現在姿勢を算出し、算出結果に基づいて撮影可能領域を特定する。領域特定部２１３Ｂは、１フレーム前のカメラ１の位置及び姿勢とカメラ１の現在位置及び現在姿勢とから、１フレーム前の撮影可能画像に対する現在の撮影範囲を推定する。領域特定部２１３Ｂは、１フレーム前の撮影可能画像に対する現在の撮影範囲から、１フレーム前の撮影可能画像と一致する、今回取得された画像内の領域を撮影可能領域として特定する。

　すなわち、１フレーム前の第１センシング値及び現在の第１センシング値から、１フレーム前のカメラ１の位置及び姿勢からの移動方向及び移動距離が算出される。そして、算出された移動方向及び移動距離からカメラ１の現在位置及び現在姿勢が推定される。推定されたカメラ１の現在位置及び現在姿勢から、１フレーム前の撮影可能画像に対するカメラ１の現在の撮影範囲が推定され、１フレーム前の撮影可能画像と一致する、今回取得された画像内の領域が撮影可能領域として特定される。

　また、本実施の形態３では、実施の形態２における画像処理装置２Ａにセンシング値取得部２１７及び領域特定部２１３Ｂを備えているが、本開示は特にこれに限定されず、実施の形態１における画像処理装置２にセンシング値取得部２１７及び領域特定部２１３Ｂを備えてもよい。この場合、図１１のステップＳ６の後に、領域特定部２１３Ｂは、最初に全てのマーカが認識された際のカメラ１の位置及び姿勢を表す第１センシング値を第１初期センシング値としてメモリ２２に記憶する。また、初期撮影可能画像と今回取得された画像とのマッチング処理により撮影可能領域が特定されていないと判定された場合（図１２のステップＳ１１でＮＯ）、領域特定部２１３Ｂは、図２１に示すステップＳ５５～ステップＳ５９の処理を行ってもよい。

　また、カメラ１は、画像内の画素毎のカメラ１から物体までの距離を検出する第２センサをさらに備えてもよい。第２センサは、例えば、デプスセンサである。カメラ１は、画像とともに、画像内の画素毎のカメラ１から物体までの距離を表す第２センシング値を画像処理装置２に送信してもよい。領域特定部２１３Ｂは、最初に複数のマーカが認識された場合、画像内の撮影可能領域内の撮影可能画像を初期撮影可能画像としてメモリ２２に記憶するとともに、初期撮影可能画像内の画素毎のカメラ１から物体までの各距離を第２初期センシング値としてメモリ２２に記憶してもよい。領域特定部２１３Ｂは、領域推定部２１６によって推定された現在フレームの撮影可能領域に基づいて撮影可能領域が特定されなかった場合、第２初期センシング値と、今回取得された画像内の画素毎のカメラ１から物体までの距離を表す第２センシング値とを取得してもよい。そして、領域特定部２１３Ｂは、今回取得された画像内の複数の画素の第２センシング値が、第２初期センシング値のうちの最も長い距離以下である領域を撮影可能領域として特定してもよい。

　また、本実施の形態３において、領域特定部２１３Ｂは、第１センシング値を用いて撮影可能領域を特定してもよいし、第２センシング値を用いて撮影可能領域を特定してもよい。また、領域特定部２１３Ｂは、第１センシング値及び第２センシング値の両方を用いて撮影可能領域を特定してもよい。この場合、領域特定部２１３Ｂは、第１センシング値を用いて特定した撮影可能領域と、第２センシング値を用いて特定した撮影可能領域との論理積を算出してもよい。

　なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。また、プログラムを記録媒体に記録して移送することにより、又はプログラムをネットワークを経由して移送することにより、独立した他のコンピュータシステムによりプログラムが実施されてもよい。

　本開示の実施の形態に係る装置の機能の一部又は全ては典型的には集積回路であるＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ）として実現される。これらは個別に１チップ化されてもよいし、一部又は全てを含むように１チップ化されてもよい。また、集積回路化はＬＳＩに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。ＬＳＩ製造後にプログラムすることが可能なＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、又はＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

　また、本開示の実施の形態に係る装置の機能の一部又は全てを、ＣＰＵ等のプロセッサがプログラムを実行することにより実現してもよい。

　また、上記で用いた数字は、全て本開示を具体的に説明するために例示するものであり、本開示は例示された数字に制限されない。

　また、上記フローチャートに示す各ステップが実行される順序は、本開示を具体的に説明するために例示するためのものであり、同様の効果が得られる範囲で上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時（並列）に実行されてもよい。

　本開示に係る技術は、複数のマーカが認識されない場合であっても、複数のマーカに囲まれた撮影可能領域以外をマスクした画像を出力することができるので、画像内の撮影可能領域以外をマスクする技術として有用である。

Claims

　コンピュータにおける情報処理方法であって、
　カメラによって撮影された画像を取得し、
　前記画像内に含まれる複数のマーカを認識し、
　前記複数のマーカが認識された場合、認識した前記複数のマーカに囲まれた撮影可能領域を特定し、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定し、
　前記画像内の前記撮影可能領域の外側の領域をマスクしたマスク画像を作成し、
　前記マスク画像を出力する、
　情報処理方法。
　前記マスク画像の作成において、前記撮影可能領域が特定されなかった場合、前記画像内の全てをマスクした前記マスク画像を作成する、
　請求項１記載の情報処理方法。
　前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の前記撮影可能画像と、今回取得された前記画像とを比較し、前記撮影可能画像と一致する前記画像内の領域を前記撮影可能領域として特定する、
　請求項１又は２記載の情報処理方法。
　さらに、最初に前記複数のマーカが認識された場合、前記画像内の前記撮影可能領域内の前記撮影可能画像を初期撮影可能画像としてメモリに記憶し、
　前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、前記初期撮影可能画像と、今回取得された前記画像とを比較し、前記初期撮影可能画像と一致する前記画像内の領域を前記撮影可能領域として特定する、
　請求項３記載の情報処理方法。
　さらに、最初に前記複数のマーカが認識された場合、前記カメラの位置及び姿勢を表す第１センシング値を第１初期センシング値として前記メモリに記憶し、
　さらに、前記撮影可能領域が特定されなかった場合、前記第１初期センシング値と、現在の前記第１センシング値とを取得し、
　さらに、前記第１初期センシング値及び現在の前記第１センシング値に基づいて推定される、前記カメラの初期位置及び初期姿勢に対する前記カメラの現在位置及び現在姿勢に基づいて、前記初期撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定する、
　請求項４記載の情報処理方法。
　前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、１フレーム前に特定された前記撮影可能領域内の前記撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定する、
　請求項３記載の情報処理方法。
　さらに、メモリに記憶されている１フレーム前に推定された前記撮影可能領域内の前記撮影可能画像と、今回取得された現在フレームの前記画像とを比較し、前記撮影可能画像と一致する前記画像内の領域を前記現在フレームの前記撮影可能領域として推定し、
　さらに、推定した前記現在フレームの前記撮影可能領域内の前記撮影可能画像を前記メモリに記憶し、
　前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、推定した前記現在フレームの前記撮影可能領域を前記撮影可能領域として特定する、
　請求項６記載の情報処理方法。
　さらに、１フレーム毎に前記カメラの位置及び姿勢を表す第１センシング値を取得し、取得した前記第１センシング値を前記メモリに記憶し、
　さらに、前記撮影可能領域が特定されなかった場合、１フレーム前の前記第１センシング値と、現在の前記第１センシング値とを取得し、
　さらに、１フレーム前の前記第１センシング値及び現在の前記第１センシング値に基づいて推定される、１フレーム前の前記カメラの位置及び姿勢に対する前記カメラの現在位置及び現在姿勢に基づいて、１フレーム前の前記撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定する、
　請求項７記載の情報処理方法。
　さらに、最初に前記複数のマーカが認識された場合、初期フレームの前記画像内の前記撮影可能領域内の前記撮影可能画像を初期撮影可能画像としてメモリに記憶し、
　さらに、１フレーム前の前記画像と現在フレームの前記画像とを比較し、１フレーム前の前記画像の撮影範囲と現在フレームの前記画像の撮影範囲との変化量を１フレーム毎に算出し、
　さらに、前記初期フレームから前記現在フレームまでの前記変化量の累積値を算出し、
　前記撮影可能領域の特定において、前記複数のマーカが認識されなかった場合、前記初期撮影可能領域と前記累積値とに基づいて、前記現在フレームの前記撮影可能領域を特定する、
　請求項１又は２記載の情報処理方法。
　さらに、最初に前記複数のマーカが認識された場合、前記画像内の前記撮影可能領域内の前記撮影可能画像を初期撮影可能画像としてメモリに記憶し、
　さらに、最初に前記複数のマーカが認識された場合、前記初期撮影可能画像内の画素毎の前記カメラから物体までの各距離を第２初期センシング値として前記メモリに記憶し、
　さらに、前記撮影可能領域が特定されなかった場合、前記第２初期センシング値と、今回取得された前記画像内の画素毎の前記カメラから物体までの距離を表す第２センシング値とを取得し、
　さらに、今回取得された前記画像内の複数の画素の前記第２センシング値が、前記第２初期センシング値のうちの最も長い距離以下である領域を前記撮影可能領域として特定する、
　請求項１又は２記載の情報処理方法。
　カメラによって撮影された画像を取得する取得部と、
　前記画像内に含まれる複数のマーカを認識する認識部と、
　前記複数のマーカが認識された場合、認識した前記複数のマーカに囲まれた撮影可能領域を特定し、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定する特定部と、
　前記画像内の前記撮影可能領域の外側の領域をマスクしたマスク画像を作成する作成部と、
　前記マスク画像を出力する出力部と、
　を備える情報処理装置。
　カメラによって撮影された画像を取得し、
　前記画像内に含まれる複数のマーカを認識し、
　前記複数のマーカが認識された場合、認識した前記複数のマーカに囲まれた撮影可能領域を特定し、前記複数のマーカが認識されなかった場合、過去に特定された前記撮影可能領域内の撮影可能画像と一致する、今回取得された前記画像内の領域を前記撮影可能領域として特定し、
　前記画像内の前記撮影可能領域の外側の領域をマスクしたマスク画像を作成し、
　前記マスク画像を出力するようにコンピュータを機能させる、
　情報処理プログラム。