以下、本発明に係る一つの実施の形態を図面に基づいて説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。また、以下の実施の形態において、その構成要素(要素ステップ等も含む)は、特に明示した場合および原理的に明らかに必須であると考えられる場合等を除き、必ずしも必須のものではないことは言うまでもない。また、「Aからなる」、「Aよりなる」、「Aを有する」、「Aを含む」と言うときは、特にその要素のみである旨明示した場合等を除き、それ以外の要素を排除するものでないことは言うまでもない。同様に、以下の実施の形態において、構成要素等の形状、位置関係等に言及するときは、特に明示した場合および原理的に明らかにそうでないと考えられる場合等を除き、実質的にその形状等に近似または類似するもの等を含むものとする。
一般に、カメラを用いて製造現場の作業者の行動解析を行う装置では、コストパフォーマンスの関係から、カメラ設置に際して様々な制約がある。その制約とは、例えば、(1)設置コスト低減のため、設置数は1[個/人]となる、(2)現場機材等映り込みのない設置位置の自由度確保のため、カメラ向きは真下となる、(3)現場天井より低い位置にしか設置できないため、カメラ高さは2.5[m]程度の場合が有る、(4)カメラコスト低減のため、視野角70度程度の普及品のカメラが採用されることが多い、等が考えられる。
このようなカメラ設置の制約により、カメラ視野内の作業動作中の作業者全体を映像上に留めるためのクリアランスが小さくなる場合があり、正常作業であっても、作業者の作業位置や腕動作の小さなズレで、カメラ画角からの人物のフレームアウトが発生してしまう場合がある。
図1は、第一の実施形態に係る行動解析システムの構成を示す図である。行動解析システム10は、撮像装置1Aおよび撮像装置1B(以降、撮像装置1Aと撮像装置1Bとを特別に区別しない場合には撮像装置1と表記)と、出力装置2Aおよび出力装置2B(以降、出力装置2Aと出力装置2Bとを特別に区別しない場合には出力装置2と表記)と、行動解析装置100と、を含んで構成される。
なお、撮像装置1、出力装置2、行動解析装置100は、それぞれネットワーク3を介して通信可能に接続され、行動解析装置100と撮像装置1、行動解析装置100と出力装置2は、互いに通信を行うことができる。また、撮像装置1、出力装置2は、それぞれ2台が図示されているが、これに限られず、それぞれ1台あるいは複数台あってもよい。
ネットワーク3は、例えば、インターネット等の公衆網やLAN(Local Area Netowork)、WAN(Wide Area Netowork)である。さらに、ネットワーク3は、USB(Universal Serial Bus)やHDMI(High−Definition Multimedia Interface)等の他の一般的な通信手段でもよい。
撮像装置1は、距離画像カメラやステレオカメラ等であって、望ましくは画素ごとに深度(被写体までの距離)の情報を有する撮影画像を取得する。そして、撮像装置1は、取得した撮影画像を行動解析装置100へ送信する。
出力装置2は、作業者単位に割り当てられたディスプレイ装置、ディスプレイ機能を有するヘッドセット、またはディスプレイに限られず前後左右が区別可能に配置された複数のランプ、音声出力を行うスピーカー等である。出力装置2は、行動解析装置100からの出力指示を受け付けて、出力を行う。出力指示が音声出力指示である場合には、出力装置2はディスプレイ装置、ヘッドセット、あるいはスピーカーから音声を出力し、出力指示が表示出力指示である場合には、出力装置2はディスプレイ装置、ヘッドセットから映像情報を出力する。出力指示がランプの点灯指示である場合には、出力装置2はランプを当該点灯指示に従った方向を示すように表示する。
行動解析装置100は、例えば、物理的なコンピュータハードウェアであるサーバ計算機である。行動解析装置100は、撮像装置1、出力装置2と通信可能に接続されており、撮像装置1から撮影画像を取得し、出力装置2に対しては出力情報を送信可能である。
行動解析装置100は、制御部110と、記憶部120と、通信部130と、出力制御部140と、を備える。制御部110には、画像取得部111と、人物画像抽出部112と、人物骨格検出部113と、フレームアウト判定部114と、通知部115と、人物行動解析部116と、が含まれる。記憶部120には、所定のデータ構造を有する複数の静止画から成る動画を記憶する映像記憶部121が含まれる。
画像取得部111は、所定の画角を有して作業者等の人物を含む撮影画像を取得する。具体的には、画像取得部111は、撮像装置1から撮影画像を受信することで、撮影画像を取得する。しかしこれに限られず、画像取得部111は、他のサーバー装置等からネットワークを介してストリーム形式で動画を取得するものであってもよい。
人物画像抽出部112は、撮影画像から、背景と区別して、動体である人物の存在する領域である人物画像領域を抽出する。
人物骨格検出部113は、人物画像を用いて、人物の姿勢を示す人物骨格を検出する。
フレームアウト判定部114は、人物画像領域または人物骨格のいずれかまたは両方を用いて、所定の画角外への人物のフレームアウトが発生する状態にあるか否か、あるいはフレームアウトが予知される状態にあるか否か、フレームアウトを判定する。
通知部115は、フレームアウトが発生する状態にある場合、あるいはフレームアウトが予知される状態に有る場合に、フレームアウトあるいは予知の情報を作業者等の人物に通知するために所定の警告や注意喚起の表示および音声を出力する。
人物行動解析部116は、人物骨格を用いて、人物の行動を解析する。
画像取得部111、人物画像抽出部112、人物骨格検出部113、人物行動解析部116は、公知の技術的特徴を備える処理部であり、本実施形態特有の処理特徴を有するものではないため、それぞれの処理の詳細についての説明は省略する。概要を説明すると、画像取得部111は、距離画像カメラやステレオカメラ等で構成した距離画像を取得するものである。人物画像抽出部112は、距離画像の時間的遷移に対する動体抽出手段等で構成した人物画像を取得するものである。人物骨格検出部113は、人物の距離画像の機械学習手段等で構成した人物の骨格を検出するものである。人物行動解析部116は、人物骨格の時間的遷移の機械学習手段等で構成した人物の行動を解析する。
また、映像記憶部121は、例えば、複数の静止画を時間的遷移に沿って再生順を定められた動画や、その他インターレース等の所定の形式で記録された動画を所定のファイル形式で記憶管理する。
通信部130は、撮像装置1、出力装置2のそれぞれとネットワーク3を介してデジタルデータを通信する。
出力制御部140は、出力装置2に対して出力の種類(表示あるいは音声またはその両方)に応じて出力を制御する。
上述のように、本実施形態においては、撮像装置1、出力装置2、行動解析装置100がそれぞれ独立した別の装置として構成されているが、一つの物理的なコンピュータハードウェアである計算機に各装置の機能が実装されていても良いことは言うまでもない。
図2は、行動解析装置100のハードウェア構成を示す図である。行動解析装置100は、例えば、NIC(Network Interface Card)等の通信装置101と、メモリ等の主記憶装置102と、キーボードやマウス等の入力装置103と、CPU(Central Processing Unit)等の演算装置104と、ハードディスクやSSD(Solid State Drive)等の外部記憶装置105と、ディスプレイやスピーカー等への出力を制御する出力制御装置106と、これらをつなぐバス107と、を含んで構成される。
通信装置101は、ネットワークケーブルを介して有線通信を行う有線の通信装置、又はアンテナを介して無線通信を行う無線通信装置である。通信装置101は、ネットワーク3に接続される他の装置との通信を行う。
主記憶装置102は、例えばRAM(Random Access Memory)などのメモリである。
入力装置103は、キーボードやマウス等のポインティングデバイス、タッチパネル、あるいは音声入力装置であるマイク等を含む入力情報を受け付ける装置である。
外部記憶装置105は、デジタル情報を記憶可能な、いわゆるハードディスクやSSD、あるいはフラッシュメモリなどの不揮発性記憶装置である。
上記した画像取得部111と、人物画像抽出部112と、人物骨格検出部113と、フレームアウト判定部114と、通知部115と、人物行動解析部116とは、演算装置104に処理を行わせるプログラムによって実現される。このプログラムは、主記憶装置102、または外部記憶装置105内に記憶され、実行にあたって主記憶装置102上にロードされ、演算装置104により実行される。
また、記憶部120に格納されるテーブルは、主記憶装置102及び外部記憶装置105により実現される。
また、インターネットやLAN等に通信可能に接続する通信部130は通信装置101により実現される。また、出力制御部140は、出力制御装置106により実現される。
以上が、本実施形態における行動解析装置100のハードウェア構成例である。しかし、これに限らず、その他のハードウェアを用いて構成されるものであってもよい。例えば、インターネットを介して演算処理を分散処理する装置であってもよい。
なお、行動解析装置100は、図示しないが、OS(Operating System)、ミドルウェア、アプリケーションなどの公知の要素を有し、特にディスプレイなどの入出力装置にGUI画面を表示するための既存の処理機能を備える。
[動作の説明]次に、本実施形態における行動解析装置100の動作を説明する。
図3は、撮影処理の動作フローを示す図である。撮影処理は、行動解析装置100が撮像画像から所定の画像処理を行い、被写体のフレームアウトが発生した場合あるいは発生が予知される状態になった場合には、被写体に移動等の注意喚起を促す処理である。この撮影処理は、所定の時間ごと(例えば、5秒ごと)に開始され、直近の時間(例えば、5秒)に取得された撮影画像を対象として処理を行う。
まず、画像取得部111は、人物が写り込んだ撮影画像を取得する(ステップS001)。
そして、人物画像抽出部112は、撮影画像から人物画像の領域を抽出する(ステップS002)。
そして、人物骨格検出部113は、人物画像から人物骨格を特定する(ステップS003)。
そして、人物行動解析部116は、人物骨格から人物行動を解析する(ステップS004)。
次に、フレームアウト判定部114は、人物がフレームアウトするおそれがあるか否かを判定する(ステップS005)。フレームアウトのおそれが無い場合(ステップS005にて「No」の場合)には、フレームアウト判定部114は、撮影処理を終了させる。
フレームアウトのおそれがある場合(ステップS005にて「Yes」の場合)には、通知部115は、フレームアウトの方向と、フレームアウト有りの旨を人物に通知する(ステップS006)。そして、通知部115は、撮影処理を終了させる。
以上が、撮影処理の動作フローである。撮影処理によれば、カメラで取得した画像を用いた行動解析技術において、取得画像からの人物のフレームアウトを防止することができる。
上記の撮影処理のステップS005において、フレームアウト判定部114は、人物のフレームアウトのおそれを判定していたが、これにはいくつかの実施例を想定することができる。その実施例について述べるが、これに限られるものではなく、他の実施例であってもよいことは言うまでもない。
図4は、第一の実施形態に係る人物画像のフレームアウト発生の判定例を示す図である。第一の実施形態に係る人物画像のフレームアウト発生の判定においては、フレームアウト判定部114は、フレームアウト判定の処理内容として、人物画像が撮影画像210の最外郭の画素に存在する場合に、フレームアウトの発生があると判定する。また、この場合に、通知部115は、「左フレームアウト発生有り、直ちに正規の位置へ移動下さい」のように、撮像画像に対してフレームアウトが検出された画素が配された方向に基づいて、フレームアウトの方向と、フレームアウト発生の事実、および改善のための行動を通知する。
ここで、図4の例においては、撮影画像210は、四角形で表された1画素が横方向32画素、縦方向に24画素分並んだものであり、「×」表記のある画素は、撮影画像210の最外郭の画素を示すものである。また、人物画像220A、220Bは、人物の真上からみた撮影画像から人物画像を抽出したものであり、色の濃さは、撮影位置からの距離の大きさ(深度)を模擬しているものとする。なお、撮影画像210内の画素数は、横方向32画素、縦方向24画素に限るものでないことは明らかである。例えば、横方向に640画素、縦方向に480画素等であってもよい。
ここで、人物画像220Aおよび人物画像220Bは、いずれも最外郭の画素に左肘が写り込んでいるため、最外郭の画素に人物画像が存在し、フレームアウト発生と判定される。
図5は、第一の実施形態に係る人物画像のフレームアウト予知の判定例を示す図である。第一の実施形態に係る人物画像のフレームアウト予知の判定においては、フレームアウト判定部114は、フレームアウト判定の処理内容として、人物画像が撮影画像310の最外郭から所定の距離にある画素に存在する場合に、フレームアウトが予知される状態に有ると判定する。また、この場合に、通知部115は、「左フレームアウト予知有り、正規の位置を意識して下さい」のように、撮像画像に対してフレームアウトが予知される状態が検出された画素が配された方向に基づいて、フレームアウトの方向と、フレームアウト予知、および改善のための行動を通知する。
ここで、図5の例においては、撮影画像310は、四角形で表された1画素が横方向32画素、縦方向に24画素分並んだものであり、「×」表記のある画素は、撮影画像310の最外郭の画素を示すものである。また、斜線表記のある画素は、撮影画像310の最外郭から内側に向かって所定の距離にある画素を示すものである。また、人物画像320A、320Bは、人物の真上からみた撮影画像から人物画像を抽出したものであり、色の濃さは、撮影位置からの距離の大きさ(深度)を模擬しているものとする。なお、撮影画像310内の画素数は、横方向32画素、縦方向24画素に限るものでないことは明らかである。例えば、横方向に640画素、縦方向に480画素等であってもよい。
ここで、人物画像320Aおよび人物画像320Bは、いずれも最外郭から内側に向かって所定の距離にある画素に左肘が写り込んでいるため、最外郭から内側に向かって所定の距離にある画素に人物画像が存在し、フレームアウト発生が予知される状態にあると判定される。
図6は、第一の実施形態に係る人物画像のフレームアウト予知の別の判定例を示す図である。第一の実施形態に係る人物画像のフレームアウト予知の別の判定においては、フレームアウト判定部114は、フレームアウト判定の処理内容として、人物画像の重心位置430が撮影画像410の中心付近にある所定の領域(例えば、撮影画像410の中心画素を中心とする横方向8画素、縦方向6画素の矩形)の画素に存在しない場合に、フレームアウトが予知される状態に有ると判定する。また、この場合に、通知部115は、「左フレームアウト予知有り、正規の位置を意識して下さい」のように、撮像画像に対してフレームアウトが予知される状態が検出された画素が配された方向に基づいて、フレームアウトの方向と、フレームアウト予知、および改善のための行動を通知する。
ここで、図6の例においては、撮影画像410は、四角形で表された1画素が横方向32画素、縦方向に24画素分並んだものであり、「×」表記のある画素は、撮影画像410の最外郭の画素を示すものである。また、斜線表記のある画素は、撮影画像410の中心付近の所定の領域にある画素を示すものである。また、人物画像420は、人物の真上からみた撮影画像から人物画像を抽出したものであり、色の濃さは、撮影位置からの距離の大きさ(深度)を模擬しているものとする。なお、撮影画像410内の画素数は、横方向32画素、縦方向24画素に限るものでないことは明らかである。例えば、横方向に640画素、縦方向に480画素等であってもよい。
ここで、人物画像420は、撮影画像410の中心付近の所定の領域にある画素に人物画像420の重心位置430が写り込んでいないため、フレームアウト発生が予知される状態にあると判定される。
図7は、第一の実施形態に係る人物骨格のフレームアウト発生の判定例を示す図である。第一の実施形態に係る人物骨格のフレームアウト発生の判定においては、フレームアウト判定部114は、フレームアウト判定の処理内容として、人物骨格が撮影画像510の最外郭の画素に存在する場合に、フレームアウトの発生があると判定する。また、この場合に、通知部115は、「左フレームアウト発生有り、直ちに正規の位置へ移動下さい」のように、撮像画像に対してフレームアウトが検出された画素が配された方向に基づいて、フレームアウトの方向と、フレームアウト発生の事実、および改善のための行動を通知する。
ここで、図7の例においては、撮影画像510は、四角形で表された1画素が横方向32画素、縦方向に24画素分並んだものであり、「×」表記のある画素は、撮影画像510の最外郭の画素を示すものである。また、人物画像520A、520Bは、人物の真上からみた撮影画像から人物画像を抽出したものであり、色の濃さは、撮影位置からの距離の大きさ(深度)を模擬しているものとする。また、人物骨格540A、540Bは、それぞれ人物画像520A、520Bを用いて所定のアルゴリズムで推定された人物骨格を、関節を繋ぐエッジ(直線)と関節を示すノード(点)で示すことで、骨格の形状を示す情報である。なお、撮影画像510内の画素数は、横方向32画素、縦方向24画素に限るものでないことは明らかである。例えば、横方向に640画素、縦方向に480画素等であってもよい。
ここで、撮影画像510は、いずれも最外郭の画素に人物骨格の一部となる左肘が写り込んでいるため、最外郭の画素に人物画像が存在し、フレームアウト発生と判定される。
図8は、第一の実施形態に係る人物骨格のフレームアウト予知の判定例を示す図である。第一の実施形態に係る人物骨格のフレームアウト予知の判定においては、フレームアウト判定部114は、フレームアウト判定の処理内容として、人物画像が撮影画像610の最外郭から所定の距離にある画素に存在する場合に、フレームアウトが予知される状態に有ると判定する。また、この場合に、通知部115は、「左フレームアウト予知有り、正規の位置を意識して下さい」のように、撮像画像に対してフレームアウトが予知される状態が検出された画素が配された方向に基づいて、フレームアウトの方向と、フレームアウト予知、および改善のための行動を通知する。
ここで、図8の例においては、撮影画像610は、四角形で表された1画素が横方向32画素、縦方向に24画素分並んだものであり、「×」表記のある画素は、撮影画像610の最外郭の画素を示すものである。また、斜線表記のある画素は、撮影画像610の最外郭の内側に所定の距離にある画素を示すものである。また、人物画像620A、620Bは、人物の真上からみた撮影画像から人物画像を抽出したものであり、色の濃さは、撮影位置からの距離の大きさ(深度)を模擬しているものとする。また、人物骨格640A、640Bは、それぞれ人物画像620A、620Bを用いて所定のアルゴリズムで推定された人物骨格を、関節を繋ぐエッジ(直線)と関節を示すノード(点)で示すことで、骨格の形状を示す情報である。なお、撮影画像610内の画素数は、横方向32画素、縦方向24画素に限るものでないことは明らかである。例えば、横方向に640画素、縦方向に480画素等であってもよい。
ここで、人物画像620Aおよび人物画像620Bは、いずれも最外郭の内側に所定の距離にある画素に左肘が写り込んでいるため、最外郭から内側に向かって所定の距離にある画素に人物骨格が存在し、フレームアウト発生が予知される状態にあると判定される。
図9は、第一の実施形態に係る人物骨格のフレームアウト予知の別の判定例を示す図である。第一の実施形態に係る人物骨格のフレームアウト予知の別の判定においては、フレームアウト判定部114は、フレームアウト判定の処理内容として、人物骨格の重心位置750が撮影画像710の中心付近にある所定の領域(例えば、撮影画像710の中心画素を中心とする横方向8画素、縦方向6画素の矩形)の画素に存在しない場合に、フレームアウトが予知される状態に有ると判定する。また、この場合に、通知部115は、「左フレームアウト予知有り、正規の位置を意識して下さい」のように、撮像画像に対してフレームアウトが予知される状態が検出された画素が配された方向に基づいて、フレームアウトの方向と、フレームアウト予知、および改善のための行動を通知する。
ここで、図9の例においては、撮影画像710は、四角形で表された1画素が横方向32画素、縦方向に24画素分並んだものであり、「×」表記のある画素は、撮影画像710の最外郭の画素を示すものである。また、斜線表記のある画素は、撮影画像710の中心付近の所定の領域にある画素を示すものである。また、人物画像720は、人物の真上からみた撮影画像から人物画像を抽出したものであり、色の濃さは、撮影位置からの距離の大きさ(深度)を模擬しているものとする。また、人物骨格740は、人物画像720を用いて所定のアルゴリズムで推定された人物骨格を、関節を繋ぐエッジ(直線)と関節を示すノード(点)で示すことで、骨格の形状を示す情報である。なお、撮影画像710内の画素数は、横方向32画素、縦方向24画素に限るものでないことは明らかである。例えば、横方向に640画素、縦方向に480画素等であってもよい。
ここで、図9の例では、撮影画像710の中心付近の所定の領域にある画素に人物骨格740の重心位置750が写り込んでいないため、フレームアウト発生が予知される状態にあると判定される。
本実施形態に係る行動解析装置100が奏する技術的効果の例は、以下のとおりであるが、これに限られず、技術的特徴により奏することが容易に想定される効果についても、奏することができることは言うまでもない。まず、カメラ画角外への人物のフレームアウト発生の予知を事前に対象人物へ通知できるので、人物のフレームアウト発生を防止することが可能となる。また、フレームアウトの発生も対象人物へ即座に通知できるため、フレームアウト発生を最小限に留めることが可能となる。これにより、人物骨格検出や人物行動解析の性能を向上できる。
以上、実施形態に係る行動解析装置100について具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。例えば、フレームアウトの発生を判定する条件として、人物行動解析を行う上で重要とされる頭、腕、手等の人物骨格の一部あるいは全部が撮影画像に含まれない場合にフレームアウトが発生したと判定するようにしても良い。その場合、フレームアウト判定部114は、人物骨格あるいは人物画像に対して人体の部位認識を行い、頭、腕、手等の認識範囲を決定し、時系列に沿って当該部位ごとの一部あるいは全部が撮影画像から消失した際にフレームアウトが発生したと判定する。このようにすることで、人物行動解析に必要な画像情報を得られない可能性が高い場合に限り警告を行うことが可能となり、作業者に対する不要な警告を減らし、作業者に与えるストレスを軽減することができる。
また例えば、上記のフレームアウト判定部114は、人物画像の重心位置あるいは人物骨格の重心位置が、撮影画像の中心付近の所定の領域にある画素に写り込んでいない場合にフレームアウト発生が予知される状態にあると判定するものであったが、これに限られず、人物画像の中心位置あるいは人物骨格の中心位置(すなわち、人物画像あるいは人物骨格が含まれる矩形領域の対角線の中点となる中心位置)が撮影画像の中心付近の所定の領域にある画素に写り込んでいない場合にフレームアウト発生が予知される状態にあると判定するものであってもよい。このようにすることで、行動解析装置100の演算に係る負荷を減らし、並列処理性能を高めることが可能となる。
また例えば、上記のフレームアウト判定部114と通知部115とは、フレームアウトの方向を特定して通知しているが、これに限られず、方向を特定せずに通知するようにしてもよい。このようにすることで、行動解析装置100の演算に係る負荷を減らし、並列処理性能を高めることが可能となる。
また例えば、上記の実施形態においては、出力装置2は、ディスプレイを想定しているが、これの例として、装着者の視界の一部または全部を覆いつつ、装着者の視界を一定程度確保するために半透明のディスプレイを用いて、AR(Augmented Reality:拡張現実)により現実の視界に重畳させるようにして通知を行うものとしてもよい。その際には、撮像装置1が得た画像に重畳させて、フレームアウトから復帰するための移動方向や移動量を直観的に示すベクトル等を表示するようにしてもよい。このようにすることで、作業者へより細やかな指針を与えることができる。
また例えば、上記の実施形態においては、撮像装置1は、作業者の頭上から鉛直方向下向きにカメラの画角が向けられていたが、これに限られず、例えば作業者の左右上方から斜め下向き、あるいは左右水平方向で作業者に向けられていてもよい。このようにすることで、作業者までの深度が所定の距離よりも近い場合、あるいは所定の距離よりも遠い場合に、作業者とカメラとの距離を適正に取るよう深度情報から算出して移動量を案内できるため、行動解析装置100の演算に係る負荷を減らし、並列処理性能を高めることが可能となる。
なお、上記した実施形態では本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、上記の各構成、機能、処理部等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
また、上記した各構成、機能、処理部等は、それらの一部又は全部を、例えば別の装置で実行してネットワークを介して統合処理する等により分散システムで実現してもよい。
また、上記した実施形態の技術的要素は、単独で適用されてもよいし、プログラム部品とハードウェア部品のような複数の部分に分けられて適用されるようにしてもよい。
以上、本発明について、実施形態を中心に説明した。