以下、本発明の各実施の形態について、図面を参照して詳細に説明する。なお、各実施の形態において同一の部分には同一の符号を付し、対応する部分には添え字違いの符号を付す。
(実施の形態1)
図1は、本発明の実施の形態1に係る動作解析システムの構成の一例を示すシステム構成図である。
本実施の形態は、本発明を、熟練作業者と一般作業者とが働く工場において各一般作業者の動作を解析するための動作解析システムに適用した例として説明する。作業者の動作は、例えば、部品を手に取り、製品本体に載せ、ネジ留めをし、シールを貼るといった、複数の単位動作からなる一連の動作である。より具体的には、本実施の形態に係る動作解析システムは、ある作業工程に従事する熟練作業者の姿を撮影し、同じ撮影アングルで同一の作業工程に従事するときの各一般作業者の姿を撮影して、各一般作業者の動作の解析を行うものである。以下、上述の一般的な単位動作と、動作解析システム100によって1つの逸脱動作として抽出される単位とを、「動作」と総称する。
図1において、動作解析システム100は、センサ装置200、本実施の形態に係る動作解析装置300、出力装置400、入力装置500を有する。
センサ装置200は、人の動作を検出する装置である。センサ装置200は、作業者の動作を計測したデータを、動作解析装置300へ出力する。ここでは、センサ装置200は、撮影した画像の画像フレームデータ(動画像データ)をリアルタイムに出力するカメラであり、工場の組み立てラインに並んで作業する各作業者を個別に撮影可能であるものとする。
以下、熟練作業者による一連の標準動作を撮影した動作データを「標準動作データ」と
いい、一般対象者による一連の比較対象動作を撮影した動作データを「比較対象動作データ」という。また、標準動作データおよび解析対象データは、適宜「動作データ」と総称する。
動作解析装置300は、標準動作との比較により比較対象動作の解析を行う装置である。動作解析装置300は、比較対象動作と標準動作との差異の程度が所定の条件を満たす箇所を抽出し、抽出した箇所を提示する画面(以下「結果表示画面」という)を生成し、生成した結果標示画面を出力装置400へ出力する。本実施の形態の動作解析装置300は、比較対象動作が、標準動作と大きく異なる動作(以下「逸脱動作」という)の箇所(以下「逸脱動作箇所」という)を、提示するものとする。
動作解析装置300は、ここでは、CPU(central processing unit)およびRAM(random access memory)等の記憶媒体、動画像データを取り込むためのビデオキャプチャ回路を有するコンピュータであるものとする。すなわち、動作解析装置300は、記憶する制御プログラムをCPUが実行することによって動作する。
出力装置400は、動作解析装置300から入力される結果表示画面のデータを出力する。ここでは、出力装置400は、液晶ディスプレイを有するモニタであるものとする。なお、出力装置400は、遠隔地に配置された装置(遠隔監視装置、携帯電話機等)であっても良い。この場合、出力装置400は、例えば、インターネット等のネットワークを介して動作解析装置300と接続される。
入力装置500は、ユーザが動作解析装置300を操作するためのインタフェースである。ここでは、入力装置500は、例えば、ポインティングデバイスとしてのマウスと、キーボードである。
このような動作解析システム100は、比較対象動作から逸脱動作として検出された箇所を、結果表示画面を介してユーザに提示することができる。したがって、ユーザは、提示された箇所のみを確認して、比較対象動作を効率良く解析することができる。
次に、動作解析装置300の構成について説明する。
図2は、動作解析装置300の構成の一例を示すブロック図である。
図2において、動作解析装置300は、動作データ入力部310、動作特徴抽出部321、動作抽出部322、提示量入力部323、動作抽出度調整部324、および動作抽出結果提示部325を有する。動作特徴抽出部321および動作抽出部322は、本発明に係る動作差異抽出部に対応する。
動作データ入力部310は、動作特徴抽出部321からの要求に応じて、センサ装置200から動作データを取得し、動作特徴抽出部321へ転送する。動作データの転送は、リアルタイムで行われても良いし、動作データを格納してから行われても良い。また、動作データ入力部310は、センサ装置200から入力する動作データを、入力装置500のユーザ操作を受けて、入力時または入力後に標準動作データと比較対象動作データとのいずれかに分類する。動作データ入力部310は、一旦入力した標準動作データを、再使用のために格納しておいても良い。
動作特徴抽出部321は、動作データ入力部310から入力された動作データから、所定のパラメータ(第1のパラメータ)を用いて、動作データから動作の特徴を示す特徴量(以下単に「特徴量」という)を抽出する。そして、動作特徴抽出部321は、抽出した
特徴量を、動作抽出部322へ出力する。
以下、標準動作データから抽出された特徴量を、適宜「標準動作特徴量」といい、比較対象動作データから抽出された特徴量を、適宜「比較対象動作特徴量」という。
ここでは、特徴量は、非特許文献2に開示されているCHLAC特徴とする。CHLAC特徴は、2次元画像データからの特徴抽出である高次局所自己相関(HLAC)特徴を、時間軸も加えて3次元に拡張したものであり、画像の平面空間に時間軸を加えた3次元座標系における動きの特徴を示す特徴ベクトルである。特徴量抽出に用いられるパラメータの値は、初期状態では予め定められた初期値が設定され、その後、動作抽出度調整部324によって適宜調整される。
動作抽出部322は、動作特徴抽出部321から入力された標準動作特徴量および比較対象動作特徴量から、所定のパラメータ(第2のパラメータ)を用いて、比較対象動作と標準動作との差異を抽出する。そして、動作抽出部322は、抽出された差異が、所定のパラメータ(第3のパラメータ)により定まる条件を満たす箇所を抽出し、抽出結果を、動作抽出度調整部324へ出力する。抽出結果は、抽出された箇所(以下「抽出箇所」という)と、所定のカウント基準による抽出箇所の個数(以下「抽出数」という)とを含む。抽出箇所が区間である場合には、抽出結果は、その区間の開始時刻および終了時刻を含む。
ここで、以下、動作特徴抽出部321が特徴量抽出に用いるパラメータを、適宜「特徴抽出パラメータ」と総称する。また、動作抽出部322が動作抽出に用いるパラメータを、適宜「動作抽出パラメータ」と総称する。特徴抽出パラメータの種類には、CHLAC特徴抽出のための画像サイズやフレームレートや窓サイズ、主成分分析の主成分分析の累積寄与度、フーリエ級数の基底関数の数、最小二乗基準の変回帰係数、およびk−nn法(k近傍法、k-nearest neighbor algorithm)のkの値が含まれる。また、動作抽出パラメータの種類には、動作の継続時間や後述する距離閾値が含まれる。
提示量入力部323は、入力装置500を介して、ユーザに提示する抽出箇所の個数(抽出結果の提示量)の指定を受け付け、指定された個数(以下「目標抽出数」という)を、動作抽出度調整部324へ出力する。
動作抽出度調整部324は、抽出数が目標抽出数と一致しないとき、一致するように、動作特徴抽出部321の特徴抽出パラメータを調整して動作特徴抽出部321に対して特徴量の再抽出を指示する。そして、動作抽出度調整部324は、抽出数が目標抽出数と一致すると、抽出結果を動作抽出結果提示部325へ出力する。すなわち、動作抽出度調整部324は、抽出数が目標抽出数と一致するまで、特徴抽出パラメータを変化させながら、動作特徴抽出部321および動作抽出部322に対して処理を繰り返させる。
動作抽出結果提示部325は、動作抽出度調整部324から入力された抽出結果を提示する結果表示画面を生成し、出力装置400を介して表示する。
このような構成を有する動作解析装置300は、解析結果として、ユーザから指定された目標抽出数で、逸脱動作箇所をユーザに提示することができる。したがって、ユーザは、特徴量抽出や動作抽出に用いられる各パラメータを個別に調整することなく、目標抽出数の入力という簡単な手法により、逸脱動作箇所の提示量を調整することができる。
以下、動作解析装置300の動作について説明する。
図3は、動作解析装置300の動作の一例を示すフローチャートである。図4は、動作解析装置300における情報の流れの一例を示す図である。
まず、ユーザは、例えば、対象の動作を含む作業の担当を、休み時間を挟んで熟練作業者と一般作業者とで交代して貰い、それぞれの動作を撮影するように、動作解析装置300を操作する。このようにすることで、動作評価のための時間を特に必要とすることなく作業者にも負荷をかけないため、工場の生産性に影響を与えることなく動作解析のためのデータ取得を行うことができる。
この結果、動作データ入力部310は、標準動作データと比較対象動作データとを入力し、入力した標準動作データおよび比較対象動作データを動作特徴抽出部321へ出力する。動作データ入力部310は、1回の解析処理につき、一人または複数の人から複数の標準動作データを取得しても良いし、一人または複数の人から複数の比較対象動作データを取得しても良い。また、動作データ入力部310は、過去に入力した標準動作データを格納している場合には、その標準動作データを動作特徴抽出部321へ出力しても良い。
まず、ステップS1100において、動作抽出度調整部324は、提示量入力部323を介して、目標抽出数(以下、記号Bを適宜用いる)を入力する。具体的には、例えば、動作抽出度調整部324から指示を受けた提示量入力部323が、目標抽出数の入力を促す画面を出力装置400に表示する。そして、提示量入力部323は、対応して入力装置500を介して入力された数値を、目標抽出数Bとして動作抽出度調整部324に返す。
なお、動作抽出度調整部324は、前回の目標抽出数を使用する場合には、提示量入力部323を介した目標抽出数の入力を必ずしも行わなくて良い。また、この場合、動作抽出度調整部324は、前回の目標抽出数を使用するか否かを、提示量入力部323を介してユーザに問い合わせたり、設定された回数だけ同じ目標抽出数で処理を繰り返したか否かに基づいて判断しても良い。
そして、ステップS1200において、動作特徴抽出部321は、1つまたは複数の標準動作データから、フレーム毎に標準動作特徴量を抽出し、抽出した一連の標準動作特徴量から、標準動作部分空間を求める。標準動作特徴量は、上述の通りここではCHLAC特徴である。標準動作部分空間とは、標準動作を定義する空間である。
動作特徴抽出部321は、例えば、以下の式(1)に示すN次自己相関関数を用いて、CHLAC特徴xを算出する。
ここで、fは時系列画像であり、変数rおよびN個の変数ai(i=1,・・・,N)は画像内の2次元座標と時間とを成分として持つ3次元のベクトルである。時間方向の積分範囲は、どの程度の時間方向の相関を取るかによって定まる。すなわち、積分範囲は、N枚の静止画像(局所特徴画像)から構成される3次元のピクセル集合であり、変数rは画像中の1ピクセル(位置ピクセル)であり、変数aはrからの変位ベクトルである。そして、f(r)は位置rの関数値であり、局所特徴画像の位置rの輝度値を表す。
CHLAC特徴の場合、変位は3次元であり、変位ベクトルの組み合わせ(変位パターン)の数は、0次で1個、1次で13個、2次で237個である。したがって、CHLAC特徴は、2値化画像の場合、合計251次元の特徴ベクトルとして表される。
また、動作特徴抽出部321は、例えば、一連の標準動作特徴量に対して主成分分析を行い、主成分ベクトルを求める。そして、動作特徴抽出部321は、その主成分ベクトルを、標準動作部分空間として取得する。なお、CHLAC特徴および標準動作部分空間の算出手法の詳細は、例えば特許文献1に記載されている。
CHLAC特徴は、その積分範囲において、標準動作特徴量の算出に用いられた標準動作と同じ動作のみが行われた場合、標準動作部分空間に収まる。また、CHLAC特徴は、その積分範囲において、1つでも標準動作と異なる動作が行われた場合、標準動作部分空間から離れた値となる。また、CHLAC特徴は、標準動作と異なる動作が、より大きく異なるほど、また、より長い時間行われるほど、標準動作部分空間からより大きく離れた値となる。したがって、動作解析装置300は、標準動作に対する動作の非類似の度合いが、特徴量の標準動作部分空間からの距離の大きさとほぼ比例関係にあることを利用して、動作解析を行う。ここで、ある特徴量の標準動作部分空間からの距離(以下、適宜「距離」という)とは、例えば、その特徴量の、標準動作部分空間への射影子とそれに対する直交補空間への射影子から求める直交補空間での垂直距離である。CHLAC特徴は、動作における各部の動きの方向の総和による影響を強く受けるため、ある時点の動作における各部(例えば手)の動きの向きの総和一致性を評価するのに適している。
なお、動作特徴抽出部321は、過去に算出した標準動作部分空間を格納している場合には、新たに算出を行わなくても良い。
そして、ステップS1300において、動作特徴抽出部321は、比較対象動作データから、フレーム毎で比較対象動作特徴量を抽出し、抽出した一連の比較対象動作特徴量のそれぞれの、標準動作部分空間との距離を求める。そして、動作特徴抽出部321は、求めた距離を、動作抽出部322へ出力する。
そして、ステップS1400において、動作抽出部322は、標準動作部分空間との距離に基づいて、逸脱動作を抽出し、その抽出数(以下、記号Aを適宜用いる)をカウントして、動作抽出度調整部324へ出力する。
より具体的には、まず、動作抽出部322は、比較対象動作データのうち、動作抽出パラメータにより定義される条件を満たす部分を、1つの逸脱動作箇所として抽出する。そして、動作抽出部322は、抽出された逸脱動作箇所を、抽出数Aとしてカウントする。
動作抽出パラメータにより定義される条件は、例えば、距離が所定の距離閾値よりも大きい状態が続き、その継続時間が所定の連続最小時間以上かつ所定の連続最長時間以下であることである。所定の距離閾値は、例えば、比較対象動作データ全体の各フレームについて求められた距離の最大値の60%である。所定の連続最小時間は、例えば、0.3秒である。所定の連続最小時間は、例えば、比較対象動作データの長さ(複数の場合には平均長さ)の25%である。
このような条件を適用することにより、動作抽出部322は、検出ノイズや微小な逸脱動作、背景の動き等の比較対象とすべきではない動作等を、逸脱動作として扱わず、適切な逸脱動作のみを抽出することができる。
そして、ステップS1500において、動作抽出度調整部324は、抽出数Aが目標抽出数Bに等しいか否かを判断する。動作抽出度調整部324は、抽出数Aが目標抽出数Bに等しくない場合には(S1500:NO)、ステップS1600へ進む。
ステップS1600において、動作抽出度調整部324は、抽出数Aが目標抽出数Bよりも大きいか否かを判断する。動作抽出度調整部324は、抽出数Aが目標抽出数Bよりも大きい場合には(S1600:YES)、ステップS1700へ進み、大きくない場合には(S1600:NO)、ステップS1800へ進む。
ステップS1700において、動作抽出度調整部324は、抽出数Aが減少する方向に、動作特徴抽出部321の特徴抽出パラメータを修正して、ステップS1200へ戻り、動作特徴抽出部321に対して特徴量の再抽出を指示する。
例えば、動作抽出度調整部324は、大まかな特徴量に基づいて比較対象動作と標準動作との差異が検出されるように、特徴抽出パラメータを調整する。つまり、動作抽出度調整部324は、大きい動作において大きい差異が現れた箇所が検出されるように、パラメータ調整ルールに基づいて特徴抽出パラメータを調整する。ここで、大きい動作とは、ある瞬間において比較的多数の画素に変化をもたらし、周期が長い動作であり、大まかな特徴量とは、このような動作から顕著に抽出される特徴量である。この場合、行われるパラメータ修正は、例えば、抽出対象となる動作データの解像度をより荒くする、フレームレートの間隔をより広くする、CHLACマスクパターンの参照点からの画素間隔をより広くする等である。また、他のパラメータ修正は、例えば、主成分分析の主成分分析の累積寄与度をより小さくする、抽出の際の窓サイズをより大きくする等である。
パラメータ調整ルールは、抽出数Aを減少させる場合と増大させる場合のそれぞれについて、どのパラメータをどのように変化させるかを規定する。動作解析装置300は、パラメータ調整ルールを、動作特徴抽出部321または動作抽出度調整部324に格納している。パラメータ調整ルールは、経験測、実験、学習等に基づいて定められたものであり、動作解析装置300に予め格納されていても良いし、必要に応じてネットワーク等を介して外部から取得されても良い。
抽出数Aを減少させるためのパラメータ調整ルールは、より大きな特徴を抽出するために、次のように特徴抽出パラメータを調整する内容である。例えば、パラメータ調整ルールは、解像度を5%下げて荒くし、フレームレートを2倍に長くし、CHLACマスクパターンの参照点からの画素間隔を2倍にし、主成分分析の累積寄与度を1%下げ、窓サイズを5増加させる内容である。この場合、パラメータ調整ルールは、予め定められた記述方式に従って、例えば、A>B:r=―5;fs=x2;ps=x2;acr=−1;ws=+5と記述される。なお、動作抽出度調整部324は、パラメータ調整ルールに複数のパラメータについての変化が記述されている場合、1回の修正で全てのパラメータの値を変化させるのではなく、複数回に分散して複数のパラメータの値を変化させても良い。
この結果、抽出数Aは減少し、動作抽出度調整部324は、再び抽出数Aと目標抽出数Bとの比較を行う(S1500)。
一方、ステップS1800において、動作抽出度調整部324は、抽出数Aが増大する方向に特徴抽出パラメータを修正して、ステップS1200へ戻り、動作特徴抽出部321に対して特徴量の再抽出を指示する。
例えば、動作抽出度調整部324は、細かい特徴量に基づいて比較対象動作と標準動作との差異が検出されるように、つまり、小さい動作において大きい差異が現れた箇所が検出されるように、特徴抽出パラメータを修正する。ここで、小さい動作とは、ある瞬間において、大きな動作よりも少ないが、一定量以上の画素に変化をもたらし、周期が短い動作であり、細かい特徴量とは、このような動作から顕著に抽出される特徴量である。例えば、大きな動作の例は腕を振りおろすといった動きであり、小さな動作の例は人差し指を
とんとん上下するといった動きである。大きな動作の方は、小さな動作と比較すると、より多くの画素に変化を与え、動作にかかる時間が長い場合が多い。
この場合、行われるパラメータ修正は、例えば、抽出対象となる動作データの解像度をより細かくする、フレームレートの間隔をより狭くする、CHLACマスクパターンの参照点からの画素間隔をより狭くする等である。また、他のパラメータ修正は、例えば、主成分分析の主成分分析の累積寄与度をより大きくする、抽出の際の窓サイズをより小さくする等である。
抽出数Aを増大させるためのパラメータ調整ルールは、より小さな特徴を抽出するために、次のように特徴抽出パラメータを調整する内容である。例えば、パラメータ調整ルールは、解像度を5%増加させて細かくし、フレームレートを0.5倍にして短くし、CHLACマスクパターンの参照点からの画素間隔を0.5倍にし、主成分分析の累積寄与度を1%上げ、窓サイズを5減少させる内容である。この場合、パラメータ調整ルールは、予め定められた記述方式に従って、例えば、A<B:r=+5;fs=x0.5;ps=x0.5;acr=+1;ws=−5と記述される。
この結果、抽出数Aは増大し、動作抽出度調整部324は、再び抽出数Aと目標抽出数Bとの比較を行う(S1500)。すなわち、抽出数Aが目標抽出数Bに一致するまで、ステップS1200〜S1800の処理が繰り返される。
そして、動作抽出度調整部324は、抽出数Aが目標抽出数Bに等しい場合には(S1500:YES)、抽出結果を動作抽出結果提示部325へ出力し、ステップS1900へ進む。
ステップS1900において、動作抽出結果提示部325は、抽出結果を提示する結果表示画面を生成し、出力装置400に表示させる。
図5は、結果表示画面の一例を示す図である。図5は、逸脱動作箇所として抽出される条件が、比較対象特徴量の標準動作部分空間に対する距離が所定の距離閾値よりも高いことであり、目標抽出数Bが、2である場合の例である。
図5に示すように、結果表示画面610は、解析結果表示領域611、再生ボタン612、比較対象動作表示領域613、一時停止ボタン614、終了ボタン615、および標準動作表示領域616を有する。
結果表示画面610は、解析結果表示領域611に、比較対象特徴量の標準動作部分空間に対する距離の時系列データ617と、所定の距離閾値を示す閾値表示線618と、抽出箇所を示すマーカ619とを表示する。また、動作抽出結果提示部325は、入力装置500から左右に移動操作可能な、再生箇所表示線620を表示する。
動作抽出結果提示部325は、再生ボタン612がクリックされると、比較対象動作の撮影画像を比較対象動作表示領域613で再生すると共に、再生箇所表示線620を、再生に合わせて移動させる。また、動作抽出結果提示部325は、画像の再生中に一時停止ボタン614がクリックされると、画像の再生を一時的に停止する。また、標準動作表示領域616は、比較対象動作表示領域613における比較対象動作の撮影画像の再生と同期して、標準動作の撮影画像を再生する。
このような結果表示画面610により、ユーザは、再生箇所表示線620をマーカ619部分に移動させて再生ボタン612をクリックすることにより、逸脱動作の映像を素早
くピックアップして確認することができる。また、指定した数で逸脱動作箇所がピックアップされるので、ユーザは自己の望む量の解析結果の提示を受けることができる。また、ユーザは、比較対象動作と標準動作とを視覚的に比較することができる。
なお、結果表示画面610は、標準動作データの画像と比較対象動作データ画像とを、同時に、または切り換えて表示しても良い。また、結果表示画面610は、動作に関連する他のデータ、例えば、動作データの撮影日時や比較対象物の加速度データや音声を、併せて出力しても良い。また、結果表示画面610は、CHLAC特徴が用いられている場合には、(主成分分析した)CHLACの値を、併せて出力しても良い。また、結果表示画面610は、加速度に基づく特徴量が用いられている場合には加速度データを、音声に基づく特徴量が用いられている場合には音声データを、併せて出力しても良い。結果表示画面610は、これらの高次の特徴量が用いられている場合、時系列の高次の特徴量を主成分分析して3次に次元削減して得られる値を、3次元トラジェクトリによって表示させても良い。ここで、結果表示画面610は、映像の再生時に、再生と同期させて、出力した3次元トラジェクトリ上の対応する値を、ハイライト表示するようにしても良い。
そして、ステップS2000において、動作解析装置300は、ユーザ操作等により解析処理の終了を指示されたか否かを判断する。動作解析装置300は、解析処理の終了を指示されない場合には(S2000:YES)、ステップS1100へ戻り、解析処理の終了を指示された場合には(S2000:NO)、一連の動作を終了する。
このような動作により、動作解析装置300は、実際の抽出数がユーザによって指定された目標抽出数に一致するように特徴抽出パラメータを調整し、抽出数が目標抽出数に一致したときに、抽出結果をユーザに提示することができる。
なお、動作抽出度調整部324は、抽出数が増大する方向でパラメータを修正する場合に、それまでの抽出結果を提示対象に残しても良い。
具体的には、動作抽出度調整部324は、まず、パラメータ修正を行う毎に、そのパラメータ修正の前の抽出箇所(以下「修正前抽出箇所」という)と、そのパラメータ修正の後の抽出箇所(以下「修正後抽出箇所」という)とを比較する。そして、動作抽出度調整部324は、修正前抽出箇所に、修正後抽出箇所のうち修正前抽出箇所のいずれにも包含されないもの(以下「新規抽出箇所」という)を追加する形で、提示対象を増やしていく。そして、動作抽出度調整部324は、提示対象の抽出箇所の個数が目標抽出数に到達すると、ステップS1900へ進む。
すなわち、動作抽出度調整部324は、修正前抽出箇所の個数(Aold)と新規抽出箇所の個数(Anew)との和(Asum=Aold+Anew)を、目標抽出数(B)と比較する。そして、動作抽出度調整部324は、目標抽出数(B)よりも抽出箇所の個数の和(Asum)が小さい間は(Asum<B)、抽出数が増大する方向のパラメータ修正を繰り返す。そして、動作抽出度調整部324は、抽出箇所の和(Asum)が目標抽出数(B)以上となった時点で(Asum≧B)、最初に抽出された箇所と新規抽出箇所とを、抽出結果として採用し、ステップS1900へ進む。
これにより、一旦抽出された逸脱動作箇所を、抽出数が増大する方向でパラメータが修正される過程において抽出対象外となるのを防ぐことができる。
また、動作抽出度調整部324は、パラメータ修正の回数が予め定められた上限値に到達したとき、抽出数Aが目標抽出数Bに等しいとみなして、ステップS1900へ進んでも良い。
また、動作抽出度調整部324は、目標抽出数Bよりも大きかった抽出数Aが、パラメータ修正の結果目標抽出数Bよりも小さくなった場合には、抽出数Aが目標抽出数Bに等しいとみなして、ステップS1900へ進んでも良い。
また、動作抽出度調整部324は、目標抽出数Bよりも小さかった抽出数Aが、パラメータ修正の結果目標抽出数Bよりも大きくなった場合には、抽出数Aが目標抽出数Bに等しいとみなして、ステップS1900へ進んでも良い。
また、動作抽出度調整部324は、抽出数Aの目標抽出数Bとの数の差が最も小さくなるときの抽出結果を選択し、ステップS1900へ進んでも良い。
これらの処理を採用することにより、ステップS1200〜S1800が長時間繰り返されて抽出結果がいつまでも表示されないといった事態を防ぐことができる。
また、動作抽出度調整部324は、目標抽出数Bよりも大きかった抽出数Aが、パラメータ修正の結果、目標抽出数Bよりも小さく、修正前の個数(Aold)と目標抽出数Bとの差が所定の閾値以下となった場合、次の処理を行っても良い。
動作抽出度調整部324は、修正前抽出箇所を、動作の面積が大きいものから順に、目標抽出数Bに一致する個数まで選択し、選択した抽出箇所で確定して、ステップS1900へ進む。ここで、動作の面積とは、抽出箇所の距離のうち距離閾値を超える部分の時間積分である。ここで、時刻tについて抽出された距離をd(t)、距離閾値をp、抽出箇所の開始時間および終了時刻をt1、t2とすると、動作の面積Sは、以下の式(2)で表される値とする。
また、動作抽出度調整部324は、目標抽出数Bよりも小さかった抽出数Aが、パラメータ修正の結果目標抽出数Bよりも大きくなった場合に、以下の処理を行っても良い。
動作抽出度調整部324は、修正前抽出箇所を、動作の面積が大きいものから順に、目標抽出数から修正前抽出箇所の個数を引いた個数(B−Aold)だけ抽出する。次に、動作抽出度調整部324は、その抽出箇所を、新規抽出箇所とし、その個数を、新規抽出箇所の個数(Anew)とする。そして、動作抽出度調整部324は、修正前抽出箇所と新規抽出箇所とを、抽出結果として確定し、ステップS1900へ進む。修正前抽出箇所の個数と新規抽出箇所の個数との和(Aold+Anew)は、目標抽出数(B)に一致する。
また、動作抽出度調整部324は、パラメータ修正の回数が上限値に到達した場合、目標抽出数Bに最も近い抽出数Aを得たときの抽出箇所を、動作の面積が大きい順に目標抽出数Bの範囲内で選択し、ステップS1900へ進んでも良い。
これらの処理を採用することにより、本実施の形態に係る動作解析装置300は、標準動作とは異なるものの、継続時間が短く、逸脱動作として扱うべきではないような動作が抽出されるのを防ぐことができる。すなわち、本実施の形態に係る動作解析装置300は、動作の継続時間を考慮して、逸脱動作の抽出を行うことができる。
また、動作抽出度調整部324は、目標抽出数の入力を、動作解析装置300が動作データを入力するときや、その後など、他のタイミングで行っても良い。
以上説明したように、本実施の形態に係る動作解析装置300は、比較対象動作と標準動作との差異の程度が所定の条件を満たす箇所の数が、ユーザが指定した目標抽出数に一致するように、所定の条件を調整する。すなわち、動作解析装置300は、逸脱動作として提示する箇所の数を、ユーザの指定値の通りとする。これにより、動作解析装置300は、細かなパラメータ調整をせずに解析結果の提示量を調整することができ、動作解析の詳細なアルゴリズムを理解していないユーザに対しても、所望の解析レベルで解析結果を容易に得ることを可能にする。
また、本実施の形態に係る動作解析装置300は、動作解析のアルゴリズムにかかわるパラメータ設定の手動での調整は不要であるため、解析対象となる単位動作の数が多いような場合にも適している。また、本実施の形態に係る動作解析装置300は、パラメータの種類が膨大で、各パラメータの解析結果に対する影響の仕方も複雑な場合に有効であり、熟練を要するパラメータ調整作業を不要とし、手間と時間と軽減することができる。
また、本実施の形態に係る動作解析装置300は、目標抽出数が変わっても、動作解析のアルゴリズムにかかわるパラメータ設定の手動での調整は不要であるため、求められる解析レベルが頻繁に変化するような場合に適している。
また、本実施の形態に係る動作解析装置300は、特徴抽出パラメータを調整するので、抽出対象となる動作の種類を考慮した、きめ細かな抽出対象の調整を行うことができる。
なお、本発明は、以上説明した実施の形態1以外の様々な実施態様に適用可能である。以下、本発明の他の実施態様を、実施の形態1の変形例として説明する。
(実施の形態1の変形例1)
実施の形態1の変形例1は、動作抽出度調整部324が、動作特徴抽出部321の特徴抽出パラメータではなく、動作抽出部322の動作抽出パラメータを修正する例である。
図6は、本変形例に係る動作解析装置300の動作の一例を示すフローチャートであり、図3に対応するものである。図7は、本変形例に係る動作解析装置300における情報の流れの一例を示す図であり、図4に対応するものである。図3および図4と同一部分には同一ステップ番号を付し、これについての説明を省略する。
本変形例に係る動作解析装置300の動作抽出度調整部324は、抽出数Aが目標抽出数Bより大きい場合は(S1600:YES)、ステップS1700aへ進み、大きくない場合には(S1600:NO)、ステップS1800aへ進む。
ステップS1700aにおいて、動作抽出度調整部324は、抽出数Aが減少する方向に、動作抽出部322の動作抽出パラメータを修正して、ステップS1400へ戻り、動作抽出部322に対して動作の再抽出を指示する。
例えば、動作抽出部322が動作を抽出する条件が上述の距離閾値、連続最小時間、および連続最長時間で定義される条件である場合を想定する。この場合、抽出数Aを減少させるためのパラメータ調整ルールは、例えば、距離閾値を10%上げ、連続最小時間を0.1秒増加させ、連続最長時間を5%上げる内容である。
一方、ステップS1800aにおいて、動作抽出度調整部324は、抽出数Aが増加する方向に、動作抽出部322の動作抽出パラメータを修正して、ステップS1400へ戻り、動作抽出部322に対して動作の再抽出を指示する。
上述の条件の場合、抽出数Aを増加させるためのパラメータ調整ルールは、例えば、距離閾値を5%下げ、連続最小時間を0.1秒減少させ、連続最長時間を5%下げる内容である。
本変形例によれば、動作解析装置300は、動作抽出パラメータを調整するので、特徴量の再抽出を行う必要がなく、解析結果をより迅速に提示することが可能となる。
なお、動作解析装置300は、特徴抽出パラメータと動作抽出パラメータとの両方を調整しても良い。また、この調整は、1回の修正で同時に行われても良く、別の回の修正に分けて行われても良い。これにより、抽出対象となる動作の種類と類似度の大きさとの両方を考慮した、よりきめ細かな抽出対象の調整を行うことが可能となる。
(実施の形態1の変形例2)
実施の形態1の変形例2は、動作解析装置300が、複数種類の動作について効率的に解析を行う例である。
本変形例に係る動作解析装置300は、大きい動作に対応する特徴量に着目した動作抽出と、小さい動作に対応する特徴量に着目した動作抽出との両方を行う。
このために、動作解析装置300は、大きい動作に対応する特徴量の抽出用の初期設定(以下、「第1の初期設定」という)と、小さい動作に対応する特徴量の抽出用の初期設定(以下、「第2の初期設定」という)とを予め格納している。
初期設定には、特徴抽出パラメータの初期値および動作抽出パラメータの初期値が含まれる。例えば、第1の初期設定は、入力された動作データの解像度を半分に落とす処理を行う設定であり、第2の初期設定は、入力された動作データの解像度をそのままとする設定である。
動作解析装置300は、まず、第1の初期設定に基づいて抽出した第1の抽出結果と、第2の初期設定に基づいて抽出した第2の抽出結果とを取得する。また、動作解析装置300は、大きい動作に対応する第1の目標抽出数と、小さい動作に対応する第2の目標抽出数との両方の入力を、ユーザから受け付ける。そして、動作解析装置300は、第1の抽出結果および第1の目標抽出数に基づいて、第1の初期設定に含まれるパラメータを調整し、第2の抽出結果および第2の目標抽出数に基づいて、第2の初期設定に含まれるパラメータを調整する。
そして、動作解析装置300は、大きい動作についての解析結果と、小さい動作についての解析結果とを、同時に、または切り換えて表示する。動作解析装置300は、大きい動作についての解析結果と、小さい動作についての解析結果とを解析結果表示領域611(図5参照)に同時に表示する場合には、色が異なるなど表示形態の異なるマーカ619を表示することが望ましい。
本変形例によれば、大きい動作における逸脱動作と、小さい動作における逸脱動作との両方を、抽出して纏めて提示するので、ユーザの動作解析の効率性および利便性を向上させることができる。
(実施の形態1の変形例3)
実施の形態1の変形例3は、指定する提示量が、抽出数ではなく、比較対象動作データの再生時間に対する抽出箇所の再生時間の合計値(以下「抽出時間」という)の割合である場合の例である。
本変形例に係る動作解析装置300は、比較対象動作データの再生時間に対する抽出時間の割合(以下「抽出時間割合」という)を算出すると共に、抽出時間割合の指定をユーザから受け付ける。そして、動作解析装置300は、算出した抽出動作時間が、指定された抽出動作時間(以下「目標抽出時間割合」という)に一致するように、特徴抽出パラメータおよび動作抽出パラメータの調整を行う。
例えば、動作解析装置300は、目標抽出時間割合が20%であって、比較対象動作データの再生時間の平均値が30秒である場合、抽出時間が6秒(30秒×0.2)となるように、パラメータ調整を行う。
動作解析装置300の動作は、図3を用いて説明した動作と同様である。但し、抽出数および目標抽出数は、抽出時間割合と目標抽出時間割合とにそれぞれ置き換えられる。また、抽出時間割合が目標抽出時間割合に完全に一致するようなパラメータ調整ルールを設定することは困難であることから、動作解析装置300は、例えば以下のような動作を行う。
動作解析装置300は、抽出時間割合と目標抽出時間割合との差が所定の閾値以下の場合には、抽出時間割合が目標抽出時間割合に一致したとみなし、抽出結果の表示の処理に移る。例えば、所定の閾値が比較対象動作データの再生時間の平均値の5%であり、当該再生時間の平均値が30秒である場合、動作解析装置300は、1.5秒(30秒×0.05)の誤差を認めることとなる。そして、目標抽出時間割合として20%が指定された場合には、動作解析装置300は、抽出時間割合が4.5秒以上7.5秒以下を満たした時点で、調整処理を完了し、解析結果を表示する。
本変形例によれば、ユーザは、動作の数ではなく、動作データの長さに対する時間の割合を入力することにより、動作データの長さを特に考慮することなく抽象的に抽出度合いを指定できる。
なお、動作解析装置300は、目標抽出時間割合ではなく、抽出時間の目標値の設定を受け付け、実際の抽出時間がこの目標値に一致するようにパラメータ調整を行っても良い。これにより、ユーザは、抽出箇所の再生に要する時間を所望の時間とすることができる。
(実施の形態1の変形例4)
実施の形態1の変形例4は、動作の特徴を示す特徴量がCHLAC特徴以外の特徴量であり、動作の抽出に標準動作部分空間との距離以外の情報を用いる例である。
例えば、動作特徴抽出部321は、動作の特徴を示す特徴量としてSVMの特徴量を用い、動作の抽出を1クラスSVMに基づいて行う。SVMの特徴量および1クラスSVMの算出手法の詳細は、例えば非特許文献1に記載されているため、ここでの説明を省略する。
この場合、動作解析装置300が用いる特徴抽出パラメータには、例えば、窓サイズ、wavelet展開係数、および主成分分析の累積寄与度が含まれる。また、本変形例に
係る動作解析装置300が用いる動作抽出パラメータには、識別超平面の乖離データの割合、識別超平面のカーネルパラメータ、連続最小時間、および連続最長時間が含まれる。
なお、動作特徴抽出部321は、CHLAC特徴を用いて1クラスSVMにより動作を抽出することもできる。また、動作特徴抽出部321は、動作特徴量だけでなく、他の高次の特徴量を用いて動作を抽出することもできる。
本変形例によれば、CHLAC特徴および距離以外の特徴量および情報を用いる動作解析手法において、ユーザは、各パラメータを手動で調整することなく、解析結果の提示量を容易に調整することができる。
なお、以上説明した各変形例は、任意に組み合わせて実施することが可能である。これにより、上述した各効果を複合的に得ることができる。
(実施の形態2)
本発明の実施の形態2は、提示対象とする動作の種別を切り換えることが可能な動作解析装置である。
図8は、本実施の形態に係る動作解析装置の構成の一例を示すブロック図であり、実施の形態1の図2に対応するものである。図2と同一部分には同一符号を付し、これについての説明を省略する。
図8において、動作解析装置300bは、実施の形態1の動作抽出部および動作抽出度調整部に代えて、異なる動作を行う動作抽出部322bおよび動作抽出度調整部324bを有し、新たに、抽出種別入力部326bを有する。
抽出種別入力部326bは、入力装置500を介して、ユーザに提示する動作の種別の指定を受け付け、指定された種別(以下「抽出動作種別」という)を、動作抽出部322bへ出力する。ここでは、抽出種別入力部326bは、抽出動作種別として、逸脱動作と、比較対象動作と標準動作との差異が小さい動作(以下「標準レベル動作」という)とのいずれかの指定を受け付けるものとする。
動作抽出部322bは、逸脱動作が指定された場合、実施の形態1と同様の動作を行い、標準レベル動作が指定された場合には、標準レベル動作の箇所を標準レベル動作箇所として抽出し、抽出結果を動作抽出度調整部324bへ出力する。標準レベル動作箇所の抽出手法については後述する。
動作抽出度調整部324bは、逸脱動作箇所が入力された場合には、実施の形態1と同様の動作を行う。また、動作抽出度調整部324bは、標準レベル動作箇所が入力された場合には、逸脱動作の場合とは異なる内容のパラメータ調整によって、抽出数を目標抽出数と一致させる。
このような構成を有する動作解析装置300bは、標準レベル動作箇所を抽出し、ユーザが指定した提示量で、抽出箇所を提示することができる。
次に、動作解析装置300bの動作について説明する。
図9は、動作解析装置300bの動作の一例を示すフローチャートであり、実施の形態1の図3に対応するものである。図3と同一部分には同一符号を付し、これについての説明を省略する。図10は、動作解析装置300bにおける情報の流れの一例を示す図であ
る。
まず、ステップS1010bにおいて、動作抽出部322bは、抽出種別入力部326bを介して、抽出動作種別を入力し、ステップS1100へ進む。具体的には、例えば、動作抽出部322bから指示を受けた抽出種別入力部326bが、動作種別の選択を促す画面を出力装置400に表示する。そして、抽出種別入力部326bは、対応して入力装置500を介して選択された動作種別を、抽出動作種別として動作抽出部322bに返す。
そして、動作解析装置300bは、目標抽出数Bを入力し、フレーム毎に標準動作特徴量の標準動作部分空間からの距離を算出すると(S1100〜S1300)、ステップS2100bへ進む。
ステップS2100bにおいて、動作抽出部322bは、抽出動作種別が、逸脱動作ではなく標準レベル動作であるか否かを判断する。動作抽出部322bは、抽出動作種別が逸脱動作である場合には(S2100b:NO)、ステップS1400へ進み、抽出動作種別が標準レベル動作である場合には(S2100b:YES)、ステップS2200bへ進む。
ステップS2200bにおいて、動作抽出部322bは、距離に基づいて、標準レベル動作を抽出し、その抽出数(以下、記号Aを適宜用いる)をカウントして、動作抽出度調整部324bへ出力する。
より具体的には、まず、動作抽出部322bは、比較対象動作データのうち、動作抽出パラメータにより定義される条件を満たす部分を、1つの標準レベル動作箇所として抽出する。そして、動作抽出部322bは、抽出された標準レベル動作箇所を、抽出数Aとしてカウントする。
動作抽出パラメータにより定義される条件は、例えば、距離が所定の距離閾値よりも小さい状態が続き、その継続時間が所定の連続最小時間以上かつ所定の連続最長時間以下であることである。所定の距離閾値は、例えば、比較対象動作データ全体から求められた距離の最大値の40%である。所定の連続最小時間は、例えば、0.3秒である。所定の連続最小時間は、例えば、比較対象動作データの長さ(複数の場合には平均長さ)の25%である。
このような条件を適用することにより、検出ノイズや背景の動きの影響により、標準レベル動作として扱われるべき動作が、提示対象から除外されるのを防ぐことができる。
そして、図3のステップS1500〜S1800と同様に、動作抽出度調整部324bは、抽出数Aと目標抽出数Bとの大小関係に応じて、動作特徴抽出部321の特徴抽出パラメータの調整を行う(S2300b〜S2600b)。
但し、動作抽出度調整部324は、S1700、S1800とは異なる内容で、ステップS2500b、S2600bにおけるパラメータ修正を行う。すなわち、動作抽出度調整部324は、例えば、抽出動作種別が逸脱動作である場合と標準レベル動作である場合のそれぞれについて、抽出数Aを減少させる場合と増大させる場合のパラメータ調整ルールを格納している。これは、逸脱動作と標準レベル動作とでは、動作抽出パラメータにより定義される条件が上述のように異なり、抽出数Aを同じ方向に変化させる場合であってもどのパラメータをどのように修正すべきかが異なるからである。
図11は、標準レベル動作が選択された場合の動作抽出結果表示画面の一例を示す図であり、実施の形態1の図5に対応するものである。図5と同一部分には同一符号を付し、これについての説明を省略する。
この場合、図11に示すように、結果表示画面610は、解析結果表示領域611に、標準レベル動作箇所である抽出箇所を示すマーカ619を表示する。このような結果表示画面610により、ユーザは、標準レベル動作箇所を素早くピックアップし、標準レベル動作を、画像で素早く確認することができる。また、指定した数で標準レベル動作箇所がピックアップされるので、ユーザは自己の望む量の解析結果の提示を受けることができる。
このように、本実施の形態に係る動作解析装置300bは、逸脱動作のみならず、標準レベル動作をも、ユーザが指定した提示量で提示することができる。また、提示対象となる動作の種別をユーザの指定に従って切り換えることができる。したがって、ユーザは、比較対象となる動作について、より深い解析を行うことができる。
なお、動作解析装置300bは、逸脱動作箇所と標準レベル動作箇所の両方を抽出し、両方の抽出結果を、同時にまたは切り換えて提示しても良い。動作解析装置300bは、逸脱動作箇所と標準レベル動作箇所とを解析結果表示領域611(図5参照)に同時に表示する場合には、色が異なるなど表示形態の異なるマーカ619を表示することが望ましい。また、動作解析装置300bは、常に標準レベル動作箇所のみを提示するようにしても良い。
また、本実施の形態は、実施の形態1で説明した各種変形例と任意に組み合わせて実施することが可能である。
但し、動作の面積を利用した標準レベル動作箇所の抽出が行われる場合には、動作の面積Sは、以下の式(3)で表される値とする。そして、動作抽出度調整部324bは、修正前抽出箇所を、動作の面積が小さいものから順に、目標抽出数Bに一致する個数まで選択し、選択した抽出箇所で確定する。
(実施の形態3)
本発明の実施の形態3は、動作の特徴を示す特徴量がCHLAC特徴における時間重みであり、動作の抽出に時間重みを用いる動作解析装置である。
図12は、本実施の形態に係る動作解析装置の構成の一例を示すブロック図であり、実施の形態1の図2に対応するものである。図2と同一部分には同一符号を付し、これについての説明を省略する。
図12において、動作解析装置300cは、実施の形態1の動作特徴抽出部および動作抽出部に代えて、異なる動作を行う動作特徴抽出部321cおよび動作抽出部322cを有する。
動作特徴抽出部321cは、CHLAC特徴に時間重みを適用した値を積分することにより、動作データ全体に関する特徴量である映像特徴を算出する手法において、フレーム毎に重みを定義する重みマップを学習する(非特許文献2参照)。そして、動作特徴抽出
部321cは、学習した重みマップを、動作抽出部322cへ出力する。
動作抽出部322cは、重みマップに含まれるフレーム毎の重みに基づいて、逸脱動作を抽出し、抽出結果を動作抽出度調整部324へ出力する。
このような構成を有する動作解析装置300cは、CHLAC特徴に時間重みを適用した映像特徴の重みマップに基づいて、逸脱動作箇所を抽出し、ユーザが指定した提示量で、抽出箇所を提示することができる。
図13は、動作解析装置300cの動作の一例を示すフローチャートであり、実施の形態1の図3と対応するものである。図3と同一部分には同一ステップ番号を付し、これについての説明を省略する。
逸脱動作の目標抽出数Bが入力されると(S1100)、動作解析装置300cは、ステップS1200cへ進む。
ステップS1200cにおいて、動作特徴抽出部321cは、標準動作データから、フレーム毎にCHLAC特徴を抽出する。
そして、ステップS1300cにおいて、動作特徴抽出部321cは、比較対象動作データから、フレーム毎にCHILAC特徴を抽出して重みマップを学習し、学習した重みマップを、動作抽出部322cへ出力する。
具体的には、動作特徴抽出部321cは、抽出した標準動作および比較対象動作の一連の各CHLAC特徴から、映像特徴を抽出するための時間重みの重みマップ(フレーム毎の重み)を、例えばフィッシャー判別基準により学習する。重みマップの学習に用いられる特徴抽出パラメータには、時間的な伸縮を吸収するために導入したフーリエ級数展開に伴う基底関数の数が含まれる。
動作特徴抽出部321cは、実施の形態1と同様にパラメータ調整を行う。したがって、重み付けの最適化は、学習データだけではなく、目標抽出数にも基づいて行われることになる。最適化された各重みは、動作に差があるフレームほど大きくなるという特性を有し、かつ、動作を時系列に評価しつつ各動作データの長さの違いを吸収するという効果を有する。映像特徴および重みマップの学習手法の詳細は、例えば特許文献2に記載されているため、ここでの説明を省略する。
そして、ステップS1400cにおいて、動作抽出部322cは、重みに基づいて、逸脱動作を抽出し、その抽出数(以下、記号Aを適宜用いる)をカウントして、動作抽出度調整部324へ出力する。
より具体的には、まず、動作抽出部322cは、比較対象動作データのうち、動作抽出パラメータにより定義される条件を満たす部分を、1つの逸脱動作箇所として抽出する。そして、動作抽出部322cは、抽出された逸脱動作箇所を、抽出数Aとしてカウントする。
動作抽出パラメータにより定義される条件は、例えば、重みが所定の重み閾値よりも大きい状態が続き、その継続時間が所定の連続最小時間以上かつ所定の連続最長時間以下であることである。所定の重み閾値は、例えば、比較対象動作データ全体から求められた重みの最大値の60%である。所定の連続最小時間は、例えば、0.3秒である。所定の連続最小時間は、例えば、比較対象動作データの長さ(複数の場合には平均長さ)の25%
である。
そして、図3のステップS1500〜S1800と同様に、動作抽出度調整部324cは、抽出数Aと目標抽出数Bとの大小関係に応じて、動作特徴抽出部321の特徴抽出パラメータの調整を行う。但し、動作抽出度調整部324cは、S1700、S1800とは異なる内容で、ステップS1700c、S1800cにおけるパラメータ修正を行っても良い。
例えば、動作抽出度調整部324cは、抽出数Aを減少させる方向に変化させる場合、重みマップの学習に用いられる基底関数の数を1少なくする。この場合、動作抽出度調整部324cは、予め定められた記述方式に従って、例えば、A>B:bf=−1と記述されたパラメータ調整ルールを格納する。ここで、基底関数以外の抽出数Aを減少させるためのパラメータ調整は、より大きな特徴が抽出されるようにパラメータを調整する内容である。例えば、パラメータ調整は、解像度を5%下げ、フレームレートを2倍にし、CHLACマスクパターンの参照点からの画素間隔を2倍にし、主成分分析の累積寄与度を1%下げ、窓サイズを5増加させる等の調整を同時に行う内容であっても良い。
また、例えば、動作抽出度調整部324cは、抽出数Aを増大させる方向に変化させる場合、重みマップの学習に用いられる基底関数の数を1多くする。この場合、動作抽出度調整部324cは、予め定められた記述方式に従って、例えば、A<B:bf=+1と記述されたパラメータ調整ルールを格納する。ここで、基底関数の数以外の抽出数Aを増大させるためのパラメータ調整は、より小さな特徴が抽出されるようにパラメータを調整する内容である。例えば、パラメータ調整は、解像度を5%増加させ、フレームレートを0.5倍にし、CHLACマスクパターンの参照点からの画素間隔を0.5倍にし、主成分分析の累積寄与度を1%上げ、窓サイズを5減少させる等の調整を同時に行う内容であっても良い。
このような動作により、動作解析装置300cは、重みが大きい箇所を逸脱動作箇所として抽出することができる。
以上説明したように、本実施の形態に係る動作解析装置300cは、映像特徴の抽出において学習される重みに基づいて逸脱動作を抽出し、ユーザが指定した提示量で抽出結果を提示することができる。映像特徴の抽出において学習される重みは、個々の動作が正しくても動作が行われる順番が異なるような箇所において高くなる。したがって、動作解析装置300cを用いることにより、動作に対する時系列的な評価を、簡単に行うことができる。
なお、本実施の形態は、実施の形態1で説明した各種変形例および実施の形態2と任意に組み合わせて実施することが可能である。また、本実施の形態は、実施の形態2のように、特徴抽出パラメータを修正せず、動作抽出パラメータのみを修正しても良い。
但し、動作の面積を利用した逸脱動作箇所の抽出が行われる場合には、動作の面積は、抽出箇所の重みのうち重み閾値を超える部分の時間積分となる。また、動作の面積を利用して標準レベル動作箇所の抽出を行う場合には、動作の面積は、抽出箇所の重みの時間積分となる。
例えば、本実施の形態と実施の形態2とを組み合わせる場合、特徴抽出パラメータと動作抽出パラメータとの両方が修正され得る。この場合、抽出数Aを減少させるためのパラメータ調整ルールは、より大きな特徴を抽出するために、次のようにパラメータを調整する内容である。例えば、パラメータ調整ルールは、解像度を5%増加させ、フレームレー
トを2倍にし、CHLACマスクパターンの参照点からの画素間隔を2倍にし、主成分分析の累積寄与度を1%下げ、窓サイズを5増加させる内容である。また、このパラメータ調整ルールは、動作抽出パラメータに対して、重み閾値を5%下げ、連続最小時間を0.2秒増加させ、連続最長時間を1%増加させ、基底関数の数を1少なくする内容である。この場合、パラメータ調整ルールは、予め定められた記述方式に従って、例えば、A>B:r=+5;fs=x2;ps=x2;acr=−1;ws=+5;w=−5;mint=+0.2;maxt=+0.1;bf=−1、と記述される。
(実施の形態4)
本発明の実施の形態4は、複数の異なる提示量のレベルの中からユーザによって指定されたレベルで、解析結果の提示を行う動作解析装置である。
図14は、本実施の形態に係る動作解析装置の構成の一例を示すブロック図であり、実施の形態1の図2に対応するものである。図2と同一部分には同一符号を付し、これについての説明を省略する。
図14において、動作解析装置300dは、実施の形態1の動作特徴抽出部、提示量入力部、および動作抽出度調整部に代えて、異なる動作を行う動作特徴抽出部321d、提示量入力部323d、および動作抽出度調整部324dを有する。また、動作解析装置300dは、新たに、動作解析初期値設定部327dを有する。動作解析初期値設定部327dは、例えば、動作データ入力部310に配置される。
動作解析初期値設定部327dは、予め定義された複数の異なる提示量のレベル(以下「抽出レベル」という)のそれぞれに対応して、各パラメータの初期値(以下「パラメータ初期値」という)と目標抽出数とを設定する。具体的には、動作解析初期値設定部327dは、予め定義された抽出レベルに対応して、標準動作データに基づいて、パラメータ初期値と目標抽出数とを算出し、設定する。
なお、本実施の形態では、動作抽出パラメータは固定のデフォルト値を用いるものとして説明を行う。また、抽出レベルとして、提示量が少ない低レベル、提示量が中程度である中レベル、提示量が多い高レベルの3つのレベルが定義されているものとする。
提示量入力部323dは、入力装置500を介して、ユーザから抽出レベルの指定を受け付け、指定された抽出(以下「目標抽出レベル」という)を、動作特徴抽出部321dおよび動作抽出度調整部324dへ出力する。
動作特徴抽出部321dは、ユーザが指定した抽出レベルのパラメータ初期値を特徴抽出パラメータに適用して、特徴量の抽出を行う。特徴抽出パラメータの値は、その後、動作抽出度調整部324dによって適宜調整される。
動作抽出度調整部324dは、抽出数が動作解析初期値設定部327dによって算出された目標抽出数と一致しないとき、一致するように、動作特徴抽出部321の特徴抽出パラメータを調整する。
このような構成を有する動作解析装置300dは、解析結果として、ユーザから指定された抽出レベルで逸脱動作箇所をユーザに提示することができる。また、動作解析装置300dは、標準動作データに基づいて抽出レベル毎に適切なパラメータ初期値および目標抽出数を設定するので、解析結果を提示するまでの時間を短縮することができる。
以下、動作解析装置300dの動作について説明する。
図15は、動作解析装置300dの動作の一例を示すフローチャートであり、実施の形態1の図3に対応するものである。図3と同一部分には同一ステップ番号を付し、これについての説明を省略する。図16は、本実施の形態に係る動作解析装置300dにおける情報の流れの一例を示す図である。
まず、ステップS1020dにおいて、動作解析初期値設定部327dは、入力装置500を介して、ユーザから標準動作数(以下、記号Jを適宜用いる)を入力し、標準動作数Jを動作特徴抽出部321dへ出力する。ここで、標準動作数とは、動作データ入力部310が入力する標準動作データに含まれる動作の個数であり、例えば、熟練作業者が手を前方へ伸ばす回数である。標準動作数は、解析の対象となるべき動作の量の目安となるものであり、例えば、標準動作データが長い場合や動作が忙しく行われる場合には、大きくなる傾向がある。
そして、ステップS1030dにおいて、動作解析初期値設定部327dは、標準動作数Jに基づいて、選択中の抽出レベルのパラメータ初期値および目標抽出数Bを算出する。そして、動作解析初期値設定部327dは、算出したパラメータ初期値を、選択中の抽出レベルのパラメータ初期値に設定し、動作特徴抽出部321dへ出力する。また、動作解析初期値設定部327dは、算出した目標抽出数Bを、選択中の抽出レベルの目標抽出数Bに設定し、動作抽出度調整部324dへ出力する。
どのようにパラメータ初期値および目標抽出数Bを算出するかは、抽出レベル毎に、初期値算出ルールとして、動作解析初期値設定部327dに格納されている。初期値算出ルールは、予め格納されていても良いし、ユーザにより手入力されても良いし、必要に応じてネットワーク等を介して外部から取得されても良い。
例えば、低レベルに対応する初期値算出ルールは、例えば、解像度を321×240とし、フレームレートを2/3倍にし、CHLACマスクパターンの参照点からの画素間隔を3とし、主成分分析の累積寄与度を96%とし、窓サイズをフレームレートに動作の平均長さを乗じて標準動作数Jで割った値とし、目標抽出数Bを標準動作数Jに0.2を乗じた値とする内容である。
また、例えば、中レベルに対応する初期値算出ルールは、解像度を640×480とし、フレームレートをそのままとし、CHLACマスクパターンの参照点からの画素間隔を3とし、主成分分析の累積寄与度を97%とし、窓サイズをフレームレートに動作の平均長さを乗じて標準動作数Jで割った値とし、目標抽出数Bを標準動作数Jに0.3を乗じた値とする内容である。
また、例えば、高レベルに対応する初期値算出ルールは、解像度を1280×960とし、フレームレートをそのままとし、CHLACマスクパターンの参照点からの画素間隔を2とし、主成分分析の累積寄与度を98%とし、窓サイズをフレームレートに動作の平均長さを乗じて標準動作数Jで割った値とし、目標抽出数Bを標準動作数Jに0.4を乗じた値とする内容である。
なお、動作の平均長さは、例えば、標準動作データの平均再生時間を標準動作数Jで割ることにより得られる時間長さである。
ここでは、上述の初期値算出ルールが適用され、元の標準動作データにおいて、標準動作数Jが10、平均再生時間が20秒、フレームレートが30bpsである場合を想定する。このとき、フレームレートの初期値は、低レベルにおいて20bps、中レベルおよ
び高レベルにおいて30bpsとなり、窓サイズは、低レベルにおいて40、中レベルにおいて60、高レベルにおいて30bpsとなる。また、目標抽出数Bは、低レベルにおいて2、中レベルにおいて3、高レベルにおいて4となる。
ここで、比較対象動作データの平均再生時間の方が、標準動作データの平均再生時間より長かった場合は、一般作業者の熟練度が低いために動作の平均速度が遅いことが考えられる。この場合は、動作解析初期値設定部327dは、比較対象動作特徴量の抽出に用いる窓サイズの算出に、標準動作データの平均再生時間ではなく、比較対象動作データの平均再生時間を用いても良い。但し、比較対象動作データの平均再生時間の方が、標準動作データの平均再生時間より長い場合でも、一般作業者が余計な動作をしている可能性もある。従って、動作解析初期値設定部327dは、同じ窓サイズ(標準動作データの平均再生時間に基づいて算出される窓サイズ)を用いて、比較対象動作特徴量の抽出を行っても良い。
そして、ステップS1040dにおいて、動作特徴抽出部321dおよび動作抽出度調整部324dは、提示量入力部323dを介して、目標抽出レベル(以下、記号Kを適宜用いる)を入力する。具体的には、例えば、動作特徴抽出部321dまたは動作抽出度調整部324dから指示を受けた提示量入力部323dが、抽出レベルの選択を促す画面を出力装置400に表示する。そして、提示量入力部323dは、対応して入力装置500を介して選択された抽出レベルを、目標抽出レベルKとして動作特徴抽出部321dおよび動作抽出度調整部324dに返す。
この結果、動作特徴抽出部321dおよび動作抽出度調整部324dは、目標抽出レベルKに対応するパラメータ初期値および目標抽出数Bを採用する。そして、動作解析装置300dは、採用したパラメータ初期値および目標抽出数Bを用いて解析処理行い、解析結果を提示して(S1200〜S1900)、ステップS1910dへ進む。
ステップS1910dにおいて、動作解析装置300dは、ユーザ操作等により同じ標準動作での解析処理の終了を指示されたか否かを判断する。動作解析装置300dは、同じ標準動作での解析処理の終了を指示されない場合には(S1910d:YES)、ステップS1040dへ戻る。また、動作解析装置300dは、同じ標準動作での解析処理の終了を指示された場合には(S1910d:NO)、ステップS2000へ進む。
このような動作により、動作解析装置300dは、ユーザから指定された抽出レベルで、つまり標準動作データの再生時間や標準動作数に応じた適切な提示量で、解析結果の提示を行うことができる。
以上説明したように、本実施の形態に係る動作解析装置300dは、標準動作データに基づいて提示レベル毎にパラメータ初期値および目標抽出数を設定し、指定された抽出レベルで解析処理を行う。これにより、動作解析装置300dは、単一のデフォルト値のみパラメータ初期値として用いる場合に比べて、適切な値から処理を開始することができ、処理の高速化を図ることができるだけでなく、解析結果の精度を向上させることができる。また、動作解析装置300dは、標準動作データの再生時間や標準動作数等に応じて各抽出レベルの提示量を調整することができる。また、ユーザは、数や割合の数値を入力するのではなく、抽出レベルといった抽象的な選択肢を選ぶ操作を行うことにより、提示量を調整することができるので、より直感的に操作を行うことができる。
なお、動作解析装置300dは、2つまたは4つ以上の抽出レベルを定義しても良い。
また、動作解析装置300dは、予め複数または全ての抽出レベルについて解析処理を
行っておき、複数の解析結果を、同時にまたは切り換えて表示しても良い。
また、動作解析装置300dは、デフォルトで1つの抽出レベルに対応する処理のみを実行するようにしても良い。この場合、目標抽出レベルの入力は不要となる。この場合でも、適切なパラメータ値から処理を開始することができ、処理の高速化を図ることができる。
例えば、特に本実施の形態と実施の形態2とを組み合わせる場合、特徴抽出パラメータと動作抽出パラメータとの両方について初期値が設定され得る。以下、動作抽出パラメータについての初期値算出ルールの例およびその算出結果の例を示す。
例えば、低レベルに対応する初期値算出ルールは、距離閾値を距離の最大値の65%とし、連続最小時間を動作の平均長さに0.5を乗じた値とし、連続最大時間をそのままとし、基底関数の数を5とする内容である。
また、例えば、中レベルに対応する初期値算出ルールは、距離閾値を距離の最大値の60%とし、連続最小時間を動作の平均長さに0.5を乗じた値とし、連続最大時間をそのままとし、基底関数の数を5とする内容である。
また、例えば、高レベルに対応する初期値算出ルールは、距離閾値を距離の最大値の50%とし、連続最小時間を動作の平均長さに0.25を乗じた値とし、連続最大時間を動作の平均長さに0.75を乗じた値とし、基底関数の数を8とする内容である。
ここでは、上述の初期値算出ルールが適用され、元の標準動作データにおいて、標準動作数Jが10、平均再生時間が20秒である場合を想定する。このとき、連続最小時間の初期値は、低レベルおよび中レベルにおいて1秒、高レベルにおいて0.5秒となり、連続最大時間は、低レベルおよび中レベルにおいて2秒、高レベルにおいて1.5秒となる。
なお、以上説明した各実施の形態では、動作データを動画像データとしたが、これに限定されない。動作データとして、動作から得られる距離データ、温度データ、加速度データ、磁気データ、音データ等、動作の特徴を示す特徴量を抽出可能な各種データを採用することができる。これらの場合、センサ装置は、距離センサ、温度センサ、加速度センサ、および磁気センサ、集音センサ等の適切な装置とする必要がある。
また、動作解析装置は、解析結果の提示を、画面表示と併せて、または画面表示に代えて、音声出力により行っても良い。この場合、主力装置を、ラウドスピーカ等とする必要がある。
(実施の形態5)
CHLAC特徴量の位置毎の時間積分値を用いて、主成分分析等により動作評価を行う動作評価手法が、例えば特許文献2に記載されている。特許文献2の方法を用いることにより、少ない処理負荷で、映像において比較対象動作と標準動作との差異の程度が大きい位置を、ユーザに提示することができる。
ところで、例えば、ピアノ演奏において親指でドの音を弾いて次に中指でミの音を弾くのが正しい動作であるときに、中指でミの音を弾いて次に親指でドの音を弾くと、異なる曲になってしまう。したがって、このような動作が行われたとき、映像における中指の位置と親指の位置とを提示することが望まれる。
また、例えば、製品の組み立て工程におけるねじ締め動作が、正しい順番と異なる順番で行われている場合にも、比較対象動作の映像におけるその動作が行われている位置を提示することが望まれる。ねじ締めの順番は、製品の安全性や作業効率に関わる重要な問題だからである。
すなわち、個々の動作は正しいけれども動作の順序が異なるような一連の動作(以下「順序違い動作」という)が発生している場合に、その動作の位置が提示されることが望ましい。
しかしながら、非特許文献2記載の方法では、順序違い動作の時間を抽出することはできても、順序違い動作の位置を自動で抽出することはできない。なぜなら、非特許文献2記載の方法は、CHLAC特徴量を空間積分した、位置不変の値を用いるからである。
また、特許文献2記載の方法では、個々の動作は正しいことから、順序違い動作の発生をそもそも検出することができない。なぜなら、特許文献2記載の方法は、CHLAC特徴量を時間積分した、時間不変の値を用いるからである。
時間を細かく区切って特許文献2記載の方法を適用すれば、区切られた時間毎に、順序違い動作の位置を抽出することは可能である。ところが、このような処理は煩雑であるため、特に、標準動作の映像データと比較対象動作の映像データとで時間長さが異なる場合に、装置の処理負荷が高くなる。すなわち、従来技術には、順序違い動作の位置を容易に抽出することができないという課題がある。
そこで、本発明の実施の形態5として、順序違い動作の位置を容易に抽出することができるようにした動作解析装置について説明する。
以下、本発明の実施の形態5について、図面を参照して詳細に説明する。
図17は、本発明の実施の形態5に係る動作解析装置を含む動作解析システムの構成の一例を示すシステム構成図である。
本実施の形態は、実施の形態1〜実施の形態4と同様に、本発明を、熟練作業者と一般作業者とが働く工場において各一般作業者の動作を解析するためのシステムに適用した例として説明する。但し、本実施の形態における動作解析システムは、一般作業者と熟練作業者とで大きく異なる動作の位置を抽出する。
図17において、本実施の形態に係る動作解析システム100eは、センサ装置200、本実施の形態に係る動作解析装置300e、出力装置400、入力装置500を有する。
センサ装置200は、人の動作を検出する装置である。センサ装置200は、作業者の動作を計測したデータを、動作解析装置300eへ出力する。ここでは、センサ装置200は、撮影した画像の画像フレームデータ(動画像データ)をリアルタイムに出力するカメラであり、工場の組み立てラインに並んで作業する各作業者を個別に撮影可能であるものとする。
以下、実施の形態1〜実施の形態4と同様に、熟練作業者による一連の標準動作を撮影した時系列のフレームデータを「標準動作データ」といい、一般対象者による一連の比較対象動作を撮影した時系列のフレームデータを「比較対象動作データ」という。また、標準動作データおよび比較対象動作データは、適宜「動作データ」と総称する。また、比較
対象動作データを構成するフレームのうち、1つの解析の対象となる連続した複数のフレームを、「対象フレーム」という。
また、本実施の形態における動作解析システム100eは、画像特徴量に基づいて、動作解析を行う。本実施の形態では、画像特徴量として、非特許文献2に開示されているCHLAC特徴を用いる。
本実施の形態において、標準動作データから得られる画像特徴量は「標準特徴量」といい、標準動作データから得られる標準特徴量のデータは、「標準特徴量データ」という。また、比較対象動作データから得られる画像特徴量は、「比較対象特徴量」といい、比較対象動作データから得られる比較対象特徴量のデータは、「比較対象特徴量データ」という。また、標準特徴量データおよび比較対象特徴量データは、適宜「特徴量データ」と総称する。
動作解析装置300eは、標準動作との比較により比較対象動作の解析を行う装置である。動作解析装置300eは、比較対象特徴量データと標準特徴量データとから、各時刻の画像における比較対象動作と標準動作との差異(以下、適宜「動作の差異」という)の大きさを表す値である時間重みを抽出する。次に、動作解析装置300eは、抽出した時間重みを用いて、比較対象特徴量データと標準特徴量データのそれぞれの重み付き位置特徴量を算出する。
ここで、時間重みとは、各時刻の標準特徴量および比較対象特徴量から算出された、時刻毎の画像特徴量の違いの度合いを示す。時間重みは、ある時刻においてその値が高ければ、その時刻の標準特徴量と比較対象特徴量との差異が大きいことを示し、ある時刻においてその値が少なければ、その時刻の標準特徴量と比較対象特徴量との差異が小さいことを示す。
動作解析装置300eは、例えば、時刻毎に、標準特徴量から標準部分空間を生成しておき、標準部分空間と比較対象特徴量との距離を算出して、各時刻の時間重みを求める。標準部分空間との距離の算出方法は公知の技術である。
例えば、各動作データは、各動作データ開始点を時刻t=0とし、毎秒30フレームの画像が300eフレーム分(10秒分)存在するとする。この場合、窓サイズを1とすると、窓毎のCHLAC特徴量は、298個取ることができる(ひとつのCHLAC特徴量を算出するのに3フレーム必要なため)。ここで、標準動作データが30フレーム分ある場合、動作解析装置300eは、窓毎に、標準動作データから、CHLAC特徴量のフレーム時刻である1/30秒から9+28/30秒までの298個の標準部分空間を算出する。次に、動作解析装置300eは、それぞれの標準部分空間に対する比較対象特徴量の距離に基づき、時間重みを求める。例えば、動作解析装置300eは、ここで求めた298個の距離を、平均0、分散1で標準化した値を、各時刻の時間重みの値としてもよい。
なお、ここでは、各時刻の画像特徴量に各フレームの画像特徴量をそのまま適用する例を説明したが、動作データによってフレーム数が異なる場合には、動作解析装置300eは、時間的な伸縮を吸収するようにしてもよい。具体的には、例えば、動作解析装置300eは、標準動作データの平均時間を基準に、フレーム間隔を伸縮させることによって各動作データの時刻を換算時刻に変換した後、必要な換算時刻の画像特徴量を推定して、上記処理を行う。
例えば、画像特徴量の抽出は、フレームレートFを毎秒20フレーム(フレーム間隔D=0.05秒)として行う。また、標準動作データの平均時間pは、10秒(200フレ
ーム)であり、ある標準動作データの時間qは、8秒(160フレーム)とする。この場合、その標準動作のフレーム間隔は、D’=0.0625秒(=p/Fq)に換算される。そして、例えば、1番目のフレームの換算時刻はt=0、2番目のフレームの換算時刻はt=0.0625、j番目のフレームの換算時刻はt=0.0625(j−1)=pj/Fqとなる。
ここで、動作解析装置300eは、j番目のフレームの換算時刻D(j−1)の画像特徴量を、換算時刻D(j−1)に一番近い換算時刻のフレームの画像特徴量を用いて算出しても良い。また、動作解析装置300eは、j番目のフレームの換算時刻D(j−1)の画像特徴量を、隣接する二つのフレームの画像特徴量から推定により算出しても良い。
例えば、動作解析装置300eは、換算時刻t=0.5の画像特徴量を求める場合、換算時刻t=0.5の8番目のフレームの画像特徴量を利用する。また、動作解析装置300eは、換算時刻t=0.55の画像特徴量を、換算時刻が一番近い換算時刻t=0.5625の9番目のフレームの値を用いて算出しても良い。また、動作解析装置300eは、時刻t=0.55と隣接する8番目と9番目のフレームから推定して算出してもよい。
動作解析装置300eは、換算時刻が一番近いフレームの画像特徴量を用いる場合、動作データの長さの違いを吸収しつつ処理負荷を軽減することができる。また、動作解析装置300eは、推定により算出を行う場合、より正確な結果を出すことができる。
図18は、推定により画像特徴量を算出する方法の一例を示す図である。
図18に示すように、換算時刻nは、換算時刻t=0.5625(9番目のフレーム)、換算時刻mは、換算時刻t=0.5(8番目のフレーム)とする。ここでは、換算時刻t=0.55である換算時刻kの画像特徴量を推定するものとする。
ここで、例えば、画像特徴量の算出は、換算時刻nのフレームの251次元の画像特徴量をVnとし、換算時刻mのフレームの251次元の画像特徴量をVmとし、換算時刻kのフレームの251次元の画像特徴量をVkとする。
この場合、動作解析装置300eは、例えば、画像特徴量V
n、V
mから、以下の式(4)を用いて、画像特徴量V
kの次元毎に、画像特徴量V
kを算出する。
すなわち、動作解析装置300eは、図18に示す時間と値の差分との比例関係を想定して、画像特徴量Vkを推定する。
例えば、画像特徴量Vnの第1次元の値が45000で、画像特徴量Vmの第1次元の値が40000であるとする。この場合、動作解析装置300eは、画像特徴量Vkの第1次元の値として、40000+(45000−40000)×0.05/0.625=40400を算出する。動作解析装置300eは、残りの250次元の値についても、同様に算出する。
ここでは、画像特徴量として251次元の値を算出する方法を説明したが、動作解析装置300eは、主成分分析を行って次数を削減した後の値を用いて推定してもよい。こうすることで、計算量が削減される。また、ここでは、2点を用いて一次関数による推定を
行うとしたが、動作解析装置300eは、多数の点を用いて二次関数や三角関数など他の関数を用いて推定を行っても良い。こうすることで、さらに推定精度の向上が見込まれる。
動作解析装置300eは、このような方法により、標準動作データおよび比較対象動作データの全て、および標準部分空間を作成する換算時刻の全てについて、画像特徴量を算出する。その後、動作解析装置300eは、推定を行わない場合と同様に、標準動作データから算出した画像特徴量から、時間重みを算出する時刻ごとに標準部分空間を生成する。次に、動作解析装置300eは、それぞれの標準部分空間と、対応する比較対象動作データから算出した画像特徴量との距離を算出して、時間重みとする。
また、重み付き位置特徴量とは、時間重みを特徴量データに適用した値の、位置毎の時間積分である。重み付き位置特徴量は、言い換えれば、時間重み対応画素対応CHLAC特徴量である。つまり、重み付き位置特徴量は、特定画素の近傍の画素の濃淡値の積に時間重みを付与し、対象フレーム全体に対して足し合わせて得られる、非常に局所的な特徴量である。例えば、時間重みの付加されていない画素対応CHLAC特徴量に関しては、非特許文献3に記載されているので説明は省略する。
そして、動作解析装置300eは、時間重みと比較対象特徴量データとから得られた重み付き位置特徴量のデータと、時間重みと標準特徴量データとから得られた重み付き位置特徴量のデータとを取得する。次に、動作解析装置300eは、取得した重み付き位置特徴量のデータと重み付き位置特徴量のデータとから、比較対象動作の標準動作との差異の大きさを表す値である位置重みを抽出する。なお、以下、比較対象特徴量データの重み付き位置特徴量のデータは、以下「比較対象位置特徴量データ」といい、標準特徴量データの重み付き位置特徴量のデータは以下「標準位置特徴量データ」という。更に、動作解析装置300eは、各位置の位置重みを、比較対象動作の映像における各位置の重要度として示す結果表示画面のデータを生成し、出力装置400へ出力する。なお、以下、標準位置特徴量データおよび比較対象位置特徴量データは、適宜「位置特徴量データ」と総称する。
ここで、位置重みとは、位置特徴量データの差異について、各画素のd次元の特徴量ベクトルを並べた行列の分散を最大化するように、フィッシャー判別基準等により最適化された、映像面上の位置の重みを指す。
なお、動作データによって画像サイズが異なる場合には、動作解析装置300eは、画素数の増減により画像サイズの違いを吸収するようにしてもよい。具体的には、例えば、動作解析装置300eは、標準動作データの画素数を基準に、画像サイズを伸縮させることによって各動作データの位置を換算位置に変換した後、必要な換算位置の画像特徴量を推定して、上記処理を行う。
動作解析装置300eは、CPUおよびRAM等の記憶媒体、動画像データを取り込むビデオキャプチャを有するコンピュータとする。すなわち、動作解析装置300eは、記憶する制御プログラムをCPUが実行することによって動作する。
出力装置400は、動作解析装置300eから入力されるデータに基づいて、結果表示画面を出力する。ここでは、出力装置400は、液晶ディスプレイを有するモニタであるものとする。なお、出力装置400は、遠隔地に配置された装置(遠隔監視装置、携帯電話機等)であっても良い。この場合、出力装置400は、例えば、インターネット等のネットワークを介して動作解析装置300eと接続される。
入力装置500は、ユーザが動作解析装置300eを操作するためのインタフェースである。ここでは、入力装置500は、例えば、ポインティングデバイスとしてのマウスと、キーボードである。
このような動作解析システム100eは、まず、時間軸での動作の差異の大きさを示す時間重みを算出する。次に、動作解析システム100eは、時間重みを特徴量データに適用して得られる位置特徴量データから、映像面(フレーム毎の空間)での動作の差異の大きさを示す位置重みを算出する。そして、動作解析システム100eは、算出した位置重みを、比較対象動作の映像における各位置の重要度として示す結果表示画面を生成し、ユーザに提示する。これにより、動作解析システム100eは、順序違い動作であっても、処理負荷を低減可能であることおよび加法性等のCHLAC特徴量の利点を活かし、その動作の位置を容易に抽出してユーザに提示することができる。
次に、動作解析装置300eの構成について説明する。
図19は、動作解析装置300eの構成の一例を示すブロック図である。
図19において、動作解析装置300eは、動作データ入力部310、時間重み抽出部331e、重み付き位置特徴量抽出部332e、位置重み抽出部333e、および表示情報生成部350を有する。
動作データ入力部310は、時間重み抽出部331eからの要求に応じて、センサ装置200から動作データを取得し、時間重み抽出部331eおよび表示情報生成部350へ転送する。動作データの転送は、リアルタイムで行われても良いし、動作データを格納してから行われても良い。また、動作データ入力部310は、センサ装置200から入力する動作データを、入力装置500のユーザ操作を受けて、入力時または入力後に標準動作データと比較対象動作データとのいずれかに分類する。動作データ入力部310は、一旦入力した標準動作データを、再使用のために格納しておいても良い。
時間重み抽出部331eは、動作データから画像特徴量を抽出し、特徴量データ(標準特徴量データおよび比較対象特徴量データ)を生成する。そして、時間重み抽出部331eは、生成した標準特徴量データおよび比較対象特徴量データから、時間重みを抽出し、フレーム毎に重みを定義する時間重みマップを生成する。時間重みマップは、比較対象動作データの各フレームの時間重みを記述したデータである。そして、時間重み抽出部331eは、生成した時間重みマップと、特徴量データ(標準特徴量データおよび比較対象特徴量データ)とを、重み付き位置特徴量抽出部332eへ出力する。
重み付き位置特徴量抽出部332eは、時間重みマップと、特徴量データ(標準特徴量データおよび比較対象特徴量データ)とから、重み付き位置特徴量(標準位置特徴量および比較対象位置特徴量)を算出し、位置特徴量データを算出する。そして、重み付き位置特徴量抽出部332eは、算出した位置特徴量データ(標準位置特徴量データおよび比較対象位置特徴量データ)を、位置重み抽出部333eへ出力する。
位置重み抽出部333eは、比較対象位置特徴量データおよび標準位置特徴量データから、位置重みを抽出し、位置毎に重みを定義する位置重みマップを生成する。位置重みマップは、比較対象動作データの映像の各位置の位置重みを記述するデータである。そして、位置重み抽出部333eは、生成した位置重みマップを、表示情報生成部350へ出力する。
表示情報生成部350は、位置重みマップと、動作データとから、各位置の位置重みを
比較対象動作の映像における各位置の重要度として示す結果表示画面のデータを生成する。そして、表示情報生成部350は、生成した結果表示画面のデータを、出力装置400に出力する。結果表示画面の詳細については後述する。
重み付き位置特徴量は、上述の通り、時間重みを特徴量データに適用した値の、位置毎の時間積分である。また、時間重みは、動作の差異がより大きい時間において、より大きい値を取る。すなわち、各位置の重み付き位置特徴量は、動作の差異が大きい時間が存在すると大きくなり、例えば、順序違い動作が発生していると、その動作の位置に対応して大きくなる。また、位置重みは、重み付き位置特徴量がより大きい位置において、より大きい値を取る。
したがって、上述の構成を有する動作解析装置300eは、順序違い動作が存在するとき、その動作に対応する位置の位置重みを強調することができ、順序違い動作の位置を抽出してユーザに提示することができる。
次に、動作解析装置300eの動作について説明する。
図20は、動作解析装置300eの動作の一例を示すフローチャートである。
まず、ユーザは、例えば、対象の動作を含む作業の担当を、休み時間を挟んで熟練作業者と一般作業者とで交代して貰い、それぞれの動作を撮影するように、動作解析装置300eを操作する。このようにすることで、動作評価のための時間を特に必要とすることなく作業者にも負荷をかけないため、工場の生産性に影響を与えることなく動作解析のためのデータ取得を行うことができる。
この結果、動作データ入力部310は、ステップS3100eにおいて、標準動作データと比較対象動作データとを入力する。そして、動作データ入力部310は、入力した標準動作データおよび比較対象動作データを、時間重み抽出部331eからの要求に応じて、時間重み抽出部331eおよび表示情報生成部350へ出力する。なお、動作データ入力部310は、過去に入力した標準動作データを格納している場合には、その標準動作データを時間重み抽出部331eへ出力しても良い。
そして、ステップS3200eにおいて、時間重み抽出部331eは、動作データから画像特徴量を抽出し、特徴量データ(標準特徴量データおよび比較対象特徴量データ)を生成する。
具体的には、時間重み抽出部331eは、例えば、以下の式(5)に示すN次自己相関関数を用いて、位置毎および時間毎の画像特徴量Vを算出する。
ここで、fは時系列画像であり、変数rおよびN個の変数ai(i=1,・・・,N)は画像内の2次元座標と時間とを成分として持つ3次元のベクトルである。時間方向の積分範囲は、どの程度の時間方向の相関を取るかによって定まる。すなわち、積分範囲は、N枚の静止画像(局所特徴画像)から構成される3次元のピクセル集合であり、変数rは画像中の1ピクセル(位置ピクセル)であり、変数aはrからの変位ベクトルである。そして、f(r)は位置rの関数値であり、局所特徴画像の位置rの輝度値を表す。
CHLAC特徴量の場合、変位は3次元であり、変位ベクトルの組み合わせ(変位パターン)の数は、0次で1個、1次で13個、2次で237個である。したがって、本実施の形態における画像特徴量は、2値化画像の場合、合計251次元の特徴ベクトルとして表される。
ステップS3300eにおいて、時間重み抽出部331eは、標準特徴量データおよび比較対象特徴量データから時間重みマップを生成し、標準特徴量データおよび比較対象特徴量データと併せて、重み付き位置特徴量抽出部332eへ出力する。
ステップS3400eにおいて、重み付き位置特徴量抽出部332eは、標準特徴量データに時間重みマップを適用して標準位置特徴量データを算出し、比較対象特徴量データに時間重みマップを適用して比較対象位置特徴量データを算出する。そして、重み付き位置特徴量抽出部332eは、算出した標準位置特徴量データおよび比較対象位置特徴量データを、位置重み抽出部333eへ出力する。
具体的には、重み付き位置特徴量抽出部332eは、以下に示す、式(6)で表される時間重みw
tと、式(7)で表される実数の画像特徴量V
t,x,yとから、式(8)を用いて、重み付き位置特徴量V
x,y(チルダ)を算出する。そして、重み付き位置特徴量抽出部332eは、映像面全体についての時間特徴量V
x,y(チルダ)を並べたデータを、位置特徴量データとして位置重み抽出部333eへ出力する。ここで、記号tは比較対象動作の映像における時間(フレームに対応)を示し、記号x,yはフレーム毎の空間(映像面)における2次元位置を示し、記号dは画像特徴量の次元数を示し、記号τは時間方向の積分範囲を示す。
そして、ステップS3500eにおいて、位置重み抽出部333eは、標準位置特徴量データおよび比較対象位置特徴量データから、位置重みマップを生成し、表示情報生成部350へ出力する。
そして、ステップS3600eにおいて、表示情報生成部350は、位置重みマップと、標準動作データおよび比較対象動作データとから、抽出結果を提示する結果表示画面を生成し、出力装置400に表示させる。
そして、ステップS3700eにおいて、動作解析装置300eは、ユーザ操作等により解析処理の終了を指示されたか否かを判断する。動作解析装置300eは、解析処理の終了を指示されない場合には(S3700e:YES)、ステップS3100eへ戻り、解析処理の終了を指示された場合には(S3700e:NO)、一連の動作を終了する。
上記の動作により、動作解析装置300eは、時間重みwx,ytを算出後、その時間重みwx,ytを特徴量データVt,x,y(チルダ)に適用して得られる位置特徴量データVx,y(チルダ)から位置重みwx,yを算出する。次に、動作解析装置300eは、算出した位置重みwx,yを、映像の各位置の重要度として提示することができる。
以下、順序違い動作の一例を挙げて、各パラメータの状態および結果表示画面について説明する。
図21は、想定する標準動作の映像および比較対象動作の映像を示す図である。
図21に示すように、標準動作の映像601と比較対象動作の映像602の撮影アングルは同じである。したがって、動作解析装置300eは、同じ動作を同じ順序で行う場合、撮影アングルおよび撮影画素数を同じくすることにより、映像上の動きの向き、大きさ、順序もほぼ同一となる。
図22は、想定する標準動作および比較対象動作の内容と、その場合の時間重みマップの一例とを示す図である。
標準動作の例は、図22Aに示すように、以下の動作を含む。
(1)左側から第1の部品を取り正面に設置し、
(2)左手を斜め左に伸ばして第2の部品を取って第1の部品に取り付け、
(3)左手を前に伸ばして第3の部品を取って第1の部品に取り付け、
(4)右手を前に伸ばして第4の部品を取って第1の部品に取り付け、
(5)第2〜第4の部品が取り付けられた第1の部品を右側に置く。
一方、比較対象動作の例は、図22Bに示すように、以下の動作を含む。
(1)左側から第1の部品を取り正面に設置し、
(2)左手を前に伸ばして第3を取って第1の部品に取り付け、
(3)左手を斜め左に伸ばして第2の部品を取って第1の部品に取り付け、
(4)右手を前に伸ばして第4の部品を取って第1の部品に取り付け、
(5)第2〜第4の部品が取り付けられた第1の部品を右側に置く。
すなわち、比較対象動作は、2番目の動作と3番目の動作の順序が、標準動作と異なっており、順序違い動作を含んでいるものとする。
この場合、標準特徴量データと比較対象特徴量データとの差異は、(2)および(3)の動作の箇所において大きくなる。したがって、動作解析装置300eが算出する時間重みは、図22Cに示すように、(2)および(3)の動作の箇所において大きくなる。
図23は、図22に示す動作における各時刻の時間重みの例を示す図である。ここでは、網掛けの濃さは時間重みの大きさを示す。また、各記号の添え字は、対応する時刻tを示すものとする。また、時刻t=1〜5は、順に、図22に示す動作(1)〜(5)に対応しているものとする。すなわち、順序違い動作は、時刻t=2、3において発生している。
図23Aに示すように、時間重みw1〜w5のうち、順序違い動作に対応する時間重みw2、w3の値が大きくなる。画像特徴量V1〜V5は、動作(1)〜(5)が行われている位置において大きな値となる。すなわち、例えば、時刻t=1のフレームでは、動作(1)が行われている位置(左手が左側から正面に移動する範囲)の画像特徴量Vt,s,yは大きい値となり、その他の位置の画像特徴量Vt,s,yは小さい値となる。
したがって、動きの大きい順序違い動作が存在するとき、その動作位置の重み付き位置特徴量Vx,y(チルダ)は、図23Bに示すように、時刻毎に画像特徴量Vt,s,yに時間重みwtを乗じた値を積分して算出することで、大きい値となる。そして、動きの大きい順序違い動作が存在するとき、その動作が行われた位置の位置重みwx,yも、大きい値となる。一方、それ以外の位置の重み付き位置特徴量Vx,y(チルダ)および位置重みwx,yは、画像特徴量Vx,yが小さいことから、時間重みwtによらずに小さい値となる。
重み付き位置特徴量Vx,y(チルダ)を算出する際の積分範囲(τ)が対象フレームの全体長に比べて短いとき、重み付き位置特徴量Vx,y(チルダ)の大きさは、積分範囲の位置によって異なる。
図24は、各区間における位置重みwx,yの分布(位置重みマップ)の一例を示す図である。ここで、網掛けの濃さは位置重みwx,yの大きさを示す。
時刻t=2と時刻t=3とでは、左手を出す方向が異なることから、動作が行われている位置は異なる。したがって、図24に示すように、例えば、時刻t=2を中心とした区間P=1と、時刻t=3を中心とした区間P=2とでは、位置重みマップの内容が異なることになる。
表示情報生成部350は、例えば、1つの区間の情報のみを提示する場合には、位置重みwx,yの値が大きい位置を目立たせる結果表示画面を生成する。例えば、表示情報生成部350は、位置重みwx,yの値が大きい位置を含む一まとまりのエリア(以下「重要エリア」という)を設定する。次に、表示情報生成部350は、重要エリアの位置重みwx,yの平均値が高いほど、重要エリアを囲む線をより濃い色にしたりより太くしたりする。また、例えば、表示情報生成部350は、重要エリアの映像のみを鮮明に表示し、他の部分の映像をぼやかして表示する結果表示画面を生成する。
図25は、結果表示画面の一例を示す図である。
図25に示すように、結果表示画面610eは、解析結果表示領域611、再生ボタン612、比較対象動作表示領域613、一時停止ボタン614、終了ボタン615、および標準動作表示領域616を有する。
結果表示画面610eは、解析結果表示領域611に、時間重みの時系列データ(重みマップ)617と、所定の閾値を示す閾値表示線618と、時間重みが閾値表示線618を超える区間を示すマーカ619とを表示する。また、結果表示画面610eは、入力装置500から左右に移動操作可能な、再生箇所表示線620を表示する。
結果表示画面610eは、再生ボタン612がクリックされると、比較対象動作の撮影画像を比較対象動作表示領域613で再生すると共に、再生箇所表示線620を、再生に合わせて移動させる。また、結果表示画面610eは、画像の再生中に一時停止ボタン614がクリックされると、画像の再生を一時的に停止する。また、標準動作表示領域616は、比較対象動作表示領域613における比較対象動作の撮影画像の再生と同期して、標準動作の撮影画像を再生する。
そして、結果表示画面610eは、比較対象動作の撮影画像に重ねて、重要エリアを示す枠線621eを表示する。枠線621eは、例えば、時間重みが閾値表示線618を超える区間において、濃い色となり、他の表示区間において、薄い色となる。
このような結果表示画面610eにより、ユーザは、再生箇所表示線620をマーカ619部分に移動させて再生ボタン612をクリックすることができる。そして、この操作により、ユーザは、順序違い動作等によって動作の差異が大きい箇所の映像を、素早くピックアップして確認することができる。また、重要エリアを示す枠線621eが表示されるので、ユーザは、動きの差異が大きく、解析対象として重要度が高い箇所を、素早くピックアップして確認することができる。すなわち、ユーザは、画像の中のどこを注目して見るべきなのかを、簡単に把握することができる。また、ユーザは、枠線621eの濃さが時間重みに対応しているので、重要度の高さを併せて確認しながら、動きの差異を映像で確認することができる。
なお、枠線621eの形状および大きさは、固定であっても良いし、重要エリアの形状に合わせた形状および大きさであっても良い。また、結果表示画面610eは、標準動作データの画像と比較対象動作データ画像とを、同時に、または切り換えて表示しても良い。また、結果表示画面610eは、動作に関連する他のデータ、例えば、動作データの撮影日時や比較対象物の加速度データや音声を、併せて出力しても良い。
また、結果表示画面610eの解析結果表示領域611は、標準特徴量および比較対象特徴量の主成分スコアを併せて出力しても良い。例えば、図26に示すように、結果表示画面610eの解析結果表示領域611は、画像特徴量の主成分スコアを、時間を横軸にとった3次元グラフ700を含んでも良い。3次元グラフ700は、例えば、標準動作特徴量を線711で結び、比較対象特徴量を線721で結ぶ。このように、結果表示画面610eは、3次元表示を行うことによって、時間重みだけでなく、動作とともに画像特徴量の変化を分かり易く表示することができる。
以上のように、本実施の形態に係る動作解析装置300eは、時間重みを算出後に、時間重みを特徴量データに適用して得られる位置特徴量データから、映像の各位置の重要度を示す位置重みを算出するものである。これにより、本実施の形態に係る動作解析装置300eは、順序違い動作を容易に抽出することができる。すなわち、時間を細かく区切ることなく、CHLAC特徴量の利点を活かして、順序違い動作を抽出することができる。
また、動作解析装置300eは、映像の位置重みが高い位置を表示するので、動作の差異が大きい位置をユーザに提示することができる。また、動作解析装置300eは、映像の時間重みが高い時間を表示するので、動作の差異が大きい時間箇所をユーザに提示することができる。すなわち、動作解析装置300eは、ユーザに対して、映像でチェックすべき動作を提示することができる。
なお、本実施の形態では、標準特徴量データに適用する時間重みマップと比較対象特徴量データに適用する時間重みマップとを同一としたが、本発明はこれに限定されない。例えば、標準特徴量データに適用する時間重みマップは、固定された分布の時間重みマップや、全てのフレームにおいて一定値の時間重みマップとしても良い。一定値としては、例えば、対象フレームの最初の時間重みの値、対象フレームにおける時間重みの平均値、対象フレームにおける時間重みの最低値を採用することができる。また、時間重みは、上限値を設けても良い。上限値としては、例えば、対象フレームにおける時間重みの平均値を採用することができる。これにより、標準動作と比較対象動作との間の重み付き位置特徴量の差異がより明確になることがある。
また、動作解析装置は、まず、時間重みに基づいて提示の対象となる時間区間を抽出し、抽出した時間区間毎に位置重みを算出してもよい。これにより、より適切な位置重みを算出することが可能となる。
また、本実施の形態では、時間重みについて標準画像に基づき時間的な伸縮を吸収したが、フーリエ級数展開を導入しても良い。フーリエ級数を導入した時間重みは、特徴量データの差異について、フーリエ級数展開の導入により時間的な伸縮を吸収する。更に、フーリエ級数を導入した時間重みは、各画素のd次元の特徴量ベクトルを並べた行列の分散を最大化するように、フィッシャー判別基準等により最適化された、時間軸上の周波数重みを指す。最適化された時間重みは、動作に差があるフレームほど大きくなるという特性を有し、かつ、動作を時系列に評価しつつ各動作データの長さの違いを吸収するという効果を有する。時間重みの詳細については、例えば非特許文献2に記載されているため、ここでの説明を省略する。
また、本実施の形態では、動作解析装置300eは、標準動作データから算出した各時間の標準部分空間と、対応する比較対象動作データから算出した画像特徴量との距離を算出して、時間重みとした。また、動作解析装置300eは、算出した距離に基づいて正規化等の処理をおこなった後の値を、時間重みとしても良い。また、動作解析装置300eは、時間特徴量データの差異について、各時間のd次元の特徴量ベクトルを並べた行列の分散を最大化するように、フィッシャー判別基準等により最適化された値としてもよい。
また、標準動作の映像と比較対象動作の映像とで時間長さが同じ、または、異なる場合であっても同じ時間長さに伸縮される場合には、本実施の形態で説明したように、必ずしも導入しなくても良い。また、かかる場合には、時間重みを、単にフレーム毎の画像特徴量の差としても良い。また、位置重みは、単に位置毎の重み付き位置特徴量の差としても良い。
また、本実施の形態では、画像特徴量をCHLAC特徴量として説明したが、これに限定されない。画像特徴量として、例えば、重み付き方向ヒストグラムを用いた高次の局所特徴量等を用いることができる。かかる特徴量を用いる場合、動作解析装置は、濃度勾配画像から画像の局所的な方向ヒストグラムを求め、求めた方向ヒストグラムを特徴ベクトルとすれば良い。このような画像特徴量を用いた場合でも、順序違い動作の位置を容易に抽出することができる。
また、本実施の形態では、時間重みの算出および位置重みの算出を行う際に、同一のセンサから取得したデータを用いたが、異なるセンサから取得したデータを用いても良い。本実施の形態では、例えば、同じ種類のセンサであるカメラセンサから取得したデータを用いても良い。この場合、時間重みの算出に用いる標準データは、水平方向だけでなく垂直方向の動きも捕らえやすいやや斜め前方から取得したデータとし、位置重みの算出に用いるデータは真上から取得したデータとしても良い。こうすることで、目的に応じて、より適切な時間重みや位置重みを抽出することができる。
更に、例えば、時間重みの算出には、加速度センサから取得したデータを用い、位置重みの算出にはカメラセンサから取得したデータを用いるようにしても良い。本実施の形態では、例えば、カメラセンサから取得したデータを用いて時間重みを算出し、加速度センサから取得したデータで時間重みを算出する。この場合は、カメラセンサに水平方向や垂直方向に死角や誤差があっても、カメラセンサの弱点を補うことができる。加速度センサから取得したデータを用いる場合にも、局所特徴量を算出した後は、画像から算出した特徴量と同様に時間重みを算出する。例えば、加速度センサを動作者の両手首に装着した場合は、両手の6次元と加速度データ間の相関関係の15次元とを合わせた21次元の特徴量を、加速度センサの局所特徴量として算出すれば良い。また、評価する動作に用いる道具には、加速度センサを装着させておくことも考えられる。こうすることで、動作者に加速度センサを装着せずに、異なるセンサの特性を生かした動作評価が可能となる。
(実施の形態6)
例えば、製品の組み立て工程において、右手と左手が異なる作業を行うことがある。具体的には、例えば、右手で電動ドライバのような工具を持ち、左手でネジのような部品を取って支え、ネジ留めをするような作業である。このように、右手で大きい工具を持ち左手で小さい部品を取って作業を行うときに、左手が無駄な動作をしていると、作業効率が低下する。したがって、このような動作が行われたとき、その動作が発生した時間の映像を提示することが望まれる。
しかしながら、このような例の場合、上述の特許文献2および非特許文献2に記載の方法では、左手の無駄な動作を抽出することが困難である。
理由は以下の通りである。上述の例の場合、右手の動作に大きい工具の動きが付随し、左手の動作に小さい部品の動きが付随する。したがって、右手の動作に関連する動きが映像面を占める面積に比べて、左手の動作に関連する動きが映像面を占める面積は小さい。
CHLAC特徴量を空間積分した値を用いる非特許文献2記載の方法では、左手の動作を示す画像特徴量が積分値に与える影響は小さくなり、左手の無駄な動作の時間を適切に抽出することは難しい。更に、右手の動作を示す画像特徴量が積分値に与える影響は大きいため、このような大きい動きが他に存在すると、動作時間の抽出がより困難となる。
また、特許文献2記載の方法では、左手の無駄な動作の位置を抽出することはできても、左手の無駄な動作の時間を自動で抽出することはできない。なぜなら、特許文献2記載の方法は、CHLAC特徴量を時間積分した、位置不変の値を用いるからである。
映像面を細かく区切って非特許文献2記載の方法を適用し、区切られた領域毎に動作評価を行えば、左手の無駄な動作の時間を抽出することは可能である。ところが、このような処理は煩雑であるため、特に、標準動作の映像データと比較対象動作の映像データとで映像の画素数が異なる場合に、装置の処理負荷が高くなる。すなわち、従来技術には、関連する動きが映像面を占める面積は小さいものの、標準動作との差異が大きいような動作(以下「小さい差異動作」という)が発生している場合に、その動作時間を容易に抽出することができないという課題がある。
そこで、本発明の実施の形態6として、小さい差異動作の時間を容易に抽出することができるようにした動作解析装置について説明する。
以下、本発明の実施の形態6について、図面を参照して詳細に説明する。
図27は、本発明の実施の形態6に係る動作解析装置を含む動作解析システムの構成の一例を示すシステム構成図である。
本実施の形態は、実施の形態1〜実施の形態5と同様に、本発明を、熟練作業者と一般作業者とが働く工場において各一般作業者の動作を解析するためのシステムに適用した例として説明する。但し、本実施の形態における動作解析システムは、一般作業者と熟練作業者とで大きく異なる動作の時間を抽出する。
図27において、本実施の形態に係る動作解析システム100fは、センサ装置200、本実施の形態に係る動作解析装置300f、出力装置400、入力装置500を有する。
センサ装置200は、人の動作を検出する装置である。センサ装置200は、作業者の
動作を計測したデータを、動作解析装置300fへ出力する。ここでは、センサ装置200は、撮影した画像の画像フレームデータ(動画像データ)をリアルタイムに出力するカメラであり、工場の組み立てラインに並んで作業する各作業者を個別に撮影可能であるものとする。
以下、実施の形態1〜実施の形態5と同様に、熟練作業者による一連の標準動作を撮影した時系列のフレームデータを「標準動作データ」といい、一般対象者による一連の比較対象動作を撮影した時系列のフレームデータを「比較対象動作データ」という。また、標準動作データおよび比較対象動作データは、適宜「動作データ」と総称する。また、比較対象動作データを構成するフレームのうち、1つの解析の対象となる連続した複数のフレームを、「対象フレーム」という。
また、本実施の形態における動作解析システム100fは、画像特徴量に基づいて、動作解析を行う。本実施の形態では、画像特徴量として、非特許文献2に開示されているCHLAC特徴を用いる。CHLAC特徴は、2次元データからの特徴抽出である高次局所自己相関(HLAC)特徴を、時間軸をも加えて3次元に拡張したものであり、画像の平面空間に時間軸を加えた3次元座標系における動きの特徴を示す特徴ベクトルである。
本実施の形態においても、実施の形態5と同様に、標準動作データから得られる画像特徴量は「標準特徴量」といい、標準動作データから得られる標準特徴量のデータは、「標準特徴量データ」という。また、比較対象動作データから得られる画像特徴量は、「比較対象特徴量」といい、比較対象動作データから得られる比較対象特徴量のデータは、「比較対象特徴量データ」という。また、標準特徴量データおよび比較対象特徴量データは、適宜「特徴量データ」と総称する。
動作解析装置300fは、標準動作との比較により比較対象動作の解析を行う装置である。動作解析装置300fは、比較対象特徴量データと標準特徴量データとから、位置特徴量を抽出する。そして、動作解析装置300fは、この位置特徴量から、映像面の位置毎の比較対象動作の標準動作との差異(以下適宜「動作の差異」という)の大きさを表す値である位置重みを抽出する。次に、動作解析装置300fは、抽出した位置重みを用いて、比較対象特徴量データと標準特徴量データのそれぞれの時間特徴量を算出する。
ここで、位置特徴量は、各時刻の画像上の2次元座標で表現されるある特定の位置の特徴量を、対象フレームの数だけ足した値である。また、位置重みとは、映像面の各位置(以下、単に「位置」という)の標準特徴量および比較対象特徴量から算出された、位置毎の画像特徴量の違いの度合いを示す。位置重みは、ある位置においてその値が高ければ、その位置の標準特徴量と比較対象特徴量との差異が大きいことを示し、ある位置においてその値が少なければ、その位置の標準特徴量と比較対象特徴量との差異が小さいことを示す。位置重みは、非特許文献3に開示されているように、固有重みマップの値を用いても良いし、フィッシャー判別基準を用いたフィッシャー重みマップの値を用いても良い。
なお、動作データによって画素数が異なる場合には、動作解析装置300fは、2次元空間的な伸縮を吸収するようにしてもよい。具体的には、例えば、動作解析装置300fは、標準動作データの画素数を基準に、比較対象データの画素数を増減させてから、上記処理を行う。
また、重み付き時間特徴量とは、位置重みを特徴量データに適用した値の、時間毎(フレーム毎)の空間積分である。重み付き時間特徴量は、言い換えれば、位置重み対応CHLAC特徴量である。つまり、重み付き時間特徴量は、特定画素の近傍の画素の濃淡値の積に位置重みを付与し、画像面全体に対して足し合わせて得られる、非常に局所的な特徴
量である。例えば、位置重みの付与されていないCHLAC特徴に関しては、非特許文献2に記載されているので説明は省略する。
そして、動作解析装置300fは、比較対象特徴量データから得られた重み付き時間特徴量のデータと、標準特徴量データから得られた重み付き時間特徴量のデータとを取得する。次に、動作解析装置300fは、取得した重み付き時間特徴量のデータと重み付き時間特徴量のデータとから、比較対象動作の標準動作との差異の大きさを表す値である時間重みを抽出する。なお、以下、比較対象特徴量データの重み付き時間特徴量のデータは、以下「比較対象時間特徴量データ」といい、標準特徴量データの重み付き時間特徴量のデータは以下「標準時間特徴量データ」という。更に、動作解析装置300fは、各時間の時間重みを、比較対象動作の映像における各時間の重要度として示す結果表示画面のデータを生成し、出力装置400へ出力する。なお、以下、標準時間特徴量データおよび比較対象時間特徴量データは、適宜「時間特徴量データ」と総称する。
ここで、時間重みとは、標準動作データおよび位置重みから算出した各時間の標準部分空間と、対応する比較対象動作データおよび位置重みから算出した画像特徴量との距離とする。
なお、動作データによってフレーム数が異なる場合には、動作解析装置300fは、時間的な伸縮を吸収するようにしてもよい。具体的には、例えば、動作解析装置300fは、標準動作データの平均時間を基準に、フレーム間隔を伸縮させることによって各動作データの時刻を換算時刻に変換した後、必要な換算時刻の画像特徴量を推定して、上記処理を行う。画像特徴量の推定は、推定する時刻に最も近い特徴量で近似してもよいし、推定時刻の前後2点の特徴量を用いて一次関数により行ったり、近傍の複数の点を用いて二次関数や三角関数など他の関数を用いて行っても良い。こうすることで、さらに推定精度の向上が見込まれる。
動作解析装置300fは、CPUおよびRAM等の記憶媒体、動画像データを取り込むビデオキャプチャを有するコンピュータとする。すなわち、動作解析装置300fは、記憶する制御プログラムをCPUが実行することによって動作する。
出力装置400は、動作解析装置300fから入力されるデータに基づいて、結果表示画面を出力する。ここでは、出力装置400は、液晶ディスプレイを有するモニタであるものとする。なお、出力装置400は、遠隔地に配置された装置(遠隔監視装置、携帯電話機等)であっても良い。この場合、出力装置400は、例えば、インターネット等のネットワークを介して動作解析装置300fと接続される。
入力装置500は、ユーザが動作解析装置300fを操作するためのインタフェースである。ここでは、入力装置500は、例えば、ポインティングデバイスとしてのマウスと、キーボードである。
このような動作解析システム100fは、まず、映像面(フレーム毎の2次元空間)での動作の差異の大きさを示す位置重みを算出する。次に、動作解析システム100fは、位置重みを特徴量データに適用して得られる時間特徴量データから、時間軸での動作の差異の大きさを示す時間重みを算出する。そして、動作解析システム100fは、算出した時間重みを、比較対象動作の映像における各時間の重要度として示す結果表示画面を生成し、ユーザに提示する。これにより、動作解析システム100fは、小さい差異動作であっても、処理負荷を低減可能であることおよび加法性等のCHLAC特徴量の利点を活かし、その発生時間を容易に抽出してユーザに提示することができる。すなわち、動作解析システム100fは、動作に付随して動くものの大きさによる影響を抑えた状態で、差異
動作の抽出を行うことができる。
次に、動作解析装置300fの構成について説明する。
図28は、動作解析装置300fの構成の一例を示すブロック図である。
図28において、動作解析装置300fは、動作データ入力部310、位置重み抽出部341f、重み付き時間特徴量抽出部342f、時間重み抽出部343f、および表示情報生成部350を有する。
動作データ入力部310は、位置重み抽出部341fからの要求に応じて、センサ装置200から動作データを取得し、位置重み抽出部341fおよび表示情報生成部350へ転送する。動作データの転送は、リアルタイムで行われても良いし、動作データを格納してから行われても良い。また、動作データ入力部310は、センサ装置200から入力する動作データを、入力装置500のユーザ操作を受けて、入力時または入力後に標準動作データと比較対象動作データとのいずれかに分類する。動作データ入力部310は、一旦入力した標準動作データを、再使用のために格納しておいても良い。
位置重み抽出部341fは、動作データから画像特徴量を抽出し、特徴量データ(標準特徴量データおよび比較対象特徴量データ)を生成する。そして、位置重み抽出部341fは、生成した標準特徴量データおよび比較対象特徴量データから、位置重みを抽出し、位置毎に重みを定義する位置重みマップを生成する。位置重みマップは、比較対象動作データの映像面の各位置の位置重みを記述したデータである。そして、位置重み抽出部341fは、生成した位置重みマップと、特徴量データ(標準特徴量データおよび比較対象特徴量データ)とを、重み付き時間特徴量抽出部342fへ出力する。
重み付き時間特徴量抽出部342fは、位置重みマップと、特徴量データ(標準特徴量データおよび比較対象特徴量データ)とから、重み付き時間特徴量(標準時間特徴量および比較対象時間特徴量)を算出し、時間特徴量データを算出する。そして、重み付き時間特徴量抽出部342fは、算出した時間特徴量データ(標準時間特徴量データおよび比較対象時間特徴量データ)を、時間重み抽出部343fへ出力する。
時間重み抽出部343fは、比較対象時間特徴量データおよび標準時間特徴量データから、時間重みを抽出し、時間毎に重みを定義する時間重みマップを生成する。時間重みマップは、比較対象動作データの映像の各時間の時間重みを記述するデータである。そして、時間重み抽出部343fは、生成した時間重みマップを、表示情報生成部350へ出力する。
表示情報生成部350は、時間重みマップと、動作データとから、各時間の時間重みを比較対象動作の映像における各時間の重要度として示す結果表示画面のデータを生成する。そして、表示情報生成部350は、生成した結果表示画面のデータを、出力装置400に出力する。結果表示画面の詳細については後述する。
重み付き時間特徴量は、上述の通り、位置重みを特徴量データに適用した値の、時間毎(平滑化のためにフレームをいくつか合わせた窓毎)の空間積分である。また、位置重みは、動作の差異がより大きい位置において、より大きい値を取る。すなわち、各時間の重み付き時間特徴量は、動作の差異が大きい位置が存在すると大きくなり、例えば、小さい差異動作が発生していると、その動作の時間に対応して大きくなる。また、時間重みは、重み付き時間特徴量がより大きい位置において、より大きい値を取る。
したがって、上述の構成を有する動作解析装置300fは、小さい差異動作が存在するとき、その動作に対応する時間の時間重みを強調することができ、小さい差異動作の時間を抽出してユーザに提示することができる。
次に、動作解析装置300fの動作について説明する。
図29は、動作解析装置300fの動作の一例を示すフローチャートである。
まず、ユーザは、例えば、対象の動作を含む作業の担当を、休み時間を挟んで熟練作業者と一般作業者とで交代して貰い、それぞれの動作を撮影するように、動作解析装置300fを操作する。このようにすることで、動作評価のための時間を特に必要とすることなく作業者にも負荷をかけないため、工場の生産性に影響を与えることなく動作解析のためのデータ取得を行うことができる。
この結果、動作データ入力部310は、ステップS3100fにおいて、標準動作データと比較対象動作データとを入力する。そして、動作データ入力部310は、入力した標準動作データおよび比較対象動作データを、位置重み抽出部341fからの要求に応じて、位置重み抽出部341fおよび表示情報生成部350へ出力する。なお、動作データ入力部310は、過去に入力した標準動作データを格納している場合には、その標準動作データを位置重み抽出部341fへ出力しても良い。
そして、ステップS3200fにおいて、位置重み抽出部341fは、動作データから画像特徴量を抽出し、特徴量データ(標準特徴量データおよび比較対象特徴量データ)を生成する。
具体的には、位置重み抽出部341fは、例えば、以下の式(9)に示すN次自己相関関数を用いて、位置毎および時間毎の画像特徴量Vを算出する。
ここで、fは時系列画像であり、変数rおよびN個の変数ai(i=1,・・・,N)は画像内の2次元座標と時間とを成分として持つ3次元のベクトルである。時間方向の積分範囲は、どの程度の時間方向の相関を取るかによって定まる。すなわち、積分範囲は、N枚の静止画像(局所特徴画像)から構成される3次元のピクセル集合であり、変数rは画像中の1ピクセル(位置ピクセル)であり、変数aはrからの変位ベクトルである。そして、f(r)は位置rの関数値であり、局所特徴画像の位置rの輝度値を表す。
CHLAC特徴量の場合、変位は3次元であり、変位ベクトルの組み合わせ(変位パターン)の数は、0次で1個、1次で13個、2次で237個である。したがって、本実施の形態における画像特徴量は、2値化画像の場合、合計251次元の特徴ベクトルとして表される。
ステップS3310fにおいて、位置重み抽出部341fは、標準特徴量データおよび比較対象特徴量データから位置重みマップを生成し、標準特徴量データおよび比較対象特徴量データと併せて、重み付き時間特徴量抽出部342fへ出力する。
ステップS3410fにおいて、重み付き時間特徴量抽出部342fは、標準特徴量データに位置重みマップを適用して標準時間特徴量データを算出し、比較対象特徴量データ
に位置重みマップを適用して比較対象時間特徴量データを算出する。そして、重み付き時間特徴量抽出部342fは、算出した標準時間特徴量データおよび比較対象時間特徴量データを、時間重み抽出部343fへ出力する。
具体的には、重み付き時間特徴量抽出部342fは、以下に示す、式(10)で表される位置重みw
x,yと、式(11)で表される実数の画像特徴量V
t,x,yとから、式(12)を用いて、重み付き時間特徴量V
t(チルダ)を算出する。そして、重み付き時間特徴量抽出部342fは、映像面全体についての重み付き時間特徴量V
t(チルダ)を並べたデータを、時間特徴量データとして時間重み抽出部343fへ出力する。ここで、記号tは比較対象動作の映像における時間(フレームに対応)を示し、記号x,yはフレーム毎の空間(映像面)における2次元位置を示し、記号dは画像特徴量の次元数を示し、記号n、mは映像の縦横それぞれの画素数を示す。
そして、ステップS3510fにおいて、時間重み抽出部343fは、標準時間特徴量データおよび比較対象時間特徴量データから、時間重みマップを生成し、表示情報生成部350へ出力する。
そして、ステップS3610fにおいて、表示情報生成部350は、時間重みマップと、標準動作データおよび比較対象動作データとから、抽出結果を提示する結果表示画面を生成し、出力装置400に表示させる。
そして、ステップS3700fにおいて、動作解析装置300fは、ユーザ操作等により解析処理の終了を指示されたか否かを判断する。動作解析装置300fは、解析処理の終了を指示されない場合には(S3700f:YES)、ステップS3100fへ戻り、解析処理の終了を指示された場合には(S3700f:NO)、一連の動作を終了する。
上記の動作により、動作解析装置300fは、位置重みwx,yを算出後、その位置重みwx,yを特徴量データVt,x,yに適用して得られる時間特徴量データVt(チルダ)から時間重みwtを算出する。次に、動作解析装置300fは、算出した時間重みwtを、映像の各時間の重要度として提示することができる。
以下、動作の画面上の位置に差異があり、時間軸で見ると他に大きな動作があるために相対的に小さい動作となる場合がある。このような標準動作と比較対象動作との差異動作といえる動作(以下、単に「小さい差異動作」という)の一例を挙げて、各パラメータの状態および結果表示画面について説明する。
図30は、想定する標準動作の映像および比較対象動作の映像を示す図である。
図30に示すように、標準動作の映像601と比較対象動作の映像602の撮影アングルおよび撮影画素数は同じである。したがって、動作解析装置300fは、同じ動作を同じ順序で行う場合、撮影アングルを同じくすることにより、映像上の動きの向き、大きさ、順序もほぼ同一となる。
図31は、想定する標準動作および比較対象動作の内容と、その場合の位置重みマップの一例とを示す図である。
標準動作の例は、図31Aに示すように、以下の動作を含む。
(1)右側から大きな第1の部品605が移動して正面に設置され、
(2)右手を前に伸ばして工具606を取り、
(3)左手を前に伸ばして第2の部品607を取り、
(4)工具606で第2の部品607を第1の部品605に取り付け、
(5)第2の部品607が取り付けられた第1の部品605を左側に送る。
一方、比較対象動作の例は、図31Bに示すように、以下の動作を含む。
(1)右側から大きな第1の部品605が移動して正面に設置され、
(2)右手を前に伸ばして工具606を取り、
(3)左手を斜め左に伸ばして第2の部品607を取り、
(4)工具606で第2の部品607を第1の部品605に取り付け、
(5)第2の部品607が取り付けられた第1の部品605を左側に送る。
すなわち、比較対象動作は、第2の部品607を取る動作の方向が、標準動作と異なっている。
この場合、標準特徴量データと比較対象特徴量データとの差異は、(3)の動作の箇所において大きくなる。したがって、動作解析装置300fが算出する位置重みは、図31Cに示すように、(3)の動作の箇所において大きくなる。ここで、網掛けの濃さは、位置重みの大きさを示す。
従来のCHLAC特徴量、つまり画像特徴量をフレーム毎に空間積分した値では、画素の値は均等に加算される。したがって、右手の動作の画像特徴量には第1の工具606の動きの画像特徴量が加算され、左手の動作の画像特徴量は相対的に少なくなり、左手の動作の差異を抽出することが困難になる。特に、工具606が大きく、相対的に第2の部品607が非常に小さい場合、その時間におけるフレーム全体の画像特徴量に占める左手の動作に関する画像特徴量は更に小さくなり、左手の動作の差異の抽出することはより困難となる。
この点、動作解析装置300fは、図31Cに示すような動作の差異を位置毎に反映する位置重みを、画像特徴量に適用するので、(3)のような小さい差異動作を強調して容易に抽出することができる。
図32は、図31に示す動作における各時刻の位置重みwx,yの分布(位置重みマップ)の例を示す図である。ここでは、網掛けの濃さは位置重みの大きさを示す。また、各記号の添え字は、対応する時間tを示すものとする。また、時間t=1〜5は、順に、図31に示す動作(1)〜(5)に対応しているものとする。すなわち、小さい差異動作は、時間t=3において発生している。
図32に示すように、位置重みのうち、小さい差異動作に対応する位置の位置重みwx,yの値が大きくなる。画像特徴量V1(チルダ)〜V5(チルダ)は、動作(1)〜(
5)が行われている位置において大きな値となる。すなわち、例えば、時間t=3のフレームでは、動作(3)が行われている位置(左手が斜め前に移動する範囲)の画像特徴量Vt,s,yは相対的に大きい値となり、その他の位置の画像特徴量Vt,s,yは相対的に小さい値となる。
したがって、(3)の動作のような小さい差異動作が存在するとき、その動作が行われた時間の重み付き時間特徴量Vt(チルダ)は、次のように求める。重み付き時間特徴量Vt(チルダ)は、図32に示すように、位置毎に画像特徴量Vt,x,yに位置重みwx,yを乗じた値を積分して算出することで、相対的に大きい値となる。そして、(3)の動作のような小さい差異動作が存在するとき、同じフレームに同時に大きな動作が含まれていたとしても、その時間の時間重みwtも、相対的に大きい値となる。
表示情報生成部350は、例えば、1つの区間の情報のみを提示する場合には、位置重みwx,yの値が大きい位置を目立たせる結果表示画面を生成する。例えば、表示情報生成部350は、位置重みwx,yの値が大きい位置を含む一まとまりのエリア(以下「重要エリア」という)を設定する。次に、表示情報生成部350は、重要エリアの位置重みwx,yの平均値が高いほど、重要エリアを囲む線をより濃い色にしたりより太くしたりする。また、例えば、表示情報生成部350は、重要エリアの映像のみを鮮明に表示し、他の部分の映像をぼやかして表示する結果表示画面を生成する。
図33は、結果表示画面の一例を示す図である。
図33に示すように、結果表示画面610fは、解析結果表示領域611、再生ボタン612、比較対象動作表示領域613、一時停止ボタン614、終了ボタン615、および標準動作表示領域616を有する。
結果表示画面610fは、解析結果表示領域611に、時間重みの時系列データ(重みマップ)617と、所定の閾値を示す閾値表示線618と、時間重みが閾値表示線618を超える区間を示すマーカ619とを表示する。また、結果表示画面610fは、入力装置500から左右に移動操作可能な、再生箇所表示線620を表示する。
結果表示画面610fは、再生ボタン612がクリックされると、比較対象動作の撮影画像を比較対象動作表示領域613で再生すると共に、再生箇所表示線620を、再生に合わせて移動させる。また、結果表示画面610fは、画像の再生中に一時停止ボタン614がクリックされると、画像の再生を一時的に停止する。また、標準動作表示領域616は、比較対象動作表示領域613における比較対象動作の撮影画像の再生と同期して、標準動作の撮影画像を再生する。
そして、結果表示画面610fは、比較対象動作の撮影画像に重ねて、重要エリアを示す枠線621fを表示する。枠線621fは、例えば、時間重みが閾値表示線618を超える区間において、濃い色となり、他の表示区間において、薄い色となる。
このような結果表示画面610fにより、ユーザは、再生箇所表示線620をマーカ619部分に移動させて再生ボタン612をクリックすることができる。そして、この操作により、ユーザは、小さい差異動作等によって動作の差異が大きい時間の映像を、素早くピックアップして確認することができる。また、重要エリアを示す枠線621fが表示されるので、ユーザは、小さい差異動作等の、動きの差異が大きく、解析対象として重要度が高い箇所を、素早くピックアップして確認することができる。すなわち、ユーザは、画像の中のどこを注目して見るべきなのかを、簡単に把握することができる。また、ユーザは、枠線621fの濃さが時間重みに対応しているので、重要度の高さを併せて確認しな
がら、動きの差異を映像で確認することができる。
なお、枠線621fの形状および大きさは、固定であっても良いし、重要エリアの形状に合わせた形状および大きさであっても良い。また、結果表示画面610fは、標準動作データの画像と比較対象動作データ画像とを、同時に、または切り換えて表示しても良い。また、結果表示画面610fは、動作に関連する他のデータ、例えば、動作データの撮影日時や比較対象物の加速度データや音声を、併せて出力しても良い。
また、結果表示画面610fの解析結果表示領域611は、標準特徴量および比較対象特徴量の主成分スコアを併せて出力しても良い。例えば、図34に示すように、結果表示画面610fの解析結果表示領域611は、画像特徴量の主成分スコアを、時間を横軸にとった3次元グラフ700を含んでも良い。3次元グラフ700は、例えば、標準動作特徴量を線711で結び、比較対象特徴量を線721で結ぶ。このように、結果表示画面610fは、3次元表示を行うことによって、時間重みだけでなく、動作とともに画像特徴量の変化を分かり易く表示することができる。
以上のように、本実施の形態に係る動作解析装置300fは、位置重みを算出後に、位置重みを特徴量データに適用して得られる時間特徴量データから、映像の各次官の重要度を示す時間重みを算出するものである。これにより、本実施の形態に係る動作解析装置300fは、小さい差異動作を容易に抽出することができる。すなわち、映像面を細かく区切ることなく、CHLAC特徴量の利点を活かして、小さい差異動作を抽出することができる。
また、動作解析装置300fは、映像の位置重みが高い位置を表示するので、動作の差異が大きい位置をユーザに提示することができる。また、動作解析装置300fは、映像の時間重みが高い時間を表示するので、動作の差異が大きい時間箇所をユーザに提示することができる。すなわち、動作解析装置300fは、ユーザに対して、映像でチェックすべき動作を提示することができる。
なお、本実施の形態では、標準特徴量データに適用する位置重みマップと比較対象特徴量データに適用する位置重みマップとを同一としたが、本発明はこれに限定されない。例えば、標準特徴量データに適用する位置重みマップは、固定された分布の位置重みマップや、全ての領域において一定値の位置重みマップとしても良い。一定値としては、例えば、映像面の中心の位置重みの値、映像面における位置重みの平均値、映像面における位置重みの最低値を採用することができる。また、位置重みは、上限値を設けても良い。上限値としては、例えば、映像面における位置重みの平均値を採用することができる。これにより、標準動作と比較対象動作との間の重み付き時間特徴量の差異がより明確になることがある。
また、動作解析装置は、まず、位置重みに基づいて提示の対象となる領域を抽出し、抽出した領域毎に時間重みを算出してもよい。これにより、より適切な時間重みを算出することが可能となる。
また、本実施の形態では、時間重みについて標準画像に基づき時間的な伸縮を吸収したが、フーリエ級数展開を導入しても良い。フーリエ級数を導入した時間重みは、特徴量データの差異について、フーリエ級数展開の導入により時間的な伸縮を吸収する。次に、フーリエ級数を導入した時間重みは、各画素のd次元の特徴量ベクトルを並べた行列の分散を最大化するように、フィッシャー判別基準等により最適化された、時間軸上の周波数重みを指す。最適化された時間重みは、動作に差があるフレームほど大きくなるという特性を有し、かつ、動作を時系列に評価しつつ各動作データの長さの違いを吸収するという効
果を有する。時間重みの詳細については、例えば非特許文献3に記載されているため、ここでの説明を省略する。
また、本実施の形態では、動作解析装置300fは、標準動作データから算出した各時間の標準部分空間と、対応する比較対象動作データから算出した画像特徴量との距離を算出して、時間重みとした。また、動作解析装置300fは、算出した距離に基づいて正規化等の処理をおこなった後の値を時間重みとしても良い。また、動作解析装置300fは、時間特徴量データの差異について、各時間のd次元の特徴量ベクトルを並べた行列の分散を最大化するように、フィッシャー判別基準等により最適化された値としてもよい。また、時間重みは、単にフレーム毎の重み付き時間特徴量の差としても良い。
また、本実施の形態では、画像特徴量をCHLAC特徴量として説明したが、これに限定されない。画像特徴量として、例えば、方向ヒストグラムを用いた高次の局所特徴量等を用いることができる。かかる特徴量を用いる場合、動作解析装置は、濃度勾配画像から画像の局所的な方向ヒストグラムを求め、求めた方向ヒストグラムを特徴ベクトルとすれば良い。このような画像特徴量を用いた場合でも、小さい差異動作の時間を容易に抽出することができる。
また、本実施の形態では、時間重みの算出および位置重みの算出を行う際に、同一のセンサから取得したデータを用いたが、異なるセンサから取得したデータを用いても良い。例えば、本実施の形態では、同じ種類のセンサであるカメラセンサから取得したデータを用いても良い。この場合、時間重みの算出に用いる標準データは、水平方向だけでなく垂直方向の動きも捕らえやすいやや斜め前方から取得したデータとし、位置重みの算出に用いるデータは真上から取得したデータとしても良い。こうすることで、目的に応じて、より適切な時間重みや位置重みを抽出することができる。
更に、例えば、時間重みの算出には加速度センサから取得したデータを用い、位置重みの算出にはカメラセンサから取得したデータを用いるようにしても良い。本実施の形態では、例えば、カメラセンサから取得したデータを用いて時間重みを算出し、加速度センサから取得したデータで時間重みを算出する。この場合は、カメラセンサに水平方向や垂直方向に死角や誤差があっても、カメラセンサの弱点を補うことができる。加速度センサから取得したデータを用いる場合にも、局所特徴量を算出した後は、画像から算出した特徴量と同様に時間重みを算出する。例えば、加速度センサの局所特徴量の算出は、加速度センサを動作者の両手首に装着した場合、両手の6次元と加速度データ間の相関関係の15次元とを合わせた21次元の特徴量を、加速度センサの局所特徴量として算出すれば良い。また、評価する動作に用いる道具は、加速度センサを装着させておくことも考えられる。こうすることで、動作者に加速度センサを装着せずに、異なるセンサの特性を生かした動作評価が可能となる。
(実施の形態7)
以上説明した実施の形態5および実施の形態6は、実施の形態1〜実施の形態4のいずれかと組み合わせることが可能である。すなわち、実施の形態1〜実施の形態4において、解析の対象を、実施の形態5で説明した順序違い動作や、実施の形態6で説明した小さい差異動作とすることができる。これにより、順序違い動作の抽出結果の提示量や、小さい差異動作の時間の抽出結果の提示量についても、容易に調整することが可能となる。本発明の実施の形態7として、実施の形態1と実施の形態5または実施の形態6とを組み合わせた動作解析装置について説明する。
ここで、動作解析装置は、少なくとも、時間成分と位置成分とを含む画像特徴量を用いて動作解析を行うものとする。以下、時間成分および位置成分のうちの一方は「第1の成
分」とし、他方は「第2の成分」とする。そして、比較対象特徴量データと標準特徴量データとの間の差異のうち、第1の成分の値毎の差異の大きさを表す重みは「第1の重み」といい、第2の成分の値毎の差異の大きさを表す重みは「第2の重み」という。
すなわち、第1の成分が時間成分である場合には、第1の重みが時間重みであり、第2の重みは位置重みである。この場合を、「第1のパターン」という。また、第1の成分が位置成分である場合には、第1の重みが位置重みであり、第2の重みは時間重みである。この場合を、「第2のパターン」という。
図35は、本実施の形態に係る動作解析装置の構成の一例を示すブロック図であり、実施の形態1の図2、実施の形態5の図19、および実施の形態6の図28に対応するものである。
図35において、動作解析装置300gは、動作データ入力部310、動作特徴抽出部321g、動作抽出部322g、提示量入力部323、動作抽出度調整部324、および動作抽出結果提示部325を有する。動作特徴抽出部321gは、第1重み抽出部341gおよび重み付き特徴量抽出部342gを有する。動作抽出部322gは、第2重み抽出部343gを有する。
まず、第1のパターンにおける各部の機能について説明する。
第1重み抽出部341gは、実施の形態5の時間重み抽出部331eと同一の機能を有する。但し、第1重み抽出部341gにおいて用いられるパラメータの値は、動作抽出度調整部324によって適宜調整される。ここで値が調整されるパラメータは、上述の第1のパラメータのうち、例えば、解像度、フレームレート、CHLACマスクパターンの参照点からの画素間隔、主成分分析の累積寄与度、窓サイズ、基底関数の数、展開数、時間重み閾値、および連続最小(最長)時間等である。
重み付き特徴量抽出部342gは、実施の形態5の重み付き位置特徴量抽出部332eと同一の機能を有する。但し、重み付き特徴量抽出部342gにおいて用いられるパラメータの値は、動作抽出度調整部324によって適宜調整される。ここで値が調整されるパラメータは、上述の第1のパラメータのうち、例えば、解像度、フレームレート、CHLACマスクパターンの参照点からの画素間隔、主成分分析の累積寄与度、および窓サイズ等である。
第2重み抽出部343gは、実施の形態5の位置重み抽出部333eと同一の機能を有する。但し、第2重み抽出部343gにおいて用いられるパラメータの値は、動作抽出度調整部324によって適宜調整される。ここで値が調整されるパラメータは、上述の第2のパラメータおよび第3のパラメータのうち、例えば、基底関数の数、展開数、位置重み閾値、および連続最小(最大)領域等である。
すなわち、第1のパターンは、実施の形態5を実施の形態1と組み合わせたパターンである。
次に、第2のパターンにおける各部の機能について説明する。
第1重み抽出部341gは、実施の形態6の位置重み抽出部341fと同一の機能を有する。但し、第1重み抽出部341gにおいて用いられるパラメータの値は、動作抽出度調整部324によって適宜調整される。ここで値が調整されるパラメータは、上述の第1のパラメータのうち、例えば、解像度、フレームレート、CHLACマスクパターンの参
照点からの画素間隔、主成分分析の累積寄与度、窓サイズ、基底関数の数、展開数、位置重み閾値、および連続最小(最大)領域等である。
重み付き特徴量抽出部342gは、実施の形態6の重み付き時間特徴量抽出部342fと同一の機能をする。但し、重み付き特徴量抽出部342gにおいて用いられるパラメータの値は、動作抽出度調整部324によって適宜調整される。ここで値が調整されるパラメータは、上述の第1のパラメータのうち、例えば、解像度、フレームレート、CHLACマスクパターンの参照点からの画素間隔、主成分分析の累積寄与度、および窓サイズ等である。
第2重み抽出部343gは、実施の形態6の時間重み抽出部343fと同一の機能を有する。但し、第2重み抽出部343gにおいて用いられるパラメータの値は、動作抽出度調整部324によって適宜調整される。ここで値が調整されるパラメータは、上述の第2のパラメータおよび第3のパラメータのうち、例えば、基底関数の数、展開数、時間重み閾値、および連続最小(最長)時間等である。
すなわち、第2のパターンは、実施の形態6を実施の形態1と組み合わせたパターンである。
動作解析装置300gの動作は、実施の形態1で説明した動作のうち、抽出数Aとしてカウントされる対象の抽出処理が、実施の形態5または実施の形態6で説明した解析対象の抽出処理に置き換わるのみである。したがって、動作解析装置300gの動作の説明については省略する。
このように、本実施の形態に係る動作解析装置300gは、順序違い動作の抽出結果の提示量や、小さい差異動作の時間の抽出結果の提示量についても、容易に調整することを可能にする。したがって、動作解析装置300gを用いることにより、異なる用途において、各ニーズにマッチした動作解析を行うことができる。
なお、本実施の形態では、実施の形態1との組み合わせについてのみ説明したが、同様に、実施の形態2〜実施の形態4と実施の形態5または実施の形態6を組み合わせることも可能である。
また、実施の形態5および実施の形態6の両方を、切り替え可能に組み合わせるようにしても良い。すなわち、動作解析装置は、上述の第1の成分を時間成分とするか位置成分とするかを、ユーザ指定等により切り替えられるようにしても良い。この場合には、動作解析装置は、例えば、時間重み抽出部331e、重み付き位置特徴量抽出部332e、および位置重み抽出部333eの系統と、位置重み抽出部341f、重み付き時間特徴量抽出部342f、および時間重み抽出部343fの系統との両方を有するようにすれば良い。
更には、実施の形態5および実施の形態6のみを切り替え可能に組み合わせるようにしても良い。この場合でも、提示量は調整することができないものの、多面的な動作解析が可能となる。
また、本発明の適用対象は、以上説明した実施の形態1〜実施の形態7では工場における作業動作の解析するための装置としたが、これに限定されない。本発明は、例えば、車両運転、スポーツ、調理、楽器演奏等、各種の動作を解析する装置等、他の各種装置に適用することができる。
以上のように、本発明の第1の態様に係る動作解析装置は、標準動作との比較により比較対象動作の解析を行う動作解析装置であって、前記比較対象動作と前記標準動作との差異の程度が、所定の条件を満たす箇所を判定する動作差異抽出部と、前記所定の条件を満たす箇所の提示量の指定を受け付ける提示量入力部と、前記所定の条件を満たす箇所の量が前記指定された提示量となるように、前記所定の条件を調整する動作抽出度調整部とを有する。
本発明の第2の態様に係る動作解析装置は、前記第1の態様に係る動作解析装置において、一連の前記標準動作の動作データである標準動作データと、一連の前記比較対象動作の動作データである比較対象動作データとを入力する動作データ入力部を更に有し、前記動作差異抽出部は、第1のパラメータを用いて前記標準動作データおよび前記比較対象動作データのそれぞれから特徴量を抽出し、第2のパラメータを用いて前記比較対象動作データと前記標準動作データの特徴量との特徴量との差異を抽出し、抽出された差異が第3のパラメータにより定まる条件を満たす箇所を抽出し、前記動作抽出度調整部は、前記第1のパラメータ、前記第2のパラメータ、および前記第3のパラメータの少なくとも1つを調整する。
本発明の第3の態様に係る動作解析装置は、前記第2の態様に係る動作解析装置において、前記動作データは動画像データであり、前記特徴量はCHLAC特徴である。
本発明の第4の態様に係る動作解析装置は、前記第2の態様に係る動作解析装置において、前記第3のパラメータにより定まる条件は、前記差異が前記第3のパラメータよりも大きいことである。
本発明の第5の態様に係る動作解析装置は、前記第2の態様に係る動作解析装置において、前記提示量は、前記第3のパラメータにより定まる条件を満たす箇所の個数である。
本発明の第6の態様に係る動作解析装置は、前記第2の態様に係る動作解析装置において、前記提示量は、前記第3のパラメータにより定まる条件を満たす箇所の時間長さの合計である。
本発明の第7の態様に係る動作解析装置は、前記第2の態様に係る動作解析装置において、前記第3のパラメータにより定まる条件は、前記差異が前記第3のパラメータよりも小さいことである。
本発明の第8の態様に係る動作解析装置は、前記第1の態様に係る動作解析装置において、一連の前記標準動作の動画データである標準動作データと、一連の前記比較対象動作の動画データである比較対象動作データとを入力する動作データ入力部を更に有し、前記動作差異抽出部は、第4のパラメータを用いて、CHLAC特徴に時間重みを導入して映像特徴を算出する際の時間重みを、前記比較対象動作と前記標準動作との差異を示す特徴量として抽出し、前記特徴量が第5のパラメータにより定まる条件を満たす箇所を抽出し、前記動作抽出度調整部は、前記第4のパラメータおよび第5のパラメータの少なくとも1つを調整する。
本発明の第9の態様に係る動作解析装置は、前記第2の態様に係る動作解析装置において、複数の異なる提示量のレベルのそれぞれに対応して、前記標準動作データに基づいて、前記所定の条件の初期値および前記提示量の目標値を設定する動作解析初期値設定部を更に有し、前記動作抽出度調整部は、前記レベルの指定により、前記所定の条件の初期値および前記提示量の指定を受け付ける。
本発明の第10の態様に係る動作解析方法は、標準動作との比較により比較対象動作の解析を行う動作解析方法であって、前記解析の結果の提示量の指定を受け付けるステップと、前記比較対象動作と前記標準動作との差異の程度が所定の条件を満たす箇所を判定するステップと、前記所定の条件を満たす箇所の量が指定された提示量と異なるとき、前記所定の条件を調整するステップとを有する。
本発明の第11の態様に係る動作解析装置は、標準動作との比較により比較対象動作の解析を行う動作解析装置であって、前記比較対象動作の画像特徴量のデータである比較対象特徴量データと、前記標準動作の画像特徴量のデータである標準特徴量データとから、前記比較対象動作の前記標準動作との差異の大きさを表す時間重みを抽出する時間重み抽出部と、前記時間重みを適用した値の位置毎の時間積分である重み付き位置特徴量を、前記比較対象特徴量データおよび前記標準特徴量データのそれぞれについて算出する重み付き位置特徴量抽出部と、前記比較対象特徴量データの前記重み付き位置特徴量のデータである比較対象位置特徴量データと、前記標準特徴量データの前記重み付き位置特徴量のデータである標準位置特徴量データとから、前記比較対象動作の前記標準動作との差異の大きさを表す位置重みを抽出する位置重み抽出部とを有する。
本発明の第12の態様に係る動作解析装置は、前記第11の態様に係る動作解析装置において、前記位置重みに基づいて、前記比較対象動作の映像における各位置の重要度を示す情報を生成する表示情報生成部を更に有する。
本発明の第13の態様に係る動作解析装置は、前記第11の態様に係る動作解析装置において、前記位置重みおよび前記時間重みに基づいて、前記比較対象動作の映像における各位置の重要度と各時間の重要度とを示す情報を生成する表示情報生成部を更に有する。
本発明の第14の態様に係る動作解析装置は、前記第11の態様に係る動作解析装置において、前記画像特徴量は、CHLAC特徴量である。
本発明の第15の態様に係る動作解析方法は、標準動作との比較により比較対象動作の解析を行う動作解析方法であって、前記比較対象動作の画像特徴量のデータである比較対象特徴量データと、前記標準動作の画像特徴量のデータである標準特徴量データとから、前記比較対象動作の前記標準動作との差異の大きさを表す時間重みを抽出するステップと、前記時間重みを適用した値の位置毎の時間積分である重み付き位置特徴量を、前記比較対象特徴量データおよび前記標準特徴量データのそれぞれについて算出するステップと、前記比較対象特徴量データの前記重み付き位置特徴量のデータである比較対象位置特徴量データと、前記標準特徴量データの前記重み付き位置特徴量のデータである標準位置特徴量データとから、前記比較対象動作の前記標準動作との差異の大きさを表す位置重みを抽出するステップとを有する。
本発明の第16の態様に係る動作解析装置は、標準動作との比較により比較対象動作の解析を行う動作解析装置であって、前記比較対象動作の画像特徴量のデータである比較対象特徴量データと、前記標準動作の画像特徴量のデータである標準特徴量データとから、前記比較対象動作の前記標準動作との差異の大きさを表す位置重みを抽出する位置重み抽出部と、前記位置重みを適用した値の時間毎の空間積分である重み付き時間特徴量を、前記比較対象特徴量データおよび前記標準特徴量データのそれぞれについて算出する重み付き時間特徴量抽出部と、前記比較対象特徴量データの前記重み付き時間特徴量のデータである比較対象時間特徴量データと、前記標準特徴量データの前記重み付き時間特徴量のデータである標準時間特徴量データとから、前記比較対象動作の前記標準動作との差異の大きさを表す時間重みを抽出する時間重み抽出部とを有する。
本発明の第17の態様に係る動作解析装置は、前記第16の態様に係る動作解析装置において、前記時間重みに基づいて、前記比較対象動作の映像における各時間の重要度を示す情報を生成する表示情報生成部を更に有する。
本発明の第18の態様に係る動作解析装置は、前記第16の態様に係る動作解析装置において、前記時間重みおよび前記位置重みに基づいて、前記比較対象動作の映像における各時間の重要度と各位置の重要度とを示す情報を生成する表示情報生成部を更に有する。
本発明の第19の態様に係る動作解析装置は、前記第16の態様に係る動作解析装置において、前記画像特徴量は、CHLAC特徴量である。
本発明の第20の態様に係る動作解析方法は、標準動作との比較により比較対象動作の解析を行う動作解析方法であって、前記比較対象動作の画像特徴量のデータである比較対象特徴量データと、前記標準動作の画像特徴量のデータである標準特徴量データとから、前記比較対象動作の前記標準動作との差異の大きさを表す位置重みを抽出するステップと、前記位置重みを適用した値の時間毎の空間積分である重み付き時間特徴量を、前記比較対象特徴量データおよび前記標準特徴量データのそれぞれについて算出するステップと、前記比較対象特徴量データの前記重み付き時間特徴量のデータである比較対象時間特徴量データと、前記標準特徴量データの前記重み付き時間特徴量のデータである標準時間特徴量データとから、前記比較対象動作の前記標準動作との差異の大きさを表す時間重みを抽出するステップとを有する。
2009年12月22日出願の特願2009−291018、2010年3月25日出願の特願2010−70444の日本出願、および2010年3月25日出願の特願2010−70445の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。