JP5186656B2 - 動作評価装置および動作評価方法 - Google Patents

動作評価装置および動作評価方法 Download PDF

Info

Publication number
JP5186656B2
JP5186656B2 JP2008226159A JP2008226159A JP5186656B2 JP 5186656 B2 JP5186656 B2 JP 5186656B2 JP 2008226159 A JP2008226159 A JP 2008226159A JP 2008226159 A JP2008226159 A JP 2008226159A JP 5186656 B2 JP5186656 B2 JP 5186656B2
Authority
JP
Japan
Prior art keywords
time
evaluation
data
weight
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008226159A
Other languages
English (en)
Other versions
JP2010061376A (ja
Inventor
展之 大津
匠 小林
雄介 森下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2008226159A priority Critical patent/JP5186656B2/ja
Publication of JP2010061376A publication Critical patent/JP2010061376A/ja
Application granted granted Critical
Publication of JP5186656B2 publication Critical patent/JP5186656B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、動作評価装置および動作評価方法に関するものであり、特に動作を撮影した動画像データの立体高次局所自己相関(CHLAC)特徴を時間重みで積分した映像特徴と外的規準(評価情報)を用いた動作評価装置および動作評価方法に関するものである。
動作に関する認識技術として、本出願人は動作の認識方法の研究を行い、本出願人が出願した下記の特許文献1には、立体高次局所自己相関特徴(以下、CHLACとも記す)を用いた動画像における動作の認識技術が開示されている。この技術は、ビデオカメラから入力される動画像データからフレーム間差分データを生成し、複数のフレーム間差分データからなる3次元データから立体高次局所自己相関によって特徴データを抽出し、抽出した特徴データを多変量解析などの統計的手法によって変換することによって新たな特徴データを生成し、登録データと比較することによって判定を行うものである。
特開2005−092346号公報
また、本出願人が出願した下記の特許文献2には、動画像からCHLAC特徴を抽出し、それを用いて異常動作を検出する異常動作検出装置が開示されている。この技術は、ビデオカメラから入力される動画像データからフレーム間差分データを生成し、複数のフレーム間差分データからなる3次元データから立体高次局所自己相関によって特徴データを抽出し、過去のCHLAC特徴データから主成分分析手法により得られた主成分ベクトルに基づく部分空間と、最新の特徴データとの距離を計算する。そして、この距離が所定値よりも大きい場合に異常と判定するものである。
特開2006−079272号公報
動作評価に関しては、例えば体操競技等の競技会における得点の付与、各種スポーツにおけるフォームの評価、リハビリにおける運動姿勢の評価などの分野において、どの程度理想のフォームに近いかによって合否を決めたり得点付与が行われている。しかしこれらの評価は熟練したエキスパートである評価者が行っており、上記したような従来の技術では動作の種別の判定や異常動作の検出は可能であるが、評価者が評価した外的基準に基づいて動作の評価を自動的に行うことはできなかった。
従来は動作の評価を自動的にかつ高精度で行う装置や方法は存在せず、そのため運動フォームの評価には熟練したエキスパートの臨席が必要であるので、エキスパートの臨席が困難な場合や多数の被評価者がいる場合などには適切な評価を得ることが困難であるという問題があった。また、動作を装置で評価する場合には、被評価者によって動作の位置や開始から終了までの時間が異なるので、この位置や動作時間の差を吸収しないと正確な評価が出来ないという問題点もあった。更に、動作の開始から終了までの間には評価に重要な時間位置部分とそうでない部分があり、これらも考慮しないと正確な評価が出来ないという問題点もあった。
本発明の目的は、上記したような従来の問題点を解決し、評価者の評価(外的基準)に基づいて、動作を撮影した動画像データから動作の評価を自動的にかつ高精度で行うことができる動作評価装置および動作評価方法を提供する点にある。
本発明の動作評価装置においては、位置不変性を持つ立体高次局所自己相関特徴(CHLAC)を用いて時系列の動作特徴を抽出し、映像の時間的な重要性の変化を考慮し、かつ映像の時間伸縮を吸収するために、連続関数として時間重みを導入する。ここではこの連続関数をフーリエ級数展開することで、時間重みを周波数成分への重みに帰着させる。そして、学習処理によってそれらの周波数成分重み(フーリエ係数)を外的規準(エキスパートの評価者が付与した学習データの評価値)に基づいて最適化している。更に、得られた時間重みを用いて映像全体の特徴を算出し、これを再び外的規準と多変量解析により動作評価を行なっている。
本発明の動作評価装置は、評価対象を撮影した動画像データからフレーム毎に差分・2値化データを生成する差分・2値化手段と、複数の前記差分・2値化データからフレーム毎に立体高次局所自己相関特徴を抽出し、時系列の立体高次局所自己相関特徴データを生成する特徴抽出手段と、前記時系列立体高次局所自己相関特徴データから多変量解析により予め求められた時間重みを用いて時間重み付き映像特徴データを生成する映像特徴生成手段と、前記映像特徴データの多変量解析により予め求められた係数行列を用いて対象動作を評価する評価手段とを備えたことを主要な特徴とする。
また、上記した動作評価装置において、更に、評価情報が付与された学習用データから多変量解析により前記時間重みおよび前記係数行列を求める学習手段を備えている点にも特徴がある。
また、上記した動作評価装置において、前記時間重みは、時系列のフレームに対する重みに帰着し、または時間重みをフーリエ級数展開しフーリエ周波数基底関数の重みに帰着し、学習的に求められる点にも特徴がある。
また、上記した動作評価装置において、前記学習手段は、前記時系列の立体高次局所自己相関特徴データをフーリエ基底関数へ射影して周波数重み表現へと変換することにより、時間重みの連続関数をフーリエ級数で近似構成する点にも特徴がある。
また、上記した動作評価装置において、前記学習手段は、質的評価情報に基づきフィッシャー判別基準を用いた線形判別分析により前記周波数重みを最適化する周波数重み生成手段と、前記周波数重み生成手段により生成された周波数重みを用いて前記時系列立体高次局所自己相関特徴データから映像特徴データを求める映像特徴生成手段と、前記映像特徴および前記評価情報から多変量解析により前記係数行列を生成する係数行列生成手段とを備えている点にも特徴がある。
また、上記した動作評価装置において、前記周波数重み生成手段は、主成分分析により前記周波数重み付き立体高次局所自己相関特徴データの次元数を削減する次元数削減手段を備えている点にも特徴がある。
また、上記した動作評価装置において、前記学習手段は、量的評価情報に基づき最小二乗基準によりフーリエ基底関数の重みを最適化する周波数重み生成手段と、前記周波数重み生成手段により生成された周波数重みを用いて前記時系列立体高次局所自己相関特徴データから映像特徴データを求める映像特徴生成手段と、前記映像特徴および前記評価情報から多変量解析により前記係数行列を生成する係数行列生成手段とを備えている点にも特徴がある。
本発明の動作評価方法は、評価対象を撮影した動画像データからフレーム毎に差分・2値化データを生成するステップ、複数の前記差分・2値化データからフレーム毎に立体高次局所自己相関特徴を抽出し、時系列の立体高次局所自己相関特徴データを生成するステップ、前記時系列立体高次局所自己相関特徴データから多変量解析により予め求められた時間重みを用いて時間重み付き映像特徴データを生成するステップ、前記映像特徴データの多変量解析により予め求められた係数行列を用いて対象動作を評価するステップを含むことを主要な特徴とする。
本発明によれば、以下のような効果がある。
(1)従来自動化が困難であった動作の評価を自動的に行うことができる。
(2)動作の時間や位置の差に依存せず、正確な評価が可能である。
(3)同じ学習結果を使用することにより同じ基準で評価できる。
(4)装置構成が簡単であり、安価に構成可能である。
(5)画像上での対象物の切り出しやマッチング処理を行わずに処理でき、特徴抽出や評価のための計算量が少なく、実時間処理が可能である。
まず、本発明の原理について説明する。映像から抽出されるCHLACは、時系列データであり、動作に関する豊富な情報を含んでいる。しかし、このデータを評価するにはフレーム数も多く、評価に無関係な動作なども含まれており、単純にこの時系列データの和をとるなどすると動作評価の性能が低下することもある。
そこで本発明においては、時系列のCHLACから動作評価に有効な情報を抽出するため、同様な動作の各映像で共通の時間(フレーム)重みを導入し、CHLACの重み付き時間積分によりコンパクトな映像特徴を抽出する手法を採用する。基本的には、τフレームの映像から抽出される時系列のCHLACをxt、時間重みをωtとしたとき、下記の式1により映像特徴x~を抽出する。
Figure 0005186656
この際、如何にして時間重みωtの値を決定するかが課題となる。しかし、映像の時間(フレーム)長τがサンプルによって異なる場合、時系列CHLACのデータ数や時間重みの次元がサンプルによって異なることになり、時間重みωtの最適化が困難となる。そのため、時間重みを連続関数φ(t)として表現し、映像の時間的な伸縮を吸収できるように数式1を拡張する。
まず、時間重み関数のフーリエ級数展開を考える。一般的に、周期2πの周期関数f(t)のフーリエ級数展開φ(t)は下記の式2で定義される。
Figure 0005186656
ただし、ak、bkは下記の式3で表される。
Figure 0005186656
一方、時間重みωtは離散的でかつ有限区間(周期)[0,τ-1]で定義されるため、そのフーリエ級数展開ω~tを、式2、3を変形し、下記の式4として定義する。
Figure 0005186656
ここで、フーリエ級数の基底関数ft (n)を式5に示すように表し、更に式4のフーリエ係数akおよびbkを式6に示すように表すと、式4の時間重みのフーリエ級数展開ω~t は、これらの積によって、式7に示すように簡潔に表現できる。
Figure 0005186656
Figure 0005186656
Figure 0005186656
よって、時間重み関数ω~tをフーリエ級数展開として表現した場合に、時系列のCHLAC(x0,・・・,xτ-1)から映像特徴x~を抽出する問題(式1)は、以下の数式8で表現できる。
Figure 0005186656
次に時間重みの最適化について説明する。時間重みのフーリエ級数展開ω~t に対して最適化を行う場合、フーリエ級数の基底関数ft (n)は最適化の影響を受けない。つまり、最適化するパラメータはフーリエ係数のξ(n)のみである。そこで、フーリエ級数の基底関数ft (n)と時系列のCHLAC(x0,・・・,xτ-1)の積を式9に示すように定義する。
Figure 0005186656
(n)∈Rdを用いて式8を書き直すと、下記の式10となる。
Figure 0005186656
更に、最適化するフーリエ係数ξ(n)の個数を映像間で統一するために、式10の基底関数の数を上位m個に限定する。つまり、式11とする。
Figure 0005186656
基底関数を低周波に限定することで、時間重み関数の形に自然と滑らかさの制約が導入され、重み関数のオーバーフィッティング(overfitting)を避けることができる。これは一般にノイズが高周波成分であることからも合理的であることが分かる。
ここで、上位m個の基底関数により計算されるm個のh(n)を各列に持つ行列H∈Rd×mを式12により定義する。
Figure 0005186656
この行列Hはフーリエ級数の各周波数成分へのCHLACの射影であり、フーリエ周波数成分CHLACと呼ぶことにする。また、このフーリエ周波数成分CHLACに対応する上位m個のフーリエ係数ξ(n)を並べたベクトルである「周波数重み」ξ∈Rmを式13により定義する。
Figure 0005186656
式12、13より、フーリエ級数展開による連続関数としての時間重みを用いて時系列CHLACから映像特徴x~を抽出する過程は、最終的に下記の式14で表現される。映像特徴x~はフーリエ重み付きCHLAC(FW-CHLAC)である。式14は映像の時間的な伸縮を吸収した映像特徴の抽出手法となる。よって、式1の時間重みを求める(最適化する)問題は、式14の周波数重みξを求める(最適化する)問題へと帰着される。
Figure 0005186656
次に、導入した周波数重みξの最適化方法について説明する。最適化方法は外的評価が例えば「合格」、「不合格」というような質的データで与えられる場合と、例えば5段階評価などの量的データで与えられる場合で処理が異なるので、以下それぞれについて説明する。
<<外的評価が質的データで与えられる場合>>
外的評価が質的データで与えられる場合の重みの最適化方法として公知のフィッシャー判別規準を利用して最適化を行う。今、外的評価として質的データ(合格、不合格のクラスラベルなど)が付いたN個の学習用映像が与えられているものとし、それぞれの映像から計算されるフーリエ周波数成分CHLACをHi、映像特徴をx~iと表す。このとき、映像特徴のクラス内共分散行列ΣWとクラス間共分散行列ΣBは、それぞれ式15により定義される。
Figure 0005186656
ただし、cはクラス数、Cjはj番目のクラス、NjはCjに属するサンプル数、μjはCjに属するx~(i)の平均、μは全平均である。このとき、映像特徴x~のフィッシャー判別規準は、クラス間分散とクラス内分散の比である式16で定義される。
Figure 0005186656
ここで、式16の分母と分子はそれぞれ、式17のように変形することができる。
Figure 0005186656
ただし、MjはCjに属するHiの平均、MはHiの全平均である。また、ΣWはHiのクラス内共分散行列、ΣBはHiのクラス間共分散行列である。式17を用いて式16のフィッシャー判別規準を書き直すと、式18を得る。
Figure 0005186656
このフィッシャー判別規準を最大化する周波数重みξは、下記の式19に示す一般化固有値問題の固有ベクトルとして得られる。
Figure 0005186656
しかし、パターン認識においては周波数重みξの次元に対して学習サンプル数Nが不足し、式19のΣWが非正則となることも想定される。そして、非正則の場合には式19の一般化固有値問題を解くことができない。この問題を回避するため、必要に応じて一般化固有値問題を解く前に主成分分析によりフーリエ周波数成分CHLACのデータ次元を削減する(正則化)。
以下に主成分分析に基づくデータ次元の削減方法について説明する。今、N個の学習用映像が与えられているものとし、それぞれの映像から計算されるフーリエ周波数成分CHLACをHi、映像特徴をx~(i)と表すことにする。このとき、前記ξをuと置き換えて、映像特徴x~(i)の全分散は式20で定義される。
Figure 0005186656
ただし、μ∈Rdはx~(i)の平均、M∈Rd×mはHiの平均、ΣHはHiの全共分散行列である。このとき、制約条件uTu=1(Tは転置行列)の下で分散σ2 T(u)を最大化する周波数重みuは、固有値問題である式21の固有ベクトルとして求められる。
Figure 0005186656
固有値問題の固有ベクトルのうち、上位p(<m)個の固有値に対応するものを{u1,・・・,up}とおき、これらp個の固有ベクトルを用いて式22により、Hi∈Rd×mからH~i∈Rd×pへと次元を削減する。
Figure 0005186656
このH~iに対する時間重みv∈Rpは、フィッシャー判別規準である式23の最大化問題を解くことで得られる。
Figure 0005186656
ここで、式23の最大化問題の解のうち、上位(c-1)の固有値に対応するものを{v1,・・・ ,vc-1}とおくと、求めるべき周波数重み{ξ1,・・・ ,ξc-1}は、式24により得られる。
Figure 0005186656
なお、クラス数cが3以上の場合は時間重みξが複数得られるが、(c-1)本のξにより生成される(c-1)本の映像特徴{x~1, ・・・ ,x~c-1}を、式25のように並べ、ベクトルx~∈Rd(c-1)を新たな映像特徴とし、x~に対して線形判別分析により学習を行う。
Figure 0005186656
<<外的評価が量的データで与えられる場合>>
外的評価が量的データで与えられる場合、周波数重みの最適化方法には判別規準ではなく最小二乗規準を用いるのが望ましい。そこで、以下に最小二乗規準による時間重みの最適化手法について説明する。
今、外的評価として量的データ(総合評価値など)が付与されているN個の学習用映像が与えられているものとし、それぞれの映像から計算されるフーリエ周波数成分CHLACをHi、映像特徴徴x~(i)と表す。このとき、映像特徴x~(i)の最小二乗規準J(ξ)は式26で定義される。
Figure 0005186656
ただし、βは偏回帰係数(特徴ベクトルの各要素への重み)、y(i)はx~(i)の外的評価である。ここで偏回帰係数β、周波数重み係数ξが最適化する変数となっている。まずξを最適化するが、ここでは、β =(1,・・・ ,1)Tとする。ここで、zi=(βTHi)T=Hi Tβと定義すると、式26は式27と書き換えることができ、公知の重回帰分析と同様の式が得られる。
Figure 0005186656
重回帰分析においては、ベクトルzの次元が大きい場合、もしくはサンプルNが小さい場合には、非正則なり解くことが困難になり、また過学習も起こりやすい。そこで、式27にξ~に関する正則化項を加えた公知のリッジ回帰を行う。リッジ回帰は数式28のようになる。
Figure 0005186656
式28をξで偏微分し、0とおくことで,最適なξ~は数式29として求められる。
Figure 0005186656
よって、最適な時間重みξは、y =(y(1),・・・ ,y(N))T、Z=z1,・・・ ,zNとおくと、式30により求めることができる。
Figure 0005186656
次に、周波数重みにより抽出した映像特徴から、動作の識別や評価の予測を行う処理について説明する。予測処理もは外的評価が質的データで与えられる場合と量的データで与えられる場合で処理が異なるので、以下それぞれについて説明する。
<<外的評価が質的データの場合>>
外的評価が質的データの場合、フィッシャー判別規準により最適化された時間重みを用いて抽出した映像特徴は、線形判別分析とk近傍法(k-NN:k-Nearest Neighbour法)により、動作の識別を行う。
今、時間重みを用いて抽出したN個の映像特徴をx~iとする。映像特徴x~iのクラス内共分散行列ΣWとクラス間共分散行列ΣBは式15により表される。このとき線形判別分析は、以下の判別規準J(a)を最大化するaを求める問題となる。このとき、ΣWが非正則でない場合は、前記と同様に主成分分析を行い正則化する。
Figure 0005186656
式31を最大化するaは、フィッシャー判別規準による周波数重みの最適化の場合と同様に、一般化固有値問題である式32の固有ベクトルとして得られる。
Figure 0005186656
一方、新たに入力された映像に対する動作の識別は、固有値問題により求められる固有ベクトルのうち、上位(c-1)の固有値に対応する{a1,・・・,ac-1}によって張られる判別特徴空間における距離に基づいて行う。
ここで、A =[a1・・・ac-1]と定義し、N個の学習用映像の映像特徴をx~i、判別特徴ベクトルをc(i)=ATx~(i)とおく。さらに、入力された映像の映像特徴をx~、それに対応する判別特徴ベクトルをc=ATx~とおく。このときk-NN法による動作の識別は、以下のようにして行われる。
まず、識別対象の判別特徴ベクトルcと全学習サンプルの判別特徴ベクトルc(i)との距離を求め、学習サンプルの中からcに最も近いk個のサンプルを選ぶ。次に、選んだk個のサンプルが属するクラスのうち最も多いクラスを識別対象cのクラスとする。なお、kは例えば3であってもよい。
<<外的評価が量的データの場合>>
外的評価が量的データの場合、最小二乗規準により最適化された時間重み(周波数重み)を用いて抽出した映像特徴に対して、重回帰分析により評価の予測を行う。今、時間重みを用いて抽出したN個の映像特徴をx~(i)、映像特徴x~(i)の外的評価をy(i)とすると、重回帰分析は最小二乗規準である式33を最小化するβ∈Rdを求める問題となる。
Figure 0005186656
最適なβは、前述した重回帰分析、最小二乗規準重みの最適化と同様に、y=(y(1),・・・,y(N))T、X=x~(1),・・・,x~(N)を用いて、式34により求めることができる。なお、ここでは公知のステップワイズ法を用いて、評価に採用する映像特徴の成分を選択しながら、重回帰分析を行う。
Figure 0005186656
一方、新たに入力された映像に対する評価値の予測は、映像特徴と式34により求めたβとの内積を計算することにより行う。すなわち、入力された映像の外的評価の予測値y~は、その映像特徴x~とβとの内積により、以下の式35のように求められる。
Figure 0005186656
以下、例えば被評価者が行う側転動作について合格/不合格という質的評価あるいは5段階評価等の量的評価を行う実施例について説明する。
図1は、本発明の動作評価装置のハードウェア構成の一例を示すブロック図である。図1(a)は学習時におけるハードウェア構成の一例を示している。ビデオカメラ10は被評価者16の行う動作を撮影してデジタル動画データを出力する周知の動画像撮影装置である。画像はカラーであってもよいし、モノクロであってもよい。
コンピュータ(PC)11は例えば周知の汎用デジタルインターフェイス回路を備えた周知のパソコン(PC)である。コンピュータ11はビデオカメラ10からのデジタル動画データをリアルタイムで読み込み、保存する。なお、動作のスタート/ストップの情報と同期してその間の動画像のみを記録してもよいし、動画像を連続して記録しておき、必要な部分のみを後から切り出してもよい。
本発明は、後述する処理を実行するプログラムを作成し、パソコンなどの周知のコンピュータ11にインストールして起動することにより実現される。モニタ装置12はコンピュータ11の周知の出力装置である。キーボード13およびマウス14は、オペレータが評価情報や動作のスタート/ストップ情報の入力に使用する周知の入力装置である。図1(b)は評価時におけるハードウェア構成の一例を示している。評価時にはモニタ装置12を使用して例えば対象の評価結果をオペレータに表示する。
図2は、本発明における質的評価を行う動作評価処理の学習時の処理の概要を示す説明図である。まず、ビデオカメラ10によって例えば360画素×240画素のグレースケール(モノクロ多値)動画像が撮影され、コンピュータ11に取り込まれる。取り込まれた動画像の各フレームデータ(a)から直前のフレームの同じ画素の輝度値との差分の絶対値を求め、この値が例えば所定の閾値以上である場合に1、そうでない場合に0とする差分2値化フレームデータ(c)を得る。
次に、隣接する3枚の差分2値化フレームデータ(d)から後述する方法で画素毎にCHLACデータを計算し、この画素対応CHLACデータを1フレーム分積算して251次元のフレーム対応CHLACデータを得る。このフレーム対応CHLACデータτ個を時系列に並べたものが時系列CHLACデータ(f)である。τはフレーム数と対応しており、動作開始から終了までの時間は人によって異なるので、τも動画像毎に異なっている。
次に、処理(g)において前述した方法で時系列CHLACデータ(f)からフーリエ周波数成分CHLACデータHを生成する。このデータは前述したように、τを基本周期とするフーリエ級数展開によって時間重み関数を近似した結果である。なお、mは予め定められた基底関数の数である。この処理により特徴データの時間差が吸収される。以上の処理は学習モードと認識モード共通の処理である。
学習モードにおいては、学習用の複数のフーリエ周波数成分CHLACデータが生成され、必要な場合にはこれらのデータに基づいて処理(h)において主成分分析によって次元数が削減される。処理(i)においては評価上重要な部分がより強調されるように周波数重みξを最適化する。
処理(j)においてはフーリエ周波数成分CHLACデータおよび最適化された周波数重みを用いて各学習データについて映像特徴x~を求める。最後に、この映像特徴x~から線形判別分析により係数行列Aを求め、更に、この係数行列Aを使用して各学習データの判別特徴ベクトルyを求める。
図3は、本発明における量的評価を行う動作評価処理の学習時の処理の概要を示す説明図である。処理(g)までは前述した質的評価を行う図2の処理と同一である。量的評価を行う場合、学習モードにおいては、学習用の複数のフーリエ周波数成分CHLACデータが生成され、処理(l)において評価上重要な部分がより強調されるように周波数重みξを最適化する。処理(m)においては、フーリエ周波数成分CHLACデータおよび最適化された周波数重みを用いて各学習データについて映像特徴x~を求める。最後に、処理(n)においてはこの映像特徴x~から重回帰分析により係数行列aを求める。
図4は、本発明における質的評価を行う動作評価処理の評価時の処理内容を示す説明図である。評価時の処理も処理(g)のフーリエ周波数成分CHLACデータHの生成までは図2の学習時の処理と同一である。評価時においては、生成されたフーリエ周波数成分CHLACデータおよび学習モードの処理において最適化された周波数重みξから映像特徴x~を生成する。
質的評価の場合には、処理(o)において生成した映像特徴x~から、処理(p)において学習処理で求めた係数行列Aを用いて判別特徴ベクトルyを求める。そして、処理(q)において、k−NN法を使用して、求めた判別特徴ベクトルの最近傍の所定個数の判別特徴ベクトルの判定値から多数決で判定予測値を求める。
図5は、本発明における量的評価を行う動作評価処理の評価時の処理内容を示す説明図である。量的評価の場合も処理(g)のフーリエ周波数成分CHLACデータHの生成までは図2の学習時の処理と同一である。量的評価の場合には、処理(r)において生成した映像特徴x~から、処理(s)において学習処理で求めた係数行列aを用いて評価予測値を求める。
図8は、本発明におけるFW-CHLAC生成処理の内容を示すフローチャートである。なお、この処理においては、予め動画像データがコンピュータ内に取り込まれているものとする。S10においては、未処理の動画データを選択する。S11においては、動画フレームデータを入力する。
S12においては、フレーム間差分データを生成し、2値化する。まず、動画像データに対して「動き」の情報を検出し、背景など静止しているものを除去する目的で差分データを生成する。差分の取り方としては、隣接するフレーム間の同じ位置の画素の輝度の変化の絶対値を抽出するフレーム間差分方式を採用するが、フレーム内における輝度の変化部分を抽出するエッジ差分、あるいは両方を採用してもよい。なお、画素毎にRGBのカラーデータを持っている場合には、2つの画素の差分データとして、2つのRGBカラーベクトル間の距離を算出してもよい。
更に、「動き」に無関係な色情報やノイズを除去するために自動閾値選定による2値化を行う。2値化の方法としては、例えば一定閾値、下記非特許文献1に開示されている判別最小二乗自動閾値法、閾値0及びノイズ処理方式(濃淡画像において差が0以外を全て動き有り=1とし、公知のノイズ除去法によってノイズを除去する方法)を採用可能である。以上の前処理により、入力動画データは画素値に「動いた(1)」「動かない(0)」の論理値をもつフレームデータ(2値画像)の列となる。
大津展之、"判別および最小2乗規準に基づく自動しきい値選定法"電子通信学会論文誌D、J63-D-4、P349-356、1980年。
S13においては、1フレームの画素それぞれについて画素CHLACデータを抽出し、積算して251次元のフレーム対応CHLACデータを得る。ここで、立体高次局所自己相関(CHLAC) 特徴について説明する。N次の立体高次局所自己相関特徴(CHLAC) は次の数式36のようになる。
Figure 0005186656
ここでf(r) は差分2値化画像の画素値、rは位置ベクトル、a1、a2、…aNは変位ベクトルを表す。参照点(注目画素位置)rおよび参照点からみたN個の変位ai(i=1,…,N)は三次元のベクトルである。
高次自己相関関数は変位方向、次数のとり方により無数に考えられるが、これを局所領域に限定したものが高次局所自己相関関数である。CHLAC(立体高次局所自己相関特徴)では変位方向を参照点rを中心とする3×3×3画素の局所領域内、即ち参照点rの26近傍に限定している。1組の変位方向に対応する数式36の積分値が特徴量の1つの要素になる。従って変位方向の組み合わせ(=マスクパターン)の数だけ特徴量の要素が生成される。
図6は、3次元空間における自己相関処理座標を示す説明図である。図6においては、z−1層、z層、z+1層の3つの層のxy平面を並べて図示してある。本発明においては、注目する参照画素を中心とする3×3×3(=27)画素の立方体の内部の画素について相関を取る。
特徴量の要素数、つまり特徴ベクトルの次元はマスクパターンの種類に相当する。マスクパターンは、相関を取る画素の組合せを示す情報であり、マスクパターンによって選択された画素のデータは相関値の計算に使用されるが、マスクパターンによって選択されなかった画素は無視される。マスクパターンでは注目画素(中心の画素:参照点)は必ず選択される。
差分2値化画像の値の場合、画素値1を何回乗算しても1であるので、二乗以上の項は乗数のみが異なる1乗の項と重複するものとして削除する。また数式36の積分操作(平行移動:スキャン)で重複するパターンは1つの代表パターンを残して他を削除する。数式36右辺の式は参照点(g(r):局所領域の中心)を必ず含むので、代表パターンとしては中心点を含み、パターン全体が3×3×3画素の局所領域内に収まるものを選択する。
この結果、中心点を含むマスクパターンの種類は、選択画素数が1個のもの(0次):1個、2個のもの(1次):26個、3個のもの(2次):26×25/2=325個の計352個あるが、数式36の積分操作(平行移動:スキャン)で重複するパターンを除くと、マスクパターンの種類は251種類となる。即ち、1つの3次元データに対するCHLACベクトルは251次元となる。
図7は、自己相関マスクパターンの例を示す説明図である。図7(1)は注目画素のみの最も簡単な0次のマスクパターンである。(2)はハッチングを施した2つの画素が選択されている1次マスクパターン例、(3)、(4)はハッチングを施した3つの画素が選択されている3次マスクパターン例であり、この他に多数のパターンがある。そして、前記したように、重複するパターンを除くと、マスクパターンの種類は251種類となる。即ち、3×3×3画素の3次元データに対するCHLACベクトルは251次元となり、要素の値は0か1である。
CHLACには、対象の切り出しを必要とせず、画像内における対象の位置によらず同一の対象から同一の特徴量が得られるという位置不変性、および画像内に複数の対象がある場合、この画像全体から得られる特徴量がそれぞれの対象から得られる特徴量の和となる加法性がある。
図9は、S13のフレーム対応CHLACデータ抽出処理の詳細を示すフローチャートである。S20においては、251個の相関パターン対応の相関値群データをクリアする。S21においては、未処理の画素(参照点)を1つ選択する(対象空間内において参照点である立方体を順にスキャンする)。S22においては、未処理の相関マスクパターンを1つ選択する。
S23においては、前記した数式36を用いてパターンと対応する位置の画素値(0または1)を乗算して相関値を計算する。なお、この処理は前記した数式36におけるf(r)f(r+a1)…f(r+aN)の演算に相当する。S24においては、相関値は1か否かが判定され、判定結果が肯定の場合にはS25に移行するが、否定の場合にはS26に移行する。S25においては、マスクパターンと対応する相関値データに1を加算する。
S26においては、全てのマスクパターンについて処理が完了したか否かが判定され、判定結果が肯定の場合にはS27に移行するが、否定の場合にはS22に移行する。S27においては、全ての画素について処理が完了したか否かが判定され、判定結果が肯定の場合にはS28に移行するが、否定の場合にはS21に移行する。S28においては、相関値群データをフレーム対応CHLACデータとして出力する。
図8に戻って、S14においてはフレーム対応CHLACデータを保存する。S15においては、全フレームについて処理が完了したか否かが判定され、判定結果が否定の場合にはS13に移行するが、肯定の場合にはS16に移行する。S16においては、学習データ対応時系列CHLACデータを保存する。
S17においては、時系列CHLACデータから前述したフーリエ周波数成分CHLACHを求める。具体的には時系列CHLACデータをフレーム数τから前述した数式5で定義したフーリエ級数の基底関数に射影し、前述した数式9、数式12によってフーリエ周波数成分CHLACを集めた行列Hを求める。S18においては、処理すべき動画データ全てについて処理が完了したか否かが判定され、判定結果が否定の場合にはS10に移行するが、肯定の場合には処理を終了する。
図10は、図2の処理(h)〜(k)の学習処理(質的評価)の内容を示すフローチャートである。S30においては、前述したように、主成分分析によって学習用のフーリエ周波数成分CHLACデータの次元数を削減する。具体的には前述した数式21の固有値問題を解くことによって、固有ベクトルが得られ、固有ベクトルのうち、上位p(<m)個の固有値に対応するものを{u1,・・・ ,up}とおき、これらp個の固有ベクトルを用いて式22により、Hi∈Rd×mからH~i ∈Rd×pへと次元を削減する。
S31においては、評価値に基づき、フィッシャー判別基準を用いた線形判別分析により周波数重みξを最適化する。具体的にはクラス内共分散行列ΣWとクラス間共分散行列ΣBを前述した数式17によって求め、前述した数式19の固有値問題を解くことによって、固有ベクトルとして最適化された周波数重みξが得られる。S32においては、フーリエ周波数成分CHLACおよび周波数重みξから前述した数式14により映像特徴x~を求める。
S33においては、特徴x~および評価値から前述した線形判別分析によって係数行列Aおよび判別特徴ベクトルyを求める。具体的には、前述した数式15によってクラス内共分散行列ΣWとクラス間共分散行列ΣBを求め、数式32の固有値問題を解くことによって得られる。
図11は、図3の処理(l)〜(n)の学習処理(量的評価)の内容を示すフローチャートである。S40においては、評価値に基づき、最小二乗基準により周波数重みξを最適化する。具体的には、数式30によって周波数重みξが得られる。
S41においては、数式14により映像特徴x~を求める。S42においては、映像特徴x~および評価値から前述した重回帰分析によって係数行列aを求める。具体的には、映像特徴x~のコンポーネントの最後に1を追加し、ステップワイズ法によって映像特徴x~の変数選択を行いつつ、切片付きの重回帰分析を行って、係数行列aを求める。
図12は、図4の処理(o)〜(q)の評価処理(質的評価)の内容を示すフローチャートである。S50においては、最適化されたξを用いて映像特徴x~=Hξを求める。S51においては、学習処理において求めた係数行列Aを用いて映像特徴x~から判別特徴ベクトルyを求める。S52においては、判別特徴ベクトルからk−NN法によって判定予測値を求める。
公知の最近傍(NN、Nearest Neighbor)法とは、入力特徴点に最も近い学習サンプル点を求め、そのクラスに識別する手法であり、より一般的な方法としてk−最近傍(k−NN、k-Nearest Neighbor)法がある。k−NN法では入力特徴点に最も近いk個の学習サンプル点を求め、その中で最も多数を占めたクラスに識別する手法である。
図13は、図5の処理(r)、(s)の評価処理(量的評価)の内容を示すフローチャートである。S60においては、最適化されたξを用いて映像特徴x~=Hξを求める。S61においては、映像特徴x~から学習処理において求めた係数行列aにより評価予測値を求める。
以上、実施例を開示したが、本発明には以下のような変形例も考えられる。実施例においては、評価値を自動的に求める例を開示したが、元の動画データにおいて、評価に大きな影響を与える、注目すべき時間位置を求め、表示することも可能である。この場合には、求めた周波数重みξを時間重みに変換して表示することによって注目時間位置を表示することができる。これにより選手の運動技能向上へのアドバイスなどを行うことが容易となる。
また、フィッシャー判別規準および最小二乗規準による時間重みの最適化を、そのフーリエ係数だけではなく、基底関数に位相を加えることで時間重みの位相も同時に行う手法への応用が考えられる。実施例では予め対象となる動作の動画を時間的に切り出して使用する例を開示したが、位相を含めた最適化により、映像の時間的な切り出しが不要となり、より実用的かつ汎用的な手法になると考えられる。更に、時間重み関数の構成法として、実施例において開示したフーリエ級数展開以外にも、ハールやアダマールなどの他の級数展開を用いても良い。
本発明は体操競技等の競技会における得点の付与、各種スポーツにおけるフォームの評価、リハビリにおける運動姿勢の評価、工場等における作業動作、伝統工芸品の製作動作、ゲームにおけるアクションの評価などの人の動作の評価の他、動物やロボットなど任意の対象物の動作の評価に適用可能である。
本発明の動作評価装置のハードウェア構成の一例を示すブロック図である。 本発明における質的評価を行う動作評価処理の学習時の処理の概要を示す説明図である。 本発明における量的評価を行う動作評価処理の学習時の処理の概要を示す説明図である。 本発明における質的評価を行う動作評価処理の評価時の処理内容を示す説明図である。 本発明における量的評価を行う動作評価処理の評価時の処理内容を示す説明図である。 3次元空間における自己相関処理座標を示す説明図である。 自己相関マスクパターンの例を示す説明図である。 本発明におけるFW-CHLAC生成処理の内容を示すフローチャートである。 S13のフレーム対応CHLACデータ抽出処理の詳細を示すフローチャートである。 図2の処理(h)〜(k)の学習処理(質的評価)の内容を示すフローチャートである。 図3の処理(l)〜(n)の学習処理(量的評価)の内容を示すフローチャートである。 図4の処理(o)〜(q)の評価処理(質的評価)の内容を示すフローチャートである。 図5の処理(r)、(s)の評価処理(量的評価)の内容を示すフローチャートである。
符号の説明
10…ビデオカメラ
11…コンピュータ
12…モニタ装置
13…キーボード
14…マウス

Claims (8)

  1. 評価対象を撮影した動画像データからフレーム毎に差分・2値化データを生成する差分・2値化手段と、
    複数の前記差分・2値化データからフレーム毎に立体高次局所自己相関特徴を抽出し、時系列の立体高次局所自己相関特徴データを生成する特徴抽出手段と、
    前記時系列立体高次局所自己相関特徴データから多変量解析により予め求められた時間重みを用いて時間重み付き映像特徴データを生成する映像特徴生成手段と、
    前記映像特徴データの多変量解析により予め求められた係数行列を用いて対象動作を評価する評価手段と
    を備えたことを特徴とする動作評価装置。
  2. 更に、評価情報が付与された学習用データから多変量解析により前記時間重みおよび前記係数行列を求める学習手段を備えていることを特徴とする請求項1に記載の動作評価装置。
  3. 前記時間重みは、時系列のフレームに対する重みに帰着し、または時間重みをフーリエ級数展開しフーリエ周波数基底関数の重みに帰着し、学習的に求められることを特徴とする請求項2に記載の動作評価装置。
  4. 前記学習手段は、前記時系列の立体高次局所自己相関特徴データをフーリエ基底関数へ射影して周波数重み表現へと変換することにより、時間重みの連続関数をフーリエ級数で近似構成することを特徴とする請求項3に記載の動作評価装置。
  5. 前記学習手段は、
    質的評価情報に基づきフィッシャー判別基準を用いた線形判別分析により前記周波数重みを最適化する周波数重み生成手段と、
    前記周波数重み生成手段により生成された周波数重みを用いて前記時系列立体高次局所自己相関特徴データから映像特徴データを求める映像特徴生成手段と、
    前記映像特徴および前記評価情報から多変量解析により前記係数行列を生成する係数行列生成手段と
    を備えていることを特徴とする請求項4に記載の動作評価装置。
  6. 前記周波数重み生成手段は、主成分分析により前記周波数重み付き立体高次局所自己相関特徴データの次元数を削減する次元数削減手段を備えていることを特徴とする請求項5に記載の動作評価装置。
  7. 前記学習手段は、
    量的評価情報に基づき最小二乗基準により前記フーリエ基底関数の重みを最適化する周波数重み生成手段と、
    前記周波数重み生成手段により生成された周波数重みを用いて前記時系列立体高次局所自己相関特徴データから映像特徴データを求める映像特徴生成手段と、
    前記映像特徴および前記評価情報から多変量解析により前記係数行列を生成する係数行列生成手段と
    を備えていることを特徴とする請求項4に記載の動作評価装置。
  8. 評価対象を撮影した動画像データからフレーム毎に差分・2値化データを生成するステップ、
    複数の前記差分・2値化データからフレーム毎に立体高次局所自己相関特徴を抽出し、時系列の立体高次局所自己相関特徴データを生成するステップ、
    前記時系列立体高次局所自己相関特徴データから多変量解析により予め求められた時間重みを用いて時間重み付き映像特徴データを生成するステップ、
    前記映像特徴データの多変量解析により予め求められた係数行列を用いて対象動作を評価するステップ
    を含むことを特徴とする動作評価方法。
JP2008226159A 2008-09-03 2008-09-03 動作評価装置および動作評価方法 Active JP5186656B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008226159A JP5186656B2 (ja) 2008-09-03 2008-09-03 動作評価装置および動作評価方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008226159A JP5186656B2 (ja) 2008-09-03 2008-09-03 動作評価装置および動作評価方法

Publications (2)

Publication Number Publication Date
JP2010061376A JP2010061376A (ja) 2010-03-18
JP5186656B2 true JP5186656B2 (ja) 2013-04-17

Family

ID=42188113

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008226159A Active JP5186656B2 (ja) 2008-09-03 2008-09-03 動作評価装置および動作評価方法

Country Status (1)

Country Link
JP (1) JP5186656B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5881136B2 (ja) 2010-09-27 2016-03-09 ソニー株式会社 情報処理装置及び方法、並びにプログラム
EP2729829A4 (en) 2011-07-08 2015-04-22 Australian Nuclear Science Tec RADION DUCK DETECTION AND IDENTIFICATION
JP6214424B2 (ja) * 2014-02-20 2017-10-18 アイホン株式会社 特定動作検出装置
JP6214425B2 (ja) * 2014-02-20 2017-10-18 アイホン株式会社 特定動作検出装置
WO2018069981A1 (ja) * 2016-10-11 2018-04-19 富士通株式会社 運動認識装置、運動認識プログラムおよび運動認識方法
EP3693923A4 (en) 2017-10-03 2020-12-16 Fujitsu Limited RECOGNITION PROGRAM, RECOGNITION PROCESS AND RECOGNITION DEVICE
JP7352119B2 (ja) 2020-04-02 2023-09-28 日本電信電話株式会社 学習装置、学習方法及び学習プログラム、並びに、スコア推定装置、スコア推定方法及びスコア推定プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4929460B2 (ja) * 2006-12-28 2012-05-09 国立大学法人九州工業大学 動体の動作認識方法

Also Published As

Publication number Publication date
JP2010061376A (ja) 2010-03-18

Similar Documents

Publication Publication Date Title
JP4215781B2 (ja) 異常動作検出装置および異常動作検出方法
Villegas et al. Learning to generate long-term future via hierarchical prediction
JP5186656B2 (ja) 動作評価装置および動作評価方法
JP2006079272A (ja) 異常動作検出装置および異常動作検出方法
Kale et al. Identification of humans using gait
JP5054206B2 (ja) 画像処理方法及び画像処理装置
EP2905724B1 (en) Object detection system and method
JP6870346B2 (ja) データ分析システム、データ分析方法およびプログラム
Kuzmanic et al. Hand shape classification using DTW and LCSS as similarity measures for vision-based gesture recognition system
JP4682820B2 (ja) オブジェクト追跡装置及びオブジェクト追跡方法、並びにプログラム
JP4061377B2 (ja) 3次元データからの特徴抽出装置
JPWO2017154655A1 (ja) 群衆種類識別システム、群衆種類識別方法および群衆種類識別プログラム
TWI776176B (zh) 手部作業動作評分裝置、方法及電腦可讀取存儲介質
US20220207874A1 (en) Image frame extraction apparatus and image frame extraction method
Liu et al. Silhouette-based on-site human action recognition in single-view video
JP5538781B2 (ja) 画像検索装置及び画像検索方法
JP4918615B2 (ja) 対象個数検出装置および対象個数検出方法
JP6405603B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP4449483B2 (ja) 画像解析装置、および画像解析方法、並びにコンピュータ・プログラム
JP2015049702A (ja) 対象認識装置、対象認識方法、およびプログラム
JP4929460B2 (ja) 動体の動作認識方法
Trivedi et al. Towards general game representations: Decomposing games pixels into content and style
JP4682365B2 (ja) 3次元データからの特徴抽出方法および装置
JP2834153B2 (ja) 適応学習型汎用画像計測装置
JP2018088093A (ja) 物体候補領域抽出装置、方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110607

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120705

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121220

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5186656

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250