JP4061377B2 - 3次元データからの特徴抽出装置 - Google Patents

3次元データからの特徴抽出装置 Download PDF

Info

Publication number
JP4061377B2
JP4061377B2 JP2003321962A JP2003321962A JP4061377B2 JP 4061377 B2 JP4061377 B2 JP 4061377B2 JP 2003321962 A JP2003321962 A JP 2003321962A JP 2003321962 A JP2003321962 A JP 2003321962A JP 4061377 B2 JP4061377 B2 JP 4061377B2
Authority
JP
Japan
Prior art keywords
data
dimensional
feature data
feature
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003321962A
Other languages
English (en)
Other versions
JP2005092346A (ja
Inventor
展之 大津
匠 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2003321962A priority Critical patent/JP4061377B2/ja
Publication of JP2005092346A publication Critical patent/JP2005092346A/ja
Application granted granted Critical
Publication of JP4061377B2 publication Critical patent/JP4061377B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、動画像における動作の認識、および3次元形状認識に関わる技術に関するものである。
画像データから特定の図形等を検出し認識したり、登録されている画像との照合のための各種の技術が提案されている。発明者らは下記に公報番号を示すように、2次元画像に対して、幾つかの望ましい条件から非常に汎用的な高次自己相関特徴に基づく学習適応型画像認識・計測方式の発明を行った。
特許第2982814号公報
動画像は2次元(静止)画像が時間に沿って並んだ3次元(立体)の数値データである。これらの動画像における動作の認識の分野では、新たなニーズが高まりつつあるが、文字など2次元の静止画像の認識に比べると、幾つかのヒューリスティックな(思いつき)手法の提案を除き、殆ど基本的かつ汎用的な体系立った特徴抽出方式が存在しない。従来の動画像からの最も基本的な特徴抽出手法とされているものにオプティカルフローがあるが、それが寄って立つ前提条件が実際には厳しく、しかも微分に基づくために実際のノイズに弱いなど、実応用につながっていない。
本発明は、動画像認識において今後ますますニーズの高くなるコンピュータ・ビジョン(人工視覚)に広く使える基本的かつ汎用的な特徴抽出方式であり、高次局所自己相関特徴抽出方式を3次元に拡張した立体高次局所自己相関特徴抽出方式であることを最も主要な特徴とする。そして、この立体高次局所自己相関特徴抽出方式と多変量解析などの統計的な情報統合手法を組み合わせることにより、適応学習型の汎用動画像認識方式が得られる。また同手法は、3次元形状認識にもそのまま用いることができる。
立体高次局所自己相関特徴抽出方式によって抽出される特徴値は、対象の立体における場所や時間に依らない位置不変な値である(位置不変性)ので、対象を画像から切り出す必要がない。また、立体内に複数個の対象がある場合、全体の特徴値はそれぞれの個別の特徴値の和になる性質を持つ(加法性)。これらの性質は、以後の認識にとって扱い易く好ましい性質である。さらに、微分でなく積分(累積)に基づくためにノイズに頑健である。また、特徴抽出のための計算量が少なく、実時間処理が可能である。
発明者がこの方式を実際の動画像認識に対して実験した結果、本発明の動画像からの動作の認識結果は非常に良好であり、画像認識、計測、人工視覚、ロボット視覚、コンピュータ・ヒューマン・インタフェース分野全般、さらにはビデオサーベイランス、監視システム、警備システムなどセキュリティに関わる応用分野など、広く様々な課題に応用できるという利点がある。
動画像データの認識や計測は、対象の3次元データ内における場所に寄らないことが望ましく、従って抽出される特徴データは位置不変であることが望ましい。また、3次元データ内に複数個の対象がある場合、全体の特徴値はそれぞれの個別の特徴値の和になると以後の認識にとって扱い易い。さらに、特徴抽出としては計算量が少なく実時間処理が可能であることが望ましい。
これらの要請条件を満たす基本的で汎用的な特徴抽出方式として、2次元の場合の高次局所自己相関特徴抽出方式を3次元に拡張した立体高次局所自己相関特徴抽出方式を用いる。そして、この特徴抽出方式と多変量解析などの統計的な情報統合手法を組み合わせることにより、適応学習型の汎用動画像(動作)認識方式が得られる。
図1は、本発明による動作認識処理の内容を示すフローチャートである。なお、この処理は、デジタルビデオカメラやその他の動画像を取り込むためのインターフェイス回路を備えたパソコンなどの周知の任意のコンピュータシステムにおいてプログラムを作成し、インストールして起動することにより実行される。動画像データは例えばビデオカメラから実時間で入力されてもよいし、一旦ファイルに保存されてから3次元データとして読み込んでもよい。従って、システムのハードウェア構成については説明を省略する。
S10においては、動画像(あるいは3次元画像)データ等の3次元データを読み込む。S11においては、入力動画データに対して「動き」の情報を検出し、背景など静止しているものを除去する目的で差分データを生成する。差分の取り方としては、隣接するフレーム間の同じ位置の画素の輝度(カラー画像の場合は色)の変化を抽出するフレーム間差分またはフレーム内における輝度の変化部分を抽出して得られるエッジのフレーム間差分、あるいは両方を採用可能である。
S12においては、差分値から「動き」に無関係な輝度値や色情報、ノイズを除去し、動きあり(値1)動きなし(値0)の2値情報にするために、自動閾値選定による2値化を行う。輝度あるいはエッジの差分で動きのある画素が得られるが、差分の値は輝度の差であり、照明条件や色などで値が異なってくるため、動きの情報だけではない。2値化の目的は、ある閾値を設けて、これより差分値が小さいとノイズとみなし、値を0とし、動きなしと判断する。また、閾値より差分値が大きいと値を1とし、動きありと見なす(判断する)ことにある。これによって、ノイズや色や明るさの違いに頑健にいわゆる「動き」情報を得ることができる。カラー画像の場合も、差分値として色ベクトル(R,G,B)差分値(距離)をとれば、濃淡画像と同様に扱うことができる。 2値化の方法としては、一定閾値、判別最小二乗自動閾値法(大津方式:画像内のピクセル値のヒストグラムを作成し、2群が統計的にもっとも分離される閾値を自動的に選定する)、閾値0及びノイズ処理方式(濃淡画像において差が0以外を全て動き有り=1としてまず2値化を行い、その2値画像のノイズを除去するために2値画像に対して収縮処理を行う方法)を採用可能である。図4は、2値化差分処理結果の画像を示す説明図である。図4左は入力された濃淡画像であり、右がフレーム間差分を取り、2値化した画像である。以上の前処理により入力動画データは画素値に「動いた(1)」「動かない(0)」の論理値をもつフレームの列となる。
図1に戻って、S13においては、詳細は後述するが、立体高次局所自己相関特徴抽出処理(251次元特徴データ生成)を行う。自己相関関数の高次への拡張が高次自己相関関数である。N次自己相関関数は、3次元データをf(r)(但しr=(x,y,z))とすると、次の式1となる。
xN(a1,a2,…,aN)=∫f(r)f(r+a1)…f(r+aN)dr ……(式1) ただし、0次は3次元データの総和、x0(0)=∫f(r)dr である
ここで(a1,a2,…,aN)は参照点(注目画素)からみた変位方向である。変位方向、次数のとり方により高次自己相関関数は無数に考えられるが、これを局所領域に限定したものが高次局所自己相関関数である。立体高次局所自己相関特徴では相関を取る範囲を注目画素から所定の距離にある画素の範囲とし、例えば変位方向を参照点を中心とする3×3×3画素の局所領域内、即ち参照点の26近傍に限定している。特徴量の計算は1組の変位方向に対して式1の積分値が1つの特徴量になる。従って変位方向の組み合わせ(=マスクパターン)の数だけ特徴量が生成される。
特徴量の数、つまり特徴ベクトルの次元はマスクパターンの種類に相当する。2値画像の場合、画素値1を何回乗算しても1であるので、二乗以上の項は乗数のみが異なる1乗の項と重複するものとして削除する。また式1の積分操作(スキャン)において、平行移動すると一致するパターンは重複するので、1つの代表パターンを残して他を削除する。式1右辺の式で参照点f(r)は局所領域の中心を必ず含むので、代表パターンとしては中心点を参照点とし、パターン全体が3×3×3画素の局所領域内に収まるものを選択する。 この結果、中心点を含むマスクパターンの種類は、選択画素数が1個のもの:1個、2個のもの:26個、3個のもの:26×25/2=325個の計352個あるが、式1の積分操作(平行移動:スキャン)で重複するパターンを除くと、マスクパターンの種類は251種類となる。即ち、1つの3次元データに対する立体高次局所自己相関特徴ベクトルは251次元となる。 なお、画素の値が多値の濃淡画像の場合には、例えば画素値をaとすると、相関値はa(0次)≠a×a(1次)≠a×a×a(2次)となり、選択画素が同じでも乗数の異なるものを重複削除できない。従って、多値の場合には、2値の場合より選択画素数が1の場合に2個、選択画素数が2の場合に26個増加し、マスクパターンの種類は計279種類となる。
このように計算される立体高次局所自己相関特徴の性質としては、自己相関で積分の特徴量であるために、しかも変位方向を局所領域に限定しているために、データ内の対象の位置に依らない位置不変性と、対象に対する加法性といった好ましい性質がある。またノイズ対しても頑強である性質を持つ。S14においては、多変量解析手法により予め求めた課題に適した係数行列Aを用いて、下記の計算により、課題に有効な新特徴データを生成する。
y=A’x
ここで、xは251次元特徴ベクトルデータ(縦ベクトル)、yはn次元(一般にn<<251)の新特徴ベクトルデータ(縦ベクトル)、A’は係数行列Aの転置行列である。新特徴ベクトルyの次数nは、例えば判別分析の場合、「識別したいクラスの数−1」および「元の特徴ベクトルの次元」の小さい方となるので、例えばクラスが4であればyは3次元となり、特徴データが大幅に圧縮される。また、主成分分析の場合は元の次元251以下の任意の次元を有効な順番に取れる。
ここで、係数行列Aの決定方法について説明する。係数行列Aは、例えば「右歩き」など「動作」が判明している学習用データ(251次元特徴ベクトルデータ)を使用して、回帰分析、主成分分析、判別分析等の周知の多変量解析手法を使用して求める。なお、多変量解析手法については前記した特許文献あるいは、柳井他編「多変量解析実例ハンドブック」(2002年6月25日朝倉書店発行)などに記載されているので詳細な説明は省略すが、一例として判別分析について説明する。 判別分析においては、ベクトルyが空間としてKクラスを最適に分離するように係数Aは次の固有値問題の解(固有値ベクトル)として求まる。
BA=XwAΛ (A’XwA=I)
ここに、Λは固有値対角行列、Iは単位行列である。また、Xw、XBはそれぞれ特徴ベクトルxのクラス内、クラス間共分散行列であり、次式で定義される。
ここで、ωjはクラスjの生起確率、xj(アッパーライン)はクラスjの平均ベクトル、Xjはクラスjの共分散行列、xT(アッパーライン)は全平均ベクトルである。
S15においては、新特徴空間Yにおいて登録データと比較する。比較方法としては、例えば新特徴空間における各クラスの平均ベクトル(yj(アッパーライン)=A’xj(アッパーライン))と入力新特徴ベクトル間の距離を計算する。 S16においては、比較結果に基づき判定を行い、認識結果を出力する。最も単純な判定方法としては、登録されている各クラス平均ベクトル(各クラスの重心)の内で最も距離の近いものに対応する動作と判定する。あるいは新特徴ベクトルの内で最も入力に距離が近いk個の登録データの内、最大多数のクラスに対応する動作と判定するk-NN(Nearest neighbor rule)法などの方法が考えられる。更に高度な非線形識別方法としては、カーネルベース識別手法を採用してもよい。
図2は、S13の立体高次局所自己相関特徴抽出処理の内容を示すフローチャートである。S20においては、251個の相関パターンカウンタをクリアする。S21においては、未処理の画素を1つ選択する(注目画素を順にスキャンする)。S22においては、未処理のマスクパターンを1つ選択する。
図5は、3次元画素空間における自己相関処理範囲を示す斜視図である。また、図6は、3次元画素空間における自己相関処理座標を示す説明図である。図6においては、t−1フレーム、tフレーム、t+1フレームの3つのフレームのxy平面を並べて図示してある。 本発明においては、注目画素を中心とする3×3×3(=27)画素の立方体の内部の画素について相関を取る。マスクパターンは、相関を取る画素の組合せを示す情報であり、マスクパターンによって選択された画素のデータは相関値の計算に使用されるが、マスクパターンによって選択されなかった画素は無視される。
前記したように、マスクパターンでは注目画素(中心の画素)は必ず選択される。また、2値画像で0次〜2次までの相関値を考えた場合、3×3×3画素の立方体において重複を排除した後のパターン数は251個となる。 図7は、自己相関マスクパターンの例を示す説明図である。図7(1)はハッチングを施した注目画素のみの最も簡単な0次のマスクであり、(2)は2つの画素が選択されている例(1次)、(3)、(4)は3つの画素が選択されている例(2次)である。
図2に戻って、S23においては、前記した式1を用いて相関値を計算する。式1のf(r)f(r+a1)…f(r+aN)の式はマスクパターンと対応する座標の差分2値化3次元データの値を掛け合わせる(=相関値、0または1)ことに相当する。また、式1の積分操作は注目画素を3次元データ内で移動(スキャン)させて相関値をカウンタによって足し合わせる(1をカウントする)ことに相当する。
S24においては、相関値は1か否かが判定され、判定結果が肯定の場合にはS25に移行するが、否定の場合にはS26に移行する。S25においては、マスクパターンと対応する相関パターンカウンタを+1する。S26においては、全てのパターンについて処理が完了したか否かが判定され、判定結果が肯定の場合にはS27に移行するが、否定の場合にはS22に移行する。
S27においては、全ての画素について処理が完了したか否かが判定され、判定結果が肯定の場合にはS28に移行するが、否定の場合にはS21に移行する。S28においては、パターンカウンタ値の集合を251次元特徴データとして出力する。 なお、画素値が多値のグレースケールの場合には相関値も多値となるので、カウンタの代わりにレジスタを使用し、相関値をレジスタに加算していくことによって特徴量を生成する。
図3は、本発明による動画像実時間処理の内容を示すフローチャートである。図1、2に示した処理は動画像データを予め取り込んでから処理を行う場合の例であるが、図3の例は、例えばビデオカメラから実時間で画像データを取り込んで処理を行う場合の例である。
S30においては、フレームデータの入力があるまで待つ。S31においては、フレーム画像データを入力する。S32においては、図1のS11、S12と同様に差分データを生成し、2値化する。S33においては、新たな1フレーム分の画素データに関する相関パターンカウント処理を行う。
図8は、本発明による動画像実時間処理の内容を示す説明図である。動画像データはフレームのシーケンスとなっている。そこで時間方向に一定幅の時間窓を設定し、窓内のフレーム集合を1つの3次元データとする。そして、新たなフレームが入力される度に時間窓を移動させ、古いフレームを削除することで有限な3次元データが得られる。この時間窓の長さは、認識しようとする動作の1周期より長く設定することが望ましい。
図8において時刻tに新たなフレームが入力された時点では、直前の時間窓(t-1,t-n-1)に対応する特徴データはすでに算出されている。但し、(t-1)フレームは端なので相関値は(t-2)フレームに対応するものまで算出されている。
そこで、新たに入力されたtフレームを用いて(t-1)フレームに対応する特徴データを生成し、現在の特徴データに加算する。また、最も古い(t-n-1)フレームと対応する特徴データを現在の特徴データから減算する。このような処理により、より少ない計算量で特徴データの更新が可能となる。なお、上記処理を行うために、各フレームに対応して生成された特徴データを保存しておく。
図3に戻って、S34においては、特徴データであるカウント値集合をフレームに対応して保存する。S35においては、カウント値集合を現在の特徴データに加算する。S36においては、最も古いフレームに対応するカウント値集合を特徴データから減算する。
S37においては、S14と同様に多変量解析手法により得られた係数を使用して特徴データから新特徴データを生成する。S38においては、S15、S16と同様に登録されている新特徴データとの一致を判定する。S39においては、判定結果を出力する。S40においては、処理を終了するか否かが判定され、判定結果が肯定の場合には処理を終了するが、否定の場合にはS30に移行する。以上のような方法によって、実時間処理が可能となる。
次に、発明者らが行った実験の結果について説明する。基礎実験においては、対象者は5人、識別クラス(動作の種類)は「右歩き」「左歩き」「右走り」「左走り」の4クラス。動画像は352×240画素、グレースケール。人の大きさは30×80画素。全データ数は立体データが約2000個とした。
ランダムに全体の3分の2をテストデータ、残りを学習データとして識別を行った。立体データの時間幅は30フレームとした。但し歩行1周期は時間幅25フレームに相当する。変更パラメータはマスクパターンの局所立体における縦、横、奥行の長さである。縦横はフレーム内での相関をとる空間的距離に相当し、奥行は時間軸上での相関をとる時間間隔に相当する。この結果、マスクの大きさにほとんど依存せずに高い識別率を得られることがわかった。
次に立体データの時間幅を変えて実験を行った。この結果、行動1周期が収まらない時間幅では若干識別率が落ちるが、それでもどの時間幅でも高い識別率が得られた。以上の実験から立体高次局所自己相関特徴がパラメータに依存しない特徴抽出手法であることが実証された。 図9は、行動認識実験における新特徴空間での実験データの分布を示すグラフである。この実験では、クラス数が4であるので、判別分析によって得られる新特徴空間は3次元となり、グラフの各軸がそれぞれの次元(判別軸)を表している。さらに、発明者らは画面内に複数人の行動が映っている場合の認識実験を行なった。従来は個々の人物の検出とトラッキングを行なった上で別々に認識する方法しかなかったが、立体高次局所自己相関特徴の加法性を利用することでこれを同時に認識することが可能である。一般の複数人対象の場合は、加法性より次のように定式化される。
x=α1f1+α2f2+α3f3+α4f4+ε……(式2)。
ここでxは複数人が映っている動画像に対する立体高次局所自己相関特徴ベクトル、f1,…,f4は「右歩き」「左歩き」「右走り」「左走り」の各クラスにおける立体高次局所自己相関特徴ベクトルの平均ベクトル、α1,…,α4は「右歩き」「左歩き」「右走り」「左走り」のそれぞれの行動が画面内に含まれている数(整数値)、εは誤差ベクトルである。 図9の判別空間プロット図を見ると、確かに行動ベクトルの線形和付近にデータが密集しているため、加法性(式2)の正当性が確かめられる。式2は立体高次局所自己相関特徴ベクトルの次元(251次元)と判別クラス数(4つ)の関係から疑似逆行列を用いて解析的に一意に解ける。また、線形判別空間(3次元)は元の特徴空間を線形写像したものであるため、式2は成立する。そこで、線形判別空間において式2の解を探索することも可能である。解の探索は、0≦α1,…,α4≦10の範囲での全探索と、遺伝的アルゴリズムを用いた探索を行った。 結果は、疑似逆行列では識別率が悪いが、これは251次元の特徴ベクトル空間においては各クラスがそれほどカテゴリを形成していないことによると考えられる。それぞれのクラスがほぼ左右対称な位置にあり、その平均ベクトルが独立でないと推測され、このことが原因と思われる。しかし線形判別空間では完全に識別できているため、複数対象の場合でも十分に識別が可能であることがわかった。
図10は、行動認識実験における新特徴空間での行動の遷移状態を示すグラフである。実環境において人間の行動は一定ではなく、様々に変化する。そこで、そのような行動の
遷移が含まれる動画像に対する動作の認識を行なう。基本実験で用いた行動データを人間の行動が連続するようにつなぎ合わせることにより行動の遷移が含まれるデータを作成した。図10を見ると、判別空間内での行動クラス間の遷移がほぼ直線状にきれいに現れている。
次に行動からの個人の同定、つまりGait Recognitionについて説明する。Gait Recognitionはバイオメトリクス認証の一つとして、近年注目をあつめている。その利点としては歩様などの行動は特徴を隠しづらく、また離れた位置からも個人認証が可能となる点である。 図11は、行動による複数人同時同定実験における新特徴空間での実験データの分布を示すグラフである。実験の対象者は5人、識別クラスは「人1」「人2」「人3」「人4」「人5」の5クラス。動画像は352×240画素、グレースケール。人の大きさは30×80画素とした。 左右走歩行のデータ全体に対してランダムに3分の2をテストデータ、残りを学習データとして識別を行った。また、左右走歩行のデータそれぞれに対して、それぞれのデータ内においてランダムに3分の2をテストデータ、残りを学習データとして識別を行った。識別率はこれらを100回繰り返し平均をとる。時間幅は30とした。その結果、どの行動に対しても高い識別率が得られた。つまり、立体高次局所自己相関特徴は個人の行動の差異を反映していると言える。そのためGait Recognitionも可能であることがわかる。
次に、より実環境に促した拡張実験を行なった。但し時間幅は30とした。画面内に複数「人」が映っている場合の同定を行なう。これは人の往来の多い場所での認証に必要となる。従来は個々の人のトラッキングを行なった上で別々に同定する方法しかなかったが、立体高次局所自己相関特徴の加法性を利用することで、画面に写っている人全員を同時に同定することが可能となる。一般の複数人の場合は、加法性より次のように定式化される。
x=α1f1+α2f2+α3f3+α4f4+α5f5+ε……(式3)。
ここでxは複数人が映っている動画像に対する立体高次局所自己相関特徴ベクトル、f1,…,f5は「人1」「人2」「人3」「人4」「人5」の各クラスにおける立体高次局所自己相関特徴ベクトルの平均ベクトル、α1,…,α5は「人1」「人2」「人3」「人4」「人5」のそれぞれの行動が画面内に含まれている数(0 or 1)、εは誤差ベクトルである。 図11の判別空間プロット図を見ると、確かに人ベクトルの線形和付近にデータが密集しているため、加法性の正当性が確かめられた。式3は立体高次局所自己相関特徴ベクトルの次元(251次元)と判別クラス数(5つ)の関係から疑似逆行列を用いて解析的に一意に解ける。また、線形判別空間(3次元)は元の特徴空間を線形変換したものであるため、式3は成立する。そこで、線形判別空間において式3の解を探索することも可能である。解の探索は、0≦α1,…,α5≦1の範囲での全探索と、遺伝的アルゴリズムを用いた探索を行った。 この結果、疑似逆行列では識別率が悪いが、これは251次元の特徴ベクトル空間においては各クラスがそれほどカテゴリを形成していないことによると考えられる。しかし線形判別空間では完全に識別できているため、複数対象の場合でも十分に識別が可能であることがわかる。
以上、実施例および実験結果を示したが、本発明の手法は3次元データから認識に実質的に有効な特徴を抽出することで、これまでの手法よりデータの本質を捉えた認識が可能になると考えられる。また、この手法の基本概念である相関はノイズにも強いことが知られており、この手法がノイズにロバストな特徴量を算出することが期待できる。
本発明の有効性を確かめるために動画像認識における行動認識とGait(歩様) Recognitionに適用し、実験により高い識別率が得られた。さらにこれまでの手法では不可能であった複数対象の同時認識も立体高次局所自己相関特徴の加法性から可能であることを示し、実験によりそれを実証した。
動画像に対して、時間幅を設定することで時系列データの対処を行ったが、これは人間での短期記憶に相当すると考えられる。しかし、時間幅が短すぎると識別率が悪くなり、長すぎても行動の遷移に鈍くなるため、時間幅の適切な設定も重要である。
立体高次局所自己相関特徴はスケールの変化に敏感であるため、スケールの設定が重要である。立体高次局所自己相関特徴をスケール不変とするためには、1つの3次元データからスケールの異なる複数の3次元データを生成し、それぞれのデータにおいて行動等の認識処理を行い、その結果を用いて総合的に判定することが考えられる。 実施例においては、2次までの自己相関を用いたが、3次以上のより高次の自己相関を用いてもよい。相関を取る範囲も3×3×3より狭い範囲あるいは広い範囲を用いてもよく、範囲が立方体でなくてもよい。また、1画素飛びや2画素飛びに3×3×3画素を取るようにしてもよい。 実施例においては、251種のマスクパターン全てを使用する例を開示したが、特徴の表現に寄与しているパターンのみを選択して使用してもよい。そうすれば、処理速度がより向上する。 以上、動作の認識を行う実施例について説明したが、ステレオビジョンやレンジファインダーなどの方法で得られる3次元(静止)物体のデータ、あるいはMRIやCTスキャナにより得られるデータも3次元(立体)の数値データであるので、本発明をそのまま適用して、3次元物体の認識を行うことが可能であり、物体の識別や病巣の検出などの応用に利用可能である。
本発明による物体、動作認識処理の内容を示すフローチャートである。 S13の立体高次局所自己相関特徴抽出処理の内容を示すフローチャートである。 本発明による動画像実時間処理の内容を示すフローチャートである。 2値化差分処理結果の画像を示す説明図である。 3次元画素空間における自己相関処理範囲を示す斜視図である。 3次元画素空間における自己相関処理座標を示す説明図である。 自己相関マスクパターンの例を示す説明図である。 本発明による動画像実時間処理の内容を示す説明図である。 行動認識実験における新特徴空間での実験データの分布を示すグラフである。 行動認識実験における新特徴空間での行動の遷移状態を示すグラフである。 行動による複数人同時同定実験における新特徴空間での実験データの分布を示すグラフである。
符号の説明
x 251次元特徴データ A 係数行列 y 新特徴データ

Claims (8)

  1. 注目画素と相関を取る画素の位置を示す相関パターンの内、3次元方向に平行移動することにより一致する相関パターンを1つを残して他を削除した相関パターンを用い、動画像データを3次元データと見なして、相関パターン毎に注目画素値と相関を取るべき1つあるいは複数の画素の画素値との積を取り、相関パターン毎に前記積を所定3次元範囲の画素について積分する立体高次局所自己相関によって特徴データを抽出する特徴データ抽出手段と、
    前記特徴データから多変量解析手法により得られた係数データを使用し、前記特徴データから新特徴データを生成する新特徴データ生成手段と、
    予め動作が既知の動画像データから生成された新特徴データである登録データと前記新特徴データ生成手段から出力される新特徴データとを比較することにより、動作の認識を行う認識手段と
    を備えたことを特徴とする3次元データからの特徴抽出装置。
  2. 前記立体高次局所自己相関においては、相関を取る範囲を注目画素を中心とする3×3×3画素の範囲とすることを特徴とする請求項1に記載の3次元データからの特徴抽出装置。
  3. 前記立体高次局所自己相関においては、注目画素のみの0次相関パターン、注目画素と相関を取る近傍の1画素からなる1次相関パターン、注目画素と相関を取る近傍の2画素からなる2次相関パターンによって相関を取ることを特徴とする請求項1に記載の3次元データからの特徴抽出装置。
  4. 更に、動画像データから隣接するフレーム間で輝度値の差分を取ったフレーム間差分データを生成するフレーム間差分データ生成手段を備えたことを特徴とする請求項1に記載の3次元データからの特徴抽出装置。
  5. 前記フレーム間差分データの差分値の絶対値が所定の閾値以上であるか否かによって値が決定される2値化手段を備えたことを特徴とする請求項4に記載の3次元データからの特徴抽出装置。
  6. 前記特徴データ抽出手段は、
    新たな動画像のフレームデータを入力する入力手段と、
    前記フレームデータを動画像データに追加したことによって新たに生成される特徴データを生成する特徴データ生成手段と、
    前記新たに生成された特徴データをフレームデータと対応して保存すると共に現在の特徴データに加算する加算手段と、
    所定の時間窓と対応する時間が経過したフレームデータと対応する特徴データを読み出して現在の特徴データから減算する減算手段と
    を含むことを特徴とする請求項1に記載の3次元データからの特徴抽出装置。
  7. 前記認識手段は、予め既知の異なる対象毎の動作を記録した動画像データから生成された登録データと前記新特徴データ生成手段から出力される新特徴データとを比較することにより、前記対象を特定することを特徴とする請求項1に記載の3次元データからの特徴抽出装置。
  8. コンピュータを
    注目画素と相関を取る画素の位置を示す相関パターンの内、3次元方向に平行移動することにより一致する相関パターンを1つを残して他を削除した相関パターンを用い、動画像データを3次元データと見なして、相関パターン毎に注目画素値と相関を取るべき1つあるいは複数の画素の画素値との積を取り、相関パターン毎に前記積を所定3次元範囲の画素について積分する立体高次局所自己相関によって特徴データを抽出する特徴データ抽出手段、
    前記特徴データから多変量解析手法により得られた係数データを使用し、前記特徴データから新特徴データを生成する新特徴データ生成手段、
    予め動作が既知の動画像データから生成された新特徴データである登録データと前記新特徴データ生成手段から出力される新特徴データとを比較することにより、動作の認識を行う認識手段
    として機能させることを特徴とする3次元データからの特徴抽出プログラム。
JP2003321962A 2003-09-12 2003-09-12 3次元データからの特徴抽出装置 Expired - Lifetime JP4061377B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003321962A JP4061377B2 (ja) 2003-09-12 2003-09-12 3次元データからの特徴抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003321962A JP4061377B2 (ja) 2003-09-12 2003-09-12 3次元データからの特徴抽出装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007287045A Division JP4682365B2 (ja) 2007-11-05 2007-11-05 3次元データからの特徴抽出方法および装置

Publications (2)

Publication Number Publication Date
JP2005092346A JP2005092346A (ja) 2005-04-07
JP4061377B2 true JP4061377B2 (ja) 2008-03-19

Family

ID=34453480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003321962A Expired - Lifetime JP4061377B2 (ja) 2003-09-12 2003-09-12 3次元データからの特徴抽出装置

Country Status (1)

Country Link
JP (1) JP4061377B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009140247A (ja) * 2007-12-06 2009-06-25 United Technologies Institute 異常動作監視装置
CN106127732A (zh) * 2016-06-13 2016-11-16 深圳市太赫兹科技创新研究院 微波图像中人体性别检测方法和装置

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4215781B2 (ja) 2006-06-16 2009-01-28 独立行政法人産業技術総合研究所 異常動作検出装置および異常動作検出方法
JP4603512B2 (ja) * 2006-06-16 2010-12-22 独立行政法人産業技術総合研究所 異常領域検出装置および異常領域検出方法
JP5046148B2 (ja) * 2006-07-06 2012-10-10 株式会社メガチップス 画像解析装置および対象物認識方法
JP4429298B2 (ja) * 2006-08-17 2010-03-10 独立行政法人産業技術総合研究所 対象個数検出装置および対象個数検出方法
JP2008140267A (ja) * 2006-12-04 2008-06-19 National Institute Of Advanced Industrial & Technology 動作認識装置および動作認識処理方法
JP4802330B2 (ja) * 2006-12-28 2011-10-26 国立大学法人九州工業大学 動体の動作判別方法
JP4742370B2 (ja) * 2007-02-01 2011-08-10 独立行政法人産業技術総合研究所 異常検出装置および異常検出方法
JP4906588B2 (ja) * 2007-05-18 2012-03-28 日本放送協会 特定動作判定装置、リファレンスデータ生成装置、特定動作判定プログラム及びリファレンスデータ生成プログラム
JP4925120B2 (ja) * 2007-07-02 2012-04-25 独立行政法人産業技術総合研究所 物体認識装置および物体認識方法
WO2009005141A1 (ja) 2007-07-05 2009-01-08 Nec Corporation 物体領域検出装置、物体領域検出システム、物体領域検出方法及びプログラム
JP4953211B2 (ja) * 2007-12-13 2012-06-13 独立行政法人産業技術総合研究所 特徴抽出装置および特徴抽出方法
JP2010061588A (ja) * 2008-09-05 2010-03-18 Univ Of Tokyo 特徴ベクトル算出装置、特徴ベクトル算出方法及びプログラム
JP4674920B2 (ja) * 2009-06-15 2011-04-20 独立行政法人産業技術総合研究所 対象個数検出装置および対象個数検出方法
CN102236893A (zh) * 2010-04-30 2011-11-09 中国人民解放军装备指挥技术学院 基于空间位置预测的月面影像图同名像点匹配方法
JP4728444B2 (ja) * 2010-08-23 2011-07-20 独立行政法人産業技術総合研究所 異常領域検出装置および異常領域検出方法
JP4918615B2 (ja) * 2010-12-29 2012-04-18 独立行政法人産業技術総合研究所 対象個数検出装置および対象個数検出方法
CN104463835B (zh) * 2014-09-03 2018-02-02 中国科学院遥感与数字地球研究所 一种基于鲁棒性卫星数据分析技术的地震红外辐射异常特征多角度遥感提取方法
JP6401648B2 (ja) * 2015-03-31 2018-10-10 株式会社Screenホールディングス 欠陥分類装置および欠陥分類方法
JP7154537B2 (ja) * 2018-09-10 2022-10-18 三菱重工業株式会社 画像特徴抽出方法、および、画像特徴抽出装置
CN112241762B (zh) * 2020-10-19 2022-07-01 吉林大学 一种用于病虫害图像分类的细粒度识别方法
JPWO2022196635A1 (ja) * 2021-03-15 2022-09-22

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009140247A (ja) * 2007-12-06 2009-06-25 United Technologies Institute 異常動作監視装置
CN106127732A (zh) * 2016-06-13 2016-11-16 深圳市太赫兹科技创新研究院 微波图像中人体性别检测方法和装置
CN106127732B (zh) * 2016-06-13 2019-01-01 深圳市太赫兹科技创新研究院 微波图像中人体性别检测方法和装置

Also Published As

Publication number Publication date
JP2005092346A (ja) 2005-04-07

Similar Documents

Publication Publication Date Title
JP4061377B2 (ja) 3次元データからの特徴抽出装置
US11789545B2 (en) Information processing device and method, program and recording medium for identifying a gesture of a person from captured image data
JP4215781B2 (ja) 異常動作検出装置および異常動作検出方法
EP1801757A1 (en) Abnormal action detector and abnormal action detecting method
Wang et al. iVAT and aVAT: enhanced visual analysis for cluster tendency assessment
US7957557B2 (en) Tracking apparatus and tracking method
JP4429298B2 (ja) 対象個数検出装置および対象個数検出方法
JP5719297B2 (ja) 特徴量算出装置、特徴量算出方法及びプログラム
CN103870824B (zh) 一种在人脸检测跟踪过程中的人脸捕捉方法及装置
US20110243434A1 (en) Feature value extracting device, object identification device, and feature value extracting method
CN111145223A (zh) 多摄像头识别人员行为轨迹分析方法
Oliveira et al. Automatic crack detection on road imagery using anisotropic diffusion and region linkage
KR20110128529A (ko) 형태와 특징 정보를 이용한 비정형 객체 추적 장치 및 그 방법
CN113297963A (zh) 多人姿态的估计方法、装置、电子设备以及可读存储介质
US20170053172A1 (en) Image processing apparatus, and image processing method
Manap et al. PATCH-IQ: a patch based learning framework for blind image quality assessment
CN116229189A (zh) 基于荧光内窥镜的图像处理方法、装置、设备及存储介质
JP4682365B2 (ja) 3次元データからの特徴抽出方法および装置
Orjuela et al. Evaluation of the wear label description in carpets by using local binary pattern techniques
Musa et al. Crowd reckoning towards preventing the repeat of ‘2015 Hajj pilgrims stampede’
JP4918615B2 (ja) 対象個数検出装置および対象個数検出方法
KR101473991B1 (ko) 얼굴 검출 방법 및 그 장치
JP4674920B2 (ja) 対象個数検出装置および対象個数検出方法
CN110363192A (zh) 物件影像辨识系统及物件影像辨识方法
Chang et al. Single-shot person re-identification based on improved random-walk pedestrian segmentation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071127

R150 Certificate of patent or registration of utility model

Ref document number: 4061377

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term