JP4925120B2 - 物体認識装置および物体認識方法 - Google Patents

物体認識装置および物体認識方法 Download PDF

Info

Publication number
JP4925120B2
JP4925120B2 JP2007174597A JP2007174597A JP4925120B2 JP 4925120 B2 JP4925120 B2 JP 4925120B2 JP 2007174597 A JP2007174597 A JP 2007174597A JP 2007174597 A JP2007174597 A JP 2007174597A JP 4925120 B2 JP4925120 B2 JP 4925120B2
Authority
JP
Japan
Prior art keywords
distance image
feature data
type
data
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007174597A
Other languages
English (en)
Other versions
JP2009014415A (ja
Inventor
展之 大津
譲二 若色
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2007174597A priority Critical patent/JP4925120B2/ja
Publication of JP2009014415A publication Critical patent/JP2009014415A/ja
Application granted granted Critical
Publication of JP4925120B2 publication Critical patent/JP4925120B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Length Measuring Devices By Optical Means (AREA)
  • Measurement Of Optical Distance (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、物体認識装置および物体認識方法に関するものであり、特に距離画像を使用し、高速かつ高精度に物体の種類等を識別することができる物体認識装置および物体認識方法に関するものである。
物体の認識、識別は、監視システム、ロボット、生産の自動化などに幅広く必要とされる重要な技術である。物体認識では画像がよく用いられるが、その中でも物体の表面までの距離(位置)を表す距離画像は輝度画像に比べ照明とスケールの影響を受けにくい性質があり、物体認識に用いるデータとして有効なデータであると考えられる。
例えば下記の特許文献1には距離画像を用いた物体検知装置が開示されている。この物体検知装置は、距離画像取得手段で取得された距離画像に基づき、撮像された物体の輪郭情報を生成することにより、物体を抽出する。抽出された物体が、予め定められた目標物であるかどうかの判定は、画像処理部が具備している認識辞書にあるパターンと輪郭情報とのマッチングにより行う。認識辞書には、予め定められた目標物の形状パターン(物体に動きがある場合には、その動きに応じた複数の形状パターン)が記憶されている。
特開平11−213166号公報 また、本出願人は、動画像における動作の認識方法の研究を行い、本出願人が出願した下記の特許文献2には、立体高次局所自己相関特徴(以下、CHLACデータとも記す)を用いた動画像における動作の認識技術が開示されている。この技術は、立体高次局所自己相関特徴抽出方式によって動画像から特徴データを抽出し、抽出した特徴データを多変量解析などの統計的手法によって変換することによって新たな特徴データを生成し、登録データと比較することによって判定を行うものである。 特開2005−092346号公報
上記したような距離画像からモデルベースで物体認識、識別を行う既存手法においては、距離画像を得る計測器については実時間と言われる領域まで高速化してきているに対し、照合処理は認識対象やその姿勢の数が多くなるにつれて計算コストが組み合わせ的に増大していき、大量のパターン照合による認識処理に時間がかかるという問題があり、距離画像から複数物体を高速に認識する手法は開発されていなかった。
本発明の目的は、上記したような従来例の問題点を解決し、距離画像から立体高次局所自己相関特徴を抽出し、多変量解析を行うことにより、高速かつ高精度に物体の種類や向き、数等を識別することができる物体認識装置および物体認識方法を提供する点にある。
本発明の物体認識装置は、対象物の表面の距離画像を取得する計測手段と、設定された単位長情報に基づいて前記距離画像から離散化距離画像データを生成する離散化距離画像データ生成手段と、前記離散化距離画像データから立体高次局所自己相関によって特徴データを抽出する特徴データ抽出手段と、学習した情報に基づいて多変量解析を行って、前記特徴データから対象物の種類、姿勢、個数の内の少なくとも1つを判定する多変量解析手段とを備えたことを主要な特徴とする。
また、上記した物体認識装置において、更に、対象物の種類が既知である学習用距離画像から設定された単位長情報に基づいて離散化距離画像データを生成し、前記離散化距離画像データから立体高次局所自己相関によって特徴データを得て、前記特徴データに基づき線形判別分析によって射影軸に射影するための変換行列を求め、かつ前記特徴データを射影軸に射影し、更に対象物の種類ごとの重心を求める学習手段を備え、前記多変量解析手段は、前記特徴データを前記変換行列を使用して射影軸に射影し、前記特徴データの種類が射影した前記特徴データからの距離が最も近い重心の種類に属すると判定するMDD(Minimum Distance Decision)法によって対象物の種類を判定する点にも特徴がある。
また、上記した物体認識装置において、更に、対象物の種類が既知である学習用距離画像から設定された単位長情報に基づいて離散化距離画像データを生成し、前記離散化距離画像データから立体高次局所自己相関によって特徴データを得て、前記特徴データに基づき線形判別分析によって射影軸に射影するための変換行列を求め、かつ前記特徴データを射影軸に射影する学習手段を備え、前記多変量解析手段は、前記特徴データを前記変換行列を使用して射影軸に射影し、射影した前記特徴データからの距離が最も近い所定個数の射影した学習特徴データを求め、前記特徴データの種類が前記所定個数の射影した学習特徴データの中で最も多数を占めた種類に属すると判定するk−NN法によって対象物の種類を判定する点にも特徴がある。
また、上記した物体認識装置において、更に、対象物の種類および姿勢が既知である学習用距離画像から設定された単位長情報に基づいて離散化距離画像データを生成し、前記離散化距離画像データから立体高次局所自己相関によって学習特徴データを得る学習手段を備え、前記多変量解析手段は、前記特徴データの種類および姿勢が前記特徴データからの距離が最も近い学習特徴データの種類および姿勢に対応すると判定するNN法によって対象物の種類および姿勢を判定する点にも特徴がある。
また、上記した物体認識装置において、更に、対象物の種類および個数が既知である学習用距離画像から設定された単位長情報に基づいて離散化距離画像データを生成し、前記離散化距離画像データから立体高次局所自己相関によって特徴データを得て、前記特徴データに基づき線形重回帰分析によって係数行列を求める学習手段を備え、前記多変量解析手段は、前記特徴データを前記係数行列を使用して個数ベクトルを求め、前記個数ベクトルの各要素の小数点以下を四捨五入することによって対象物の種類および個数を判定する点にも特徴がある。
また、上記した物体認識装置において、2つ以上の異なる多変量解析手段を用いて判定を行う点にも特徴がある。
また、上記した物体認識装置において、前記離散化距離画像データ生成手段は、複数の異なる単位長情報に基づいてそれぞれ前記距離画像から離散化距離画像データを生成する点にも特徴がある。
本発明の物体認識方法は、対象物の表面の距離画像を取得するステップ、設定された単位長情報に基づいて前記距離画像から離散化距離画像データを生成するステップ、前記離散化距離画像データから立体高次局所自己相関によって特徴データを抽出するステップ、学習した情報に基づき、前記特徴データから対象物の種類、姿勢、個数の内の少なくとも1つを判定するステップを含むことを主要な特徴とする。
本発明によれば、以下のような効果がある。
(1)対象物の切り出しやマッチング処理を行わずに対象物を認識するので、特徴抽出や種類等の判定のための計算量が少なく、実時間処理が可能である。
(2)物体の種類と共に個数や姿勢(向き)も判定可能である。
(3)複数の異なる多変量解析手段を組み合わせて判定することにより、認識精度が向上する。
(4)距離画像を使用することにより、照明や外光等の影響を受け難くなり、認識精度が向上する。
(5)距離画像を使用することにより、背景が動いていても容易に対象物を切り出し、背景を削除することができるので、認識精度がより向上する。
(6)距離画像を使用することにより、対象物までの距離情報を取得することができる。
以下、実施例について説明するが、本発明は距離画像を取得可能な任意の対象物に適用可能である。
図1は、本発明の物体認識装置のハードウェア構成の一例を示すブロック図である。図1(a)は計測時(物体認識時)におけるハードウェア構成の一例を示している。レンジファインダ10は距離画像を計測するための装置であり、例えばレーザ光を放射して対象物表面から反射して帰ってくるまでの時間を用いる光飛行時間測定法や三角測量の原理を用いた光切断法を採用した装置を採用可能である。
近年レンジファインダは、小型化、高速化の技術が進歩して実用性が高まっており、実施例におけるレンジファインダの一例として、例えば光切断法によって0.3秒で距離画像を撮影可能なコニカミノルタホールディングス社製の3次元デジタイザVIVID910を採用可能である。
コンピュータ(PC)11は例えば周知の汎用デジタルインターフェイス回路を備えた周知のパソコン(PC)であってもよい。本発明は、後述する処理を実行するプログラムを作成し、パソコンなどの周知のコンピュータ11にインストールして起動することにより実現される。モニタ装置12はコンピュータ11の周知の出力装置であり、例えば対象の認識結果をオペレータに表示するために使用される。キーボード13およびマウス14は、オペレータが入力に使用する周知の入力装置である。
図1(b)は学習時におけるハードウェア構成の一例を示している。学習時においては、例えば対象物15を回転台16に搭載し、所定の角度(例えば数度)づつ回転しては距離画像を撮影する(処理については後述する)。回転台16は所定の角度づつ回転するようにPC11から制御してもよいし、手動で回転と撮影を繰り返してもよい。
なお、図1(b)においては、垂直軸についてのみ回転させているが、例えば飛行物体など、対象物によっては直行する2つの水平軸についても回転させて撮影する必要がある。この場合には例えば、全球の表面になるべくそれぞれの間の距離が一定になるような複数の点を設定し、これらの点を球の中心から見た方向を対象物の撮影方向としてもよい。
図2は、本発明における物体認識処理の内容を示すフローチャートである。S10からS12においては、いずれかの1つの手段を用いて距離画像を取得する。S10においては、前述したレンジファインダ10により距離画像を取得する。距離画像とは計測機器と対象表面までの距離の2次元分布データ(対象物表面の位置データ)からなる画像である。距離を計測しているため、照明等の外来光や対象物表面の模様などから受ける影響は少ない。
S11においては、ステレオカメラにより距離画像を取得する。公知のステレオ画像法は複数のカメラから得た輝度画像の対応点を検出して距離分布を推定する方法である。ステレオ画像法の詳細については本発明の要旨ではないので説明は省略する。
S12においては、濃淡2次元画像を取得して距離画像に変換する。この場合には2次元画像の2つの座標軸をx軸およびy軸とし、各画素の輝度値を定数(値は任意)倍した値をz軸の値として採用する。従って、2次元画像を、明るい部分が遠く、暗い部分が近い(あるいはその逆の)距離画像と見なすことになる。なお、S10からS12の内の複数の手段を用いて距離画像を撮影し、取得したデータを合成して距離画像を得てもよい。
S13においては、単位長情報であるキューブサイズに基づき距離画像を離散化処理する。S10〜S12において得られる距離画像データは、例えば計測機器の光軸と直交する水平軸をx軸、光軸と直交する垂直軸をy軸、光軸をz軸とする直交座標における対象物表面の離散した計測点の位置情報(xi、yi、zi)の集合からなる。
S13においては、設定した長さ=キューブサイズの辺をもつ立方体(あるいは直方体)を定義し、この立方体を用いて測定空間内を分割(くまなくかつ重複無く走査)して、この立方体内に計測点の位置情報が含まれていた場合には当該位置と対応する値を1とし、そうでなければ0として離散化距離画像データを生成する。
なお、S13において、一定の距離以上の位置情報を背景情報と見なして削除してもよい。この処理は、背景が一様であれば、CHLACの加法性から対象の違いがCHLACに反映されるので必須ではないが、背景が複雑で対象が隠蔽する部分が異なる場合には誤差になるので、背景は削除しておいた方が望ましい。また、近接する位置情報とかけ離れたり、欠落している位置情報はノイズと見なし、周囲の位置情報から補間演算により補正してもよい。
図5は、本発明における離散化処理の内容を示す説明図である。図5においては、離散化処理によって生成されたアヒルの置物の離散化距離画像データについて、値が1である立方体のみを抽出し、z軸方向とは異なる所定の角度(斜め上)から見える立方体について立方体の各面に異なる陰影をつけて表示してある。各辺の最小単位がキューブサイズとなっている。
図2に戻って、S14においては、離散化距離画像データからCHLACベクトルデータを抽出する。ここで、立体高次局所自己相関特徴(CHLAC)について説明する。N次自己相関関数は次の数式1のように表せる。
Figure 0004925120
ここでg(r) は離散化距離画像の値、rは位置ベクトル、a1、a2、…aNは変位ベクトルを表す。参照点(注目位置)rおよび参照点からみたN個の変位ai(i=1,…,N)は三次元のベクトルである。
高次自己相関関数は変位方向、次数のとり方により無数に考えられるが、これを局所領域に限定したものが高次局所自己相関関数である。立体高次局所自己相関特徴では変位方向を参照点rを中心とする3×3×3画素の局所領域内、即ち参照点rの26近傍に限定している。1組の変位方向に対応する数式1の積分値が特徴量の1つの要素になる。従って変位方向の組み合わせ(=マスクパターン)の数だけ特徴量の要素が生成される。
図6は、3次元空間における自己相関処理座標を示す説明図である。図6においては、z−1層、z層、z+1層の3つの層のxy平面を並べて図示してある。本発明においては、注目する参照画素を中心とする3×3×3(=27)画素の立方体の内部の画素について相関を取る。
特徴量の要素数、つまり特徴ベクトルの次元はマスクパターンの種類に相当する。マスクパターンは、相関を取る画素の組合せを示す情報であり、マスクパターンによって選択された画素のデータは相関値の計算に使用されるが、マスクパターンによって選択されなかった画素は無視される。マスクパターンでは注目画素(中心の画素:参照点)は必ず選択される。
離散化距離画像の値の場合、画素値1を何回乗算しても1であるので、二乗以上の項を含む特徴量の要素(パターン)は乗数のみが異なる1乗の項を含む特徴量の要素(パターン)と重複するものとして削除する。また数式1の積分操作(平行移動:スキャン)で重複するパターンは1つの代表パターンを残して他を削除する。数式1右辺の式は参照点(g(r):局所領域の中心)を必ず含むので、代表パターンとしては中心点を含み、パターン全体が3×3×3画素の局所領域内に収まるものを選択する。
この結果、中心点を含むマスクパターンの種類は、選択画素数が1個のもの(0次):1個、2個のもの(1次):26個、3個のもの(2次):26×25/2=325個の計352個あるが、数式1の積分操作(平行移動:スキャン)で重複するパターンを除くと、マスクパターンの種類は251種類となる。即ち、次数を高々2次、変位ベクトルを3×3×3の近傍に限った場合、1つの3次元データに対する立体高次局所自己相関特徴ベクトルは251次元となる。
図7は、自己相関マスクパターンの例を示す説明図である。図7(1)は注目画素のみの最も簡単な0次のマスクパターンである。(2)はハッチングを施した2つの画素が選択されている1次マスクパターン例、(3)、(4)はハッチングを施した3つの画素が選択されている3次マスクパターン例であり、この他に多数のパターンがある。そして、前記したように、重複するパターンを除くと、マスクパターンの種類は251種類となる。即ち、3×3×3画素の3次元データに対する立体高次局所自己相関特徴ベクトルは251次元となり、要素の値は0か1である。
立体高次局所自己相関特徴には、対象の位置によらず同一の対象から同一の特徴量が得られるという位置不変性、および画像内に複数の対象がある場合、この画像全体から得られる特徴量がそれぞれの対象から得られる特徴量の和となる加法性がある。CHLAC特徴は位置不変性から認識時に対象の切り出しを必要としない。また加法性があるので、対象物の個数の判定ができる。更に、積分特徴であるためノイズに強い。
図8は、S14の画素CHLACデータ抽出処理の内容を示すフローチャートである。S50においては、251個の相関パターン対応の相関値群データをクリアする。S51においては、未処理のキューブ(参照点である立方体)を1つ選択する(対象空間内において参照点である立方体を順にスキャンする)。S52においては、未処理の相関マスクパターンを1つ選択する。
S53においては、前記した数式1を用いてパターンと対応する位置のキューブ値(0または1)を乗算して相関値を計算する。なお、この処理は前記した数式1におけるg(r)g(r+a1)…g(r+aN)の演算に相当する。
S54においては、相関値は1か否かが判定され、判定結果が肯定の場合にはS55に移行するが、否定の場合にはS56に移行する。S55においては、マスクパターンと対応する相関値データに1を加算する。S56においては、全てのマスクパターンについて処理が完了したか否かが判定され、判定結果が肯定の場合にはS57に移行するが、否定の場合にはS52に移行する。
S57においては、全てのキューブについて処理が完了したか否かが判定され、判定結果が肯定の場合にはS58に移行するが、否定の場合にはS51に移行する。S58においては、相関値群データをCHLACデータとして出力する。
図2に戻って、S15、16の処理、S17の処理、S18、19の処理については少なくとも1つの処理を実行し、必要に応じて任意の2つあるいは3つ全部を並列に、あるいは順次直列に実行して所望の出力を得る。また、異なるキューブサイズの特徴データに対して同じ処理を繰り返して実行してもよい。なお、複数の処理を実行する場合には、対象物の種類についてはそれぞれの認識結果を他の処理において参照したり、複数の結果を総合的に判断して決定してもよい。
S15においては、学習時に線形判別分析によって求めた変換行列を使用して対象の種類を最も判別する射影軸に射影する。即ち、特徴ベクトルと変換行列の積を求めて判別特徴ベクトルを得る。S16においては、学習時に求めた各対象の判別特徴ベクトルの重心を使用したMDD法により、あるいはCHLAC射影特徴ベクトルを使用したk−NN法により種類を判別する。公知のMDD法とは識別すべき入力特徴点から重心までの距離が最も小さいクラス(種類)に識別する手法である。比較に用いる距離としてはユークリッド距離を用いるが、分散を考慮した距離であるマハラノビス距離を利用することも可能である。
やはり公知の最近傍(NN、Nearest Neighbor)法とは、入力特徴点に最も近い学習サンプル点を求め、そのクラスに識別する手法であり、より一般的な方法としてk-最近傍(k−NN、k-Nearest Neighbor)法がある。k−NN法では入力特徴点に最も近いk個(通常は奇数個)の学習サンプル点を求め、その中で最も多数を占めたクラスに識別する手法である。
S17においては、学習時に求めたCHLACデータを使用し、最近傍法により、種類および姿勢(向き)を判定する。最近傍(Nearest Neighbor, NN) 法とは、入力特徴点に最も近い学習サンプル点を求め、そのクラスに識別する手法である。最も近い学習サンプル点が判明すれば、その学習サンプルの学習時の向きも判明するので、その向きが入力特徴点の向きであるものと推定する。
S18においては、学習時に線形重回帰分析によって求めた係数行列を使用し、個数ベクトルを求める。即ち、入力特徴ベクトルと係数行列とを乗算して個数推定値ベクトルを求める。S19においては、S18によって求めた個数推定値ベクトルの要素である各種類ごとの個数推定値の小数点以下を四捨五入して種類ごとの個数を求める。なお、推定値が負の場合は0個とする。S16、S17、S19の判別結果は例えばモニタ装置12に表示される。
図3は、本発明における物体認識処理の学習時の処理の内容を示すフローチャートである。S30からS32においては、S10からS12と同様に1つの手段を用いて距離画像を取得する。S30においては、S10と同様にレンジファインダにより距離画像を取得する。また、S31においては、S11と同様にステレオカメラにより距離画像を取得する。S32においては、S12と同様に濃淡2次元画像を取得して距離画像と見なす。
S33においては、対象物を所定角度だけ回転させる。例えば図1(b)に開示されているように回転台16を制御して対象物15を所定の角度だけ回転させる。S34においては、距離画像の取得終了か否かが判定され、判定結果が否定の場合にはS30〜32のいずれかに移行するが、肯定の場合にはS35に移行する。以上の処理によって種類、個数および姿勢が既知の学習用距離画像データが得られる。
S35においては、背景部分や回転台部分の距離データを削除する。即ち、距離(z値)が一定の値以上の距離(位置)データや高さ(y値)が一定の値以下の距離(位置)データを削除する。
S36においては、S13と同様に、1つあるいは複数のキューブサイズに基づきそれぞれ距離画像を離散化処理する。具体的には、計測空間内においてx軸、y軸、z軸それぞれを単位長情報であるキューブサイズで立方体(あるいは直方体)に区切り、その立方体内に距離画像の画素である距離データが含まれていれば1、含まれていなければ0として離散化距離画像データを生成する。
キューブサイズは、小さすぎると全体の特徴を捉えることができなくなり、認識率が低下するが、大きすぎても分解能が低下して認識率が低下する。発明者が実験した結果、比較的大きなキューブサイズから生成した特徴データにも識別に有効な情報が含まれていることが判明した。具体的には、計測対象物が100mm前後の大きさである場合にキューブサイズが数十mm程度でも物体の識別が可能であった。また、キューブサイズが大きいほど離散化距離画像データのデータ量は減少する。
なお、同じ距離画像から異なるキューブサイズで抽出された例えば2つの特徴データはそのまま組み合わせて251+251=502次元の1つの特徴データとして後続する処理を行ってもよいし、2つの特徴データとしてそれぞれ後続の処理を行って、最後に結果の統合(例えば、多数決)を行ってもよい。
S37においては、S14と同様に、それぞれの離散化距離画像データから学習CHLAC特徴ベクトルデータを抽出する。S38においては、この学習特徴データから線形判別分析によって射影軸(変換行列)を求める。線形判別分析とは対象の種類判別に適した空間を求めるための公知の統計的手法である。線形判別分析では、数式2に示す、級間分散σ2 Bを級内分散σ2 Wに対して大きくする、つまりλを最大化する射影軸を解析的に陽に求めることができる。
Figure 0004925120
具体的には、学習データに基づき、数式3に示すような、より少ない次元で種類間の分離を最大限強調する線形写像を構成する係数行列Aを求める。
Figure 0004925120
最適な係数行列Aは数式4に示す公知の固有値問題の解として求まる。
Figure 0004925120
ここで、Mは判別空間の次元であり、M≦(種類の数−1)となる。(正確には、maxM=min(種類の数-1,元のxの次元(251)))即ち、対象物の種類が2つであればMは1となる。ΣBおよびΣWはそれぞれ級間共分散行列および級内共分散行列であり、IMは単位行列である。
S39においては、S38で求めた変換行列を使用して学習CHLACデータを判別空間に射影する。S40においては、学習CHLAC射影データの重心を求める。
図4は、線形判別分析による射影処理の内容を示す説明図である。図4においては、記載を容易にするために特徴データの次元を2、対象物の種類を2種類としてある。CHLAC特徴空間において、CHLACデータ(種類A)20、CHLACデータ(種類B)21はそれぞれ1つの点として表されている。そして、角度を少しづつ変えて計測した1つの種類(例えば種類A)の特徴データ全体は例えば(超)楕円などの環状に分布している。
線形判別分析によって得られた射影軸は例えば図4に図示するような角度となり、特徴データを射影した種類Aの射影データと種類Bの射影データとは完全に分離している。更にそれぞれの射影データの重心も求めておく。
図3に戻って、S41においては、線形重回帰分析により係数行列を求める。線形重回帰分析とは、多変数間の関係式を線形推定する公知の統計的手法である。説明変数ベクトルx(サンプル数L個の学習用特徴データを並べたベクトル)から、目的変数(教示)ベクトルy(学習用特徴ベクトルと対応する、種類ごとの個数データを並べたベクトル)を推定したときの推定誤差を最小化する係数を考える。yの推定値および平均操作を数式5の1行目に記載されているものとすると、平均2乗誤差は数式5の3行目以降のようになる。
Figure 0004925120
ここで、Rxx、RxyおよびRyyはそれぞれxiの自己相関行列、xiとyiの相互相関行列、yiの自己相関行列である。このとき誤差eを最小にする係数行列Aは以下の数式6を解いて、解は数式7のように線形代数の範囲で陽に求まる。
Figure 0004925120
Figure 0004925120
以上の学習時の処理によって、特徴データ、射影のための変換行列、射影後の特徴データ、射影後の重心、個数を求めるための係数行列が得られる。S38からS41の処理については、図2の認識時の判定に必要な処理のみを行えばよい。
本発明の物体認識装置のハードウェア構成の一例を示すブロック図である。 本発明における物体認識処理の内容を示すフローチャートである。 本発明における物体認識処理の学習時の処理の内容を示すフローチャートである。 線形判別分析による射影処理の内容を示す説明図である。 本発明における離散化処理の内容を示す説明図である。 3次元空間における自己相関処理座標を示す説明図である。 自己相関マスクパターンの例を示す説明図である。 S14の画素CHLACデータ抽出処理の内容を示すフローチャートである。
符号の説明
10…レンジファインダ
11…コンピュータ
12…モニタ装置
13…キーボード
14…マウス

Claims (8)

  1. 対象物の表面の距離画像を取得する計測手段と、
    設定された単位長情報に基づいて前記距離画像から離散化距離画像データを生成する離散化距離画像データ生成手段と、
    前記離散化距離画像データから立体高次局所自己相関によって特徴データを抽出する特徴データ抽出手段と、
    学習した情報に基づいて多変量解析を行って、前記特徴データから対象物の種類、姿勢、個数の内の少なくとも1つを判定する多変量解析手段と
    を備えたことを特徴とする物体認識装置。
  2. 更に、対象物の種類が既知である学習用距離画像から設定された単位長情報に基づいて離散化距離画像データを生成し、前記離散化距離画像データから立体高次局所自己相関によって特徴データを得て、前記特徴データに基づき線形判別分析によって射影軸に射影するための変換行列を求め、かつ前記特徴データを射影軸に射影し、更に対象物の種類ごとの重心を求める学習手段を備え、
    前記多変量解析手段は、前記特徴データを前記変換行列を使用して射影軸に射影し、前記特徴データの種類が射影した前記特徴データからの距離が最も近い重心の種類に属すると判定するMDD法によって対象物の種類を判定することを特徴とする請求項1に記載の物体認識装置。
  3. 更に、対象物の種類が既知である学習用距離画像から設定された単位長情報に基づいて離散化距離画像データを生成し、前記離散化距離画像データから立体高次局所自己相関によって特徴データを得て、前記特徴データに基づき線形判別分析によって射影軸に射影するための変換行列を求め、かつ前記特徴データを射影軸に射影する学習手段を備え、
    前記多変量解析手段は、前記特徴データを前記変換行列を使用して射影軸に射影し、射影した前記特徴データからの距離が最も近い所定個数の射影した学習特徴データを求め、前記特徴データの種類が前記所定個数の射影した学習特徴データの中で最も多数を占めた種類に属すると判定するk−NN法によって対象物の種類を判定することを特徴とする請求項1に記載の物体認識装置。
  4. 更に、対象物の種類および姿勢が既知である学習用距離画像から設定された単位長情報に基づいて離散化距離画像データを生成し、前記離散化距離画像データから立体高次局所自己相関によって学習特徴データを得る学習手段を備え、
    前記多変量解析手段は、前記特徴データの種類および姿勢が前記特徴データからの距離が最も近い学習特徴データの種類および姿勢に対応すると判定するNN法によって対象物の種類および姿勢を判定することを特徴とする請求項1に記載の物体認識装置。
  5. 更に、対象物の種類および個数が既知である学習用距離画像から設定された単位長情報に基づいて離散化距離画像データを生成し、前記離散化距離画像データから立体高次局所自己相関によって特徴データを得て、前記特徴データに基づき線形重回帰分析によって係数行列を求める学習手段を備え、
    前記多変量解析手段は、前記特徴データを前記係数行列を使用して個数ベクトルを求め、前記個数ベクトルの各要素の小数点以下を四捨五入することによって対象物の種類および個数を判定することを特徴とする請求項1に記載の物体認識装置。
  6. 請求項2ないし請求項5の内の2つ以上の請求項の構成要件を備えていることを特徴とする物体認識装置。
  7. 前記離散化距離画像データ生成手段は、複数の異なる単位長情報に基づいてそれぞれ前記距離画像から離散化距離画像データを生成することを特徴とする請求項1に記載の物体認識装置。
  8. 対象物の表面の距離画像を取得するステップ、
    設定された単位長情報に基づいて前記距離画像から離散化距離画像データを生成するステップ、
    前記離散化距離画像データから立体高次局所自己相関によって特徴データを抽出するステップ、
    学習した情報に基づき、前記特徴データから対象物の種類、姿勢、個数の内の少なくとも1つを判定するステップ
    を含むことを特徴とする物体認識方法。

JP2007174597A 2007-07-02 2007-07-02 物体認識装置および物体認識方法 Expired - Fee Related JP4925120B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007174597A JP4925120B2 (ja) 2007-07-02 2007-07-02 物体認識装置および物体認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007174597A JP4925120B2 (ja) 2007-07-02 2007-07-02 物体認識装置および物体認識方法

Publications (2)

Publication Number Publication Date
JP2009014415A JP2009014415A (ja) 2009-01-22
JP4925120B2 true JP4925120B2 (ja) 2012-04-25

Family

ID=40355513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007174597A Expired - Fee Related JP4925120B2 (ja) 2007-07-02 2007-07-02 物体認識装置および物体認識方法

Country Status (1)

Country Link
JP (1) JP4925120B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8630456B2 (en) * 2009-05-12 2014-01-14 Toyota Jidosha Kabushiki Kaisha Object recognition method, object recognition apparatus, and autonomous mobile robot
JP5567908B2 (ja) * 2009-06-24 2014-08-06 キヤノン株式会社 3次元計測装置、その計測方法及びプログラム
JP5673017B2 (ja) * 2010-11-25 2015-02-18 株式会社Ihi 振動測定システム、振動測定装置および振動測定方法
US10972680B2 (en) * 2011-03-10 2021-04-06 Microsoft Technology Licensing, Llc Theme-based augmentation of photorepresentative view
KR101675798B1 (ko) * 2011-05-31 2016-11-16 한화테크윈 주식회사 객체 수 추정 장치 및 방법
JP5877135B2 (ja) * 2012-07-20 2016-03-02 株式会社日立製作所 画像認識装置及びエレベータ装置
JP2015148895A (ja) * 2014-02-05 2015-08-20 日本電信電話株式会社 物体数分布推定方法
JP6336351B2 (ja) * 2014-08-08 2018-06-06 東芝テック株式会社 情報処理装置及びプログラム
JP6517398B2 (ja) * 2018-05-01 2019-05-22 東芝テック株式会社 情報処理装置及びプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3098276B2 (ja) * 1991-05-20 2000-10-16 日本電信電話株式会社 表情認識装置
JPH0981731A (ja) * 1995-09-19 1997-03-28 Hitachi Ltd 画像認識方法および装置
JP3660492B2 (ja) * 1998-01-27 2005-06-15 株式会社東芝 物体検知装置
JP2000076464A (ja) * 1998-09-01 2000-03-14 Ricoh Co Ltd 図形認識方法、図形認識装置、図形分類方法、図形分類装置、記録媒体、及び、図形特徴抽出方法
JP2002366953A (ja) * 2001-06-11 2002-12-20 Central Res Inst Of Electric Power Ind 画像抽出方法および装置ならびに画像抽出プログラム、画像抽出方法を利用した配電柱の柱上機材の異常検出方法および装置ならびに異常検出プログラム
JP4292837B2 (ja) * 2002-07-16 2009-07-08 日本電気株式会社 パターン特徴抽出方法及びその装置
JP2004070475A (ja) * 2002-08-02 2004-03-04 Hicom:Kk 地形観察システムおよびその方法
JP4061377B2 (ja) * 2003-09-12 2008-03-19 独立行政法人産業技術総合研究所 3次元データからの特徴抽出装置
JP4368767B2 (ja) * 2004-09-08 2009-11-18 独立行政法人産業技術総合研究所 異常動作検出装置および異常動作検出方法
JP4701100B2 (ja) * 2006-02-17 2011-06-15 株式会社日立製作所 異常行動検知装置
JP4918615B2 (ja) * 2010-12-29 2012-04-18 独立行政法人産業技術総合研究所 対象個数検出装置および対象個数検出方法

Also Published As

Publication number Publication date
JP2009014415A (ja) 2009-01-22

Similar Documents

Publication Publication Date Title
JP4925120B2 (ja) 物体認識装置および物体認識方法
Sock et al. Multi-view 6D object pose estimation and camera motion planning using RGBD images
JP5671281B2 (ja) 位置姿勢計測装置、位置姿勢計測装置の制御方法及びプログラム
US20180189556A1 (en) Hand gesture recognition for virtual reality and augmented reality devices
JP5417494B2 (ja) 画像処理方法およびシステム
Diaz et al. Analysis and evaluation between the first and the second generation of RGB-D sensors
CN107680125B (zh) 在视觉系统中自动选择三维对准算法的系统和方法
CN107025663A (zh) 视觉系统中用于3d点云匹配的杂波评分系统及方法
CN110176075B (zh) 通过视觉系统同时考虑图像特征中边缘和法线的系统和方法
JP2016099982A (ja) 行動認識装置、行動学習装置、方法、及びプログラム
US11651581B2 (en) System and method for correspondence map determination
EP3916355A1 (en) Method and apparatus for indoor localization, electronic device, storage medium and computer program
WO2016133697A1 (en) Projection transformations for depth estimation
JP2018120283A (ja) 情報処理装置、情報処理方法及びプログラム
Sun et al. High-accuracy three-dimensional measurement based on multi-directional cooperative target with weighted SfM algorithm
CN111275734B (zh) 物体辨识与追踪系统及其方法
Guðmundsson et al. Model-based hand gesture tracking in tof image sequences
JP5217917B2 (ja) 物体検知追跡装置,物体検知追跡方法および物体検知追跡プログラム
JP6606340B2 (ja) 画像検出装置、画像検出方法およびプログラム
JP2020181374A (ja) 情報処理装置、情報処理方法、及びプログラム
Wuest Efficient line and patch feature characterization and management for real-time camera tracking
Tascón-Vidarte Floor plans from 3d reconstruction of indoor environments
JP6796850B2 (ja) 物体検出装置、物体検出方法および物体検出プログラム
Ramli et al. Enhancement of Depth Value Approximation for 3D Image-Based Modelling using Noise Filtering and Inverse Perspective Mapping Techniques for Complex Object
OK Rahmat et al. Enhancement of depth value approximation using noise filtering and inverse perspective mapping techniques for image based modelling

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100624

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120131

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120201

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees