JP2012178133A - 被写体認識装置、被写体認識方法及び被写体認識プログラム - Google Patents
被写体認識装置、被写体認識方法及び被写体認識プログラム Download PDFInfo
- Publication number
- JP2012178133A JP2012178133A JP2011117186A JP2011117186A JP2012178133A JP 2012178133 A JP2012178133 A JP 2012178133A JP 2011117186 A JP2011117186 A JP 2011117186A JP 2011117186 A JP2011117186 A JP 2011117186A JP 2012178133 A JP2012178133 A JP 2012178133A
- Authority
- JP
- Japan
- Prior art keywords
- subject
- data
- dimensional
- image
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】被写体の3次元形状データとテクスチャデータに基づいて、所定の視点位置における被写体の2次元展開画像を生成し、生成した2次元展開画像から特徴点データを抽出し、抽出した特徴点データ群と被写体を識別可能な識別情報と関係付けた展開画像特徴量データを記憶した学習データ記憶手段と、認識対象の被写体の画像データから特徴量を抽出し、画像特徴量データとして記憶する被写体特徴量データ記憶手段と、被写体特徴量データ記憶手段に記憶された画像特徴量データと、学習データ記憶手段に記憶された展開画像特徴量データとを照合した結果に基づき、認識対象の被写体の画像データが、学習データ記憶手段に記憶されている被写体のいずれに該当するかを特定し、特定した被写体の識別情報を出力する照合手段とを備えた。
【選択図】図1
Description
以下、図面を参照して、本発明の第1の実施形態による被写体認識装置を説明する。図1は同実施形態の構成を示す機能ブロック図である。被写体認識装置は、コンピュータ装置によって構成する。図1において、符号1は、被写体の認識処理を行う被写体認識部である。符号2は、カメラ等で撮影して得られた2次元画像データを入力する画像入力部である。符号3は、3次元形状データ及びテクスチャデータを入力するデータ入力部である。符号4は、被写体認識処理に必要なデータを記憶する記憶部である。符号5は、キーボード等から構成する入力部である。符号6は、表示装置等から構成する表示部である。
この特徴量抽出処理は入力画像の枚数分繰り返し実行する。
次に、本発明の第2の実施形態による被写体認識装置を説明する。第1の実施形態では、3次元形状の中心位置に対し、視点球を構成する2軸は任意でよいものとして説明したが、第2の実施形態以降では、精度を向上させることができる被写体認識装置について説明する。
ax+by+cz+d=0・・・(3)
次に、本発明の第3の実施形態による被写体認識装置を説明する。第3の実施形態による被写体認識装置は、曲面を含む被写体を対象とした被写体認識を行うためのものである。図23を参照して、被写体の2次元断面図における輪郭の長さである周囲長が最大となる箇所が、情報量が多い箇所であるとして候補となる被写体の断面図を求め、この2次元断面図上の被写体形状をもとに、情報量が多い箇所に幾何ゆがみが発生しないよう被写体を回転する方法を説明する。
次に、本発明の第4の実施形態による被写体認識装置を説明する。第4の実施形態による被写体認識装置は、すべての形状の被写体を対象とした被写体認識のためのものである。図26を参照して、被写体の2次元投影画像を用いてこの投影画像の面積から被写体の中で情報量が最大となる箇所の候補を求め、2次元投影画像上での被写体の形状をもとに、情報量が最大の箇所に幾何ゆがみが発生しないよう被写体を回転する方法を説明する。
次に、図28を参照して、本発明の第5の実施形態による被写体認識装置を説明する。前述した説明において、図25右図Fに示すように求められた回転処理候補面が複数平面の複合で為る場合、照合の際に特徴量を算出する対象となるテクスチャの色情報に連続性が保たれない。そのため、求めた複数の回転処理候補面において、連続する最大面の大きさを比較することで更に被写体認識の精度劣化を防ぐことができるようになる。
次に、図29を参照して、本発明の第6の実施形態による被写体認識装置を説明する。ここでは、情報量の大きさを平面分割による面積の大きさとテクスチャ情報量から求める方法を説明する。
次に、図30を参照して、本発明の第7の実施形態による被写体認識装置を説明する。ここでは、被写体の2次元投影画像を用いて、投影画像の面積と平面性とテクスチャの情報量から被写体の中で情報量が最大となる箇所の候補を求め、2次元投影画像上での被写体の形状をもとに、この箇所に幾何ゆがみが発生しないよう被写体を回転する方法を説明する。
Claims (16)
- 被写体の3次元形状データとテクスチャデータに基づいて、所定の視点位置における前記被写体の2次元展開画像を生成し、生成した前記2次元展開画像から特徴点データを抽出し、抽出した前記特徴点データ群と前記被写体を識別可能な識別情報と関係付けた展開画像特徴量データを記憶した学習データ記憶手段と、
認識対象の被写体の画像データから特徴量を抽出し、画像特徴量データとして記憶する被写体特徴量データ記憶手段と、
前記被写体特徴量データ記憶手段に記憶された前記画像特徴量データと、前記学習データ記憶手段に記憶された前記展開画像特徴量データとを照合した結果に基づき、前記認識対象の被写体の画像データが、前記学習データ記憶手段に記憶されている被写体のいずれに該当するかを特定し、特定した被写体の前記識別情報を出力する照合手段と
を備えたことを特徴とする被写体認識装置。 - 被写体の画像データから特徴量を抽出し、抽出した前記特徴点データ群と前記被写体を識別可能な識別情報と関係付けた画像特徴量データを記憶した学習データ記憶手段と、
認識対象の被写体の3次元形状データとテクスチャデータに基づいて、所定の視点位置における前記被写体の2次元展開画像を生成し、生成した前記2次元展開画像から特徴点データを抽出し、抽出した前記特徴点データ群を展開画像特徴量データとして記憶する被写体特徴量データ記憶手段と、
前記被写体特徴量データ記憶手段に記憶された前記展開画像特徴量データと、前記学習データ記憶手段に記憶された前記画像特徴量データとを照合した結果に基づき、前記認識対象の被写体の3次元形状データとテクスチャデータが、前記学習データ記憶手段に記憶されている被写体のいずれに該当するかを特定し、特定した被写体の前記識別情報を出力する照合手段と
を備えたことを特徴とする被写体認識装置。 - 被写体の3次元形状データとテクスチャデータに基づいて、所定の視点位置における前記被写体の2次元展開画像を生成し、生成した前記2次元展開画像から特徴点データを抽出し、抽出した前記特徴点データ群と前記被写体を識別可能な識別情報と関係付けた画像特徴量データを記憶した学習データ記憶手段と、
認識対象の被写体の3次元形状データとテクスチャデータに基づいて、所定の視点位置における前記被写体の2次元展開画像を生成し、生成した前記2次元展開画像から特徴点データを抽出し、抽出した前記特徴点データ群を展開画像特徴量データとして記憶する被写体特徴量データ記憶手段と、
前記被写体特徴量データ記憶手段に記憶された前記展開画像特徴量データと、前記学習データ記憶手段に記憶された前記画像特徴量データとを照合した結果に基づき、前記認識対象の被写体の3次元形状データとテクスチャデータが、前記学習データ記憶手段に記憶されている被写体のいずれに該当するかを特定し、特定した被写体の前記識別情報を出力する照合手段と
を備えたことを特徴とする被写体認識装置。 - 前記2次元展開画像は、前記3次元形状データから前記被写体の3次元形状の中心位置と、サンプリング視点群を設定し、前記サンプリング視点と前記3次元形状の中心位置とを結ぶ視線を決定し、該視線と前記3次元形状の交点を決定し、該交点のテクスチャ情報を抽出する処理を、設定した前記サンプリング視点群すべてに対して行うことにより生成することを特徴とする請求項1から3のいずれかに記載の被写体認識装置。
- 前記サンプリング視点群は、前記3次元形状の中心位置を中心座標とした球体を設定し、当該球体を視点球とし、該視点球の半径を前記3次元形状の中心位置から3次元形状の表面までの最遠距離よりも大きいものとし、前記サンプリング視点群の位置を、所定距離毎に平行する複数の平面と、該平面に直交し所定距離毎に平行する複数の平面が視点球の表面上で交わる箇所として設定することを特徴とする請求項4記載の被写体認識装置。
- 前記サンプリング視点群は、前記3次元形状の中心位置を中心座標とした球体を設定し、当該球体を視点球とし、該視点球の半径を前記3次元形状の中心位置から3次元形状の表面までの最遠距離よりも大きいものとし、前記サンプリング視点群の位置を視点球上に、直交する2軸周りを前記3次元形状の中心位置から所定角度毎に設定することを特徴とする請求項4記載の被写体認識装置。
- 前記被写体を構成する点群を平面毎に分割し、最大点群数を有する回転処理候補面を算出し、原点を通り、前記回転処理候補面に垂直な軸直線を求めて出力する回転処理候補面・軸直線決定手段と、
前記回転処理候補面と前記軸直線に基づき、前記被写体を回転する被写体回転手段と
をさらに備えたことを特徴とする請求項1から6のいずれかに記載の被写体認識装置。 - 前記被写体の所定方向の断面の周囲長を求め、原点を通り、前記断面の最大周囲長である回転処理候補面を求め、前記回転処理候補面に垂直な軸直線を求めて出力する回転処理候補面・軸直線決定手段と、
前記回転処理候補面と前記軸直線に基づき、前記被写体を回転する被写体回転手段と
をさらに備えたことを特徴とする請求項1から6のいずれかに記載の被写体認識装置。 - 前記被写体の所定視点からの正射影した回転処理候補面における投影面積を求め、前記投影面積が最大投影面積となる視点位置と、前記被写体の重心を結ぶ軸直線を求めて出力する回転処理候補面・軸直線決定手段と、
前記回転処理候補面と前記軸直線に基づき、前記被写体を回転する被写体回転手段と
をさらに備えたことを特徴とする請求項1から6のいずれかに記載の被写体認識装置。 - 前記被写体の所定視点からの正射影した投影面積を求め、前記投影面積が最大投影面積となる回転処理候補面を求め、原点を通り、前記回転処理候補面に垂直な軸直線を出力する回転処理候補面・軸直線決定手段と、
前記回転処理候補面と前記軸直線に基づき、前記被写体を回転する被写体回転手段と
をさらに備えたことを特徴とする請求項1から6のいずれかに記載の被写体認識装置。 - 前記被写体を構成する点群を平面毎に分割し、テクスチャ情報が最大となる回転処理候補面を求め、原点を通り、前記回転処理候補面に垂直な軸直線を出力する回転処理候補面・軸直線決定手段と、
前記回転処理候補面と前記軸直線に基づき、前記被写体を回転する被写体回転手段と
をさらに備えたことを特徴とする請求項1から6のいずれかに記載の被写体認識装置。 - 前記被写体の所定視点からの正射影した投影面を求め、テクスチャ情報が最大となる回転処理候補面を求め、原点を通り、前記回転処理候補面に垂直な軸直線を出力する回転処理候補面・軸直線決定手段と、
前記回転処理候補面と前記軸直線に基づき、前記被写体を回転する被写体回転手段と
をさらに備えたことを特徴とする請求項1から6のいずれかに記載の被写体認識装置。 - 被写体の3次元形状データとテクスチャデータに基づいて、所定の視点位置における前記被写体の2次元展開画像を生成し、生成した前記2次元展開画像から特徴点データを抽出し、抽出した前記特徴点データ群と前記被写体を識別可能な識別情報と関係付けた展開画像特徴量データを記憶した学習データ記憶手段と、認識対象の被写体の画像データから特徴量を抽出し、画像特徴量データとして記憶する被写体特徴量データ記憶手段と、照合手段とを備える被写体認識装置上において被写体認識処理を行う被写体認識方法であって、
前記照合手段が、前記被写体特徴量データ記憶手段に記憶された前記画像特徴量データと、前記学習データ記憶手段に記憶された前記展開画像特徴量データとを照合した結果に基づき、前記認識対象の被写体の画像データが、前記学習データ記憶手段に記憶されている被写体のいずれに該当するかを特定し、特定した被写体の前記識別情報を出力するステップを有することを特徴とする被写体認識方法。 - 被写体の画像データから特徴量を抽出し、抽出した前記特徴点データ群と前記被写体を識別可能な識別情報と関係付けた画像特徴量データを記憶した学習データ記憶手段と、認識対象の被写体の3次元形状データとテクスチャデータに基づいて、所定の視点位置における前記被写体の2次元展開画像を生成し、生成した前記2次元展開画像から特徴点データを抽出し、抽出した前記特徴点データ群を展開画像特徴量データとして記憶する被写体特徴量データ記憶手段と、照合手段とを備える被写体認識装置上において被写体認識処理を行う被写体認識方法であって、
前記照合手段が、前記被写体特徴量データ記憶手段に記憶された前記展開画像特徴量データと、前記学習データ記憶手段に記憶された前記画像特徴量データとを照合した結果に基づき、前記認識対象の被写体の3次元形状データとテクスチャデータが、前記学習データ記憶手段に記憶されている被写体のいずれに該当するかを特定し、特定した被写体の前記識別情報を出力するステップを有することを特徴とする被写体認識方法。 - 被写体の3次元形状データとテクスチャデータに基づいて、所定の視点位置における前記被写体の2次元展開画像を生成し、生成した前記2次元展開画像から特徴点データを抽出し、抽出した前記特徴点データ群と前記被写体を識別可能な識別情報と関係付けた画像特徴量データを記憶した学習データ記憶手段と、認識対象の被写体の3次元形状データとテクスチャデータに基づいて、所定の視点位置における前記被写体の2次元展開画像を生成し、生成した前記2次元展開画像から特徴点データを抽出し、抽出した前記特徴点データ群を展開画像特徴量データとして記憶する被写体特徴量データ記憶手段と、照合手段とを備える被写体認識装置上において被写体認識処理を行う被写体認識方法であって、
前記照合手段が、前記被写体特徴量データ記憶手段に記憶された前記展開画像特徴量データと、前記学習データ記憶手段に記憶された前記画像特徴量データとを照合した結果に基づき、前記認識対象の被写体の3次元形状データとテクスチャデータが、前記学習データ記憶手段に記憶されている被写体のいずれに該当するかを特定し、特定した被写体の前記識別情報を出力するステップを有することを特徴とする被写体認識方法。 - コンピュータを請求項1〜12に記載の被写体認識装置として機能させることを特徴とする被写体認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011117186A JP5647072B2 (ja) | 2011-02-03 | 2011-05-25 | 被写体認識装置、被写体認識方法及び被写体認識プログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011021909 | 2011-02-03 | ||
JP2011021909 | 2011-02-03 | ||
JP2011117186A JP5647072B2 (ja) | 2011-02-03 | 2011-05-25 | 被写体認識装置、被写体認識方法及び被写体認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012178133A true JP2012178133A (ja) | 2012-09-13 |
JP5647072B2 JP5647072B2 (ja) | 2014-12-24 |
Family
ID=46979916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011117186A Expired - Fee Related JP5647072B2 (ja) | 2011-02-03 | 2011-05-25 | 被写体認識装置、被写体認識方法及び被写体認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5647072B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085933A (ja) * | 2012-10-25 | 2014-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 3次元姿勢推定装置、3次元姿勢推定方法、及びプログラム |
JP2014157509A (ja) * | 2013-02-15 | 2014-08-28 | Canon Inc | 情報処理装置、情報処理方法 |
KR101439966B1 (ko) | 2014-03-06 | 2014-09-12 | (주) 골프존 | 뎁스 정보를 이용한 영상의 재구성을 위한 영상 처리 방법 및 이를 이용한 영상 처리 장치 |
JP2017033278A (ja) * | 2015-07-31 | 2017-02-09 | 三菱電機ビルテクノサービス株式会社 | 設備管理台帳作成支援システム、設備管理台帳作成支援装置及びプログラム |
JP2019534510A (ja) * | 2016-10-05 | 2019-11-28 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | 表面モデル化システムおよび方法 |
WO2023032085A1 (ja) * | 2021-09-01 | 2023-03-09 | 日本電気株式会社 | 映像送信システム、端末装置および映像送信方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000193435A (ja) * | 1998-12-25 | 2000-07-14 | Nitto Seiko Co Ltd | 対象物の画像処理方法 |
JP2002197472A (ja) * | 2000-12-26 | 2002-07-12 | Masahiro Tomono | 物体認識方法 |
JP2004362128A (ja) * | 2003-06-03 | 2004-12-24 | Shimizu Corp | モデル画像照合における3次元姿勢の補正手法 |
JP2008102611A (ja) * | 2006-10-17 | 2008-05-01 | Canon Inc | 画像処理装置 |
-
2011
- 2011-05-25 JP JP2011117186A patent/JP5647072B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000193435A (ja) * | 1998-12-25 | 2000-07-14 | Nitto Seiko Co Ltd | 対象物の画像処理方法 |
JP2002197472A (ja) * | 2000-12-26 | 2002-07-12 | Masahiro Tomono | 物体認識方法 |
JP2004362128A (ja) * | 2003-06-03 | 2004-12-24 | Shimizu Corp | モデル画像照合における3次元姿勢の補正手法 |
JP2008102611A (ja) * | 2006-10-17 | 2008-05-01 | Canon Inc | 画像処理装置 |
Non-Patent Citations (1)
Title |
---|
村瀬洋 外1名: "2次元照合による3次元物体認識 パラメトリック固有空間法", 電子情報通信学会論文誌D−II, vol. 第J77-D-II巻 第11号, JPN6014015374, 25 November 1994 (1994-11-25), pages 2179 - 2187, ISSN: 0002930514 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085933A (ja) * | 2012-10-25 | 2014-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 3次元姿勢推定装置、3次元姿勢推定方法、及びプログラム |
JP2014157509A (ja) * | 2013-02-15 | 2014-08-28 | Canon Inc | 情報処理装置、情報処理方法 |
KR101439966B1 (ko) | 2014-03-06 | 2014-09-12 | (주) 골프존 | 뎁스 정보를 이용한 영상의 재구성을 위한 영상 처리 방법 및 이를 이용한 영상 처리 장치 |
JP2017033278A (ja) * | 2015-07-31 | 2017-02-09 | 三菱電機ビルテクノサービス株式会社 | 設備管理台帳作成支援システム、設備管理台帳作成支援装置及びプログラム |
JP2019534510A (ja) * | 2016-10-05 | 2019-11-28 | マジック リープ, インコーポレイテッドMagic Leap,Inc. | 表面モデル化システムおよび方法 |
WO2023032085A1 (ja) * | 2021-09-01 | 2023-03-09 | 日本電気株式会社 | 映像送信システム、端末装置および映像送信方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5647072B2 (ja) | 2014-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509848B (zh) | 三维物体的实时检测方法及系统 | |
Huang et al. | A coarse-to-fine algorithm for matching and registration in 3D cross-source point clouds | |
JP5618569B2 (ja) | 位置姿勢推定装置及びその方法 | |
JP5771413B2 (ja) | 姿勢推定装置、姿勢推定システム、および姿勢推定方法 | |
JP5647072B2 (ja) | 被写体認識装置、被写体認識方法及び被写体認識プログラム | |
CN104007817B (zh) | 具有至少一个摄像机的可穿戴信息系统 | |
Glasner et al. | aware object detection and continuous pose estimation | |
CN109859305A (zh) | 基于多角度二维人脸的三维人脸建模、识别方法及装置 | |
JP2012043308A (ja) | 位置姿勢決定方法、位置姿勢決定装置、物体モデル生成方法、物体モデル生成装置、およびプログラム | |
JP4938748B2 (ja) | 画像認識装置及びプログラム | |
Ao et al. | A repeatable and robust local reference frame for 3D surface matching | |
JP2014102746A (ja) | 被写体認識装置及び被写体認識プログラム | |
JP2014164483A (ja) | データベース生成装置、カメラ姿勢推定装置、データベース生成方法、カメラ姿勢推定方法、およびプログラム | |
JP2013101423A (ja) | 画像マッチング装置及び画像マッチングプログラム | |
Zhang et al. | A fast method for measuring the similarity between 3d model and 3d point cloud | |
JP5536124B2 (ja) | 画像処理システム及び画像処理方法 | |
JP6016242B2 (ja) | 視点推定装置及びその分類器学習方法 | |
Barros et al. | Real-time human pose estimation from body-scanned point clouds | |
CN103034859B (zh) | 一种获取姿势模型的方法及装置 | |
JP5723301B2 (ja) | 被写体認識装置及び被写体認識プログラム | |
JP6946912B2 (ja) | 推定プログラム、推定装置、及び推定方法 | |
Kim et al. | Object recognition and pose estimation using KLT | |
Matusiak et al. | Depth-based descriptor for matching keypoints in 3D scenes | |
JP3706603B2 (ja) | データ特徴抽出装置及びデータ照合装置 | |
Li et al. | Analysis of range images used in 3D facial expression recognition systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130606 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130731 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130801 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140415 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140516 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5647072 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |