JP5791751B2 - 画像認識方法及び画像認識装置 - Google Patents
画像認識方法及び画像認識装置 Download PDFInfo
- Publication number
- JP5791751B2 JP5791751B2 JP2014089310A JP2014089310A JP5791751B2 JP 5791751 B2 JP5791751 B2 JP 5791751B2 JP 2014089310 A JP2014089310 A JP 2014089310A JP 2014089310 A JP2014089310 A JP 2014089310A JP 5791751 B2 JP5791751 B2 JP 5791751B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- partial
- category
- target object
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
図1は、実施形態による画像認識方法の基本的な処理構成を説明する図である。図2は、実施形態による画像認識方法の処理手順を示すフローチャートである。
例えばthresholdを0とすると、ターミナルノードには必ずある登録画像の部分画像しか含まないようになる。
図9を用いて実施形態2を説明する。
図10、図11を用いて実施形態3を説明する。
図12および図13を用いて実施形態4を説明する。実施形態4では、部分画像サイズ決定部101の具体的実装の例を示す。本実施形態では、いわゆるクロスバリデーションという手法を用いて部分画像のサイズを決定する。
横軸が部分画像サイズで、縦軸がそのサイズで評価した平均認識率である。
図14および図15を用いて実施形態5を説明する。
そして、クラス内平均距離(スカラー)は
図16〜図19を用いて実施形態6を説明する。
そして、カレントノードがヌルノードかリーフノードであった場合は、このサブルーチンは終了する。
102 部分画像サイズ
103 登録画像
104 登録部分画像集合抽出部
105 登録部分画像集合
106 新規画像
107 新規部分画像集合抽出部
108 新規部分画像集合
109 部分画像属性判定部
110 部分画像判定結果
111 部分画像判定結果集計部
112 認識結果
113 辞書作成部
114 辞書
Claims (29)
- 複数のカテゴリのいずれかに属する対象物体を含む入力画像を取得する第1の取得手段と、
前記入力画像を構成する複数の部分画像を取得する第2の取得手段と、
前記複数の部分画像それぞれに含まれる複数の画素の画素値を抽出する抽出手段と、
前記対象物体を認識するための学習画像を構成する部分学習画像のカテゴリと該部分学習画像の位置情報とを登録した辞書を保持する保持手段と、
前記抽出手段で抽出された複数の画素の画素値を比較することによって前記複数の部分画像を分類し、前記部分画像ごとに、前記分類された結果に対応する前記部分学習画像のカテゴリと前記部分学習画像の位置情報とを前記辞書から取得する第3の取得手段と、
前記第3の取得手段によって前記部分画像ごとに取得された結果を集計することにより、前記入力画像に含まれる対象物体のカテゴリと位置とを認識する認識手段とを備えることを特徴とする情報処理装置。 - 前記認識手段は、前記部分画像ごとに、前記取得されたカテゴリに対応するデータ空間における前記位置情報が示す位置に、前記第3の取得手段の結果を登録する登録手段を備え、
前記登録手段による結果を集計することにより、前記入力画像に含まれる対象物体のカテゴリと位置とを認識することを特徴とする請求項1に記載の情報処理装置。 - 前記認識手段は、前記取得されたカテゴリに対応するデータ空間における前記部分画像ごとに登録された前記結果の分布に基づいて、前記入力画像に含まれる対象物体のカテゴリと位置とを認識することを特徴とする請求項2に記載の情報処理装置。
- 前記認識手段は、前記取得されたカテゴリごとに、前記取得されたカテゴリに対応するデータ空間における前記部分画像ごとに登録された前記結果の分布のピーク位置のスコアを求め、前記取得されたカテゴリの中で、前記スコアが最も高いピーク位置が求められたデータ空間に対応するカテゴリを前記対象物体のカテゴリとし、前記スコアが最も高いピーク位置を前記対象物体の位置として認識することを特徴とする請求項2または3に記載の情報処理装置。
- 前記データ空間は、多次元のテーブル形式であることを特徴とする請求項3または4に記載の情報処理装置。
- 前記データ空間は、前記入力画像の各画素に対応する要素を持った2次元テーブル形式であることを特徴とする請求項5に記載の情報処理装置。
- 前記保持手段は、前記辞書を複数備えており、
前記第3の取得手段は、前記部分画像ごとに、前記辞書それぞれから前記カテゴリと前記部分学習画像の位置情報とを取得し、
前記登録手段は、前記部分画像ごとに、前記取得した全てのカテゴリに対応するデータ空間に前記位置情報が示す位置を前記第3の取得手段の結果を登録することを特徴とする請求項1乃至6のいずれか1項に記載の情報処理装置。 - 前記第3の取得手段は、前記カテゴリと前記位置情報とを組として取得することを特徴とする請求項1乃至7のいずれか1項に記載の情報処理装置。
- 前記画素値は、輝度値であることを特徴とする請求項1乃至8のいずれか1項に記載の情報処理装置。
- 前記画素値が抽出される画素は、ランダムに決定されることを特徴とする請求項1乃至9のいずれか1項に記載の情報処理装置。
- 複数のカテゴリのいずれかに属する対象物体を含む入力画像を取得する第1の取得手段と、
前記入力画像を構成する複数の部分画像を取得する第2の取得手段と、
前記複数の部分画像それぞれから、少なくとも一つの特徴量を抽出する抽出手段と、
前記対象物体を含む画像を分類するための複数の識別器を取得する識別器取得手段と、
前記対象物体を認識するための学習画像を構成する部分学習画像の特徴量に基づき、該部分学習画像を前記複数の識別器それぞれで分類された部分学習画像のカテゴリと該部分学習画像の位置情報とを登録した辞書を保持する保持手段と、
前記抽出手段で抽出された特徴量に基づいて前記複数の識別器それぞれで前記部分画像を分類し、前記部分画像ごとに前記複数の識別器それぞれで分類された結果に対応する複数の前記部分学習画像のカテゴリと前記部分学習画像の位置情報とを、前記辞書からそれぞれ取得する第3の取得手段と、
前記第3の取得手段で前記部分画像ごとに取得された前記複数の前記部分学習画像のカテゴリと前記部分学習画像の位置情報とをそれぞれ登録する登録手段と、
前記登録手段によって前記部分画像ごとに登録された前記複数の前記部分学習画像のカテゴリと前記部分学習画像の位置情報とを集計することにより、前記入力画像に含まれる対象物体のカテゴリと位置とを認識する認識手段とを備えることを特徴とする情報処理装置。 - 前記登録手段は、前記部分画像ごとに、前記取得されたカテゴリに対応するデータ空間における前記位置情報が示す位置に投票することにより、前記取得されたカテゴリに対応するデータ空間に前記位置情報が示す位置に、前記第3の取得手段の結果を登録することを特徴とする請求項2乃至11のいずれか1項に記載の情報処理装置。
- 前記位置情報は、前記取得されたカテゴリの部分学習画像の中心位置と、該部分学習画像を一部として構成される学習画像に含まれる対象物体の中心位置との位置関係を示す情報であり、
前記登録手段は、前記位置関係を示す情報に基づいて、前記取得されたカテゴリに対応するデータ空間において、前記部分画像の中心位置から前記位置関係をオフセットした位置に、前記第3の取得手段の結果を登録することを特徴とする請求項2乃至12のいずれか1項に記載の情報処理装置。 - 前記カテゴリは、前記対象物体の姿勢であることを特徴とする請求項1乃至13のいずれか1項に記載の情報処理装置。
- 前記第3の取得手段は、木構造の識別器を用いて、前記複数の部分画像を分類することを特徴とする請求項1乃至14のいずれか1項に記載の情報処理装置。
- 前記入力画像は、撮像装置で撮像された画像であることを特徴とする請求項1乃至15に記載の情報処理装置。
- 前記学習画像は、CG画像であることを特徴とする請求項1乃至16のいずれか1項に記載の情報処理装置。
- 前記複数の部分画像は、互いに重複する領域を持つことを特徴とする請求項1乃至17のいずれか1項に記載の情報処理装置。
- 前記辞書は、前記部分学習画像のカテゴリと前記部分学習画像の位置情報とを組にして登録されていることを特徴とする請求項1乃至18のいずれか1項に記載の情報処理装置。
- 複数のカテゴリのいずれかに属する対象物体を含む入力画像を取得する第1の取得手段と、
前記入力画像を構成する複数の部分画像を取得する第2の取得手段と、
前記複数の部分画像それぞれに含まれる複数の画素の画素値を抽出する抽出手段と、
前記対象物体を認識するための学習画像を構成する部分学習画像のカテゴリと該部分学習画像の位置情報とを登録した辞書を保持する保持手段と、
前記抽出手段で抽出された複数の画素の画素値を比較することによって前記複数の部分画像を分類し、前記部分画像ごとに、前記分類された結果に対応する前記部分学習画像のカテゴリと前記部分学習画像の位置情報とを前記辞書から取得する第3の取得手段と、
前記部分画像ごとに、前記第3の取得手段によって取得されたカテゴリに対応するデータ空間における前記位置情報が示す位置に投票する投票手段と、
前記部分画像ごとに前記投票手段によって投票された結果を集計することにより、前記入力画像に含まれる対象物体のカテゴリと位置とを認識する認識手段とを備えることを特徴とする情報処理装置。 - 前記認識手段は、前記投票手段によって投票された分布に基づいて、前記入力画像に含まれる対象物体のカテゴリと位置とを認識することを特徴とする請求項20に記載の情報処理装置。
- 前記認識手段は、前記取得されたカテゴリごとに、前記取得されたカテゴリに対応するデータ空間における前記部分画像ごとに投票された分布のピーク位置のスコアを求め、前記取得されたカテゴリの中で、前記スコアが最も高いピーク位置が求められたデータ空間に対応するカテゴリを前記対象物体のカテゴリとし、前記スコアが最も高いピーク位置を前記対象物体の位置として認識することを特徴とする請求項21に記載の情報処理装置。
- 前記データ空間は、多次元のテーブル形式であることを特徴とする請求項20乃至22のいずれか1項に記載の情報処理装置。
- 前記データ空間は、前記入力画像の各画素に対応する要素を持った2次元テーブル形式であることを特徴とする請求項20乃至23のいずれか1項に記載の情報処理装置。
- 前記学習画像は、CG画像であることを特徴とする請求項20乃至24のいずれか1項に記載の情報処理装置。
- 対象物体を認識するための学習画像を構成する部分学習画像のカテゴリと該部分学習画像の位置情報とを登録した辞書に基づいて、入力される画像から前記対象物体の位置とカテゴリを認識する情報処理方法であって、
複数のカテゴリのいずれかに属する前記対象物体を含む入力画像を取得する第1の取得工程と、
前記入力画像を構成する複数の部分画像を取得する第2の取得工程と、
前記複数の部分画像それぞれに含まれる複数の画素の画素値を抽出する抽出工程と、
前記抽出工程で抽出された複数の画素の画素値を比較することによって、前記複数の部分画像を分類し、前記部分画像ごとに、前記分類された結果に対応する前記部分学習画像のカテゴリ及び前記部分学習画像の位置情報とを、前記辞書から取得する第3の取得工程と、
前記第3の取得工程で前記部分画像ごとに取得された結果を集計することにより、前記入力画像に含まれる対象物体のカテゴリと位置とを認識する認識手段とを備えることを特徴とする情報処理方法。 - 対象物体を認識するための学習画像を構成する部分学習画像の特徴量に基づき、該部分学習画像を複数の識別器それぞれで分類された部分学習画像のカテゴリと該部分学習画像の位置情報とを保持する辞書に基づいて、入力される画像から前記対象物体の位置とカテゴリを認識する情報処理方法であって、
複数のカテゴリのいずれかに属する前記対象物体を含む入力画像を取得する第1の取得工程と、
前記入力画像を構成する複数の部分画像を取得する第2の取得工程と、
前記複数の部分画像から、少なくとも一つの特徴量を抽出する抽出工程と、
前記抽出工程で抽出された特徴量に基づいて前記複数の識別器それぞれで前記部分画像を分類し、前記部分画像ごとに、前記複数の識別器それぞれで分類された結果に対応する複数の前記部分学習画像のカテゴリと前記部分学習画像の位置情報とを、前記辞書からそれぞれ取得する第3の取得工程と、
前記第3の取得工程で前記部分画像ごとに取得された前記複数の前記部分学習画像のカテゴリ及び前記部分学習画像の位置情報とを、それぞれ登録する登録工程と、
前記登録工程で記部分画像ごとに登録された前記複数の前記部分学習画像のカテゴリと前記部分学習画像の位置情報とを集計することにより、前記入力画像に含まれる対象物体のカテゴリと位置とを認識する認識工程とを備えることを特徴とする情報処理方法。 - 対象物体を認識するための学習画像を構成する部分学習画像のカテゴリと該部分学習画像の位置情報とを登録した辞書に基づいて、入力される画像から前記対象物体の位置とカテゴリを認識する情報処理方法であって、
複数のカテゴリのいずれかに属する対象物体を含む入力画像を取得する第1の取得工程と、
前記入力画像を構成する複数の部分画像を取得する第2の取得工程と、
前記複数の部分画像それぞれに含まれる複数の画素の画素値を抽出する抽出工程と、
前記抽出手段で抽出された複数の画素の画素値を比較することによって前記複数の部分画像を分類し、前記部分画像ごとに、前記分類された結果に対応する前記部分学習画像のカテゴリと前記部分学習画像の位置情報とを前記辞書から取得する第3の取得工程と、
前記部分画像ごとに、前記第3の取得手段によって取得されたカテゴリに対応するデータ空間における前記位置情報が示す位置に投票する投票工程と、
前記部分画像ごとに前記投票手段によって投票された結果を集計することにより、前記入力画像に含まれる対象物体のカテゴリと位置とを認識する認識手段とを備えることを特徴とする情報処理方法。 - コンピュータを、請求項1乃至25のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014089310A JP5791751B2 (ja) | 2009-06-18 | 2014-04-23 | 画像認識方法及び画像認識装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009145457 | 2009-06-18 | ||
JP2009145457 | 2009-06-18 | ||
JP2014089310A JP5791751B2 (ja) | 2009-06-18 | 2014-04-23 | 画像認識方法及び画像認識装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010064316A Division JP5538967B2 (ja) | 2009-06-18 | 2010-03-19 | 情報処理装置、情報処理方法、プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015155825A Division JP6049822B2 (ja) | 2009-06-18 | 2015-08-06 | 画像認識方法及び画像認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014135092A JP2014135092A (ja) | 2014-07-24 |
JP5791751B2 true JP5791751B2 (ja) | 2015-10-07 |
Family
ID=51413253
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014089310A Active JP5791751B2 (ja) | 2009-06-18 | 2014-04-23 | 画像認識方法及び画像認識装置 |
JP2015155825A Active JP6049822B2 (ja) | 2009-06-18 | 2015-08-06 | 画像認識方法及び画像認識装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015155825A Active JP6049822B2 (ja) | 2009-06-18 | 2015-08-06 | 画像認識方法及び画像認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP5791751B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018032071A (ja) | 2016-08-22 | 2018-03-01 | 株式会社クレスコ | 検証装置、検証方法及び検証プログラム |
CN110291539A (zh) * | 2017-02-24 | 2019-09-27 | 欧姆龙株式会社 | 用于生成学习数据的处理方法、系统、程序和存储介质、以及生成学习数据的方法和系统 |
JP7309392B2 (ja) * | 2019-03-15 | 2023-07-18 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
WO2023127085A1 (ja) * | 2021-12-28 | 2023-07-06 | 日本電気株式会社 | 物体認識装置、物体認識方法、及び、記憶媒体 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62210596A (ja) * | 1986-03-12 | 1987-09-16 | Hitachi Ltd | 画像認識方法 |
JPH0921610A (ja) * | 1995-07-04 | 1997-01-21 | N T T Data Tsushin Kk | 画像処理装置及び画像処理方法 |
JP2002032766A (ja) * | 2000-07-18 | 2002-01-31 | Matsushita Electric Ind Co Ltd | 画像認識装置及びその方法 |
JP2002063567A (ja) * | 2000-08-23 | 2002-02-28 | Nec Corp | 物体位置姿勢推定装置及びその方法並びそれを用いた特徴点位置抽出方法及び画像照合方法 |
JP4161659B2 (ja) * | 2002-02-27 | 2008-10-08 | 日本電気株式会社 | 画像認識システム及びその認識方法並びにプログラム |
EP1679657B1 (en) * | 2003-10-30 | 2017-12-27 | NEC Corporation | Estimation system, estimation method, and estimation program for estimating object state |
JP4479478B2 (ja) * | 2004-11-22 | 2010-06-09 | 株式会社日立製作所 | パターン認識方法および装置 |
JP4556891B2 (ja) * | 2006-03-17 | 2010-10-06 | ソニー株式会社 | 情報処理装置および方法、記録媒体、並びにプログラム |
JP4636064B2 (ja) * | 2007-09-18 | 2011-02-23 | ソニー株式会社 | 画像処理装置および画像処理方法、並びにプログラム |
-
2014
- 2014-04-23 JP JP2014089310A patent/JP5791751B2/ja active Active
-
2015
- 2015-08-06 JP JP2015155825A patent/JP6049822B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP6049822B2 (ja) | 2016-12-21 |
JP2016001489A (ja) | 2016-01-07 |
JP2014135092A (ja) | 2014-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5538967B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
Sirmacek et al. | A probabilistic framework to detect buildings in aerial and satellite images | |
Konstantinidis et al. | Building detection using enhanced HOG–LBP features and region refinement processes | |
US9824294B2 (en) | Saliency information acquisition device and saliency information acquisition method | |
US10346720B2 (en) | Rotation variant object detection in Deep Learning | |
US9367766B2 (en) | Text line detection in images | |
EP3274921B1 (en) | Multi-layer skin detection and fused hand pose matching | |
JP6032921B2 (ja) | 物体検出装置及びその方法、プログラム | |
Rejeb Sfar et al. | Vantage feature frames for fine-grained categorization | |
JP6049822B2 (ja) | 画像認識方法及び画像認識装置 | |
CN111860309A (zh) | 一种人脸识别方法及系统 | |
CN111160169A (zh) | 人脸检测方法、装置、设备及计算机可读存储介质 | |
CN112633297A (zh) | 目标对象的识别方法、装置、存储介质以及电子装置 | |
CN110263731B (zh) | 一种单步人脸检测系统 | |
JP6128910B2 (ja) | 学習装置、学習方法及びプログラム | |
JP3914864B2 (ja) | パターン認識装置及びその方法 | |
CN108509925A (zh) | 一种基于视觉词袋模型的行人重识别方法 | |
He et al. | Aggregating local context for accurate scene text detection | |
Li et al. | Road-network-based fast geolocalization | |
Elhadi et al. | Arabic-numbers recognition system for car plates | |
CN110148133B (zh) | 基于特征点及其结构关系的电路板残片图像识别方法 | |
CN114927236A (zh) | 一种面向多重目标图像的检测方法及系统 | |
Zhang et al. | Experiments in building recognition | |
Takahashi et al. | A compact color descriptor for person re-identification with clothing selection from a wardrobe | |
Awad et al. | A new hybrid texture-perceptual descriptor: application cbir |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140423 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150316 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150707 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150804 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5791751 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |