JP6032930B2 - 情報処理装置、情報処理方法 - Google Patents
情報処理装置、情報処理方法 Download PDFInfo
- Publication number
- JP6032930B2 JP6032930B2 JP2012096036A JP2012096036A JP6032930B2 JP 6032930 B2 JP6032930 B2 JP 6032930B2 JP 2012096036 A JP2012096036 A JP 2012096036A JP 2012096036 A JP2012096036 A JP 2012096036A JP 6032930 B2 JP6032930 B2 JP 6032930B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- node
- partial
- information processing
- luminance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/803—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of input or preprocessed data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Description
前記画像セットに含まれている輝度画像及び距離画像から対応する部分画像を抽出し、該輝度画像から抽出した部分画像及び該距離画像から抽出した部分画像のセットを生成する生成手段と、
前記生成手段で生成された部分画像のセットを木構造のルートノードに割り当てる第1割り当て手段と、
前記木構造における各ノードにおいて、該ノードに割り当てられている部分画像の各セットに対して2つの画素の位置を設定し、それぞれのセット中の距離画像の部分画像における該2つの画素の何れかの画素値が0であるか否かを判断する判断手段と、
前記2つの画素の何れかの画素値が0であれば輝度画像の部分画像を選択し、前記2つの画素の何れの画素値も0でない場合は距離画像の部分画像を選択する選択手段と、
前記各ノードにおいて、前記割り当てられている部分画像の各セットについて、前記選択手段が選択した輝度画像若しくは距離画像の部分画像における前記設定された位置の画素値に基づいて、該セットを下位のノードのいずれかに割り当てる第2割り当て手段と、
前記木構造の末端ノードに割り当てられているセットに関する情報を出力する出力手段と
を備えることを特徴とする。
本実施形態では、複数の取得手法により取得した認識対象を含む入力画像を効率よく用いて認識対象を識別することを目的とする。複数の取得手法により取得した入力画像とは、例えば、一般的な光学装置によって得られる輝度画像や既存の距離計測手法によって得られる距離画像等が挙げられる。また、複数の取得手法により取得した入力画像とは、例えばそれぞれ異なる照明パターンで撮影された各々の輝度画像等も含まれる。
Q(i,c)=
else i→right node
i∈P | P:カレントパターン集合
この場合、ステップS212で実施するクエリ点の選択とは、カレントパターン中の任意の2点を選択する動作に該当する。図6(b)に示すように、クエリ点はノードごとに決定され、あるノードに割り当てられているカレントパターンはすべて同一のクエリ点を用いてクエリを行う。クエリ点の位置は、ノードごとにランダムに決めても良いし、ノードごとに予め定められた方法で決めても良い。
ステップS914では、ステップS902で抽出した識別パターンのうちステップS913で選択したチャネルの識別パターンを用いて、カレントノードより1つ下位のノード(左側のノード及び右側のノード)のうち一方を選択する。選択方法は、学習過程と同様の方法(上記式を用いた方法)でもって行う。
本実施形態では図2Bおよび図9Bにおけるチャネル決定ルーチンの処理のみが異なり、その他については、第1の実施形態と同様である。然るに以下では、他の処理は第1の実施形態と同様であるため、ここではチャネル決定ルーチンについて図10を用いて説明する。
本実施形態では、木構造の代わりに、fern構造(M. Ozuysal,et al “Fast Keypoint Recognition using Random Ferns” IEEE Transactions on PAMI, Vol. 32, Nr. 3, pp. 448 − 461, 2010.)を用いた学習・識別について述べる。
else Q(i,c)=0
i∈P | P:カレントパターン集合
図11では、3段の深さを有するfern判別器1100を示している。第1の実施形態と同様に、学習パターンはまず1段目の深さ(d1)のクエリにより分類される。このとき、カレントパターンごとに各チャネルにおけるクエリ点の画素値により適切なチャネルが選択される。図11においては3種のチャネルを用いて学習を行っているが、チャネル選択は図10で示した処理と同様にチャネルに応じて定められた信頼度を比較することで行えばよい。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (6)
- 輝度画像と距離画像の画像セットを複数セット取得する取得手段と、
前記画像セットに含まれている輝度画像及び距離画像から対応する部分画像を抽出し、該輝度画像から抽出した部分画像及び該距離画像から抽出した部分画像のセットを生成する生成手段と、
前記生成手段で生成された部分画像のセットを木構造のルートノードに割り当てる第1割り当て手段と、
前記木構造における各ノードにおいて、該ノードに割り当てられている部分画像の各セットに対して2つの画素の位置を設定し、それぞれのセット中の距離画像の部分画像における該2つの画素の何れかの画素値が0であるか否かを判断する判断手段と、
前記2つの画素の何れかの画素値が0であれば輝度画像の部分画像を選択し、前記2つの画素の何れの画素値も0でない場合は距離画像の部分画像を選択する選択手段と、
前記各ノードにおいて、前記割り当てられている部分画像の各セットについて、前記選択手段が選択した輝度画像若しくは距離画像の部分画像における前記設定された位置の画素値に基づいて、該セットを下位のノードのいずれかに割り当てる第2割り当て手段と、
前記木構造の末端ノードに割り当てられているセットに関する情報を出力する出力手段と
を備えることを特徴とする情報処理装置。 - 更に、
前記第1割り当て手段、前記判断手段、前記選択手段、前記第2割り当て手段、の各手段を複数回動作させることで複数の木構造を生成させる手段を備えることを特徴とする請求項1に記載の情報処理装置。 - 更に、
輝度画像と距離画像の入力画像セットを取得し、該入力画像セットにおける該輝度画像及び該距離画像のそれぞれの部分領域内の画像を入力部分画像として取得する手段と、
それぞれの入力部分画像中の前記2つの画素の画素値を用いて、前記輝度画像の入力部分画像若しくは前記距離画像の入力部分画像のうち1つを選択し、該選択した入力部分画像を対象入力部分画像とする手段と、
前記木構造における各ノードにおいて、現在参照しているノードより下位のノードのうち、前記対象入力部分画像中の前記2つの画素の画素値に応じたノードを、次の参照先として選択する手段と、
前記現在参照しているノードが前記木構造の末端ノードである場合、該末端ノードに割り当てられている情報から、前記入力画像セットの識別結果を決定する決定手段と
を備えることを特徴とする請求項1又は2に記載の情報処理装置。 - 前記2つの画素の位置は、ノードごとに異なることを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
- 情報処理装置が行う情報処理方法であって、
前記情報処理装置の取得手段が、輝度画像と距離画像の画像セットを複数セット取得する取得工程と、
前記情報処理装置の生成手段が、前記画像セットに含まれている輝度画像及び距離画像から対応する部分画像を抽出し、該輝度画像から抽出した部分画像及び該距離画像から抽出した部分画像のセットを生成する生成工程と、
前記情報処理装置の第1割り当て手段が、前記生成工程で生成された部分画像のセットを木構造のルートノードに割り当てる第1割り当て工程と、
前記情報処理装置の判断手段が、前記木構造における各ノードにおいて、該ノードに割り当てられている部分画像の各セットに対して2つの画素の位置を設定し、それぞれのセット中の距離画像の部分画像における該2つの画素の何れかの画素値が0であるか否かを判断する判断工程と、
前記情報処理装置の選択手段が、前記2つの画素の何れかの画素値が0であれば輝度画像の部分画像を選択し、前記2つの画素の何れの画素値も0でない場合は距離画像の部分画像を選択する選択工程と、
前記情報処理装置の第2割り当て手段が、前記各ノードにおいて、前記割り当てられている部分画像の各セットについて、前記選択工程で選択した輝度画像若しくは距離画像の部分画像における前記設定された位置の画素値に基づいて、該セットを下位のノードのいずれかに割り当てる第2割り当て工程と、
前記情報処理装置の出力手段が、前記木構造の末端ノードに割り当てられているセットに関する情報を出力する出力工程と
を備えることを特徴とする情報処理方法。 - コンピュータを、請求項1乃至4の何れか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012096036A JP6032930B2 (ja) | 2012-04-19 | 2012-04-19 | 情報処理装置、情報処理方法 |
US13/861,060 US9098776B2 (en) | 2012-04-19 | 2013-04-11 | Information processing apparatus and information processing method that determine whether any one of a plurality of pixels in an obtained partial image has an invalid value to select an appropriate acquisition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012096036A JP6032930B2 (ja) | 2012-04-19 | 2012-04-19 | 情報処理装置、情報処理方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013225175A JP2013225175A (ja) | 2013-10-31 |
JP2013225175A5 JP2013225175A5 (ja) | 2015-06-11 |
JP6032930B2 true JP6032930B2 (ja) | 2016-11-30 |
Family
ID=49380177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012096036A Active JP6032930B2 (ja) | 2012-04-19 | 2012-04-19 | 情報処理装置、情報処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9098776B2 (ja) |
JP (1) | JP6032930B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11741718B2 (en) | 2021-05-18 | 2023-08-29 | Hitachi Astemo, Ltd. | Light interference detection during vehicle navigation |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5930392A (en) | 1996-07-12 | 1999-07-27 | Lucent Technologies Inc. | Classification technique using random decision forests |
US6351561B1 (en) * | 1999-03-26 | 2002-02-26 | International Business Machines Corporation | Generating decision-tree classifiers with oblique hyperplanes |
US20100266179A1 (en) * | 2005-05-25 | 2010-10-21 | Ramsay Thomas E | System and method for texture visualization and image analysis to differentiate between malignant and benign lesions |
US8577130B2 (en) * | 2009-03-16 | 2013-11-05 | Siemens Medical Solutions Usa, Inc. | Hierarchical deformable model for image segmentation |
JP5588165B2 (ja) * | 2009-12-24 | 2014-09-10 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
US9053393B2 (en) * | 2010-03-19 | 2015-06-09 | Canon Kabushiki Kaisha | Learning method and apparatus for pattern recognition |
US8768944B2 (en) * | 2010-08-18 | 2014-07-01 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
-
2012
- 2012-04-19 JP JP2012096036A patent/JP6032930B2/ja active Active
-
2013
- 2013-04-11 US US13/861,060 patent/US9098776B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9098776B2 (en) | 2015-08-04 |
JP2013225175A (ja) | 2013-10-31 |
US20130279814A1 (en) | 2013-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10467526B1 (en) | Artificial intelligence system for image similarity analysis using optimized image pair selection and multi-scale convolutional neural networks | |
Zhao et al. | Deep hough transform for semantic line detection | |
JP6041923B2 (ja) | 情報処理方法及び情報処理装置 | |
Rukhovich et al. | Iterdet: iterative scheme for object detection in crowded environments | |
US8675974B2 (en) | Image processing apparatus and image processing method | |
Zhao et al. | Hi-Fi: Hierarchical feature integration for skeleton detection | |
KR101581112B1 (ko) | 계층적 패턴 구조에 기반한 기술자 생성 방법 및 이를 이용한 객체 인식 방법과 장치 | |
US9563822B2 (en) | Learning apparatus, density measuring apparatus, learning method, computer program product, and density measuring system | |
JP5706647B2 (ja) | 情報処理装置、およびその処理方法 | |
GB2489272A (en) | Segmentation of images into superpixels | |
KR101934325B1 (ko) | 객체 분류 방법 및 그 장치 | |
US8768944B2 (en) | Information processing apparatus, information processing method, and storage medium | |
KR102592551B1 (ko) | Ar장치를 위한 객체 인식 처리 장치 및 방법 | |
US10614312B2 (en) | Method and apparatus for determining signature actor and identifying video based on probability of appearance of signature actor | |
JP6128910B2 (ja) | 学習装置、学習方法及びプログラム | |
Jemilda et al. | Moving object detection and tracking using genetic algorithm enabled extreme learning machine | |
CN115048969A (zh) | 用于评估、理解和改进深度神经网络的视觉分析系统 | |
JP6032930B2 (ja) | 情報処理装置、情報処理方法 | |
KR101991186B1 (ko) | 철근 검출 방법 및 그 장치 | |
JP6659120B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN114492366A (zh) | 二进制文件的分类方法、计算设备及存储介质 | |
US8930286B2 (en) | Information processing apparatus, processing method therefor, and non-transitory computer-readable storage medium | |
WO2013154062A1 (ja) | 画像識別システム、画像識別方法、およびプログラム | |
JP2017004052A (ja) | 学習装置、方法及びプログラム | |
Gominski et al. | Benchmarking individual tree mapping with sub-meter imagery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150420 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160317 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160519 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161025 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6032930 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |