JP6448325B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP6448325B2 JP6448325B2 JP2014234869A JP2014234869A JP6448325B2 JP 6448325 B2 JP6448325 B2 JP 6448325B2 JP 2014234869 A JP2014234869 A JP 2014234869A JP 2014234869 A JP2014234869 A JP 2014234869A JP 6448325 B2 JP6448325 B2 JP 6448325B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- image
- area
- discriminator
- scene information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Description
図1は、画像処理装置を備えたシステムの概略的な構成例を示す図である。図1のシステムは、カメラ10と、画像処理装置及び情報処理方法を実現する一構成例である画像認識装置20とが、ネットワーク15を介して接続されている。なお、画像認識装置20とカメラ10は、一体に構成されていてもよい。
Sc={Ph1、Ph2、・・・、Phn} 式(2)
F={S1、S2、・・・、SR、Sc} 式(3)
次に、第2の実施形態について説明する。第2の実施形態の学習装置300は、統合識別器学習工程において、第1の実施形態のようにシーン情報の特徴量をそのまま利用するのではなく、各領域判別器の学習の際に利用した学習画像のシーン情報を保持しておいてそのシーン情報との類似度を用いる。
次に、第3の実施形態について説明する。第3の実施形態の学習装置300は、第1の実施形態の例とは異なり、学習評価セット判別の結果に応じて領域判別器の再学習即ち再領域判別を行う。図20の(a)は、第3の実施形態の学習装置300のCPU401が実行する各処理の一例を機能ブロックとして示している。第3の実施形態における学習装置300は、図12の(a)に示した学習装置300の機能ブロック構成に加えて、領域判別器再学習部305の機能ブロックを実行可能となされている。領域判別器再学習部305の詳細な説明については、図13の(c)等を用いて後述する。図20の(a)の学習装置300において、領域判別器再学習部305の他の構成については、図12の(a)に示した各構成と同様であるためそれらの説明は省略する。
次に第4の実施形態の学習装置300について説明する。第4の実施形態の学習装置300は、第1の実施形態と異なり、学習評価セット判別の結果に応じて領域判別器の追加学習を行う。図20の(b)は、第4の実施形態の学習装置300のCPU401が実行する各処理の機能ブロック構成例を示している。第4の実施形態における学習装置300は、図12の(a)に示した機能構成に加えて領域判別器追加学習部306の機能を実行可能となされている。領域判別器追加学習部306の詳細な説明については、図13の(d)等を用いて後述する。その他の構成については、図12と同様であるため説明を省略する。
第5の実施形態における学習装置300は、第1の実施形態の例とは異なり、各領域判別器で学習する学習画像を選択するのではなく、各領域判別器で学習する各学習画像の重要度を設定する。そして、学習装置300は、その重要度に基づいて領域判別器を学習する。図20の(c)は、第5の実施形態における学習装置300のCPU401が実行する各処理の機能ブロック構成例を示している。第5の実施形態における学習装置300は、図12に示した機能構成のサブセット選択部301に代えて学習画像重要度設定部307の機能を実行可能となされている。学習画像重要度設定部307の詳細な説明については、図13の(e)のフローチャートを用いて後述する。その他の構成については、図12と同様であるため説明を省略する。図13の(e)は、第5の実施形態における学習装置300が統合識別器を学習するまでの処理の概要を示している。この図13の(e)において、学習画像重要度設定部307は、学習画像重要度設定工程T510として、第1の実施形態における学習処理のサブセット選択工程T110と違い、各領域判別器で学習に用いる学習画像の重要度を設定する。また第5の実施形態において、重要度は、シーン情報に基づいて設定される。重要度の具体的な設定方法に関しては後で説明する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (17)
- 複数の学習画像の一部を選択してなるサブセットを複数作成する作成手段と、
前記作成されたサブセットごとに、前記学習画像を分割してなる各領域のクラスを判別するための領域判別器を学習する学習手段と、
前記学習された複数の領域判別器を用いて複数の学習評価画像を分割してなる各領域のクラスを判別する学習判別手段と、
前記学習判別手段により判別された前記複数の学習評価画像の各領域に対する判別結果と、前記複数の学習評価画像それぞれに対応づけられたシーン情報と、に基づいて統合識別器を学習する識別学習手段と、
を有することを特徴とする画像処理装置。 - 前記複数の学習画像のそれぞれはシーン情報が対応付けられており、
前記作成手段は、前記複数の学習画像それぞれのシーン情報に基づいて、複数のサブセットを作成することを特徴とする請求項1に記載の画像処理装置。 - 前記作成手段は、前記複数の学習画像からランダムに選択された学習画像のシーン情報に基づいて、前記複数の学習画像から前記選択された学習画像のシーン情報と類似したシーン情報が対応付けられている学習画像を選択してサブセットを作成することを特徴とする請求項2に記載の画像処理装置。
- 前記作成手段は、前記複数の学習画像からユーザの指示により選択された学習画像のシーン情報に基づいて、前記複数の学習画像から前記選択された学習画像のシーン情報と類似したシーン情報が対応付けられている学習画像を選択してサブセットを作成することを特徴とする請求項2に記載の画像処理装置。
- 前記作成手段は、前記複数の学習画像を前記シーン情報の類似度に基づいてクラスタリングして、クラスタリングによるクラスタに含まれる学習画像を同一のサブセットとすることを特徴とする請求項2から4のいずれか1項に記載の画像処理装置。
- 前記識別学習手段は、前記複数の学習画像のシーン情報と前記複数の学習評価画像のシーン情報との類似度に基づいて、前記統合識別器を学習することを特徴とする請求項2から5のいずれか1項に記載の画像処理装置。
- 前記複数の学習評価画像は、前記複数の学習画像の一部または全部であることを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。
- 前記学習判別手段による判別結果の精度に応じて、前記複数の領域判別器を再学習する再学習手段を更に有することを特徴とする請求項1から7のいずれか1項に記載の画像処理装置。
- 前記学習判別手段による判別結果に応じて、領域判別器を追加学習する追加学習手段を更に有し、
前記識別学習手段は、前記追加学習手段によって追加学習された領域判別器の判別結果に基づいて、前記統合識別器を学習することを特徴とする請求項1から8のいずれか1項に記載の画像処理装置。 - 前記複数の学習画像のそれぞれは重要度が対応付けられており、
前記作成手段は、前記複数の学習画像それぞれの重要度に基づいて、複数のサブセットを作成することを特徴とする請求項1から9のいずれか1項に記載の画像処理装置。 - 前記学習手段により学習された複数の領域判別器を保持するための保持手段を更に有することを特徴とする請求項1から10のいずれか1項に記載の画像処理装置。
- 前記シーン情報は、画像を分割してなる複数のブロックにおける色情報のヒストグラムであることを特徴とする請求項1から11のいずれか1項に記載の画像処理装置。
- 前記学習手段は、前記学習画像の各領域から抽出される特徴量と、該各領域に付与された正解データとに基づいて、各領域のクラスを判別するための領域判別器を学習することを特徴とする請求項1から12のいずれか1項に記載の画像処理装置。
- 前記識別学習手段は、前記判別結果と前記シーン情報とにより構成される特徴量と、前記複数の学習評価画像の各領域付与される正解データとに基づいて、前記統合識別器を学習することを特徴とする請求項1から13のいずれか1項に記載の画像処理装置。
- 識別対象画像を取得する取得手段と、
前記識別対象画像のシーン情報を取得するシーン情報取得手段と、
前記学習手段により学習された複数の領域判別器を用いて、前記識別対象画像を分割してなる各領域のクラスを判別する判別手段と、
前記学習された統合識別器を用い、前記判別手段により判別された前記複数の識別対象画像の各領域に対する判別結果と、前記取得されたシーン情報と、に基づいて前記識別対象画像の各領域のクラスを識別する統合識別手段と、
を更に有することを特徴とする請求項1から14のいずれか1項に記載の画像処理装置。 - 画像処理装置が実行する画像処理方法であって、
複数の学習画像の一部を選択してなるサブセットを複数作成すステップと、
前記作成されたサブセットごとに、前記学習画像を分割してなる各領域のクラスを判別するための領域判別器を学習するステップと、
前記学習された複数の領域判別器を用いて複数の学習評価画像を分割してなる各領域のクラスを判別するステップと、
前記判別された前記複数の学習評価画像の各領域に対する判別結果と、前記複数の学習評価画像それぞれに対応づけられたシーン情報と、に基づいて統合識別器を学習するステップと、
を有することを特徴とする画像処理方法。 - コンピュータを請求項1から15のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014234869A JP6448325B2 (ja) | 2014-11-19 | 2014-11-19 | 画像処理装置、画像処理方法及びプログラム |
US14/940,871 US9779329B2 (en) | 2014-11-19 | 2015-11-13 | Image processing apparatus, image processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014234869A JP6448325B2 (ja) | 2014-11-19 | 2014-11-19 | 画像処理装置、画像処理方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016099734A JP2016099734A (ja) | 2016-05-30 |
JP2016099734A5 JP2016099734A5 (ja) | 2017-12-07 |
JP6448325B2 true JP6448325B2 (ja) | 2019-01-09 |
Family
ID=55961996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014234869A Active JP6448325B2 (ja) | 2014-11-19 | 2014-11-19 | 画像処理装置、画像処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9779329B2 (ja) |
JP (1) | JP6448325B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020126614A (ja) * | 2019-01-31 | 2020-08-20 | 株式会社ストラドビジョンStradvision,Inc. | 高精度イメージを分析するディープラーニングネットワークの学習に利用するためのトレーニングイメージをオートラベリングするための方法、及びこれを利用したオートラベリング装置{method for auto−labeling training images for use in deep learning network to analyze images with high precision, and auto−labeling device using the same} |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6866095B2 (ja) * | 2016-09-26 | 2021-04-28 | キヤノン株式会社 | 学習装置、画像識別装置、学習方法、画像識別方法及びプログラム |
JP6855207B2 (ja) * | 2016-10-07 | 2021-04-07 | キヤノン株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP6781950B2 (ja) * | 2016-10-12 | 2020-11-11 | オムロン株式会社 | 識別情報付与システム、識別情報付与方法、及びそのプログラム |
US11755004B2 (en) | 2017-07-13 | 2023-09-12 | Nec Corporation | Analysis system, analysis method, and storage medium |
US11625597B2 (en) * | 2017-11-15 | 2023-04-11 | Canon Medical Systems Corporation | Matching network for medical image analysis |
CN108596116B (zh) | 2018-04-27 | 2021-11-05 | 深圳市商汤科技有限公司 | 测距方法、智能控制方法及装置、电子设备和存储介质 |
JP7278088B2 (ja) * | 2019-01-31 | 2023-05-19 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP7363383B2 (ja) | 2019-11-05 | 2023-10-18 | 富士通株式会社 | 解析装置、解析プログラム及び解析方法 |
JP6846765B1 (ja) * | 2020-03-26 | 2021-03-24 | 株式会社 情報システムエンジニアリング | 情報処理プログラム |
JP2022171150A (ja) * | 2021-04-30 | 2022-11-11 | パナソニックIpマネジメント株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
US11922702B2 (en) * | 2021-08-19 | 2024-03-05 | Ford Global Technologies, Llc | Enhanced object detection |
JP7275233B1 (ja) | 2021-11-18 | 2023-05-17 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 学習装置、学習方法及び学習プログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6647139B1 (en) * | 1999-02-18 | 2003-11-11 | Matsushita Electric Industrial Co., Ltd. | Method of object recognition, apparatus of the same and recording medium therefor |
US7856123B2 (en) * | 2004-06-04 | 2010-12-21 | France Telecom | Method for recognising faces by means of a two-dimensional linear discriminant analysis |
US7995055B1 (en) * | 2007-05-25 | 2011-08-09 | Google Inc. | Classifying objects in a scene |
JP2009064162A (ja) * | 2007-09-05 | 2009-03-26 | Fuji Heavy Ind Ltd | 画像認識システム |
JP4772839B2 (ja) * | 2008-08-13 | 2011-09-14 | 株式会社エヌ・ティ・ティ・ドコモ | 画像識別方法および撮像装置 |
JP4623387B2 (ja) | 2008-09-04 | 2011-02-02 | ソニー株式会社 | 学習装置および方法、認識装置および方法、並びにプログラム |
JP4720913B2 (ja) * | 2009-02-19 | 2011-07-13 | ソニー株式会社 | 学習装置、学習方法、識別装置、識別方法、及び、プログラム |
JP5401695B2 (ja) * | 2011-05-23 | 2014-01-29 | 株式会社モルフォ | 画像識別装置、画像識別方法、画像識別プログラム及び記録媒体 |
JP2013003686A (ja) * | 2011-06-13 | 2013-01-07 | Sony Corp | 認識装置および方法、プログラム、並びに記録媒体 |
JP2013125322A (ja) * | 2011-12-13 | 2013-06-24 | Olympus Corp | 学習装置、プログラム及び学習方法 |
JP5660078B2 (ja) * | 2012-05-31 | 2015-01-28 | カシオ計算機株式会社 | 多クラス識別器、方法、およびプログラム |
JP5742873B2 (ja) * | 2013-05-08 | 2015-07-01 | 株式会社デンソー | 物体識別装置 |
-
2014
- 2014-11-19 JP JP2014234869A patent/JP6448325B2/ja active Active
-
2015
- 2015-11-13 US US14/940,871 patent/US9779329B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020126614A (ja) * | 2019-01-31 | 2020-08-20 | 株式会社ストラドビジョンStradvision,Inc. | 高精度イメージを分析するディープラーニングネットワークの学習に利用するためのトレーニングイメージをオートラベリングするための方法、及びこれを利用したオートラベリング装置{method for auto−labeling training images for use in deep learning network to analyze images with high precision, and auto−labeling device using the same} |
Also Published As
Publication number | Publication date |
---|---|
US20160140422A1 (en) | 2016-05-19 |
JP2016099734A (ja) | 2016-05-30 |
US9779329B2 (en) | 2017-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6448325B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US20220138490A1 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
US11710299B2 (en) | Method and apparatus for employing specialist belief propagation networks | |
JP6332937B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
US9824294B2 (en) | Saliency information acquisition device and saliency information acquisition method | |
US10204283B2 (en) | Image recognizing apparatus, image recognizing method, and storage medium | |
Li et al. | A positive and unlabeled learning algorithm for one-class classification of remote-sensing data | |
US9633282B2 (en) | Cross-trained convolutional neural networks using multimodal images | |
JP6351240B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2017033469A (ja) | 画像識別方法、画像識別装置及びプログラム | |
US9418440B2 (en) | Image segmenting apparatus and method | |
US10929978B2 (en) | Image processing apparatus, training apparatus, image processing method, training method, and storage medium | |
CN104504366A (zh) | 基于光流特征的笑脸识别系统及方法 | |
JP6866095B2 (ja) | 学習装置、画像識別装置、学習方法、画像識別方法及びプログラム | |
US11055584B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium that perform class identification of an input image using a discriminator that has undergone learning to perform class identification at different granularities | |
US20110235901A1 (en) | Method, apparatus, and program for generating classifiers | |
JP2016099668A (ja) | 学習方法、学習装置、画像認識方法、画像認識装置及びプログラム | |
JP5214679B2 (ja) | 学習装置、方法及びプログラム | |
JP6448212B2 (ja) | 認識装置及び認識方法 | |
WO2015146113A1 (ja) | 識別辞書学習システム、識別辞書学習方法および記録媒体 | |
Lin | Semantic building façade segmentation from airborne oblique images | |
JP2018205858A (ja) | 学習装置、認識装置、学習方法及びプログラム | |
Vicente | Large-scale weakly-supervised shadow detection | |
JP2011096291A (ja) | 特徴抽出装置、対象物検出装置、特徴抽出方法、および対象物検出方法 | |
JP2018060440A (ja) | 画像処理装置、画像処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171027 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171027 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181029 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181204 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6448325 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |