JP2013117860A - 画像処理方法、画像処理装置、撮像装置およびプログラム - Google Patents
画像処理方法、画像処理装置、撮像装置およびプログラム Download PDFInfo
- Publication number
- JP2013117860A JP2013117860A JP2011265047A JP2011265047A JP2013117860A JP 2013117860 A JP2013117860 A JP 2013117860A JP 2011265047 A JP2011265047 A JP 2011265047A JP 2011265047 A JP2011265047 A JP 2011265047A JP 2013117860 A JP2013117860 A JP 2013117860A
- Authority
- JP
- Japan
- Prior art keywords
- region
- image
- result
- similar
- division
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】 入力画像を、当該入力画像中の被写体ごとの領域に分割する画像処理装置は、入力画像を被写体ごとの複数の領域の候補を表わす候補領域群に分割する分割部と、候補領域群のそれぞれの候補領域に対して類似する類似画像群を画像データベースより取得する取得部と、類似画像群の中から類似画像に共通する特徴を候補領域の特徴成分として抽出する抽出部と、抽出された特徴成分と入力画像の各画素の特徴量とを比較して、各画素が候補領域群のうちどの候補領域に属するかを同定し、領域分割の結果として出力する領域同定部と、を備える。
【選択図】 図1
Description
前記入力画像を被写体ごとの複数の領域の候補を表わす候補領域群に分割する分割手段と、
前記候補領域群のそれぞれの候補領域に対して類似する類似画像群を画像データベースより取得する取得手段と、
前記類似画像群の中から類似画像に共通する特徴を候補領域の特徴成分として抽出する抽出手段と、
前記特徴成分と前記入力画像の各画素の特徴量とを比較して、各画素が候補領域群のうちどの候補領域に属するかを同定し、領域分割の結果として出力する領域同定手段と、を備えることを特徴とする。
以下、図面を参照しながら本発明の実施形態に係る画像処理方法(画像の領域分割方法)、および画像処理装置10について詳細に説明する。また、撮像装置20は、画像を撮像する撮像部と、撮像部により撮像された画像を入力画像とし、入力画像を、入力画像中の被写体ごとの領域に分割する画像処理装置10とを有する。なお、図面間で符号が同じものは同じ動作をするものとして説明を省略する。本発明の実施形態にかかる画像処理方法および画像処理装置は、入力画像を被写体に応じて適切に複数の領域に分割するための画像処理技術に関するものである。適切に被写体を分割することは、被写体の認識やシーンの認識、被写体に応じた画質の補正などにおいて多くの画像処理を容易にする。ここでの入力画像は静止画・動画を問わない。また被写体としては人物や犬などの生物、建物や道具などの人工物、山や空といった自然物などあらゆる対象を含む。
次に本発明の実施形態に係る領域分割部101の動作を説明する。領域分割部101は入力画像から複数の領域を抽出し、画像中の被写体の領域の候補とする。領域分割部101は画像中でひとまとまりと考えられる領域を入力画像から複数個抽出することが可能である。この段階の領域抽出は画素の色、テクスチャ、画素の位置等、画像の局所的な特徴量の類似性を手掛かりとして行う。領域の多くは被写体の一部だけを切り出し、あるいは領域中に複数の被写体を含むことが考えられる。このような切り出しの失敗を考慮して、領域分割部101では十分な数のバリエーションの候補領域を抽出する。なお候補領域は多重の切り出しを許す。すなわち互いに部分的な重なりがあることを許す。
次に類似画像取得部102の動作を説明する。類似画像取得部102は、前段の処理で得られた入力画像中の候補領域に対して、類似する領域を含む画像(類似画像)を取得する。類似画像の取得は候補領域ごとに行われ、複数の検索結果の画像が類似画像群として後段の処理に送られる。
次に類似領域の検索する方法の詳細について説明する。画像データベース103には十万や百万といったオーダーのサンプル画像のセットがあらかじめ記憶されていると想定する。そのためここでは高速な近傍検索の一般的な手法であるハッシュを用いる。例えば具体的には非特許文献5に開示されている局所性鋭敏型ハッシュ(LSH)と呼ばれる手法を用いる。
領域成分抽出部104の動作について説明する。このモジュールの動作の目的は、前段の類似画像取得部102によって得られた類似画像のセット(類似画像群)の中から、領域の成分を抽出することである。
次に領域同定部105の動作について詳しく説明する。領域同定部105には、領域成分抽出部104によって抽出されたK個の領域成分Z1、・・・・、ZKが送られる。次に領域同定部105はこの領域成分に基づいて入力画像の各画素のカテゴリーの同定を行う。
以上のような処理を行うことによって、被写体の教師データを用いずに、入力画像を被写体の種類に応じて、互いに異なる領域に分割することができる。
本発明に係る第2実施形態として、第1実施形態が行う領域分割の精度を更に向上させることのできる拡張的な方法について説明する。図9に本実施形態の画像処理装置10のブロック図を示す。図1と符号を同じとする処理要素は同じ動作をするものとして説明を省略する。図9に示す構成では、領域同定部105の領域分割結果が変化しなくなるまで(所定の変化率以下になるまで)、領域分割部101からの処理を繰り返す。この点で、図9の構成は第1実施形態における図1の構成と相違する。
本発明に係る第3実施形態として、第1実施形態が行う領域分割の結果に対して、「牛」や「草原」といった被写体の名称の同定(被写体認識)を行う方法について説明する。本実施形態における被写体認識方法は第1実施形態の拡張的な方法である。図11に本実施形態の画像処理装置10のブロック図を示す。図11に示す画像処理装置10は、図1に示したブロック図の構成に対して更に領域ラベル同定部106を備える。領域ラベル同定部106は、画像データベースに記憶されている各画像に対して関連づけられたタグを用いて、領域同定部105の領域分割の結果にアノテ−ションを設定し、入力画像における被写体の認識結果として出力する。図11の画像データベース103は、各画像に対して関連づけられたタグを記憶しているとする。タグはウェブページなどから画像を自動収集する際に、ウェブページの見出しなどの関連情報から抽出されたり、Flickr等のイメージデータベースのように、人手によってタグが付されていることを想定している。
本発明に係る第4実施形態として、第1実施形態で述べた領域成分抽出部104ならびに領域同定部105の動作の派生的な別の形態について説明する。本実施形態は第1実施形態と部分的に同一であり、領域成分抽出部104と領域同定部105の動作のみが異なる形態を説明する。そのため、ここでは説明の重複を避けて領域成分抽出部104と領域同定部105の動作についてのみ説明する。
本発明に係る画像処理方法(領域分割方法)の別の形態として、任意の手段により求められた領域カテゴリーの成分に基づいて候補領域の領域分割を行う方法について説明する。第1実施形態では類似画像に基づいて領域の成分を求めたが、本実施形態において、領域の成分を求める構成はこれに限定するものではない。本実施形態では外部の構成によって領域の成分が得られているような場合に適用可能な別の実施形態について説明する。本実施形態の画像処理装置10の構成例を図13に示す。また本実施形態の画像処理装置10の動作フローを図14に示す。領域分割部101によって分割された候補領域群は、領域同定部105に送られる。領域同定部105は、K個の領域成分を領域成分データベース107より読み出し、次に候補領域ごとに特徴量を算出する(S1401、S1402)。K個の領域成分とのカルバック・ライブラー距離を計算する(S1403、S1404、S1405)。以上の処理を入力画像の全候補領域について繰り返し実行する(S1406)。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (10)
- 入力画像を、当該入力画像中の被写体ごとの領域に分割する画像処理方法であって、
分割手段が、前記入力画像を被写体ごとの複数の領域の候補を表わす候補領域群に分割する分割工程と、
取得手段が、前記候補領域群のそれぞれの候補領域に対して類似する類似画像群を画像データベースより取得する取得工程と、
抽出手段が、前記類似画像群の中から類似画像に共通する特徴を候補領域の特徴成分として抽出する抽出工程と、
領域同定手段が、前記特徴成分と前記入力画像の各画素の特徴量とを比較して、各画素が候補領域群のうちどの候補領域に属するかを同定し、領域分割の結果として出力する領域同定工程と、
を有することを特徴とする画像処理方法。 - 第2の分割手段が、前記領域同定工程で出力された前記領域分割の結果を、被写体ごとの複数の領域の候補を表わす新たな候補領域群に分割する第2の分割工程を更に有し、
前記取得工程は、前記第2の分割工程で分割された新たな候補領域群のそれぞれの候補領域に対して類似する類似画像群を画像データベースより取得し、
前記抽出工程は、前記類似画像群の中から類似画像に共通する特徴を候補領域の特徴成分として抽出し、
前記領域同定工程は、前記抽出された特徴成分と入力画像の各画素の特徴量とを比較して、各画素が新たな候補領域群のうちどの候補領域に属するかを同定して、第2の領域分割の結果とすることを特徴とする請求項1に記載の画像処理方法。 - 前記領域同定工程は、前記領域分割の結果に対して前記第2の領域分割の結果が収束しているか否かを判定する判定工程を有し、
前記判定工程で前記第2の領域分割の結果が収束していると判定された場合、前記領域同定工程は、前記第2の領域分割の結果を被写体ごとの領域分割の結果として出力し、
前記判定工程により前記第2の領域分割の結果が収束していないと判定された場合、前記第2の分割工程は、当該第2の領域分割の結果を、被写体ごとの複数の領域の候補を表わす新たな候補領域群に分割することを特徴とする請求項2に記載の画像処理方法。 - 設定手段が、前記画像データベースに記憶されている各画像に対して関連づけられたタグを用いて、前記領域同定工程の領域分割の結果にアノテ−ションを設定し、前記入力画像における被写体の認識結果として出力する設定工程を更に有することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理方法。
- 入力画像を、当該入力画像中の被写体ごとの領域に分割する画像処理装置であって、
前記入力画像を被写体ごとの複数の領域の候補を表わす候補領域群に分割する分割手段と、
前記候補領域群のそれぞれの候補領域に対して類似する類似画像群を画像データベースより取得する取得手段と、
前記類似画像群の中から類似画像に共通する特徴を候補領域の特徴成分として抽出する抽出手段と、
前記特徴成分と前記入力画像の各画素の特徴量とを比較して、各画素が候補領域群のうちどの候補領域に属するかを同定し、領域分割の結果として出力する領域同定手段と、
を備えることを特徴とする画像処理装置。 - 前記領域同定手段で出力された前記領域分割の結果を、被写体ごとの複数の領域の候補を表わす新たな候補領域群に分割する第2の分割手段を更に備え、
前記取得手段は、前記第2の分割手段で分割された新たな候補領域群のそれぞれの候補領域に対して類似する類似画像群を画像データベースより取得し、
前記抽出手段は、前記類似画像群の中から類似画像に共通する特徴を候補領域の特徴成分として抽出し、
前記領域同定手段は、前記抽出された特徴成分と入力画像の各画素の特徴量とを比較して、各画素が新たな候補領域群のうちどの候補領域に属するかを同定して、第2の領域分割の結果とすることを特徴とする請求項5に記載の画像処理装置。 - 前記領域同定手段は、前記領域分割の結果に対して前記第2の領域分割の結果が収束しているか否かを判定する判定手段を有し、
前記判定手段により前記第2の領域分割の結果が収束していると判定された場合、前記領域同定手段は、前記第2の領域分割の結果を被写体ごとの領域分割の結果として出力し、
前記判定手段により前記第2の領域分割の結果が収束していないと判定された場合、前記第2の分割手段が、当該第2の領域分割の結果を、被写体ごとの複数の領域の候補を表わす新たな候補領域群に分割することを特徴とする請求項6に記載の画像処理装置。 - 前記画像データベースに記憶されている各画像に対して関連づけられたタグを用いて、前記領域同定手段の領域分割の結果にアノテ−ションを設定し、前記入力画像における被写体の認識結果として出力する設定手段を更に有することを特徴とする請求項5乃至7のいずれか1項に記載の画像処理装置。
- 画像を撮像する撮像手段と、
前記撮像手段により撮像された前記画像を入力画像とし、当該入力画像を入力画像中の被写体ごとの領域に分割する請求項5乃至8のいずれか1項に記載の画像処理装置と、
を有することを特徴とする撮像装置。 - コンピュータを、請求項5乃至8のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011265047A JP5836779B2 (ja) | 2011-12-02 | 2011-12-02 | 画像処理方法、画像処理装置、撮像装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011265047A JP5836779B2 (ja) | 2011-12-02 | 2011-12-02 | 画像処理方法、画像処理装置、撮像装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013117860A true JP2013117860A (ja) | 2013-06-13 |
JP5836779B2 JP5836779B2 (ja) | 2015-12-24 |
Family
ID=48712381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011265047A Expired - Fee Related JP5836779B2 (ja) | 2011-12-02 | 2011-12-02 | 画像処理方法、画像処理装置、撮像装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5836779B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015064292A1 (ja) * | 2013-10-30 | 2015-05-07 | 日本電気株式会社 | 画像の特徴量に関する処理システム、処理方法及びプログラム |
JP2016004369A (ja) * | 2014-06-16 | 2016-01-12 | 日本電信電話株式会社 | 被写体領域抽出装置、方法、及びプログラム |
US10007678B2 (en) | 2014-11-21 | 2018-06-26 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and recording medium |
CN110378911A (zh) * | 2019-07-11 | 2019-10-25 | 太原科技大学 | 基于候选区域和邻域分类器的弱监督图像语义分割方法 |
JPWO2021186672A1 (ja) * | 2020-03-19 | 2021-09-23 | ||
WO2022137979A1 (ja) * | 2020-12-21 | 2022-06-30 | 日本電気株式会社 | 画像処理装置、画像処理方法およびプログラム記録媒体 |
JP2023500835A (ja) * | 2019-10-31 | 2023-01-11 | シーメンス・ヘルスケア・ダイアグノスティックス・インコーポレイテッド | 自動診断分析システムにおいて検体のhiln決定に使用される訓練画像をハッシュおよび検索するための方法および装置 |
-
2011
- 2011-12-02 JP JP2011265047A patent/JP5836779B2/ja not_active Expired - Fee Related
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015064292A1 (ja) * | 2013-10-30 | 2015-05-07 | 日本電気株式会社 | 画像の特徴量に関する処理システム、処理方法及びプログラム |
US10140555B2 (en) | 2013-10-30 | 2018-11-27 | Nec Corporation | Processing system, processing method, and recording medium |
JP2016004369A (ja) * | 2014-06-16 | 2016-01-12 | 日本電信電話株式会社 | 被写体領域抽出装置、方法、及びプログラム |
US10007678B2 (en) | 2014-11-21 | 2018-06-26 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and recording medium |
CN110378911A (zh) * | 2019-07-11 | 2019-10-25 | 太原科技大学 | 基于候选区域和邻域分类器的弱监督图像语义分割方法 |
CN110378911B (zh) * | 2019-07-11 | 2022-06-21 | 太原科技大学 | 基于候选区域和邻域分类器的弱监督图像语义分割方法 |
JP2023500835A (ja) * | 2019-10-31 | 2023-01-11 | シーメンス・ヘルスケア・ダイアグノスティックス・インコーポレイテッド | 自動診断分析システムにおいて検体のhiln決定に使用される訓練画像をハッシュおよび検索するための方法および装置 |
JP7458481B2 (ja) | 2019-10-31 | 2024-03-29 | シーメンス・ヘルスケア・ダイアグノスティックス・インコーポレイテッド | 自動診断分析システムにおいて検体のhiln決定に使用される訓練画像をハッシュおよび検索するための方法および装置 |
JPWO2021186672A1 (ja) * | 2020-03-19 | 2021-09-23 | ||
WO2021186672A1 (ja) * | 2020-03-19 | 2021-09-23 | 日本電気株式会社 | 画像処理方法 |
JP7459927B2 (ja) | 2020-03-19 | 2024-04-02 | 日本電気株式会社 | 画像処理方法 |
WO2022137979A1 (ja) * | 2020-12-21 | 2022-06-30 | 日本電気株式会社 | 画像処理装置、画像処理方法およびプログラム記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP5836779B2 (ja) | 2015-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sandoval et al. | Two-stage deep learning approach to the classification of fine-art paintings | |
JP5836779B2 (ja) | 画像処理方法、画像処理装置、撮像装置およびプログラム | |
Liu et al. | Open-world semantic segmentation via contrasting and clustering vision-language embedding | |
Malisiewicz et al. | Recognition by association via learning per-exemplar distances | |
Wilkinson et al. | Neural Ctrl-F: segmentation-free query-by-string word spotting in handwritten manuscript collections | |
Zhang et al. | Sparse reconstruction for weakly supervised semantic segmentation | |
Li et al. | Publication date estimation for printed historical documents using convolutional neural networks | |
Golge et al. | Conceptmap: Mining noisy web data for concept learning | |
CN115203408A (zh) | 一种多模态试验数据智能标注方法 | |
Lin et al. | Learning contour-fragment-based shape model with and-or tree representation | |
CN110532449A (zh) | 一种业务文档的处理方法、装置、设备和存储介质 | |
Bodapati | Modified self-training based statistical models for image classification and speaker identification | |
Belhi et al. | Deep learning and cultural heritage: the CEPROQHA project case study | |
Nyon et al. | Durian species recognition system based on global shape representations and k-nearest neighbors | |
Li et al. | An Object Co-occurrence Assisted Hierarchical Model for Scene Understanding. | |
Rubinstein et al. | Joint inference in weakly-annotated image datasets via dense correspondence | |
Ke et al. | Human attribute recognition method based on pose estimation and multiple-feature fusion | |
Zhang et al. | Accurate object retrieval for high-resolution remote-sensing imagery using high-order topic consistency potentials | |
Sachdeva et al. | Handwritten offline devanagari compound character recognition using machine learning | |
Tu et al. | Featured correspondence topic model for semantic search on social image collections | |
Chien et al. | Large-scale image annotation with image–text hybrid learning models | |
Liao et al. | Image-matching based identification of store signage using web-crawled information | |
Sreenivasulu et al. | Adaptive inception based on transfer learning for effective visual recognition | |
Nepovinnykh et al. | Species-Agnostic Patterned Animal Re-identification by Aggregating Deep Local Features | |
Liu et al. | Accumulated reconstruction error vector (AREV): a semantic representation for cross-media retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151005 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151104 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5836779 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |