JP2017117019A - 画像処理装置、画像処理方法及びプログラム - Google Patents
画像処理装置、画像処理方法及びプログラム Download PDFInfo
- Publication number
- JP2017117019A JP2017117019A JP2015249067A JP2015249067A JP2017117019A JP 2017117019 A JP2017117019 A JP 2017117019A JP 2015249067 A JP2015249067 A JP 2015249067A JP 2015249067 A JP2015249067 A JP 2015249067A JP 2017117019 A JP2017117019 A JP 2017117019A
- Authority
- JP
- Japan
- Prior art keywords
- area
- region
- mixed
- small
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
Description
以下、図面を参照して本発明の第1の実施形態を詳細に説明する。図1は、各実施形態に係る画像処理装置のソフトウェア構成を示す構成図であり、図1(a)が本実施形態の画像処理装置の構成図である。本実施形態の画像処理装置は、ネットワークまたは各種情報記録媒体を介して取得したソフトウェア(プログラム)を、CPU、メモリ、ストレージデバイス、入出力装置、バス、表示装置などにより構成される計算機によって実現できる。なお、計算機については、汎用の計算機を用いてもよいし、本発明のプログラムに最適に設計されたハードウェアを用いてもよい。
小領域SP_kのα_kの値が任意の閾値ρ未満の場合、その小領域は学習に用いないものとし、更新クラスラベルデータGTnew_nにおける該当箇所のクラスラベルを「非使用」として書き直す。閾値ρの値は、例えばρ=0.9などと設定する。小領域SP_kのα_kの値がρ以上である場合には、クラスc1とc2の混在度を計算する。混在度とは、もっとも単純には画素数の比率で定義され、下記の数式2のように表わされる。
ここでmix_kは、小領域SP_kの混在率と呼ぶ。空と木の枝のように二つのクラスが入り組んだ状態だけを混在領域として考えるのであれば、下記の数式3のように定義してもよい。ここで、m_c1、m_c2は、それぞれ小領域SP_k内でクラスc1およびc2が割り当てられている画素の重心である。
このようにして定義された混在度が所定の閾値θ以上であるとき、小領域SP_kは「クラスc1とc2の混在領域である」とする。閾値θの値は、例えばθ=1.5などと設定する。図5(b)の例では、小領域530における背景の空の領域531と、前景の細かい木の枝の領域532の画素数が近ければ、「空と木の混在領域」と判定される。ここで、2つのクラスの混在領域に関して、どちらを前景クラスにするかは、予め決めておく。例えば、空と木の混在領域の場合、「木を前景、空を背景とする」と定義しておく。
ここで、N_newは、もとの意味的クラス数N_cに、混在領域クラスを含めた総クラス数である。領域識別器の学習は、識別関数に対して小領域特徴x_kを入力したときに得られる出力ベクトルと教師ベクトルτ_kの誤差が、全学習データを通して小さくなるように識別関数のパラメータを調整して、小領域識別器を生成することである。小領域識別器は、小領域特徴x_kを入力として、各領域クラスのスコアベクトルf(x_k)を出力する。ここで、スコアベクトルf(x_k)は、N_new次元のベクトルである。スコアベクトルf(x_k)の各要素は各領域クラスに対するスコアであって、c番目の領域クラスに対するスコアをf_c(x_k)(c=1,…,N_new)と記述すると、下記の数式6のように表現される。
識別関数のモデルとその学習方法には様々なものが考えられ、例えば、SVMや多層ニューラルネットワーク、ロジスティック回帰などを用いることができる。本実施形態は、それらの種類によって限定されるものではない。学習して得られた領域識別器は、小領域識別器記憶部5200に記憶される。
画像I_nにおける混在領域の画素数がS_nであるとすれば、画像I_nからパッチ領域はS_n個抽出されることとなる。全学習画像に対して通し番号でj番目のパッチをP_jと書くこととする。ここで簡単のため、空を背景クラス、前景が木クラスである混在領域の場合を考える。これらのパッチ領域は、その中心画素が前景クラスであれば正事例、背景クラスであれば負事例と割り振られる。図7では、正事例831、832と負事例833、834とに割り振られた例を挙げている。パッチP_jに対する教師値η_jは下記のようになる。
ここでは、色情報とエッジ情報の統合による識別器生成を考える。パッチ領域からの色情報としては、パッチ全体からの色分布情報としてのRGBヒストグラムと、パッチ領域中心位置におけるRGB値を特徴量として抽出する。色情報特徴量はHSVやYCbCrなどの色空間によるものでもよく、RGBに限定されるものではない。パッチP_jから得られた色情報特徴量をy_jとする。色情報による前景/背景識別器の学習は、識別関数に対して色情報特徴量y_jを入力したときに得られる出力値と教師値η_jの誤差が、全学習データを通して小さくなるように識別関数のパラメータを調整して、領域識別器を生成することである。本実施形態は識別器の種類に限定されるものではなく、具体的な例としては、SVMやロジスティック回帰などが挙げられる。色情報による前景/背景識別器を、色情報特徴量y_jを入力とした関数g_color(y_j)と表すこととする。
これを入力として、教師値η_jの値に従って関数h(g_j)を学習させることで、統合器が生成される。色情報による前景/背景識別器g_color(y_j)と、エッジ情報による前景/背景識別器g_edge(e_j)、それらを統合する統合器h(g_j)によって、前景/背景識別器は構成される。生成された前景/背景識別器は、混在領域識別器記憶部5300に書き込まれる。
ここで、各小領域SP_kに対する領域識別結果は、スコアf(x_k)が最大となるクラスc_kとして得られるものとする。
全ての小領域SP_k(k=1,…,K)に関して領域識別器fを適用して全ての領域識別結果c_kが得られたら、小領域識別ステップS1300を終了する。図8(c)には、得られた領域識別結果300の例を示す。
第2の実施形態では、混在領域と判定された領域をさらに小さな小領域に過分割して、それぞれの過分割領域を識別する構成について説明する。なお、第1の実施形態において既に説明をした構成については、同一の符号を付し、その説明を省略する。まず、図2(a)のフローチャートを参照して、学習時の処理の詳細について説明する。
ここで過分割領域OSP_mが前景であるとは、OSP_mで面積的に占有率の大きいクラスが前景クラスである場合である。空と木の混在領域に関して、木を前景、空を背景とした場合、図15の例では、過分割領域531は前景で、過分割領域532は背景である。教師値λ_mと過分割領域特徴量z_m(m=1,…,M)を用いて、過分割領域識別器h(z)を学習して生成する。過分割領域識別器h(z)のモデルは様々なものが考えられるが、本実施形態はその種類によって限定されるものではない。例えば、SVMや多層ニューラルネットワーク、ロジスティック回帰などを使ってもよい。学習によって得られた過分割領域識別器h(z)は、混在領域識別器記憶部5300に書き込まれる。
第3の実施形態では、テンプレートマッチングによるマスクの適用によって混在領域を識別する構成について説明する。なお、第1、第2の実施形態において既に説明をした構成については、同一の符号を付し、その説明を省略する。まず、図2(a)のフローチャートを参照して、学習時の処理の詳細について説明する。
第1、第2および第3の実施形態で利用していた領域クラスラベルデータは、例えば、図9(b)で示したように、領域クラスラベルが細かく入力されている必要がある。しかしながら、このような詳細な領域クラスラベルをユーザが入力していくのは非常に手間のかかる作業である。そこで、本発明の第4の実施形態では、混在領域を用いて領域クラスラベルデータを入力する手間を削減し、高精度に混在領域を識別できる構成について説明する。なお、第1〜第3の実施形態において既に説明をした構成については同一の符号を付し、その説明は省略する。
本発明は、上記実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムを読み出して実行する処理である。また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。本発明は上記実施例に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施例の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施例及びその変形例を組み合わせた構成も全て本発明に含まれるものである。
2200 学習画像小領域分割部
2300 混在領域設定部
2400 小領域識別器生成部
5100 学習データ記憶部
5200 小領域識別器記憶部
Claims (14)
- 入力画像を読み込む読み込み手段と、
前記読み込んだ入力画像を複数の小領域に分割する第1の分割手段と、
前記分割された小領域のうち複数のクラスが混在する小領域を、前記複数のクラスに関する混在領域として識別する識別手段と、
を有することを特徴とする画像処理装置。 - 前記混在領域を複数のクラスの領域に分割する混在領域分割手段を更に有することを特徴とする請求項1に記載の画像処理装置。
- 複数の学習画像と、当該複数の学習画像の各画素に対してクラスラベルが与えられた領域クラスラベルデータと、を読み込む学習データ読み込み手段と、
前記複数の学習画像を小領域に分割する第2の分割手段と、
前記複数の学習画像を分割してなる小領域に含まれる複数のクラスに関するクラスラベルを設定する混在領域設定手段と、
前記領域クラスラベルデータに含まれるクラスラベルと、前記設定された複数のクラスに関するクラスラベルとに基づいて、前記小領域のクラスを識別するための領域識別器を生成する第1の生成手段と、を更に有し、
前記識別手段は、前記第1の生成手段により生成された領域識別器を用いて、前記分割された小領域のクラスを識別することを特徴とする請求項1または2に記載の画像処理装置。 - 前記混在領域設定手段は、前記複数の学習画像を分割してなる小領域に含まれる複数のクラスの混在率に基づいて、前記複数のクラスに関するクラスラベルを設定することを特徴とする請求項3に記載の画像処理装置。
- 前記混在率は、前記小領域の画素に対する前記複数のクラスの領域の画素の比率であることを特徴とする請求項4に記載の画像処理装置。
- 前記複数の学習画像と前記領域クラスラベルデータとに基づいて、前記混在領域における各画素のクラスを識別する識別器を生成する第2の生成手段を更に有することを特徴とする請求項3から5のいずれか1項に記載の画像処理装置。
- 前記複数の学習画像の混在領域に対してユーザが入力したクラスラベルを取得する領域クラスラベル入力手段と、
前記第1の生成手段は、前記取得したユーザが入力したクラスラベルに基づいて領域識別器を生成することを特徴とする請求項3から6のいずれか1項に記載の画像処理装置。 - 前記複数の学習画像の混在領域よりも大きな領域に対してユーザが入力したクラスラベルを取得する簡易領域クラスラベル入力手段と、
前記入力されたクラスラベルに対するユーザの修正を受け付ける領域クラスラベル修正手段と、を更に有することを特徴とする請求項7に記載の画像処理装置。 - 前記混在領域分割手段は、前記混在領域の注目画素に含まれる所定の領域の特徴量に基づいて、前記注目画素が前景であるか背景であるかを判定することを特徴とする請求項2に記載の画像処理装置。
- 前記混在領域分割手段は、前記混在領域と識別された小領域を過分割してなる過分割領域の特徴量に基づいて、当該過分割領域を前景であるか背景であるか判定することを特徴とする請求項2に記載の画像処理装置。
- 前記混在領域分割手段は、前記混在領域の注目画素を含む所定の領域の画像と類似した学習画像の部分画像に基づいて生成された変形マスクを用いて、前記混在領域を複数のクラスに分割することを特徴とする請求項2に記載の画像処理装置。
- 複数の学習画像と、当該複数の学習画像の各画素に対してクラスラベルが与えられた領域クラスラベルデータと、を読み込む学習データ読み込み手段と、
前記複数の学習画像を小領域に分割する第2の分割手段と、
前記複数の学習画像を分割してなる小領域に含まれる複数のクラスに関するクラスラベルを設定する混在領域設定手段と、
前記領域クラスラベルデータに含まれるクラスラベルと、前記設定された複数のクラスに関するクラスラベルとに基づいて、前記小領域のクラスを識別するための領域識別器を生成する第1の生成手段と、
を有することを特徴とする画像処理装置。 - 入力画像を読み込むステップと、
前記読み込んだ入力画像を複数の小領域に分割するステップと、
前記分割された小領域のうち複数のクラスが混在する小領域を、前記複数のクラスに関する混在領域として識別するステップと、
を有することを特徴とする画像処理方法。 - コンピュータを、請求項1から12のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015249067A JP6702716B2 (ja) | 2015-12-21 | 2015-12-21 | 画像処理装置、画像処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015249067A JP6702716B2 (ja) | 2015-12-21 | 2015-12-21 | 画像処理装置、画像処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017117019A true JP2017117019A (ja) | 2017-06-29 |
JP6702716B2 JP6702716B2 (ja) | 2020-06-03 |
Family
ID=59234482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015249067A Active JP6702716B2 (ja) | 2015-12-21 | 2015-12-21 | 画像処理装置、画像処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6702716B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019016114A (ja) * | 2017-07-05 | 2019-01-31 | キヤノン株式会社 | 画像処理装置、学習装置、フォーカス制御装置、露出制御装置、画像処理方法、学習方法、及びプログラム |
JP2019086899A (ja) * | 2017-11-02 | 2019-06-06 | キヤノン株式会社 | 情報処理装置、画像領域選択方法、コンピュータプログラム、及び記憶媒体 |
JP2020047055A (ja) * | 2018-09-20 | 2020-03-26 | 日本電信電話株式会社 | 画像認識器学習装置、画像認識器学習方法、及びプログラム |
WO2020111048A1 (ja) * | 2018-11-26 | 2020-06-04 | 大日本印刷株式会社 | コンピュータプログラム、学習モデル生成装置、表示装置、粒子識別装置、学習モデル生成方法、表示方法及び粒子識別方法 |
JP2020161077A (ja) * | 2019-03-28 | 2020-10-01 | 株式会社イシダ | 学習済みモデル生成方法、学習済みモデル生成装置、商品判別方法、商品判別装置、商品判別システム及び計量装置 |
KR20210008051A (ko) * | 2018-08-06 | 2021-01-20 | 가부시키가이샤 시마쓰세사쿠쇼 | 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치 |
JPWO2021206053A1 (ja) * | 2020-04-06 | 2021-10-14 | ||
JP2022068282A (ja) * | 2017-07-05 | 2022-05-09 | キヤノン株式会社 | ホワイトバランス調整装置、フォーカス制御装置、露出制御装置、ホワイトバランス調整方法、フォーカス制御方法、露出制御方法、及びプログラム |
US12002259B2 (en) | 2017-07-05 | 2024-06-04 | Canon Kabushiki Kaisha | Image processing apparatus, training apparatus, image processing method, training method, and storage medium |
-
2015
- 2015-12-21 JP JP2015249067A patent/JP6702716B2/ja active Active
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7300027B2 (ja) | 2017-07-05 | 2023-06-28 | キヤノン株式会社 | 画像処理装置、画像処理方法、学習装置、学習方法、及びプログラム |
US12002259B2 (en) | 2017-07-05 | 2024-06-04 | Canon Kabushiki Kaisha | Image processing apparatus, training apparatus, image processing method, training method, and storage medium |
JP7350208B2 (ja) | 2017-07-05 | 2023-09-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
JP2019016114A (ja) * | 2017-07-05 | 2019-01-31 | キヤノン株式会社 | 画像処理装置、学習装置、フォーカス制御装置、露出制御装置、画像処理方法、学習方法、及びプログラム |
JP7026456B2 (ja) | 2017-07-05 | 2022-02-28 | キヤノン株式会社 | 画像処理装置、学習装置、フォーカス制御装置、露出制御装置、画像処理方法、学習方法、及びプログラム |
JP2022068282A (ja) * | 2017-07-05 | 2022-05-09 | キヤノン株式会社 | ホワイトバランス調整装置、フォーカス制御装置、露出制御装置、ホワイトバランス調整方法、フォーカス制御方法、露出制御方法、及びプログラム |
JP2019086899A (ja) * | 2017-11-02 | 2019-06-06 | キヤノン株式会社 | 情報処理装置、画像領域選択方法、コンピュータプログラム、及び記憶媒体 |
KR20210008051A (ko) * | 2018-08-06 | 2021-01-20 | 가부시키가이샤 시마쓰세사쿠쇼 | 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치 |
KR102565074B1 (ko) | 2018-08-06 | 2023-08-08 | 가부시키가이샤 시마쓰세사쿠쇼 | 교사 라벨 화상 수정 방법, 학습 완료 모델의 작성 방법 및 화상 해석 장치 |
JP2020047055A (ja) * | 2018-09-20 | 2020-03-26 | 日本電信電話株式会社 | 画像認識器学習装置、画像認識器学習方法、及びプログラム |
WO2020059545A1 (ja) * | 2018-09-20 | 2020-03-26 | 日本電信電話株式会社 | 画像認識器学習装置、画像認識器学習方法、及びプログラム |
JP7067383B2 (ja) | 2018-09-20 | 2022-05-16 | 日本電信電話株式会社 | 画像認識器学習装置、画像認識器学習方法、及びプログラム |
JPWO2020111048A1 (ja) * | 2018-11-26 | 2021-10-21 | 大日本印刷株式会社 | コンピュータプログラム、学習モデル生成装置、表示装置、粒子識別装置、学習モデル生成方法、表示方法及び粒子識別方法 |
WO2020111048A1 (ja) * | 2018-11-26 | 2020-06-04 | 大日本印刷株式会社 | コンピュータプログラム、学習モデル生成装置、表示装置、粒子識別装置、学習モデル生成方法、表示方法及び粒子識別方法 |
US11669948B2 (en) | 2019-03-28 | 2023-06-06 | Ishida Co., Ltd. | Learned model generating method, learned model generating device, product identifying method, product identifying device, product identifying system, and measuring device |
JP2020161077A (ja) * | 2019-03-28 | 2020-10-01 | 株式会社イシダ | 学習済みモデル生成方法、学習済みモデル生成装置、商品判別方法、商品判別装置、商品判別システム及び計量装置 |
JP7374453B2 (ja) | 2019-03-28 | 2023-11-07 | 株式会社イシダ | 学習済みモデル生成方法、学習済みモデル生成装置、商品判別方法、商品判別装置、商品判別システム及び計量装置 |
JP7236202B2 (ja) | 2020-04-06 | 2023-03-09 | 国立大学法人 新潟大学 | データ生成装置、データ生成方法及びプログラム |
JPWO2021206053A1 (ja) * | 2020-04-06 | 2021-10-14 |
Also Published As
Publication number | Publication date |
---|---|
JP6702716B2 (ja) | 2020-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6702716B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN110689037B (zh) | 用于使用深度网络的自动对象注释的方法和系统 | |
US10936911B2 (en) | Logo detection | |
CN109154978B (zh) | 用于检测植物疾病的系统和方法 | |
Chung et al. | Efficient shadow detection of color aerial images based on successive thresholding scheme | |
Dalla Mura et al. | Classification of hyperspectral images by using extended morphological attribute profiles and independent component analysis | |
Tong et al. | Salient object detection via bootstrap learning | |
AU2018102232A4 (en) | Bone marrow cell marking method and system | |
US9898686B2 (en) | Object re-identification using self-dissimilarity | |
US8879855B2 (en) | Image segmentation for large-scale fine-grained recognition | |
KR101640998B1 (ko) | 화상 처리 장치 및 화상 처리 방법 | |
CN111145209B (zh) | 一种医学图像分割方法、装置、设备及存储介质 | |
Mavridaki et al. | A comprehensive aesthetic quality assessment method for natural images using basic rules of photography | |
WO2017181892A1 (zh) | 前景分割方法及装置 | |
US8718401B2 (en) | Image processing device, method and program | |
WO2019197021A1 (en) | Device and method for instance-level segmentation of an image | |
CN102592132A (zh) | 超像素推进型自上而下图像识别方法和系统 | |
JP7173309B2 (ja) | 学習方法、学習プログラム、および、学習装置 | |
JP2015041254A (ja) | Trimap生成装置、Trimap生成方法、及びプログラム | |
JP2017102622A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN112053367A (zh) | 图像处理方法、设备及存储介质 | |
CN110969641A (zh) | 图像处理方法和装置 | |
KR20230117752A (ko) | 이미지들 내의 주석이 달린 관심 영역들의 검출 | |
US11461880B2 (en) | Generating image masks from digital images utilizing color density estimation and deep learning models | |
Herchenbach et al. | Segmentation and classification of THCs on PCBAs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191112 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200507 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6702716 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |