JP2020052475A - 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 - Google Patents

分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 Download PDF

Info

Publication number
JP2020052475A
JP2020052475A JP2018178161A JP2018178161A JP2020052475A JP 2020052475 A JP2020052475 A JP 2020052475A JP 2018178161 A JP2018178161 A JP 2018178161A JP 2018178161 A JP2018178161 A JP 2018178161A JP 2020052475 A JP2020052475 A JP 2020052475A
Authority
JP
Japan
Prior art keywords
auxiliary
classifier
class
teacher
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018178161A
Other languages
English (en)
Inventor
松村 明
Akira Matsumura
明 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2018178161A priority Critical patent/JP2020052475A/ja
Publication of JP2020052475A publication Critical patent/JP2020052475A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
  • Image Analysis (AREA)

Abstract

【課題】加重平均で最終結果を算出するよりも分類性能の良い分類器を構築する高精度な分類器を容易に構築する。【解決手段】補助教師データに基づく各補助特徴量軸における複数のクラスの度数分布である補助判別情報を用いて複数の補助特徴量軸に対する複数のクラス評価結果を取得し、複数のクラス評価結果に基づいて分類クラスを決定する第1世代の暫定補助分類器に対して、度数分布において、誤分類教師画像から得られる値が属する区間における教示クラスの度数が、他のクラスの度数よりも相対的に増大するように、補助特徴量軸群に対する補助判別情報を修正して世代が更新され、現在の世代以前の複数の暫定補助分類器のそれぞれにより教師画像から得られる複数のクラス評価結果から取得したクラス毎のクラス確信度を特徴量軸の成分とする特徴量ベクトルと、教示クラスとを含む教師データを学習させて分類器を構築する。【選択図】図4

Description

本発明は、画像を分類する分類器を構築する技術、および、該分類器を用いて画像を分類する技術に関する。
従来、複数の弱分類器の分類結果を統合することにより高精度な分類を行う分類器の構築手法(アンサンブル学習法)が提案されており、該手法として、例えばバギング、ブースティング、ランダムフォレスト等が知られている。バギングでは、与えられたデータセットからブートストラップ法によるサンプリングで複数の教師データセットが作成され、該複数の教師データセットから複数の弱分類器が取得される。そして、複数の弱分類器の分類結果の多数決により、最終的な分類結果が取得される(バギングについて、例えば非特許文献1参照)。
ブースティングでは、与えられたデータセットを用いた弱分類器の取得と、該弱分類器の分類結果に基づくデータの重みの調整とを繰り返して複数の弱分類器が取得される。そして、複数の弱分類器の分類結果の重み付き多数決により、最終的な分類結果が取得される(ブースティングについて、例えば非特許文献2参照)。ランダムフォレストでは、与えられたデータセットからブートストラップ法によるサンプリングで複数の教師データセットが作成され、該複数の教師データセットから決定木である複数の弱分類器が取得される。そして、複数の決定木の結果の多数決により、最終的な分類結果が取得される(ランダムフォレストについて、例えば非特許文献3参照)。
なお、特許文献1では、画像を分類する分類器の学習に使用される教師データを検証する手法が提案されている。該手法では、特徴量の複数種類のそれぞれに関して、各教師画像が複数のクラスのそれぞれに属するとした場合の妥当性を示す評価値が取得される。各教師画像において、特徴量の複数種類における評価値の代表値がクラス毎に求められ、複数のクラスにおける複数の代表値に基づいて該教師画像が属すべきものと判定されるクラスの候補が決定される。
特開2014−70944号公報
Leo Breiman, "Bagging Predictors", Machine Learning, 1996, 24, p.123-140 Yoav Freund and Robert E. Schapire, "A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting", Journal of Computer and System Sciences, 1997, 55, p.119-139 Leo Breiman, "Random Forests", Machine Learning, 2001, 45, p.5-32
ところで、アンサンブル学習法に係る分類器では、追加学習を繰り返すことで分類成績を向上させることが可能な分類器を用いたアンサンブル学習法を構成することができる。図23は、縦軸に分類成績、横軸に追加学習の回数(分類器の世代数−1)をとり、この
様子を示したグラフである。ここで、折れ線101は、学習データセット自身を分類する評価法(いわゆる再代入法)と追加学習を交互に繰り返して、分類器の世代を進めることで分類成績が向上して行く様子を示す。また、折れ線102は、ある世代の分類器で教師データとは別に用意したテストデータセットを分類したときの分類成績を示す。
図23に示すように、追加学習を繰り返す途中で特に分類成績の良い分類器が現れても、加重平均で最終結果を算出する場合には、その分類成績を、最終結果に充分に反映することができなかった。
本発明は上記課題に鑑みなされたものであり、加重平均で最終結果を算出するよりも分類性能の良い分類器を構築することを目的としている。
本発明に係る分類器構築方法は、
画像を分類する分類器を構築する分類器構築方法であって、
a)複数の教師画像のそれぞれにおいて、複数のクラスのうち1つを教示クラスとして教示されており、前記各教師画像の前記教示クラスと、前記各教師画像に対して取得される複数の補助特徴量軸における値とを含む補助教師データを準備する工程と、
b)前記補助教師データに基づいて各補助特徴量軸における前記複数のクラスの度数分布を補助判別情報として求める工程と、
c)前記複数の補助特徴量軸における値が入力される際に、前記複数の補助特徴量軸の補助判別情報を用いて前記複数の補助特徴量軸に対する複数のクラス評価結果を取得し、さらに、前記複数のクラス評価結果に基づいて分類クラスを決定する第1世代の暫定補助分類器を生成する工程と、
d)前記複数の教師画像に含まれる教師画像群を現在の世代の暫定補助分類器を用いて分類する工程と、
e)前記現在の世代以前の複数の暫定補助分類器のそれぞれにより前記教師画像から得られる複数のクラス評価結果から、前記複数のクラスに対応する複数のクラス確信度を取得し、前記現在の世代以前の複数の暫定補助分類器のそれぞれに対して取得された、前記複数のクラスに対応する複数の前記クラス確信度を特徴量軸の成分とする特徴量ベクトルを生成する工程と、
f)所定の条件が満たされた場合に、前記特徴量ベクトルを最終的な特徴量ベクトルとして取得する工程と、
g)前記所定の条件が満たされない場合に、前記複数の補助特徴量軸に含まれる補助特徴量軸群における前記複数のクラスの度数分布において、前記教師画像のうち、前記d)工程にて得られた分類クラスが教示クラスと相違する教師画像から得られる値が属する区間における前記教示クラスの度数が、他のクラスの度数よりも相対的に増大するように、前記補助特徴量軸群に対する補助判別情報を修正することにより、次の世代の暫定補助分類器を取得する工程と、
h)前記現在の世代の暫定補助分類器を前記次の世代の暫定補助分類器に更新して、前記d)工程に戻る工程と、
i)前記複数の教師画像のそれぞれについて、各教師画像の前記教示クラスと、前記各教師画像に対して取得される前記特徴量ベクトルとを含む教師データを準備する工程と、
j)前記教師データを学習させて分類器を構築する工程と、
を備えることを特徴とする。
また、本発明に係る画像分類方法は、
画像を分類する画像分類方法であって、
対象画像を準備する工程と、
前記分類器構築方法により構築された分類器により前記対象画像を分類する工程と、
を備えることを特徴とする。
また、本発明に係る分類器構築装置は、
複数の教師画像のそれぞれに対して算出された複数の特徴量を含む特徴量ベクトルを算出する特徴量算出部と、
前記教師画像のそれぞれにおいて、複数のクラスのうち1つを教示クラスとして教示されており、前記各教師画像の前記教示クラスと、前記各教師画像に対して算出された前記特徴量ベクトルとを有する教師データを記憶する教師データ記憶部と、
前記教師データを学習させて画像を分類する分類器を構築する分類器生成部と、
を備える分類器を構築する分類器構築装置であって、
複数の教師画像のそれぞれにおいて、複数のクラスのうち1つを教示クラスとして教示されており、前記各教師画像の前記教示クラスと、前記各教師画像に対して取得された複数の補助特徴量軸における値とを含む補助教師データを記憶する補助教師データ記憶部と、
前記補助教師データに基づいて各補助特徴量軸における前記複数のクラスの度数分布を補助判別情報として取得する補助判別情報取得部と、
前記複数の補助特徴量軸における値が入力される際に、前記複数の補助特徴量軸の補助判別情報を用いて前記複数の補助特徴量軸に対する複数のクラス評価結果を取得し、さらに、前記複数のクラス評価結果に基づいて分類クラスを決定する第1世代の暫定補助分類器を生成する補助分類器生成部と、
前記複数の教師画像に含まれる教師画像群を現在の世代の暫定補助分類器を用いて分類し、前記現在の世代以前の複数の暫定補助分類器のそれぞれにより前記教師画像から得られる複数のクラス評価結果を取得する補助分類評価部と、
前記補助分類評価部にて取得された前記クラス評価結果から、前記複数のクラスに対応する複数のクラス確信度を取得し、前記現在の世代以前の複数の暫定補助分類器のそれぞれに対して取得された、前記複数のクラスに対応する複数の前記クラス確信度を特徴量軸の成分とする特徴量ベクトルを生成する特徴量ベクトル生成部と、
所定の条件が満たされない場合に、前記複数の補助特徴量軸に含まれる補助特徴量軸群における前記複数のクラスの度数分布において、前記教師画像のうち、前記現在の世代の暫定補助分類器による分類にて得られた分類クラスが教示クラスと相違する教師画像から得られる値が属する区間における前記教示クラスの度数が、他のクラスの度数よりも相対的に増大するように、前記補助特徴量軸群に対する補助判別情報を修正することにより、次の世代の暫定補助分類器を取得する補助分類器修正部と、
前記所定の条件が満たされるまで、前記現在の世代の暫定補助分類器を前記次の世代の暫定補助分類器に更新して、前記複数の教師画像に含まれる教師画像群を現在の世代の暫定補助分類器を用いて分類し、前記現在の世代以前の複数の暫定補助分類器のそれぞれにより前記教師画像から得られる複数のクラス評価結果からの、前記複数のクラスに対応する複数のクラス確信度の取得、前記現在の世代以前の複数の暫定補助分類器のそれぞれに対する前記特徴量ベクトルの生成を繰り返させ、前記所定の条件が満たされた場合に、前記特徴量ベクトルを最終的な特徴量ベクトルとして取得する繰返制御部と、
を備えることを特徴とする。
また、本発明に係る画像分類装置は、
画像を分類する画像分類装置であって、
対象画像を記憶する対象画像記憶部と、
前記分類器構築装置により構築された分類器と、
を備えることを特徴とする画像分類装置。
本発明によれば、加重平均で最終結果を算出するよりも分類性能の良い分類器を構築する高精度な分類器を容易に構築することができる。
図1は、実施形態に係る検査・分類装置の一例を示す図である。 図2は、実施形態に係るコンピュータの構成を示す図である。 図3は、実施形態に係る検査・分類装置の機能構成を示すブロック図である。 図4は、実施形態に係る特徴量算出部の機能構成を示すブロック図である。 図5は、実施形態に係る特徴量算出の流れを示す図である。 図6は、実施形態に係る第1の補助特徴量軸における複数のクラスの度数分布表を示す図である。 図7は、実施形態に係る第1の補助特徴量軸における複数のクラスのヒストグラムを示す図である。 図8は、実施形態に係る第2の補助特徴量軸における複数のクラスの度数分布表を示す図である。 図9は、実施形態に係る第2の補助特徴量軸における複数のクラスのヒストグラムを示す図である。 図10は、実施形態に係る暫定補助分類器による教師画像群の分類結果を示す図である。 図11は、実施形態に係る複合補助分類器の構成を説明するための図である。 図12は、実施形態に係る複合補助分類器の構成を説明するための図である。 図13は、実施形態に係る追加学習と正答率の関係を示す図である。 図14は、実施形態に係る特徴量ベクトルを用いた分類器の構築の流れを説明する図である。 図15は、実施形態に係る画像分類装置による画像分類の流れを説明する図である。 図16は、比較例に係る分類器による教師画像の分類結果を示す図である。 図17は、比較例に係る複合分類器の構成を説明するための図である。 図18は、比較例に係る複合分類器による教師画像の分類結果を示す図である。 図19は、比較例に係る暫定分類器の正答率を示す図である。 図20は、比較例に係る10個の暫定分類器による加重平均を行う複合分類器による教師画像の分類結果を示す図である。 図21は、実施形態に係る分類器による教師画像の分類結果を示す図である。 図22は、実施形態に係る特徴量ベクトルによる学習についての検定結果を示す図である。 図23は、従来技術を説明するグラフである。
以下、図面を参照して、実施形態について説明する。以下に示す実施形態の構成は例示であり、開示の技術は実施形態の構成に限定されない。
≪実施形態≫
図1は本発明の実施の形態に係る検査・分類装置1の概略構成を示す図である。検査・分類装置1では、半導体基板9(以下、単に「基板9」という。)上のパターンの欠陥を示す欠陥画像が取得され、該欠陥画像の分類が行われる。欠陥画像の分類により、分類対象である該欠陥が分類される。
検査・分類装置1は、撮像装置2、欠陥検出部41、および、コンピュータ5を備える。撮像装置2は、基板9上の検査対象領域を撮像する。欠陥検出部41は、検査対象領域の画像データを処理しつつ欠陥を検出する。コンピュータ5は、欠陥検出部41において欠陥が検出された場合に欠陥が属すべき欠陥クラス(欠陥の種別であり、「カテゴリ」等とも呼ばれる。)へと欠陥を分類する。コンピュータ5は、検査・分類装置1の全体動作の制御、および、欠陥の分類に利用される分類器の構築も行う。基板9上に存在するパターンの欠陥のクラスは、例えば、欠損、突起、断線、ショート、異物などである。撮像装置2は基板9の製造ラインに組み込まれ、検査・分類装置1はいわゆるインライン型のシステムとなっている。検査・分類装置1は、欠陥検査装置に自動欠陥分類の機能を付加した装置と捉えることもできる。
撮像装置2は、撮像部21、基板9を保持するステージ22、および、撮像部21に対してステージ22を相対的に移動するステージ駆動部23を有する。撮像部21は、基板9上の検査対象領域を撮像して多値の撮像画像(のデータ)を取得する。撮像部21は、照明部211、光学系212、および、撮像デバイス213を有する。照明部211は、照明光を出射する。光学系212は、基板9に照明光を導き、基板9からの光は光学系212に入射する。撮像デバイス213は、光学系212により結像された基板9の像を電気信号に変換する。ステージ駆動部23はボールねじ、ガイドレール、モータ等により構成される。コンピュータ5がステージ駆動部23および撮像部21を制御することにより、基板9上の検査対象領域が撮像される。
欠陥検出部41では、基板9の撮像画像と、該撮像画像と同じ領域(正常な領域)を示す参照画像とを比較することにより差分画像(典型的には、両画像の差の絶対値を示す画像)が得られ、該差分画像に基づいて、異常部分である欠陥が検出される。そして、欠陥部分の多値画像である欠陥画像が生成される。欠陥検出部41では、他の手法により欠陥が検出されてよい。
図2はコンピュータ5の構成を示す図である。コンピュータ5は各種演算処理を行うCPU51、基本プログラムを記憶するROM52、および、各種情報を記憶するRAM53を含む一般的なコンピュータシステムの構成となっている。コンピュータ5は、情報記憶を行う固定ディスク54、画像等の各種情報の表示を行う表示部であるディスプレイ55、ユーザからの入力を受け付けるキーボード56aおよびマウス56b(以下、「入力部56」と総称する。)、光ディスク、磁気ディスク、光磁気ディスク等のコンピュータ読み取り可能な記録媒体8から情報の読み取りを行う読取装置57、並びに、検査・分類装置1の他の構成との間で信号を送受信する通信部58をさらに含む。
コンピュータ5には、事前に読取装置57を介して記録媒体8からプログラム80が読み出され、固定ディスク54に記憶される。そして、CPU51によりRAM53および固定ディスク54を利用しつつプログラム80に従って演算処理が実行される。
図3は検査・分類装置1における機能構成を示すブロック図であり、図3では、コンピュータ5のCPU51、ROM52、RAM53、固定ディスク54等により実現される機能構成を、符号5を付す破線の矩形にて囲んでいる。
コンピュータ5は、特徴量算出部31、画像分類装置32および分類器構築装置33を有する。特徴量算出部31は、画像から各種特徴量を算出する。本実施形態では、特徴量算出部31を分類器構築装置33に設けているが、機能構成に応じて適宜の配置が可能である。画像分類装置32は、欠陥が検出された場合に該欠陥を自動的に分類する。画像分類装置32は、対象画像記憶部321、分類制御部322および入力部56を有し、分類
制御部322は、分類器320を有する。分類器構築装置33は、画像分類装置32における分類器320を構築する。分類器構築装置33は、教師データ記憶部331、分類器生成部333、を有する。これらの構成が実現する機能の詳細については後述する。なお、これらの機能は専用の電気回路により構築されてもよく、部分的に専用の電気回路が利用されてもよい。
検査・分類装置1では、事前準備として、分類器構築装置33による分類器の構築が行われる。
まず、欠陥検出部41にて検出された多数の欠陥画像が、教師データ記憶部331に記憶される。続いて、特徴量算出部31では、各欠陥画像に対して複数種類の特徴量の値、すなわち、複数の特徴量軸における値が取得される。図4は、特徴量算出部31の構成を説明するための図である。特徴量算出部31は、補助特徴量算出部310、補助教師データ記憶部311、補助判別情報取得部312、補助分類器生成部313、補助分類評価部314、補助分類器修正部315、繰返制御部316および特徴量ベクトル生成部317を有する。図5は、特徴量算出部31における特徴量算出の流れを説明する図である。特徴量算出部31では、例えば、欠陥の面積、周囲長、重心位置、モーメント量、階調値の平均、分散、最大、最小等の補助特徴量に基づいて後述する複数の特徴量を算出する。各欠陥画像に対する複数の特徴量軸の値の集合は、特徴量ベクトルとも呼ばれる。
また、各欠陥画像が示す欠陥に対して、ユーザにより、欠陥のクラスの教示(入力)が行われる。クラスの教示では、複数の欠陥画像が、コンピュータ5のディスプレイ55に表示される。そして、ユーザにより、各欠陥画像に対して複数のクラスのいずれか1つが決定され、クラスの入力が入力部56を介して行われる。これにより、複数の欠陥画像のそれぞれにおいて、複数のクラスのうちの1つが教示クラスとして教示される。以下、クラスの教示が行われた欠陥画像を、以下、「教師画像」という。
補助教師データ記憶部311では、各教師画像の教示クラスと、該教師画像に対して取得される複数の補助特徴量軸における値とが互いに関連付けられた状態で、これらの情報が記憶される。言い換えると、各教師画像の教示クラスと、該教師画像における複数の補助特徴量軸の値とを含む補助教師データ810が生成され、補助教師データ記憶部311に記憶される(ステップS11)。既述のように、欠陥検出部41では、基板9の撮像画像と参照画像とを比較することにより差分画像が得られ、該差分画像に基づいて欠陥画像が生成される。したがって、欠陥画像(教師画像)と共に、参照画像および差分画像において欠陥画像と同じ領域を示す部分等を用いて、補助特徴量軸上の値が取得されてもよい(後述する画像分類装置32による対象画像の分類において同様)。
補助教師データ810が準備されると、補助判別情報取得部312では、補助教師データ810に基づいて各補助特徴量軸における複数のクラスの度数分布が求められる(ステップS12)。具体的には、まず、各補助特徴量軸に関して、補助教師データ810に含まれる複数の値の最大値および最小値が特定され、値の分布範囲が取得される。該分布範囲は、適当な個数の区間に等分割(離散化)され、各区間においてクラス毎の値の度数(出現頻度)が求められる。例えば、分布範囲の分割数は、2の1乗以上、2の10乗以下である。
図6は、第1の補助特徴量軸における複数のクラスの度数分布表を示す図であり、図7は、第1の補助特徴量軸における複数のクラスのヒストグラムを示す図である。また、図8は、第2の補助特徴量軸における複数のクラスの度数分布表を示す図であり、図9は、第2の補助特徴量軸における複数のクラスのヒストグラムを示す図である。図6および図8では、複数(3種類)のクラスをそれぞれ「Class 1」、「Class 2」、「Class 3」と
表し、補助特徴量軸における区間を、見出しに「bin」と記す行に0ないし15の番号で
示している(以下同様)。
図6ないし図9では、各補助特徴量軸における値の分布範囲の分割数は14であり、該分布範囲よりも小さい値の区間(0)および大きい値の区間(15)も設けている。区間(0)および区間(15)は、未知の画像から得られる値が、教師画像に基づく分布範囲よりも外側となる場合に用いられる。後述するように、各補助特徴量軸における複数のクラスの度数分布は、特徴量の算出に利用されるため、以下、「補助情報」という。
分布範囲の分割数は、補助特徴量軸毎に異なっていてもよく、全ての補助特徴量軸において同じであってもよい。例えば、全区間において度数が1となる区間が1つのみ存在するような分割数のうち、最小のものが分割数の上限として設定される。これにより、度数が1以上となる区間が不連続となることが抑制される。また、複数の補助特徴量軸により規定される補助特徴量空間において、複数の補助特徴量軸の区間により表現される領域(セル)の個数が、教師画像の総数よりも十分に多くなるように、分割数の下限が設定されることが好ましい。通常、教師画像の個数は、多くとも104個程度であるため、例えば、補助特徴量軸の個数が20個である場合、分割数が2であれば、補助特徴量空間におけるセルの個数は220となり、教師画像の個数よりも十分に多くなる。
続いて、補助分類器生成部313では、複数の補助特徴量軸における値の入力により補助分類クラスを決定する初期の補助分類器である暫定補助分類器30が生成される(ステップS13)。本処理例では、暫定補助分類器30の構造が予め決定されており、暫定補助分類器30は、複数の補助特徴量軸に対してそれぞれ演算を行う複数の弱分類器を含む。各弱分類器は、補助特徴量軸における値を用いて補助情報を参照することにより、該値が取得された画像が、複数のクラスのそれぞれに属する確率(該補助特徴量軸のみに着目した確率)をクラス評価結果として求める。
ここで、教師画像の総数をN、クラスの個数をn、クラスC(i=1、2、・・・、n)に属する(すなわち、教示クラスがCである)教師画像の総数をN(N≠0)とすると、Nはどの補助特徴量軸においても同じ数である。したがって、クラスCiに属する教師画像の総数Nの全クラスにおける総和は、数1のように教師画像の総数となる。
Figure 2020052475
また、補助特徴量軸の個数をm、補助特徴量軸D(j=1、2、・・・、m)における値の分布範囲の分割数をKとして、補助特徴量軸Djにおける区間k(k=1、2、・・・、K)において、クラスCに属する教師画像の個数をFij(k)で表すと、クラスCに属する教師画像の総数Nは、数2のように表される。
Figure 2020052475
一方、一の補助特徴量軸Dのみに着目した場合に、区間kにおいてクラスCに属する教師画像の個数Fij(k)の、クラスCiに属する教師画像の総数Nに対する比率は、該補助特徴量軸Dにおける値が区間kに属すると判った画像が、クラスCに属する確率と考えることができる。該確率をpjk(C)と表すと、確率pjk(C)は、数3のように表される。
Figure 2020052475
例えば、第1の補助特徴量軸の9番の区間について確率pjk(C)を求めると、p1,9(C)は(49/1578)から0.031となり、p1,9(C)は(486/2849)から0.171となり、p1,9(C)は(9/688)から0.013
となる。確率pjk(C)は、1つの補助特徴量軸に対してn個(クラス数)だけ得られるが、全クラスの確率pjk(C)の総和は1にはならない。そこで、検査・分類装置1で得られる全ての画像がn個のクラスのいずれかに属することを前提として、全クラスにおける総和が1となるように正規化した、新たな確率p'jk(C)を数4のよう
に定める。
Figure 2020052475
確率p'jk(C)は、各区間kにおいて全てのクラスの画像の総数が同じであると
仮定した上で、補助特徴量軸Dにおいて区間kに属する値を有する画像が、クラスCに属する確率(該特徴量軸Dのみに着目した確率)と捉えることができ、ある種の事後確率(確率予報)とも捉えられる。例えば、第1の補助特徴量軸の9番の区間について確率p'jk(Ci)を求めると、p'1,9(C)は((49/1578)/((49/
1578)+(486/2849)+(9/688)))から0.145となり、同様の計算によりp'1,9(C)は0.794となり、p'1,9(C)は0.061となる。確率p'jk(C)の全クラスにおける総和は1となる。
暫定補助分類器30に含まれる各弱分類器は、対応する補助特徴量軸Dにおける値を用いて判別情報を参照することにより、各クラスCに対して確率p'jk(Ci)をク
ラス評価結果として求める。該弱分類器では、該補助特徴量軸Dにおいて値が取得された画像が、複数のクラスCのそれぞれに属するとした場合の妥当性(確信度)を示す評価値が、クラス評価結果として求められているともいえる。
なお、通常の条件つき確率として、p(C1|D1,k=9)は(49/(49+486+9))から0.090となり、同様の計算によりp(C2|D1,k=9)は0.893となり、p(C3|D1,k=9)は0.017となる。上記条件つき確率は、各クラスに属する教師画像の個数の比率が、実際に分類される未知の画像における該クラスの出現比率であることを前提としている。したがって、各クラスに属する教師画像の個数の比率が実際の出現比率と相違する場合には、正しい確率計算を行うことができない場合がある。これに対し、確率p'jk(C)を求める場合には、全てのクラスの出現比率が
一定であることを前提としており、より安定した分類結果が得られることが期待される。暫定補助分類器30の設計によっては、確率p'jk(C)以外の値(例えば、上述の
条件つき確率)がクラス評価結果として求められてもよい。
ところで、多くの補助特徴量軸における複数のクラスの度数分布では、図6および図8のヒストグラムのように、互いに重なり合う部分が多く存在するため、各補助特徴量軸において求められる複数のクラスに対する確率によるクラスの予測精度は、あまり高いとは言えない(ただし、ランダムにクラスを予測するよりは精度は高いといえる。)。そこで、暫定補助分類器30では、アンサンブル学習の考え方が取り入れられており、複数の補助特徴量軸に対する複数の弱分類器のクラス評価結果に基づいて分類クラスを決定する強分類器として、暫定補助分類器30が構成される。このようにして構成された最初の暫定補助分類器30を「第1世代の暫定補助分類器」と呼ぶ。
次に、補助分類評価部314により、第1世代の暫定補助分類器30を用いて複数の教師画像に含まれる教師画像群の分類が行われる(ステップS14)。補助分類評価部314は分類クラスと教示クラスとから、再代入法による補助分類評価結果を取得する(ステップS15)。補助分類評価結果は、全体の正答率でもよく、クラス毎の正答率でもよい。
初回のステップS16,S17は、実質的に実行されず、ステップS18の分岐処理を経由して補助分類器修正部315による補助判別情報の修正が行われる(ステップS19)。補助判別情報の修正は実質的に暫定補助分類器30の修正である。補助分類器修正部315では、補助教師データ81における複数の教師画像に含まれる教師画像群の分類が、暫定補助分類器30を用いて行われる(ステップS14)。本処理例では、教師画像群として、補助教師データ810に含まれる全ての教師画像が選択される。既述のように、補助教師データ810は、全ての教師画像に対する複数の補助特徴量軸における値を含む。したがって、教師画像群に含まれる各教師画像の分類では、各補助特徴量軸において、該教師画像の値が属する区間が迅速に特定され、複数のクラスに対する評価値(例えば、数4の確率p'jk(C))がクラス評価結果として容易に取得される。
暫定補助分類器30による分類では、さらに、各クラスに対して、複数の補助特徴量軸における複数の評価値の代表値(例えば、平均値や中央値、加重平均値等)が求められる。そして、複数のクラスのうち代表値が最大であるクラスが、該教師画像の分類クラスとして決定される。各教師画像の分類クラスは、補助分類器修正部315において記憶される。このとき、暫定補助分類器30における好ましい処理では、最大の代表値が一の閾値未満である場合、または、最大の代表値と2番目に大きい代表値との差(または比率)が他の閾値未満である場合等に、分類すべきクラスが不明であることを示す追加クラスが分類クラスとして決定される。以下の説明では、上記の場合に、教師画像群の教師画像が、追加クラスに分類されるものとする。
図10は、暫定補助分類器30による教師画像群の分類結果の一例を示す図であり、分類結果をまとめたコンフュージョンマトリクス(混同行列)である。図10では、3種類の教示クラスを行見出しに記し、不明を含む4種類の分類クラスを列見出しに記している
。教示クラスが「A」である複数の教師画像のうち、分類クラス「B」に属すると判定された教師画像の個数は、「A」の行と「B」の列との交差位置に示される。また、「Precision」の行と「Recall」の列との交差位置は、分類が行われた教師画像の総数のうち、
教示クラスと分類クラスとが一致した教師画像の個数の比率(以下、単に「正答率」という。)を示す。既述のように教師画像群は、全ての教師画像であるため、図10の分類結果は、いわゆる再代入法評価の結果である。
続いて、補助分類器修正部315は、教師画像群のうち、分類クラスが教示クラスと相違する教師画像(以下、「誤分類教師画像」という。)が存在する場合に、補助特徴量軸群に対する補助判別情報が誤分類教師画像に基づいて修正される(ステップS19)。本処理例では、分類クラスが追加クラスである教師画像は、誤分類教師画像とは扱われない。また、補助特徴量軸群は、上記複数の補助特徴量軸に含まれ、本処理例では、補助特徴量軸群として、ステップS11にて値が求められた全ての補助特徴量軸が選択される。
各補助特徴量軸の補助判別情報の修正では、各補助特徴量軸の各クラスの度数分布において、教師画像から得られる値が属する区間における教示クラスの度数が、他のクラスの度数よりも相対的に増大するように、補助判別情報が修正される。たとえば、該補助特徴量軸における複数のクラスの度数分布において誤分類教師画像の値が属する区間が特定され、該区間における誤分類教師画像の教示クラスの度数が、予め定められた正の値(ここでは、1)だけ加算される。すなわち、分類クラスが教示クラスと相違する誤分類教師画像が、各補助特徴量軸の複数のクラスの度数分布において重複して計数される。上記処理は、誤分類教師画像の重みの変更と捉えることもできる。ステップS12,S13における補助判別情報の取得および暫定補助分類器30の生成を、学習と捉えると、ステップS17,S19における教師画像群の分類および補助判別情報の修正は、暫定補助分類器30の追加学習であるといえる。補助教師データ810は、全ての教師画像に対する複数の補助特徴量軸における値を含むため、補助特徴量軸群の補助判別情報において誤分類教師画像に対応する区間の度数を変更する処理は、短時間に、かつ、容易に行うことが可能である。
これにより、第1世代の暫定補助分類器30が修正され、第2世代の暫定補助分類器30が生成される。換言すれば、追加学習により次の世代の暫定補助分類器30が生成される。誤分類教師画像としては、直前のステップS14にて行われる分類により取得されたものが利用されてもよく、別途、暫定補助分類器30による教師画像の分類を行って誤分類教師画像が取得されてもよい。
暫定補助分類器30は、教師画像の分類クラスが不明であることを示す追加クラスが出力可能であることが好ましい。分類クラスが追加クラスである場合は、教師画像に基づく補助判別情報の修正は行われない。
現在の暫定補助分類器30が第1世代の暫定補助分類器30から第2世代の暫定補助分類器30に更新され、ステップS14に戻る(ステップS20)。ステップS20の実行は、実質的にステップS19を含んでもよい。
2回目のステップS14では、補助分類評価部314により、第2世代の暫定補助分類器30を用いて教師画像群の分類が行われる(ステップS14)。補助分類評価部314は分類クラスと教示クラスとから、分類成績を取得する(ステップS15)。
特徴量ベクトル生成部317は、第1および第2世代の暫定補助分類器30から複合補助分類器40を生成する(ステップS16)。複合補助分類器40の構成については後述する。複合補助分類器40は、教師画像群の分類を行う(ステップS17)。
ステップS19では、誤分類教師画像に基づいて補助判別情報の修正が行われる。これにより、第3世代の暫定補助分類器30が生成され、現在の暫定補助分類器30が第3世代の暫定補助分類器30に更新されてステップS14に戻る(ステップS20)。その後、第3世代の暫定補助分類器30による分類が行われる。特徴量ベクトル生成部317は、第1ないし第3世代の暫定補助分類器30を含む複合補助分類器40を生成し、複合補助分類器40による分類が行われる。以後、終了条件が満たされるまで、現在の世代の暫定補助分類器30による分類、複合補助分類器40の生成、複合補助分類器40による分類、および、次の世代の暫定補助分類器30の生成が繰り返される(ステップS18)。
なお、複合補助分類器40の生成(ステップS16)および複合補助分類器40による分類(ステップS17)は、暫定補助分類器30の世代が更新される毎に行われる必要はない。例えば、暫定補助分類器30の世代の更新が所定回数行われる毎にステップS16,S17が実行されてステップS18におけるループ終了確認が行われてもよい。
上記繰り返し処理は繰返制御部316により制御され、所定の終了条件が満たされると、その段階での複合補助分類器40が最終的な複合補助分類器として取得される(ステップS18)。そして、複合補助分類器40を構成する第1世代から現在の世代までの暫定補助分類器30から出力される全てのクラスCのクラス確信度を特徴量とする特徴量ベクトル50が生成される(ステップS20)。クラスの個数をnとし、第1世代から第q世代までの暫定補助分類器を含む複合補助分類器40が構成された場合には、特徴量ベクトル50は、n×q次元のベクトルとなる。第i世代の暫定補助分類器30によって出力されるクラスCのクラス確信度をEijとすると、特徴量ベクトル50は具体的には、(E11,E12,…E1n,E21,…E2n,…Eq1,Eq2,…Eqn)となる。
図11および図12は、複合補助分類器40の構成を説明するための図である。複合補助分類器40は実質的に第1世代から現在の世代までの複数の暫定補助分類器30を含む。正確には、複合補助分類器40は、暫定補助分類器30のうち、複数の補助特徴量軸における複数のクラスの評価結果(上述の確率p'jk(C))の代表値を取得するまで
の部分を含む。図11は、1つの暫定補助分類器30における値の流れや情報を抽象的に示す図である。図11では、演算する機能の表示を省略し、値の流れを線のみで表現している。
現在の世代以前の複数の暫定補助分類器30のそれぞれでは、クラスの評価結果の代表値が取得される。複合補助分類器40ではこれらの代表値が利用される。すなわち、複合補助分類器40では、図11において破線にて示す部分401が利用される。クラスの評価結果の代表値は、画像が該クラスに属する度合いを示す確信度である。以下、クラスの評価結果の代表値を「クラス確信度」という。なお、複合補助分類器40を構築する際の分類処理(ステップS17)では、各世代の暫定補助分類器30による分類処理(ステップS14)にて求められたクラス確信度を流用することも可能である。
図12は、複合補助分類器40において、各世代の暫定補助分類器30からの出力が利用される様子を示す図である。暫定補助分類器30からは複数のクラスに対応するクラス確信度が出力されるものとして示している。また、演算処理を部分的に線のみにて表現している。
図13は、追加学習の回数(ステップS19,S20の繰り返し回数)と正答率との関係の一例を示す図である。横軸の追加学習の回数は、「暫定補助分類器30の世代数−1」である。縦軸は正答率である。符号101にて示す線は、暫定補助分類器30に教師画
像群を分類させる評価法(再代入法)と追加学習とを交互に繰り返して暫定補助分類器30の正答率が向上する様子を示す。符号102にて示す線は、追加学習を行う毎に教師画像群とは別に準備した評価用画像群を分類した場合の正答率を示す。
符号103にて示す線は、複合補助分類器40を用いて教師画像群を分類した成績を示し、符号104にて示す線は、複合補助分類器40を用いて評価用画像群を分類した成績を示す。複合補助分類器40は、第1世代から最新の世代までの暫定補助分類器30を用いて1つのBoosting分類器を構成するため、正答率は滑らかに向上する。
暫定補助分類器30の追加学習を繰り返すのみでは暫定補助分類器30の分類成績(すなわち、正答率)が振動し続けて100%に到達しない場合であっても、複合補助分類器40では追加学習により分類成績が滑らかに向上する。そのため、追加学習を終了する条件を試行錯誤することなく容易に決定することができる。Boosting分類器の分類成績は比較的初期の世代で安定するため、追加学習の演算量を少なく抑えることができ、得られたBoosting分類器は過学習にも陥らず、汎化性能の低下が抑制される。
補助特徴量軸群に対する補助判別情報の修正は、様々な手法にて行われてもよい。例えば、補助特徴量軸群における複数のクラスの度数分布において、誤分類教師画像から得られる値が属する区間における教示クラスの度数に1よりも大きい係数が掛けられてもよく、他のクラスの度数から所定の正の値が引かれる、または、該度数に1未満の係数が掛けられてもよい。以上のように、補助特徴量軸群における複数のクラスの度数分布において、誤分類教師画像から得られる値が属する区間における、誤分類教師画像の教示クラスの度数が、他のクラスの度数よりも相対的に増大するように、補助特徴量軸群に対する補助判別情報が修正されればよい。
補助分類器修正部315では、一部の補助特徴量軸のみが、補助判別情報が修正される補助特徴量軸群として選択されてもよい。該追加学習を効率よく行うという観点では、補助特徴量軸群に含まれる補助特徴量軸の個数が、補助教師データ810に値が含まれる複数(全て)の補助特徴量軸の半分以上であることが好ましい。
上記実施の形態では、暫定補助分類器30の追加学習に利用される教師画像群として、補助教師データ810に含まれる全ての教師画像が選択されるが、例えば、各教示クラスの教師画像が同じ個数となるように選択された教師画像のみが教師画像群に含まれてもよい。
2以上の教師画像を含む教師画像群が分類され、全ての誤分類教師画像に基づいて補助判別情報が修正されるが、例えば、教師画像群が1つの教師画像とされ、該教師画像の分類クラスが教示クラスと相違する場合に、該教師画像のみに基づいて補助判別情報の修正が行われてもよい。ステップS19においても同様である。
欠陥検出部41において、欠陥の検出の際に補助特徴量が算出される場合には、該補助特徴量が特徴量算出部31において利用されてよい。
図12に示すクラス確信度としては、対象画像が各クラスに属する可能性の程度を示す値であれば他の様々な値が利用可能である。例えば、確率p'jk(C)を求める前の
条件つき確率の代表値がクラス確信度として用いられてもよい。
教師データ記憶部331では、各教師画像の教示クラスと、該教師画像に対して上述のようにして取得された複数の特徴量軸における値とが互いに関連づけられた状態で、これらの情報が記憶される。言い換えると、各教師画像の教示クラスと、該教師画像における
複数の特徴量軸の値とを含む教師データ81が生成され、教師データ記憶部331に記憶される。既述のように、欠陥検出部41では、基板9の撮像画像と参照画像とを比較することにより差分画像が得られ、該差分画像に基づいて欠陥画像が生成される。
上述の教師データ81によって分類器を構築する流れを図14に説明する。
まず、欠陥画像を準備する(ステップS31)。次に、ユーザがディスプレイ55に表示された欠陥画像に対して入力部56を介して該欠陥画像のクラスを入力し、教示する(ステップS32)。そして、上述の方法に従って、特徴量算出部31において、特徴量ベクトルを生成する(ステップS33)。ステップS32で教示されたクラスと、ステップS34で取得された特徴量ベクトルと関連付けた教師データ81が教師データ記憶部331に記憶される(ステップS34)。このようにして準備された教師データ81を学習させることにより、分類器生成部333において分類器330を生成し(ステップS35)、分類制御部322に分類器320として登録する(ステップS36)。ここで、分類器320としては、識別関数型の分類器を生成することができるが、これに限られず任意のアルゴリズムを用いて分類器を構築することができる。このようにして構築された分類器320で画像の分類を行う場合には、欠陥検出部41で取得された欠陥画像に対して上述の特徴量ベクトルが取得され、得られた特徴量ベクトルを分類器320に与えて分類クラスを付与することになる。このようにすれば、複数の暫定補助分類器の個々の分類成績を保持する必要がなくなり、加重平均で最終結果を算出するよりも分類性能の良い(追加学習を繰り返す過程で得られた分類器まで含んだ全体として性能の良い)分類器を得ることができる。また、追加学習の繰返し処理において、分類器の成績が100%に到達しないまま世代が進むとともに振動し続けるような場合でも、停止条件を見出すための試行錯誤を必要とせず、予め決めた比較的少ない世代数(例えば10世代)で打ち切ることができる。また、このようにして構築された分類器では、教師データを分類し(再代入法)、誤分類した教師データの教示クラスを新たに定義した「不明」クラスに変更するようにしてもよい。また、再代入法による分類結果に応じて、分類器を再構築するようにしてもよい。
上述の教師データ81に基づく学習によって生成された分類器320は、画像分類装置32の分類制御部322に入力され、分類器320として画像の分類に利用される。図15に画像分類装置32による欠陥画像の分類について説明する。図15は画像分類装置32による欠陥画像の分類の流れを示す図である。既述のように、検査・分類装置1では、撮像装置2により基板9が撮像され、撮像画像が欠陥検出部41に出力される。欠陥検出部41では、検査対象領域の欠陥検査が行われ、欠陥が検出されると、欠陥部分の多値画像である欠陥画像が生成されて画像分類装置32に出力される。これにより、欠陥画像が、対象画像記憶部321に記憶されて準備される(ステップS41)。該欠陥画像は、画像分類装置32における分類対象の画像、すなわち対象画像である。続いて、特徴量算出部31により、対象画像に対して特徴量ベクトルが算出される(ステップS42)。分類制御部322には、分類器構築装置33により構築された分類器320が設けられており、複数の特徴量軸における値、すなわち、特徴量ベクトルの複数の成分が分類器320に入力されることにより、対象画像の分類が行われる(ステップS43)。
以下に、総数5112個の欠陥画像を3クラスに分類する例を示す。まず、上述の補助特徴量を特徴量とし、教示クラスと関連付けた教師データを用い、例えばロジスティック回帰により識別関数型の分類器を構築する。図16は、この分類器による、再代入法による分類結果をまとめたコンフュージョンマトリクス(混同行列)である。図16では、3種類の教示クラスを見出しに記し、不明を含む4種類の分類クラスを列見出しに記している。教示クラスが「A」である複数の教師画像のうち、分類クラス「B」に属すると判定された教師画像の個数は、「A」の行と「B」の列との交差位置に示される。また、「Precision」の行と「Recall」の列との交差位置は、分類が行われた教師画像の総数のうち
、教示クラスと分類クラスとが一致した教師画像の個数の比率(以下、単に「正答率」という。)を示す。
一方、同じ欠陥画像データを用いて、上述の特徴量算出部31における複合補助分類器40と共通した構成を有するBoosting強分類器である複合分類器410を構築し、この分類器の再代入法による分類を行う。図17は、複合分類器410の構成を説明する図である。各世代の暫定分類器301は、図12に示す暫定補助分類器30と共通の構成を有する。複合分類器410は、各世代の暫定分類器301を用いて教師画像群を分類した際の分類成績(例えば正答率)をそれぞれ保持しており、各世代の暫定分類器301から出力される複数のクラス確信度に該世代の暫定分類器301の分類成績を乗算する乗算器411を有する。これにより、クラスCについては、第1世代の暫定分類器301のクラスCのクラス確信度に第1世代の暫定分類器の分類成績を乗算した値が取得され、第2世代の暫定分類器301のクラスCのクラス確信度に第2世代の暫定分類器の分類成績を乗算した値、…、最新世代の暫定分類器301のクラスCのクラス確信度に最新世代の暫定分類器301の分類成績を乗算した値が取得される。そして、クラスCに関するこれらの値の平均値が、クラスCの複合評価結果として取得される。他の暮らすについても同様である。複合評価結果としては、平均値以外の代表値が用いられてもよい。他の代表値としては、例えば、中央値や世代数に依存する加重平均を挙げることができる。そして、複数の複合評価結果のうち、最大のものに対応するクラスが、分類クラスとして取得される。このとき、複合分類器410における好ましい処理では、最大の複合評価結果が一の閾値未満である場合、または、最大の複合評価結果と2番目に大きい複合評価結果との差(または比率)が他の閾値未満である場合等に、分類すべきクラスが不明であることを示す追加クラスが分類クラスとして割り当てられる。
図18に、上述の複合分類器410による、同じ欠陥画像データを用いた再代入法による分類結果をまとめたコンフュージョンマトリクスを示す。ただし、離散化の分割数64であり、繰返しを終了する(この場合は正答率が100%に対するという条件)までに追加学習(暫定分類器の更新)を42回実行した。つまり、全部で43個の分類器によるBoosting(加重平均)である。
このとき、個々の暫定分類器301の総正答率を調べると図19のようになり、追加学習を9回繰り返した(第10世代)の分類器の時点で概ね図18に示す97%に達していることがわかる。これは、分類を実行する際の演算量を4分の1程度に削減できる可能性があることを示している。
ただし、図20に示す、これらの10個の暫定分類器301によるBoosting(加重平均)を行う複合分類器410の分類結果をまたとめたコンフュージョンマトリクスによると、元の欠陥画像データの特徴量から構築した識別関数型の分類成績(図16参照)には及ばない。
そこで、これらの10個の暫定分類器301の出力するクラス毎の確信度を改めて特徴量ベクトルとみなして(この場合には全部で30次元のベクトルとなる)、例えば、ロジスティック回帰により識別関数型の分類器330を構築する。図17に示す複合分類器における加重平均計算と分類クラスの決定の役割をこのような特徴量ベクトルに基づいて構築された分類器330が担うことになる。
図21に、このようにして構築された分類器330による、再代入法による分類結果をまとめたコンフュージョンマトリクスを示す。これによれば、分類器330による分類成績は、複合分類器410による加重平均の場合の分類成績(図16参照)を上回っている。また、分類器330による分類成績は第10世代の暫定分類器単体の成績(図19参照)をも上回っている。
なお、上述のようにクラス確信度を新たな特徴量ベクトルとした学習について、n-Fold
s Cross Validation(n分割交叉検定)(n=10)の結果を図22に示す。図22に示すように、クラス確信度を新たな特徴量ベクトルに基づいて学習させた分類器に過学習は認められない。また、追加学習を繰り返す過程で得られる分類器は過学習でないことが分かっているので、全体として過学習でないといえる。
図3および図4に示す各機能要素が担う役割は、部分的に適宜変更されてよい。
欠陥画像は、半導体基板以外の基板上の欠陥を示すものであってよい。該基板として、ハードディスク基板等の薄膜デバイス、プラズマディスプレイや液晶ディスプレイ等の薄型ディスプレイに用いられるガラス基板、フォトマスク基板、フィルム基板、プリント配線基板等が例示される。
また、検査・分類装置1が、太陽電池パネルを撮像した欠陥画像を分類する用途に用いられてもよい。例えば、太陽電池パネルのEL(エレクトロ・ルミネッセンス)発光やPL(フォト・ルミネッセンス)発光を撮像して得られる画像や、レーザーテラヘルツエミッション顕微鏡(LTEM)を用いて得られる太陽電池パネルの画像において、参照画像が示す正常な領域とは異なる領域を含む部分を欠陥画像として扱って、検査・分類装置1において太陽電池パネルの欠陥が分類されてよい。さらに、欠陥画像は、電子線やX線等により撮像される画像であってもよい。このように、検査・分類装置1では、可視光により撮像される画像のみならず、広義の放射線により撮像される画像が分類される。
検査・分類装置1において、画像分類装置32および分類器構築装置33の機能は、撮像装置2および欠陥検出部41とは独立して用いられてよい。画像分類装置および分類器構築装置は、血液や培養液等の所定の液中の細胞を撮像した細胞画像を、複数のクラスに分類する用途に用いられてもよい。画像分類装置および分類器構築装置は、様々な分類対象を示す画像の分類に利用可能である。分類器構築装置は、画像分類装置に含まれてもよい。
上記実施の形態および各変形例における構成は、相互に矛盾しない限り適宜組み合わされてよい。
30 暫定補助分類器
31 特徴量算出部
32 画像分類装置
33 分類器構築装置
40 複合補助分類器
50 特徴量ベクトル
56 入力部
81 教師データ
310 補助特徴量算出部
311 補助教師データ記憶部
312 補助判別情報取得部
313 補助分類器生成部
314 補助分類評価部
315 補助分類器修正部
316 繰返制御部
317 特徴量ベクトル生成部
320 分類器
321 対象画像記憶部
324 分類器更新部
330 分類器
331 教師データ記憶部
332 判別情報取得部
333 分類器生成部
334 分類器修正部
335 繰返制御部
342 複合分類器生成部
810 補助教師データ

Claims (4)

  1. 画像を分類する分類器を構築する分類器構築方法であって、
    a)複数の教師画像のそれぞれにおいて、複数のクラスのうち1つを教示クラスとして教示されており、前記各教師画像の前記教示クラスと、前記各教師画像に対して取得される複数の補助特徴量軸における値とを含む補助教師データを準備する工程と、
    b)前記補助教師データに基づいて各補助特徴量軸における前記複数のクラスの度数分布を補助判別情報として求める工程と、
    c)前記複数の補助特徴量軸における値が入力される際に、前記複数の補助特徴量軸の補助判別情報を用いて前記複数の補助特徴量軸に対する複数のクラス評価結果を取得し、さらに、前記複数のクラス評価結果に基づいて分類クラスを決定する第1世代の暫定補助分類器を生成する工程と、
    d)前記複数の教師画像に含まれる教師画像群を現在の世代の暫定補助分類器を用いて分類する工程と、
    e)前記現在の世代以前の複数の暫定補助分類器のそれぞれにより前記教師画像から得られる複数のクラス評価結果から、前記複数のクラスに対応する複数のクラス確信度を取得し、前記現在の世代以前の複数の暫定補助分類器のそれぞれに対して取得された、前記複数のクラスに対応する複数の前記クラス確信度を特徴量軸の成分とする特徴量ベクトルを生成する工程と、
    f)所定の条件が満たされた場合に、前記特徴量ベクトルを最終的な特徴量ベクトルとして取得する工程と、
    g)前記所定の条件が満たされない場合に、前記複数の補助特徴量軸に含まれる補助特徴量軸群における前記複数のクラスの度数分布において、前記教師画像のうち、前記d)工程にて得られた分類クラスが教示クラスと相違する教師画像から得られる値が属する区間における前記教示クラスの度数が、他のクラスの度数よりも相対的に増大するように、前記補助特徴量軸群に対する補助判別情報を修正することにより、次の世代の暫定補助分類器を取得する工程と、
    h)前記現在の世代の暫定補助分類器を前記次の世代の暫定補助分類器に更新して、前記d)工程に戻る工程と、
    i)前記複数の教師画像のそれぞれについて、各教師画像の前記教示クラスと、前記各教師画像に対して取得される前記特徴量ベクトルとを含む教師データを準備する工程と、
    j)前記教師データを学習させて分類器を構築する工程と、
    を備えることを特徴とする分類器構築方法。
  2. 画像を分類する画像分類方法であって、
    対象画像を準備する工程と、
    請求項1に記載の分類器構築方法により構築された分類器により前記対象画像を分類する工程と、
    を備えることを特徴とする画像分類方法。
  3. 複数の教師画像のそれぞれに対して算出された複数の特徴量を含む特徴量ベクトルを算出する特徴量算出部と、
    前記教師画像のそれぞれにおいて、複数のクラスのうち1つを教示クラスとして教示されており、前記各教師画像の前記教示クラスと、前記各教師画像に対して算出された前記特徴量ベクトルとを有する教師データを記憶する教師データ記憶部と、
    前記教師データを学習させて画像を分類する分類器を構築する分類器生成部と、
    を備える分類器を構築する分類器構築装置であって、
    複数の教師画像のそれぞれにおいて、複数のクラスのうち1つを教示クラスとして教示されており、前記各教師画像の前記教示クラスと、前記各教師画像に対して取得された複数の補助特徴量軸における値とを含む補助教師データを記憶する補助教師データ記憶部と

    前記補助教師データに基づいて各補助特徴量軸における前記複数のクラスの度数分布を補助判別情報として取得する補助判別情報取得部と、
    前記複数の補助特徴量軸における値が入力される際に、前記複数の補助特徴量軸の補助判別情報を用いて前記複数の補助特徴量軸に対する複数のクラス評価結果を取得し、さらに、前記複数のクラス評価結果に基づいて分類クラスを決定する第1世代の暫定補助分類器を生成する補助分類器生成部と、
    前記複数の教師画像に含まれる教師画像群を現在の世代の暫定補助分類器を用いて分類し、前記現在の世代以前の複数の暫定補助分類器のそれぞれにより前記教師画像から得られる複数のクラス評価結果を取得する補助分類評価部と、
    前記補助分類評価部にて取得された前記クラス評価結果から、前記複数のクラスに対応する複数のクラス確信度を取得し、前記現在の世代以前の複数の暫定補助分類器のそれぞれに対して取得された、前記複数のクラスに対応する複数の前記クラス確信度を特徴量軸の成分とする特徴量ベクトルを生成する特徴量ベクトル生成部と、
    所定の条件が満たされない場合に、前記複数の補助特徴量軸に含まれる補助特徴量軸群における前記複数のクラスの度数分布において、前記教師画像のうち、前記現在の世代の暫定補助分類器による分類にて得られた分類クラスが教示クラスと相違する教師画像から得られる値が属する区間における前記教示クラスの度数が、他のクラスの度数よりも相対的に増大するように、前記補助特徴量軸群に対する補助判別情報を修正することにより、次の世代の暫定補助分類器を取得する補助分類器修正部と、
    前記所定の条件が満たされるまで、前記現在の世代の暫定補助分類器を前記次の世代の暫定補助分類器に更新して、前記複数の教師画像に含まれる教師画像群を現在の世代の暫定補助分類器を用いて分類し、前記現在の世代以前の複数の暫定補助分類器のそれぞれにより前記教師画像から得られる複数のクラス評価結果からの、前記複数のクラスに対応する複数のクラス確信度の取得、前記現在の世代以前の複数の暫定補助分類器のそれぞれに対する前記特徴量ベクトルの生成を繰り返させ、前記所定の条件が満たされた場合に、前記特徴量ベクトルを最終的な特徴量ベクトルとして取得する繰返制御部と、
    を備えることを特徴とする分類器構築装置。
  4. 画像を分類する画像分類装置であって、
    対象画像を記憶する対象画像記憶部と、
    請求項3に記載の分類器構築装置により構築された分類器と、
    を備えることを特徴とする画像分類装置。
JP2018178161A 2018-09-21 2018-09-21 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 Pending JP2020052475A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018178161A JP2020052475A (ja) 2018-09-21 2018-09-21 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018178161A JP2020052475A (ja) 2018-09-21 2018-09-21 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Publications (1)

Publication Number Publication Date
JP2020052475A true JP2020052475A (ja) 2020-04-02

Family

ID=69997078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018178161A Pending JP2020052475A (ja) 2018-09-21 2018-09-21 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Country Status (1)

Country Link
JP (1) JP2020052475A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021119462A (ja) * 2020-09-23 2021-08-12 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 信号機画像の処理方法、装置、コンピュータシステム及び路側デバイス
WO2023157187A1 (ja) * 2022-02-17 2023-08-24 オリンパスメディカルシステムズ株式会社 ニューラルネットワーク更新装置、ニューラルネットワーク更新プログラム及びニューラルネットワーク更新方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016115115A (ja) * 2014-12-15 2016-06-23 株式会社Screenホールディングス 画像分類装置および画像分類方法
JP2016181098A (ja) * 2015-03-24 2016-10-13 株式会社Screenホールディングス 領域検出装置および領域検出方法
JP2016191589A (ja) * 2015-03-31 2016-11-10 株式会社Screenホールディングス 欠陥分類装置および欠陥分類方法
JP2018045673A (ja) * 2016-09-09 2018-03-22 株式会社Screenホールディングス 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016115115A (ja) * 2014-12-15 2016-06-23 株式会社Screenホールディングス 画像分類装置および画像分類方法
JP2016181098A (ja) * 2015-03-24 2016-10-13 株式会社Screenホールディングス 領域検出装置および領域検出方法
JP2016191589A (ja) * 2015-03-31 2016-11-10 株式会社Screenホールディングス 欠陥分類装置および欠陥分類方法
JP2018045673A (ja) * 2016-09-09 2018-03-22 株式会社Screenホールディングス 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021119462A (ja) * 2020-09-23 2021-08-12 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド 信号機画像の処理方法、装置、コンピュータシステム及び路側デバイス
JP7267333B2 (ja) 2020-09-23 2023-05-01 阿波▲羅▼智▲聯▼(北京)科技有限公司 信号機画像の処理方法、装置、コンピュータシステム及び路側デバイス
US11790772B2 (en) 2020-09-23 2023-10-17 Apollo Intelligent Connectivity (Beijing) Technology Co., Ltd Traffic light image processing
WO2023157187A1 (ja) * 2022-02-17 2023-08-24 オリンパスメディカルシステムズ株式会社 ニューラルネットワーク更新装置、ニューラルネットワーク更新プログラム及びニューラルネットワーク更新方法

Similar Documents

Publication Publication Date Title
JP2018045673A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
US10818000B2 (en) Iterative defect filtering process
JP6472621B2 (ja) 分類器構築方法、画像分類方法および画像分類装置
US20180260531A1 (en) Training random decision trees for sensor data processing
JP6063756B2 (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
JP6669453B2 (ja) 画像分類装置および画像分類方法
US20180260719A1 (en) Cascaded random decision trees using clusters
JP2020061066A (ja) 学習プログラム、検出プログラム、学習装置、検出装置、学習方法および検出方法
JP6641195B2 (ja) 最適化方法、最適化装置、プログラムおよび画像処理装置
CN111753863A (zh) 一种图像分类方法、装置、电子设备及存储介质
CN111275660A (zh) 一种平板显示器缺陷检测方法及装置
JP2015038441A (ja) 分類器取得方法、欠陥分類方法、欠陥分類装置およびプログラム
WO2021195689A1 (en) Method for artificial intelligence (ai) model selection
JP2016191589A (ja) 欠陥分類装置および欠陥分類方法
JP2020052475A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP6632124B2 (ja) 画像分類方法および画像分類装置
Bahat et al. Classification confidence estimation with test-time data-augmentation
CN117173154A (zh) 玻璃瓶的在线图像检测系统及其方法
JP2018205860A (ja) 分類器構築方法、分類器および分類器構築装置
JP6425468B2 (ja) 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置
JP2021076994A (ja) 分類装置および画像分類システム
WO2023280229A1 (zh) 图像处理方法、电子设备及存储介质
US20240160196A1 (en) Hybrid model creation method, hybrid model creation device, and recording medium
JP7120528B2 (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
CN115953430A (zh) 基于改进的批量样本损失函数的视频单目标跟踪方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230110