JP6632124B2 - 画像分類方法および画像分類装置 - Google Patents

画像分類方法および画像分類装置 Download PDF

Info

Publication number
JP6632124B2
JP6632124B2 JP2015241032A JP2015241032A JP6632124B2 JP 6632124 B2 JP6632124 B2 JP 6632124B2 JP 2015241032 A JP2015241032 A JP 2015241032A JP 2015241032 A JP2015241032 A JP 2015241032A JP 6632124 B2 JP6632124 B2 JP 6632124B2
Authority
JP
Japan
Prior art keywords
image
sub
classifier
class
teacher
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015241032A
Other languages
English (en)
Other versions
JP2017107422A (ja
Inventor
松村 明
明 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2015241032A priority Critical patent/JP6632124B2/ja
Publication of JP2017107422A publication Critical patent/JP2017107422A/ja
Application granted granted Critical
Publication of JP6632124B2 publication Critical patent/JP6632124B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、画像を分類する技術に関する。
従来より、分類器を用いた画像の自動分類が行われている。画像の自動分類では、教師画像およびそのクラス(すなわち、教師画像が示す対象物の種別であり、カテゴリとも呼ばれる。)を示す教師データを用意して分類器を学習させる必要がある。
一の学習方法としてアダブーストが知られている(例えば、非特許文献1参照)。アダブーストでは、複数の弱分類器を順次構築して、当該複数の弱分類器を含む最終的な分類器が生成される。このとき、各弱分類器が誤って分類した教師画像に対する重みを大きくしつつ、全ての教師画像を用いて次の弱分類器が構築される。また、各弱分類器に対して分類のエラー値が算出されており、クラスが未知の画像の分類では、弱分類器毎のエラー値に基づく重み付きの投票により、当該画像のクラスが決定される。
なお、特許文献1では、アダブースト等のアンサンブル学習で学習した分類器を用いる分類方法が開示されている。当該方法では、入力データに対して複数の弱分類器のそれぞれにより所定の分類に属する度合いを示す評価値を順次算出し、当該評価値に各弱分類器に応じた重みを乗算した値の総和を重み付け評価値として算出し、重み付け評価値と所定の閾値とを比較することにより、当該入力データが当該分類に属するか否かが判定される。
特開2007−66114号公報
Yoav Freund and Robert E. Schapire, "A decision-theoretic generalization of on-line learning and an application to boosting", Computational Learning Theory, Germany, Springer-Verlag Berlin Heidelberg, 1995, P. 23-37
ところで、アダブーストでは、弱分類器(サブ分類器)の構築において、個別に重み付けされた教師画像が用いられるため、利用可能な学習アルゴリズムの種類が制限される。したがって、サブ分類器の構築において様々な種類の学習アルゴリズムを利用可能としつつ、分類性能を向上する新規な手法が求められている。
本発明は上記課題に鑑みなされたものであり、サブ分類器の構築において様々な種類の学習アルゴリズムを利用可能としつつ、分類性能を向上することを目的としている。
請求項1に記載の発明は、画像を分類する画像分類方法であって、a)複数の教師画像のそれぞれが複数のクラスのいずれかに割り振られており、それぞれが一の教師画像と、前記教師画像に割り振られたクラスを教示結果として示す情報とを含む複数の教師データセットを準備する工程と、b)前記複数の教師データセットから学習用の教師データセット群を選択する工程と、c)前記教師データセット群を用いて学習を行うことによりサブ分類器を構築する工程と、d)前記サブ分類器を用いて前記複数の教師画像を分類する工程と、e)前記サブ分類器による分類結果が前記教示結果と相違する教師画像を誤分類画像として、前記複数の教師画像の一部を含み、かつ、半分以上が誤分類画像である選択画像群をそれぞれ含む新たな教師データセット群を前記b)工程にて選択しつつ、前記b)ないしd)工程を所定回数だけ繰り返す工程と、f)分類対象の対象画像を準備する工程と、g)前記c)工程にて構築された複数のサブ分類器を用いて前記対象画像を分類する工程と、h)前記複数のサブ分類器による複数の分類結果に基づいて前記対象画像のクラスを決定する工程とを備え、前記e)工程により繰り返される前記b)工程おいて、各クラスを前記教示結果とする誤分類画像の数が確認され、所定数以上の誤分類画像が存在するクラスに関して前記所定数以上の誤分類画像のみが前記選択画像群に含められ、前記所定数以上の誤分類画像が存在しないクラスに関して、前記クラスを前記教示結果とし、かつ、誤分類画像ではない教師画像が前記選択画像群に含められる。
請求項2に記載の発明は、請求項1に記載の画像分類方法であって、前記d)工程において、前記サブ分類器のクラス毎の正答率が算出され、前記h)工程において、前記複数の分類結果を用いて、各サブ分類器の前記クラス毎の正答率に基づく重み付け投票が行われることにより、前記対象画像のクラスが決定される。
請求項に記載の発明は、請求項1または2に記載の画像分類方法であって、前記複数のサブ分類器が、互いに異なる学習アルゴリズムにより構築される2つのサブ分類器を含む。
請求項に記載の発明は、画像を分類する画像分類装置であって、複数のサブ分類器を構築する分類器構築部と、分類対象の対象画像を記憶する対象画像記憶部と、前記複数のサブ分類器を用いて前記対象画像を分類するとともに、前記複数のサブ分類器による複数の分類結果に基づいて前記対象画像のクラスを決定する分類制御部とを備え、前記分類器構築部が、複数の教師画像のそれぞれが複数のクラスのいずれかに割り振られており、それぞれが一の教師画像と、前記教師画像に割り振られたクラスを教示結果として示す情報とを含む複数の教師データセットを記憶する教師データ記憶部と、前記複数の教師データセットから学習用の教師データセット群を選択するデータ選択部と、前記教師データセット群を用いて学習を行うことによりサブ分類器を構築するサブ分類器構築部と、前記サブ分類器を用いて前記複数の教師画像を分類するサブ分類器制御部と、前記サブ分類器による分類結果が前記教示結果と相違する教師画像を誤分類画像として、前記複数の教師画像の一部を含み、かつ、半分以上が誤分類画像である選択画像群をそれぞれ含む新たな教師データセット群を前記データ選択部に選択させつつ、前記データ選択部の処理、前記サブ分類器構築部の処理、および、前記サブ分類器制御部の処理を所定回数だけ繰り返させる繰返制御部とを備え、前記繰返制御部により繰り返される前記データ選択部の処理において、各クラスを前記教示結果とする誤分類画像の数が確認され、所定数以上の誤分類画像が存在するクラスに関して前記所定数以上の誤分類画像のみが前記選択画像群に含められ、前記所定数以上の誤分類画像が存在しないクラスに関して、前記クラスを前記教示結果とし、かつ、誤分類画像ではない教師画像が前記選択画像群に含められる。
請求項に記載の発明は、請求項に記載の画像分類装置であって、前記サブ分類器制御部が、前記サブ分類器のクラス毎の正答率を算出し、前記分類制御部が、前記複数の分類結果を用いて、各サブ分類器の前記クラス毎の正答率に基づく重み付け投票を行うことにより、前記対象画像のクラスを決定する。
請求項に記載の発明は、請求項4または5に記載の画像分類装置であって、前記複数のサブ分類器が、互いに異なる学習アルゴリズムにより構築される2つのサブ分類器を含む。
本発明によれば、サブ分類器の構築において様々な種類の学習アルゴリズムを利用可能としつつ、分類性能を向上することができる。
検査・分類装置の概略構成を示す図である。 コンピュータの構成を示す図である。 検査・分類装置の機能構成を示すブロック図である。 複数のサブ分類器の構築の流れを示す図である。 欠陥画像の分類の流れを示す図である。 分類部の性能評価結果を示す図である。 サブ分類器のクラス毎の正答率を示す図である。 サブ分類器のクラス毎の重みを示す図である。 第1比較例の分類部の性能評価結果を示す図である。 第2比較例の分類部の性能評価結果を示す図である。
図1は本発明の一の実施の形態に係る検査・分類装置1の概略構成を示す図である。検査・分類装置1では、半導体基板9(以下、単に「基板9」という。)上のパターンの欠陥を示す欠陥画像が取得され、当該欠陥画像の分類が行われる。欠陥画像の分類により、分類対象である当該欠陥が分類される。
検査・分類装置1は、撮像装置2、欠陥検出部41、および、コンピュータ5を備える。撮像装置2は、基板9上の検査対象領域を撮像する。欠陥検出部41は、検査対象領域の画像データを処理しつつ欠陥を検出する。コンピュータ5は、欠陥検出部41において欠陥が検出された場合に欠陥が属すべき欠陥クラスへと欠陥を分類する。コンピュータ5は、検査・分類装置1の全体動作の制御、および、欠陥の分類に利用される分類器の構築も行う。撮像装置2は基板9の製造ラインに組み込まれ、検査・分類装置1はいわゆるインライン型のシステムとなっている。検査・分類装置1は、欠陥検査装置に自動欠陥分類の機能を付加した装置と捉えることもできる。
撮像装置2は、撮像部21、基板9を保持するステージ22、および、撮像部21に対してステージ22を相対的に移動するステージ駆動部23を有する。撮像部21は、基板9上の検査対象領域を撮像して多値の撮像画像(のデータ)を取得する。撮像部21は、照明光を出射する照明部211、光学系212、および、撮像デバイス213を有する。光学系212は基板9に照明光を導き、基板9からの光は光学系212に入射する。撮像デバイス213は、光学系212により結像された基板9の像を電気信号に変換する。ステージ駆動部23はボールねじ、ガイドレール、モータ等により構成される。コンピュータ5がステージ駆動部23および撮像部21を制御することにより、基板9上の検査対象領域が撮像される。
欠陥検出部41では、基板9の撮像画像と、当該撮像画像と同じ領域(正常な領域)を示す参照画像とを比較することにより差分画像(典型的には、両画像の差の絶対値を示す画像)が得られ、当該差分画像に基づいて、異常部分である欠陥が検出される。そして、欠陥部分の多値画像である欠陥画像が生成される。欠陥検出部41では、他の手法により欠陥が検出されてよい。
図2はコンピュータ5の構成を示す図である。コンピュータ5は各種演算処理を行うCPU51、基本プログラムを記憶するROM52、および、各種情報を記憶するRAM53を含む一般的なコンピュータシステムの構成となっている。コンピュータ5は、情報記憶を行う固定ディスク54、画像等の各種情報の表示を行うディスプレイ55、ユーザからの入力を受け付けるキーボード56aおよびマウス56b(以下、「入力部56」と総称する。)、光ディスク、磁気ディスク、光磁気ディスク等のコンピュータ読み取り可能な記録媒体8から情報の読み取りを行う読取装置57、並びに、検査・分類装置1の他の構成との間で信号を送受信する通信部58をさらに含む。
コンピュータ5には、事前に読取装置57を介して記録媒体8からプログラム80が読み出され、固定ディスク54に記憶される。そして、CPU51によりRAM53および固定ディスク54を利用しつつプログラム80に従って演算処理が実行される。
図3は検査・分類装置1における機能構成を示すブロック図であり、図3では、コンピュータ5のCPU51、ROM52、RAM53、固定ディスク54等により実現される機能構成を、符号5を付す破線の矩形にて囲んでいる。
コンピュータ5は、分類部32および分類器構築部33を有する。分類部32および分類器構築部33により、画像を分類する画像分類装置が実現される。分類部32は、欠陥が検出された場合に当該欠陥を自動的に分類する。分類部32は、対象画像記憶部321および分類制御部322を有し、分類制御部322は、特徴量算出部323および複数のサブ分類器324を有する。分類器構築部33は、分類部32における複数のサブ分類器324を構築する。分類器構築部33は、教師データ記憶部331、データ選択部332、サブ分類器構築部333、サブ分類器制御部334および繰返制御部335を有する。これらの構成が実現する機能の詳細については後述する。なお、これらの機能は専用の電気回路により構築されてもよく、部分的に専用の電気回路が利用されてもよい。
検査・分類装置1では、事前準備として、複数のサブ分類器324が分類器構築部33により構築される。図4は、分類器構築部33による複数のサブ分類器324の構築の流れを示す図である。サブ分類器の構築とは、サブ分類器が含むパラメータに値を付与したり、構造を決定すること等によりサブ分類器を生成することを意味する。
サブ分類器324の構築の際には、欠陥検出部41にて検出された多数の欠陥画像が、教師データ記憶部331に記憶される。続いて、各欠陥画像が示す欠陥に対して、ユーザにより、欠陥のクラスの教示(入力)が行われる。クラスの教示では、まず、複数の欠陥画像が、コンピュータ5のディスプレイ55に表示される。そして、ユーザにより、各欠陥画像が複数のクラスのいずれかに割り振られ、当該クラスの入力が入力部56を介して行われる。各欠陥画像に対するクラスの教示結果と、当該欠陥画像(すなわち、クラスの教示が行われた欠陥画像であり、以下、「教師画像」という。)とは互いに関連付けられ、教師データセット81として教師データ記憶部331に記憶される。このようにして、それぞれが一の教師画像と、当該教師画像に割り振られたクラスを教示結果として示す情報とを含む複数の教師データセット81が準備される(ステップS11)。
本処理例では、複数のクラスに対して互いに異なる番号が付与される。以下の説明では、ステップS11の処理によりN個(Nは2以上の整数であり、例えば、1000以上である。)の教師データセット81が準備されるものとする。なお、各教師画像から取得される後述の特徴量ベクトルと、教示結果(の情報)とを含むデータが教師データセット81として扱われてもよい。この場合も、実質的に、教師データセット81が、教師画像と教示結果とを含むと捉えられる。
続いて、データ選択部332により、複数の(N個の)教師データセット81から学習用の教師データセット群が選択される(ステップS12)。学習用の教師データセット群は、後述の処理にてサブ分類器324の構築に用いられる教師データセット81の集合である。ここでは、全ての教師データセット81が教師データセット群に含まれる。
教師データセット群が選択されると、サブ分類器構築部333により、サブ分類器324が構築される(ステップS13)。サブ分類器324の構築では、各教師データセット81に含まれる教師画像から、複数の特徴量が特徴量算出部323により取得される。複数の特徴量は、例えばP次元(Pは2以上の整数)の特徴量ベクトルx (P)(=(x,x,・・・,x)として表現される。そして、サブ分類器構築部333が、教師データセット群の全ての教師画像に対するクラスの教示結果、および、特徴量ベクトルを用いて、上記サブ分類器324を学習させることにより、複数のクラスのいずれかに画像を分類するサブ分類器324が構築される。サブ分類器324は、画像の特徴量ベクトルの入力により、複数のクラスのいずれかの番号を出力する。サブ分類器324を構築する方法(学習アルゴリズム)または機構としては、例えば、決定木法、線形判別分析、ニューラルネットワーク、サポートベクターマシン(SVM)、ロジスティック回帰等が採用可能である。
サブ分類器324が構築されると、サブ分類器制御部334の制御により、複数の(N個の)教師データセット81にそれぞれ含まれる複数の教師画像の分類が当該サブ分類器324を用いて行われ、各教師画像が複数のクラスのいずれかに分類される(ステップS14)。サブ分類器制御部334では、さらに、サブ分類器324の正答率が算出される(ステップS15)。このとき、サブ分類器324の正答率は、複数のクラスのそれぞれに対して個別に算出される。サブ分類器324による各クラスの正答率は、例えば、当該クラスを教示結果とする教師画像のうちサブ分類器324による分類結果が当該クラスとなる教師画像の個数である正答数を、当該クラスを教示結果とする教師画像の総数により割って得た値である。
続いて、繰返制御部335により、所定の設定数のサブ分類器324が構築されていないことが確認されると(ステップS16)、データ選択部332による新たな教師データセット群の選択が行われる(ステップS12)。ここで、教師データセット群の全ての教師データセット81にそれぞれ含まれる複数の教師画像の集合を「選択画像群」と呼ぶと、新たな教師データセット群の選択画像群は、ステップS11にて準備されたN個の教師画像の一部のみを含む。
詳細には、まず、データ選択部332では、直前のステップS14におけるサブ分類器324による分類結果が教示結果と相違する教師画像を誤分類画像として、各クラスを教示結果とする誤分類画像の数が確認される。続いて、所定の下限画像数以上の誤分類画像が存在するクラスに関して当該下限画像数以上の誤分類画像の全部が選択画像群に含められる。一方、当該クラスを教示結果とし、かつ、当該クラスを分類結果とする教師画像(以下、教示結果と分類結果とが一致する教師画像を「正分類画像」という。)については、選択画像群に含められない。すなわち、下限画像数以上の誤分類画像が存在するクラスについては、当該下限画像数以上の誤分類画像のみが選択画像群に含められる。下限画像数は、例えば1であり、2または3以上であってもよい。
また、下限画像数以上の誤分類画像が存在しないクラスについては、当該クラスを教示結果とし、かつ、誤分類画像ではない教師画像、すなわち、当該クラスの正分類画像のみが選択画像群に含められる。例えば、下限画像数が1である場合には、誤分類画像の数が0であるクラスに関して、当該クラスの正分類画像が選択画像群に含められる。当該クラスに関して選択画像群に含められる正分類画像の個数は任意に決定されてよく、例えば、1以上かつ下限画像数以下である。そして、選択画像群をそれぞれ含む複数の教師データセット81の集合が、新たな教師データセット群として選択される。原則として、選択画像群には重複した教師画像は含まれない。
新たな教師データセット群が選択されると、サブ分類器構築部333が当該教師データセット群を用いて学習を行うことにより、次のサブ分類器324が構築される(ステップS13)。2回目以降のステップS13では、N個の教師データセット81の一部のみを用いて、サブ分類器324が構築される。このとき、教師データセット群には、多くの誤分類画像の教師データセット81が含まれるため、直前のステップS13にて構築されたサブ分類器324とは特性が異なる(例えば、分類に係るパラメータの値が大きく異なる)サブ分類器324が構築される。その後、サブ分類器制御部334の制御により、N個の教師データセット81の教師画像が、当該サブ分類器324を用いて分類される(ステップS14)。また、当該サブ分類器324のクラス毎の正答率が算出される(ステップS15)。
上記ステップS12〜S15は、設定数のサブ分類器324が構築されるまで繰り返される(ステップS16)。i回目(iは1以上の整数)のステップS13により構築されるサブ分類器324をCと表現すると、iが設定数maxとなるまでiを1ずつインクリメントしつつ、C、C、・・・、Cmaxが取得される。以上のように、繰返制御部335が、新たな教師データセット群をデータ選択部332に選択させつつ、データ選択部332の処理、サブ分類器構築部333の処理、および、サブ分類器制御部334の処理(ステップS12〜S15)を所定回数だけ繰り返させることにより、設定数のサブ分類器324が取得される。設定数のサブ分類器324が取得されると(ステップS16)、図4の処理が終了する。
図5は、分類部32による欠陥画像の分類の流れを示す図である。既述のように、検査・分類装置1では、撮像装置2により基板9が撮像され、撮像画像が欠陥検出部41に入力される。欠陥検出部41では、検査対象領域の欠陥検査が行われ、欠陥が検出されると、欠陥部分の多値画像である欠陥画像が生成されて分類部32に出力される。当該欠陥画像は分類部32における分類対象(欠陥)を示す画像であるため、以下、「対象画像」という。対象画像は、その属するクラスが未知の画像である。分類部32では、対象画像のデータが、対象画像データ82として、対象画像記憶部321に記憶されて準備される(ステップS21)。
分類制御部322では、図4の処理により構築された複数(設定数)のサブ分類器324を用いて対象画像が分類され、対象画像に対する複数の分類結果が取得される(ステップS22)。具体的には、特徴量算出部323により、対象画像から特徴量ベクトル(例えばP次元の特徴量ベクトル)が取得される。各サブ分類器324では、対象画像の特徴量ベクトルの入力により、分類結果であるクラスの番号(複数のクラスのいずれかの番号)が予測値として出力される。ステップS22では、jの初期値を1として、jが設定数maxとなるまでjを1ずつインクリメントしつつ、サブ分類器であるCにより対象画像のクラスの予測値が出力され、設定数max個の予測値が取得される。
その後、複数のサブ分類器324による複数の分類結果(予測値)に基づいて対象画像の分類クラスが決定される(ステップS23)。対象画像の分類クラスの決定では、当該複数の分類結果を用いて、各サブ分類器324のクラス毎の正答率に基づく重み付け投票が、複数のクラスに対して行われる。例えば、複数のクラスに対して1ないしK(Kは2以上の整数)の番号をそれぞれ付与し、i回目のステップS13により取得されるサブ分類器324(以下、単に「i番目のサブ分類器324」という。)による番号k(kは1以上K以下の整数)のクラスの正答率をpikと表現する場合、分類制御部322では、正答率pikを正規化した値が、重みwikとして数1を用いて求められる。
(数1)
ik=pik/Σik
重みwikは、i番目のサブ分類器324が対象画像を番号kのクラスと予測(分類)した場合の重み(得票値または得点)であり、数1のように、番号kのクラスに関する全てのサブ分類器324の正答率の和により正答率pikを割ることにより得られる。重みは、数1以外の演算により求められてもよい。そして、番号kのクラスを分類結果とする全てのサブ分類器324(すなわち、kを予測値として出力する全てのサブ分類器324)の重みwikの和が、番号kのクラスに関する総得点Sとして求められる。
分類制御部322では、複数のクラスのうち総得点Sが最も高いクラスが特定される。そして、特定されたクラスの総得点Sが、例えば0.5以上である場合に、当該クラスが対象画像の分類クラス(すなわち、分類部32による分類結果)として決定される。当該クラスの総得点Sが0.5未満である場合には、対象画像は、いずれのクラスにも分類されず、分類不可と判定される。分類不可の判定は、総得点が1番目のクラスと2番目のクラスとの点差等に基づいて行われてもよい。以下の説明では、分類不可も一の分類クラスとして扱う。
図6は、図4の処理により構築された複数のサブ分類器324を含む分類部32の性能評価結果を示す図である。ここでは、分類部32にN個の教師画像を分類させ、分類結果をまとめたコンフュージョンマトリクス(混同行列)を、性能評価結果として示している。本性能評価が行われた分類部32は、6個のサブ分類器324を含む。
図6では、3種類の教示結果のクラスを行見出しに記し、分類不可を含む4種類の分類クラスを列見出しに記している。教示結果のクラスが「A」である複数の教師画像のうち、分類クラス「B」に属すると判定された教師画像の個数は、「A」の行と「B」の列との交差位置に示される。また、「Purity」の行と「Accuracy」の列との交差位置は、分類が行われた教師画像の総数のうち、教示結果のクラスと分類クラスとが一致した教師画像の個数の比率(総正答率)を示す。なお、図7および図8では、分類部32に含まれる各サブ分類器324のクラス毎の正答率pikおよび重みwikをそれぞれ示している。
次に、全ての教師データセットを用いて構築される1つのサブ分類器のみを含む第1比較例の分類部を想定する。また、5個の教師データセット群を所定の条件に従いつつ無作為に選択することにより5個のサブ分類器を構築し、第1比較例のサブ分類器と合わせて6個のサブ分類器を用いて多数決により分類を行う第2比較例の分類部を想定する。第2比較例における教師データセット群の選択の条件は、各クラスに関して、当該クラスを教示結果とする教師画像の総数のp倍(ただし、pは1未満)をおよそ保つ、すなわち、教師データセット群における各クラスの割合が、全ての教師データセットにおける当該クラスの割合とほぼ同じであることであり、教師データセットを重複して選択することは認められない。このような条件の下で構築される第2比較例の5個のサブ分類器では、その特性は、必ずしも互いに十分に異なるものとはならない。
図9および図10は、第1比較例の分類部および第2比較例の分類部の性能評価結果をそれぞれ示す図である。第1比較例の分類部による総正答率は、図9に示すように89.9%であり、第2比較例の分類部による総正答率は、図10に示すように89.5%である。これに対し、図3の分類部32による総正答率は、図6に示すように98.5%である。このように、分類部32では、第1および第2比較例よりも高い総正答率が得られている。
以上に説明したように、検査・分類装置1では、学習用の教師データセット群(選択画像群)を選択するデータ選択部332と、教師データセット群を用いてサブ分類器324を構築するサブ分類器構築部333と、サブ分類器324を用いて複数の教師画像を分類するサブ分類器制御部334とが設けられる。そして、繰返制御部335による繰返処理において、データ選択部332では、下限画像数以上の誤分類画像が存在するクラスに関して当該下限画像数以上の誤分類画像のみが選択画像群に含められ、下限画像数以上の誤分類画像が存在しないクラスに関して正分類画像が選択画像群に含められる。これにより、誤分類画像の教師データセット81が教師データセット群に優先的に含められ、直前に構築されたサブ分類器324とは特性(挙動)が異なるサブ分類器324が、当該教師データセット群を用いて構築される。その結果、多様な複数のサブ分類器324を取得することができ、当該複数のサブ分類器324による複数の分類結果に基づいて画像の分類を行う分類部32の分類性能(汎化能力を含む。)を向上することができる。
ここで、公知の学習方法であるアダブーストでは、弱分類器(サブ分類器)の構築において、重み付けされた教師画像が用いられるため、例えば、線形判別分析等の学習アルゴリズムを組み合わせることができない。すなわち、利用可能な学習アルゴリズムの種類が制限される。
これに対し、分類器構築部33における上記処理では、各サブ分類器324が誤って分類した誤分類画像が多く含まれるように、次のサブ分類器324に対する学習用の教師データセット群が選択される。そして、当該教師データセット群に含まれる、重み付けされていない複数の教師画像(換言すると、一定の重みの複数の教師画像)を用いて当該次のサブ分類器324が構築される。このように、教師画像(教師データセット81)に対する重み付けを行わない分類器構築部33では、サブ分類器324の構築において様々な種類の学習アルゴリズムを利用することが可能である。
また、分類器構築部33における上記処理では、サブ分類器制御部334により、各サブ分類器324のクラス毎の正答率が算出される。そして、対象画像の分類の際に、分類制御部322により、複数のサブ分類器324における複数の分類結果を用いて、クラス毎の正答率に基づく重み付け投票が行われる。これにより、対象画像の分類クラスをより精度よく決定することが実現される。
対象画像の分類では、複数のサブ分類器324における複数の分類結果の多数決により対象画像の分類クラスを決定することも可能である。この場合に、得票数が1番目のクラスの得票率や、2番目のクラスとの票数差等によっては、分類不可の判定が行われてもよい。対象画像の分類クラスの信頼性を向上するという観点では、各サブ分類器324のクラス毎の正答率を考慮することが好ましい。
上記処理例では、全てのサブ分類器324が同じ学習アルゴリズムにより構築されるが、例えば、サブ分類器構築部333によるサブ分類器324の構築毎に、複数種類の学習アルゴリズムから一の学習アルゴリズムが規則的に、または、不規則に選択され、多様な複数のサブ分類器324が取得されてもよい。この場合、分類部32における複数のサブ分類器324において、互いに異なる学習アルゴリズムにより構築される少なくとも2つのサブ分類器324が含まれる。このような分類部32においても、分類性能を向上することが可能となる。
上記検査・分類装置1では様々な変形が可能である。
n回目(nは2以上の整数)のステップS12にて選択される教師データセット群の選択画像群において、当該選択画像群の半数未満の正分類画像が含まれてもよい。この場合も、n回目のステップS13にて構築されるサブ分類器324の特性を、(n−1)回目のステップS13(直前のステップS13)にて構築されるサブ分類器324の特性とある程度相違させ、アンサンブル学習に係る複数のサブ分類器324(分類部32)による分類性能を向上することが可能である。以上のように、2回目以降のステップS12にて選択される教師データセット群の選択画像群は、複数の教師画像の一部を含み(典型的には、N個の教師画像の一部であり)、かつ、半分以上が誤分類画像であることが重要である。
対象画像は、半導体基板以外の基板の外観を示すものであってよい。当該基板として、ハードディスク基板等の薄膜デバイス、プラズマディスプレイや液晶ディスプレイ等の薄型ディスプレイに用いられるガラス基板、フォトマスク基板、フィルム基板、プリント配線基板等が例示される。
また、検査・分類装置1が、太陽電池パネルを撮像した欠陥画像を分類する用途に用いられてもよい。例えば、太陽電池パネルのEL(エレクトロ・ルミネッセンス)発光やPL(フォト・ルミネッセンス)発光を撮像して得られる画像や、レーザーテラヘルツエミッション顕微鏡(LTEM)を用いて得られる太陽電池パネルの画像において、参照画像が示す正常な領域とは異なる領域を含む部分を欠陥画像として扱って、検査・分類装置1において太陽電池パネルの欠陥が分類されてよい。さらに、欠陥画像は、電子線やX線等により撮像される画像であってもよい。このように、検査・分類装置1では、可視光により撮像される画像のみならず、広義の放射線により撮像される画像が分類される。
検査・分類装置1において、分類器構築部33、対象画像記憶部321および分類制御部322により実現される画像分類装置の機能は、撮像装置2および欠陥検出部41とは独立して用いられてよい。画像分類装置は、血液や培養液等の所定の液中の細胞を撮像した細胞画像を分類する用途に用いられてもよい。画像分類装置は、様々な分類対象を示す画像の分類に利用可能である。
上記実施の形態および各変形例における構成は、相互に矛盾しない限り適宜組み合わされてよい。
32 分類部
33 分類器構築部
81 教師データセット
82 対象画像データ
321 対象画像記憶部
322 分類制御部
324 サブ分類器
331 教師データ記憶部
332 データ選択部
333 サブ分類器構築部
334 サブ分類器制御部
335 繰返制御部
S11〜S16,S21〜S23 ステップ

Claims (6)

  1. 画像を分類する画像分類方法であって、
    a)複数の教師画像のそれぞれが複数のクラスのいずれかに割り振られており、それぞれが一の教師画像と、前記教師画像に割り振られたクラスを教示結果として示す情報とを含む複数の教師データセットを準備する工程と、
    b)前記複数の教師データセットから学習用の教師データセット群を選択する工程と、
    c)前記教師データセット群を用いて学習を行うことによりサブ分類器を構築する工程と、
    d)前記サブ分類器を用いて前記複数の教師画像を分類する工程と、
    e)前記サブ分類器による分類結果が前記教示結果と相違する教師画像を誤分類画像として、前記複数の教師画像の一部を含み、かつ、半分以上が誤分類画像である選択画像群をそれぞれ含む新たな教師データセット群を前記b)工程にて選択しつつ、前記b)ないしd)工程を所定回数だけ繰り返す工程と、
    f)分類対象の対象画像を準備する工程と、
    g)前記c)工程にて構築された複数のサブ分類器を用いて前記対象画像を分類する工程と、
    h)前記複数のサブ分類器による複数の分類結果に基づいて前記対象画像のクラスを決定する工程と、
    を備え
    前記e)工程により繰り返される前記b)工程おいて、各クラスを前記教示結果とする誤分類画像の数が確認され、所定数以上の誤分類画像が存在するクラスに関して前記所定数以上の誤分類画像のみが前記選択画像群に含められ、前記所定数以上の誤分類画像が存在しないクラスに関して、前記クラスを前記教示結果とし、かつ、誤分類画像ではない教師画像が前記選択画像群に含められることを特徴とする画像分類方法。
  2. 請求項1に記載の画像分類方法であって、
    前記d)工程において、前記サブ分類器のクラス毎の正答率が算出され、
    前記h)工程において、前記複数の分類結果を用いて、各サブ分類器の前記クラス毎の正答率に基づく重み付け投票が行われることにより、前記対象画像のクラスが決定されることを特徴とする画像分類方法。
  3. 請求項1または2に記載の画像分類方法であって、
    前記複数のサブ分類器が、互いに異なる学習アルゴリズムにより構築される2つのサブ分類器を含むことを特徴とする画像分類方法。
  4. 画像を分類する画像分類装置であって、
    複数のサブ分類器を構築する分類器構築部と、
    分類対象の対象画像を記憶する対象画像記憶部と、
    前記複数のサブ分類器を用いて前記対象画像を分類するとともに、前記複数のサブ分類器による複数の分類結果に基づいて前記対象画像のクラスを決定する分類制御部と、
    を備え、
    前記分類器構築部が、
    複数の教師画像のそれぞれが複数のクラスのいずれかに割り振られており、それぞれが一の教師画像と、前記教師画像に割り振られたクラスを教示結果として示す情報とを含む複数の教師データセットを記憶する教師データ記憶部と、
    前記複数の教師データセットから学習用の教師データセット群を選択するデータ選択部と、
    前記教師データセット群を用いて学習を行うことによりサブ分類器を構築するサブ分類器構築部と、
    前記サブ分類器を用いて前記複数の教師画像を分類するサブ分類器制御部と、
    前記サブ分類器による分類結果が前記教示結果と相違する教師画像を誤分類画像として、前記複数の教師画像の一部を含み、かつ、半分以上が誤分類画像である選択画像群をそれぞれ含む新たな教師データセット群を前記データ選択部に選択させつつ、前記データ選択部の処理、前記サブ分類器構築部の処理、および、前記サブ分類器制御部の処理を所定回数だけ繰り返させる繰返制御部と、
    を備え
    前記繰返制御部により繰り返される前記データ選択部の処理において、各クラスを前記教示結果とする誤分類画像の数が確認され、所定数以上の誤分類画像が存在するクラスに関して前記所定数以上の誤分類画像のみが前記選択画像群に含められ、前記所定数以上の誤分類画像が存在しないクラスに関して、前記クラスを前記教示結果とし、かつ、誤分類画像ではない教師画像が前記選択画像群に含められることを特徴とする画像分類装置。
  5. 請求項に記載の画像分類装置であって、
    前記サブ分類器制御部が、前記サブ分類器のクラス毎の正答率を算出し、
    前記分類制御部が、前記複数の分類結果を用いて、各サブ分類器の前記クラス毎の正答率に基づく重み付け投票を行うことにより、前記対象画像のクラスを決定することを特徴とする画像分類装置。
  6. 請求項4または5に記載の画像分類装置であって、
    前記複数のサブ分類器が、互いに異なる学習アルゴリズムにより構築される2つのサブ分類器を含むことを特徴とする画像分類装置。
JP2015241032A 2015-12-10 2015-12-10 画像分類方法および画像分類装置 Active JP6632124B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015241032A JP6632124B2 (ja) 2015-12-10 2015-12-10 画像分類方法および画像分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015241032A JP6632124B2 (ja) 2015-12-10 2015-12-10 画像分類方法および画像分類装置

Publications (2)

Publication Number Publication Date
JP2017107422A JP2017107422A (ja) 2017-06-15
JP6632124B2 true JP6632124B2 (ja) 2020-01-15

Family

ID=59059625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015241032A Active JP6632124B2 (ja) 2015-12-10 2015-12-10 画像分類方法および画像分類装置

Country Status (1)

Country Link
JP (1) JP6632124B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6960356B2 (ja) * 2018-02-28 2021-11-05 株式会社Screenホールディングス 教師データ作成支援方法および教師データ作成支援装置
KR102107847B1 (ko) * 2018-07-13 2020-05-15 클라우드브릭주식회사 웹 트래픽 학습을 위한 16진수 이미지 변환과 증분학습을 적용한 딥러닝 방법
KR102370910B1 (ko) * 2019-09-05 2022-03-08 고려대학교 산학협력단 딥러닝 기반 소수 샷 이미지 분류 장치 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4482796B2 (ja) * 2004-03-26 2010-06-16 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
JP5241606B2 (ja) * 2009-05-20 2013-07-17 キヤノン株式会社 オブジェクト識別装置及びオブジェクト識別方法
JP5707570B2 (ja) * 2010-03-16 2015-04-30 パナソニックIpマネジメント株式会社 物体識別装置、物体識別方法、及び、物体識別装置の学習方法

Also Published As

Publication number Publication date
JP2017107422A (ja) 2017-06-15

Similar Documents

Publication Publication Date Title
US11023806B2 (en) Learning apparatus, identifying apparatus, learning and identifying system, and recording medium
Jeong et al. Ood-maml: Meta-learning for few-shot out-of-distribution detection and classification
JP6472621B2 (ja) 分類器構築方法、画像分類方法および画像分類装置
KR102263397B1 (ko) 뉴럴 네트워크 학습에 이용될 오토 라벨링된 이미지 중에서 라벨 검수를 위한 샘플 이미지를 획득하는 방법 및 이를 이용한 샘플 이미지 획득 장치
JP6063756B2 (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
CN109784293B (zh) 多类目标对象检测方法、装置、电子设备、存储介质
JP6669453B2 (ja) 画像分類装置および画像分類方法
Chen et al. Confidence scoring using whitebox meta-models with linear classifier probes
JP2017062713A (ja) 識別器作成装置、識別器作成方法、およびプログラム
JP6584250B2 (ja) 画像分類方法、分類器の構成方法および画像分類装置
JP6113024B2 (ja) 分類器取得方法、欠陥分類方法、欠陥分類装置およびプログラム
KR20200095336A (ko) 고 정밀도로 이미지를 분석하기 위한 딥 러닝 네트워크를 사용하기 위해 트레이닝 이미지를 오토 라벨링하는 오토 라벨링 장치의 하이퍼파라미터를 최적화하는 방법 및 이를 이용한 최적화 장치
Oancea et al. Predicting students’ results in higher education using a neural network
JP2018045673A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP6401648B2 (ja) 欠陥分類装置および欠陥分類方法
WO2019053052A1 (en) METHOD FOR (RE-) TRAINING MACHINE LEARNING COMPONENT
JP6632124B2 (ja) 画像分類方法および画像分類装置
JP2017102906A (ja) 情報処理装置、情報処理方法及びプログラム
JP6763673B2 (ja) 教師データ作成支援装置、画像分類装置、教師データ作成支援方法および画像分類方法
US11373285B2 (en) Image generation device, image generation method, and image generation program
Bahat et al. Classification confidence estimation with test-time data-augmentation
Hadjadji et al. Multiple one-class classifier combination for multi-class classification
CN112597997A (zh) 感兴趣区域确定方法、图像内容识别方法及装置
JP2020052475A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
Zhang et al. An efficient deep learning framework of covid-19 ct scans using contrastive learning and ensemble strategy

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191209

R150 Certificate of patent or registration of utility model

Ref document number: 6632124

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250