WO2021090601A1

WO2021090601A1 - 分類装置および画像分類システム

Info

Publication number: WO2021090601A1
Application number: PCT/JP2020/036288
Authority: WO
Inventors: 辰彦坪井; 松村　淳一; 憲治大久保
Original assignee: 東レエンジニアリング株式会社
Priority date: 2019-11-07
Filing date: 2020-09-25
Publication date: 2021-05-14
Also published as: JP2021076994A; TW202125405A

Abstract

分類器の性能を向上させることが可能な分類装置を提供すること。　具体的には、この分類装置３０では、分類器学習手段３１ａは、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致しない場合、カテゴリが一致しない欠陥画像Ｐｄのカテゴリとして、分類実行手段３１ｂによって分類されたカテゴリが選択されたカテゴリ選択画像Ｐｄ３を教師データＤ１に含めた状態で、教師データＤ１１に基づいて分類器３２を再学習させるように構成されている。

Description

分類装置および画像分類システム

　この発明は、分類装置および画像分類システムに関する。

　従来、画像を複数のカテゴリのうちのいずれかに分類する分類器が知られている（たとえば、特許文献１参照）。

　上記特許文献１には、画像を複数のクラス（カテゴリ）のうちのいずれかに分類する分類器構築方法が開示されている。この分類器構築方法では、まず、ユーザにより予めクラスが教示された教師画像と、教師画像に基づく複数の特徴量軸毎の値を含む教師データが準備される。なお、画像は、基板上に形成された欠陥を含む画像である。次に、準備された教師データに基づいて、複数の特徴量軸毎に、特徴量軸の値が離散化された各区間における度数分布データ（出現頻度）が生成される。たとえば、特徴量軸は、欠陥の面積、周囲長、重心位置、モーメント量などである。また、度数分布データは、以下のように形成される。まず、特徴量軸の値の最大値および最小値を特定して、特徴量軸の値の分布範囲を取得する。そして、この分布範囲を、適当な個数の区間に分割（離散化）する。そして、離散化された各区間におけるクラス毎の度数（出現頻度）が求められる。

　次に、度数分布データに示される特徴量軸毎の各区間におけるクラス別の出現比率に基づいて、画像を分類する分類器（複数の弱分類器）が生成される。たとえば、ある１つの特徴量において、ある区間に属する画像が、あるクラスに属する確率が求められる。そして、弱分類器の各々は、対応する特徴量軸の値から度数分布データを参照することにより、特徴量軸の値が取得された画像が、特定のクラスに属するとした場合の妥当性（確信度）を示す評価値を、クラス評価値をして求める。

　次に、教師データを分類器で分類する。そして、分類器で分類された教師データのうち、クラスが誤分類された教師データについて、度数分布データが修正される。具体的には、クラスが誤分類された教師データが有する特徴量の値に対応する区間（度数分布データの区間）のクラスの度数を増加させる。そして、修正された度数分布データに基づいて、分類器を更新することにより、上記の誤分類された教師データは、更新された分類器によって正しいクラスに分類される可能性が高くなる。

特開２０１９－５７０２４号公報

　上記特許文献１に記載の分類器構築方法では、ユーザにより予めクラスが教示された教師画像と、教師画像に基づく複数の特徴量軸毎の値を含む教師データに基づいて、分類器が生成されている。ここで、教師画像のクラスは、ユーザにより教示されている一方、教師画像の数が比較的多い場合などでは、疲労などによりユーザの集中力が低下し、クラスの教示に誤りが生じる場合があると考えられる。この場合、誤って教示されたクラス（カテゴリ）に基づいて分類器が生成（評価）されるので、分類器の分類精度の向上が困難であるという問題点がある。

　この発明は、上記のような課題を解決するためになされたものであり、この発明の１つの目的は、分類器の性能を向上させることが可能な分類装置および画像分類システムを提供することである。

　上記目的を達成するために、この発明の第１の局面による分類装置は、未知の画像のカテゴリを分類する分類装置であって、ユーザにより予め複数のカテゴリのうちのいずれかに分類された複数の画像からなる教師データに基づいて機械学習を行うことにより、分類器を学習させる分類器学習手段と、学習された分類器に基づいて、複数の画像からなる評価用データを、複数のカテゴリのうちのいずれかに分類する分類実行手段と、を備え、分類器学習手段は、分類実行手段によって分類された評価用データの画像のカテゴリと、ユーザにより予め分類された画像のカテゴリとが一致しない場合、カテゴリが一致しない画像のカテゴリとして、分類実行手段によって分類されたカテゴリもしくはユーザが再判定したカテゴリが選択されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器を再学習させるように構成されている。

　この発明の第１の局面による分類装置では、上記のように、分類器学習手段は、分類実行手段によって分類された評価用データの画像のカテゴリと、ユーザにより予め分類された画像のカテゴリとが一致しない場合、カテゴリが一致しない画像のカテゴリとして、分類実行手段によって分類されたカテゴリもしくはユーザが再判定したカテゴリが選択されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器を再学習させるように構成されている。これにより、画像のカテゴリが、誤って分類されている場合でも、誤って分類された画像のカテゴリを、正しいカテゴリに変更することができる。そして、誤って分類されたカテゴリが正しいカテゴリに変更されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器が再学習されるので、分類器の性能を向上させることができる。

　上記第１の局面による分類装置において、好ましくは、カテゴリ選択画像のカテゴリは、分類実行手段によるカテゴリの分類の確かさの指標である分類推定確率に基づいて選択
されるように構成されている。このように構成すれば、比較的高い分類推定確率を有する画像のカテゴリを選択することによって、カテゴリが誤って選択されてしまうのを抑制することができる。また、比較的低い分類推定確率を有する画像のカテゴリを選択しないことによって、同様に、カテゴリが誤って選択されてしまうのを抑制することができる。

　この場合、好ましくは、分類推定確率は、複数の分類器によるカテゴリの分類結果の多数決の割合と、単一の分類器から出力される分類推定確率とのうちの少なくとも一方を含む。このように構成すれば、複数の分類器によるカテゴリの分類結果の多数決の割合（単一の分類器から出力される分類推定確率）は、一般的な学習アルゴリズムから出力される値であるので、これらの値に基づいて、容易に、カテゴリを選択することができる。

　上記カテゴリが分類推定確率に基づいて選択される分類装置において、好ましくは、分類実行手段によるカテゴリとユーザによるカテゴリとが一致しない画像に関する、分類実行手段によって分類された評価用データの画像のカテゴリと、ユーザにより予め分類された画像のカテゴリと、分類推定確率とを表示する表示部をさらに備える。このように構成すれば、分類実行手段によって分類された画像のカテゴリと、ユーザにより予め分類された画像のカテゴリとが一致しない場合があるか否かを、ユーザが容易に視認することがでる。

　この場合、好ましくは、分類実行手段によって分類された評価用データの画像のカテゴリと、ユーザにより予め分類された画像のカテゴリとが一致しない場合、表示部は、ユーザによるカテゴリの選択の入力を受け付けるように構成されており、分類器学習手段は、ユーザによってカテゴリが選択されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器を再学習させるように構成されている。このように構成すれば、ユーザは、表示部に表示された分類推定確率を確認しながら、画像のカテゴリを選択す
ることができる。すなわち、分類推定確率が、画像のカテゴリを選択するか否かの指標となるので、ユーザによるカテゴリの選択を容易化することができる。

　上記ユーザによるカテゴリの選択の入力を受け付ける分類装置において、好ましくは、分類実行手段によって分類された評価用データの画像のカテゴリと、ユーザにより予め分類された画像のカテゴリとが一致せず、さらに分類推定確率が所定の閾値以上の場合、表示部は、ユーザによるカテゴリの選択の入力を受け付けるように構成されており、分類器学習手段は、ユーザによってカテゴリが選択されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器を再学習させるように構成されている。このように構成すれば、分類推定確率が所定の閾値以上の場合のみ、ユーザによるカテゴリの選択の入力が受け付けられるので、カテゴリの選択を要しない場合、カテゴリの選択の入力を受け付ける制御を省略することができる。

　上記表示部を備える分類装置において、好ましくは、分類実行手段によって分類された評価用データの画像のカテゴリと、ユーザにより予め分類された画像のカテゴリとが一致しない場合、表示部は、カテゴリの自動選択を受け付けるように構成されており、分類器学習手段は、自動選択が受け付けられた場合、画像のカテゴリを自動で選択するとともに、カテゴリが自動で選択されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器を再学習させるように構成されている。このように構成すれば、ユーザによる（手動による）カテゴリの選択を行うことなく、カテゴリが自動で選択されるので、ユーザの手間を省くことができる。

　上記カテゴリの自動選択を受け付ける分類装置において、好ましくは、分類実行手段によって分類された評価用データの画像のカテゴリと、ユーザにより予め分類された画像のカテゴリとが一致せず、さらに分類推定確率が所定の閾値以上の場合、表示部は、カテゴリの自動選択を受け付けるように構成されており、分類器学習手段は、自動選択が受け付けられた場合、画像のカテゴリを自動で選択するとともに、カテゴリが自動で選択されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器を再学習させるように構成されている。このように構成すれば、分類推定確率が所定以上の場合のみ、カテゴリの自動選択が受け付けられるので、カテゴリの選択を要しない場合、カテゴリの選択の入力を受け付ける制御を省略することができる。

　上記第１の局面による分類装置において、好ましくは、評価用データは、教師データを含み、分類実行手段は、学習された分類器に基づいて、教師データに含まれる画像のカテゴリを分類するように構成されており、分類器学習手段は、カテゴリとして分類実行手段によって分類されたカテゴリが選択されたカテゴリ選択画像が含まれるように教師データを更新した状態で、教師データに基づいて分類器を再学習させるように構成されている。このように構成すれば、教師データに含まれる画像のカテゴリが誤分類されている場合でも、教師データが更新されるので、ユーザによるカテゴリの誤分類に起因して、分類器の性能が低下するのを抑制することができる。

　上記第１の局面による分類装置において、好ましくは、評価用データは、教師データと異なる画像を含み、分類実行手段は、学習された分類器に基づいて、教師データと異なる評価用データに含まれる画像のカテゴリを分類するように構成されており、分類器学習手段は、カテゴリとして分類実行手段によって分類されたカテゴリが選択されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器を再学習させるように構成されている。ここで、一旦生成された分類器の性能を向上させるために、教師データと異なる画像を含む評価用データのカテゴリを分類する場合がある。この場合においても、評価用データに含まれる画像のカテゴリは、予め、ユーザにより分類されている。そして、疲労などに起因して、ユーザは、誤ってカテゴリを分類してしまう場合がある。そこで、上記のように構成することによって、評価用データに含まれる画像のカテゴリが誤分類されている場合でも、カテゴリが選択（修正）されるので、分類器の性能を向上させることができる。

　この発明の第２の局面による画像分類システムは、画像を撮像するための撮像装置と、撮像部により撮像された、未知の画像のカテゴリを分類する分類装置とを備え、分類装置は、ユーザにより予め複数のカテゴリのうちのいずれかに分類された複数の画像からなる教師データに基づいて機械学習を行うことにより、分類器を学習させる分類器学習手段と、学習された分類器に基づいて、複数の画像からなる評価用データを、複数のカテゴリのうちのいずれかに分類する分類実行手段と、を含み、分類器学習手段は、分類実行手段によって分類された評価用データの画像のカテゴリと、ユーザにより予め分類された画像のカテゴリとが一致しない場合、カテゴリが一致しない画像のカテゴリとして、分類実行手段によって分類されたカテゴリもしくはユーザが再判定したカテゴリが選択されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器を再学習させるように構成されている。

　この発明の第２の局面による画像分類システムでは、上記のように、分類器学習手段は、分類実行手段によって分類された評価用データの画像のカテゴリと、ユーザにより予め分類された画像のカテゴリとが一致しない場合、カテゴリが一致しない画像のカテゴリとして、分類実行手段によって分類されたカテゴリもしくはユーザが再判定したカテゴリが選択されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器を再学習させるように構成されている。これにより、画像のカテゴリが、誤って分類されている場合でも、誤って分類された画像のカテゴリを、正しいカテゴリに変更することができる。そして、誤って分類されたカテゴリが正しいカテゴリに変更されたカテゴリ選択画像を教師データに含めた状態で、教師データに基づいて分類器が再学習されるので、分類器の性能を向上させることが可能な画像分類システムを提供することができる。

　本発明によれば、上記のように、分類器の性能を向上させることができる。

画像分類システムを説明するためのブロックである。半導体基板を撮像した画像を示す図である。分類装置を説明するためのブロックである。教師データを説明するための図である。評価用データを説明するための図である。分類装置の表示部の画面を示す図である。更新後の教師データを説明するための図（１）である。更新後の教師データを説明するための図（２）である。更新後の評価用データを説明するための図である。撮像装置および検査装置側の動作を説明するためのフロー図である。分類器の学習（生成）を説明するためのフロー図である。第１評価用データによる分類器の性能を評価するためのフローを説明するためのフロー図（手動フィードバックの場合）である。第１評価用データによる分類器の性能を評価するためのフローを説明するためのフロー図（自動フィードバックの場合）である。第２評価用データによる分類器の性能を評価するためのフローを説明するためのフロー図（手動フィードバックの場合）である。変形例によるカテゴリの再判定を説明するための図（１）である。変形例によるカテゴリの再判定を説明するための図（２）である。

　以下、本発明を具体化した実施形態を図面に基づいて説明する。

　［本実施形態］
　図１～図１４を参照して、本実施形態による画像分類システム１００（分類装置３０）の構成について説明する。

　図１に示すように、画像分類システム１００は、撮像装置１０を備えている。撮像装置１０は、照明部１１と、光学系１２と、撮像部１３とを含む。照明部１１から出射された光は、光学系１２を介して、半導体基板２００に照射される。そして、撮像部１３は、半導体基板２００によって反射された光を撮像する。これにより、半導体基板２００の表面が撮像される。

　また、撮像装置１０は、ステージ１４と、ステージ駆動部１５とを含む。半導体基板２００は、ステージ１４の表面上に載置されている。ステージ駆動部１５は、半導体基板２００が載置されたステージ１４を、水平面内において移動させる。そして、ステージ駆動部１５によってステージ１４が移動されることにより、撮像部１３によって、半導体基板２００の表面の所望の領域が撮像される。

　また、画像分類システム１００は、検査装置２０を備えている。また、検査装置２０は、欠陥検出部２１を含む。欠陥検出部２１は、撮像部１３によって撮像された半導体基板２００の画像Ｐｓ（図２参照）から、欠陥ｄ（後述する黒欠陥ｄｂ、および、白欠陥ｄｗ）を検出する。たとえば、検査装置２０は、撮像部１３によって撮像された半導体基板２００の画像Ｐｓのある領域の画像（以下、検査対象領域画像という）と、この検査対象領域画像に対応する、欠陥ｄを含まない半導体基板２００の画像（参照画像、図示せず）との差分画像を取得する。そして、取得された差分画像に基づいて、欠陥ｄが検出される。なお、欠陥ｄとは、半導体基板２００上の欠損、突起、異物などである。

　また、画像分類システム１００は、分類装置３０を備えている。分類装置３０は、未知の欠陥画像Ｐｄ（図４など参照）のカテゴリを分類するように構成されている。なお、本実施形態では、欠陥画像Ｐｄは、半導体基板２００の欠陥画像Ｐｄを含み、複数のカテゴリは、半導体基板２００に含まれる複数の欠陥ｄの種類を含む。なお、欠陥画像Ｐｄは、特許請求の範囲の「画像」の一例である。以下、具体的に説明する。

　分類装置３０は、コンピュータにより構成されている。図３に示すように、分類装置３０（コンピュータ）は、ＣＰＵなどの制御部３１を含む。そして、分類装置３０（制御部３１）は、分類器学習手段３１ａを備えている。分類器学習手段３１ａは、ユーザにより予め複数のカテゴリのうちのいずれかに分類された複数の欠陥画像Ｐｄからなる教師データＤ１（図４参照）に基づいて機械学習を行うことにより、分類器３２を学習させるように構成されている。

　具体的には、図４に示すように、欠陥ｄが撮像されている複数の欠陥画像Ｐｄが準備される。たとえば、欠陥ｄは、黒欠陥ｄｂと白欠陥ｄｗとを含む。そして、ユーザは、人手によって、複数の欠陥画像Ｐｄのカテゴリを、黒欠陥ｄｂと白欠陥ｄｗとに分類する。そして、黒欠陥ｄｂと白欠陥ｄｗとに分類された複数の欠陥画像Ｐｄが、教師データＤ１とされる。なお、欠陥画像Ｐｄの枚数が多い場合、ユーザの疲労などに起因して、ユーザは、カテゴリを誤って分類してしまう場合がある。図４では、黒欠陥ｄｂの欠陥画像Ｐｄ１が、白欠陥ｄｗのカテゴリに分類され、白欠陥ｄｗの欠陥画像Ｐｄ２が、黒欠陥ｄｂのカテゴリに分類されている。なお、黒欠陥ｄｂおよび白欠陥ｄｗは、特許請求の範囲の「欠陥」の一例である。

　そして、分類器学習手段３１ａは、図４に示される複数の欠陥画像Ｐｄを含む教師データＤ１に基づいて機械学習を行う。なお、機械学習（教師あり機械学習アルゴリズム）として、たとえば、線形判別法、サポートベクターマシン、ニューラルネットワーク、ディープラーニング、および、決定木などが用いられる。また、機械学習では、複数の欠陥画像Ｐｄの各々のカテゴリ（黒欠陥ｄｂ、または、白欠陥ｄｗ）と、複数の欠陥画像Ｐｄの各々が有する特徴量とに基づいて、学習が行われる。特徴量は、たとえば、欠陥画像Ｐｄにおける、最大の輝度、最小の輝度、輝度の範囲、および、欠陥画像Ｐｄの輝度を２値化した場合の面積比などである。

　また、図３に示すように、分類装置３０（制御部３１）は、分類実行手段３１ｂを備えている。分類実行手段３１ｂは、学習された分類器３２に基づいて、評価用データＤ２（図４および図５参照）を、複数のカテゴリのうちのいずれかに分類するように構成されている。なお、評価用データＤ２は、分類器３２の性能を評価するための、ユーザにより予め複数のカテゴリのうちのいずれかに分類された複数の欠陥画像Ｐｄからなる。

　また、本実施形態では、図４に示すように、評価用データＤ２は、教師データＤ１を含んでいる。以下では、教師データＤ１から構成される評価用データＤ２を、第１評価用データＤ２１とする。具体的には、第１評価用データＤ２１は、教師データＤ１そのものである。そして、分類実行手段３１ｂは、学習された分類器３２に基づいて、第１評価用データＤ２１（教師データＤ１）に含まれる欠陥画像Ｐｄのカテゴリを分類するように構成されている。

　また、本実施形態では、図５に示すように、評価用データＤ２は、教師データＤ１と異なる欠陥画像Ｐｄを含んでいる。以下では、教師データＤ１と異なる欠陥画像Ｐｄから構成される評価用データＤ２を、第２評価用データＤ２２とする。そして、分類実行手段３１ｂは、学習された分類器３２に基づいて、教師データＤ１と異なる第２評価用データＤ２２に含まれる欠陥画像Ｐｄのカテゴリを分類するように構成されている。

　そして、本実施形態では、分類器学習手段３１ａは、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致しない場合、カテゴリが一致しない欠陥画像Ｐｄのカテゴリとして、分類実行手段３１ｂによって分類されたカテゴリが選択された欠陥画像Ｐｄ（以下、カテゴリ選択画像Ｐｄ３という）を教師データＤ１に含めた状態（図７および図８参照）で、教師データ（更新された教師データＤ１１およびＤ１２）に基づいて分類器３２を再学習させるように構成されている。以下では、ユーザにより予め欠陥画像Ｐｄのカテゴリを分類することを、ＭＤＣ（Ｍａｎｕａｌ　Ｄｅｆｅｃｔ　Ｃｌａｓｓｉｆｉｃａｔｉｏｎ）という。また、分類実行手段３１ｂによって欠陥画像Ｐｄのカテゴリを分類することを、ＡＤＣ（Ａｕｔｏｍａｔｉｃ　Ｄｅｆｅｃｔ　Ｃｌａｓｓｉｆｉｃａｔｉｏｎ）という。また、本実施形態では、カテゴリ選択画像Ｐｄ３は、分類実行手段３１ｂによって分類されたカテゴリに変更されている。

　具体的には、本実施形態では、カテゴリ選択画像Ｐｄ３のカテゴリは、分類実行手段３１ｂによるカテゴリの分類の確かさの指標である分類推定確率に基づいて選択される。なお、分類推定確率は、複数の分類器３２によるカテゴリの分類結果の多数決の割合と、単一の分類器３２から出力される分類推定確率とのうちの少なくとも一方を含む。詳細には、機械学習のアルゴリズムが決定木などの場合、分類推定確率は、複数の分類器３２（決定木）によるカテゴリの分類結果の多数決の割合である。たとえば、黒欠陥ｄｂと分類された場合の分類推定確率は、（黒欠陥ｄｂとして分類した分類器３２の数）／（全ての分類器３２の数）×１００として算出される。また、機械学習のアルゴリズムがサポートベクターマシンなどの場合、サポートベクターマシンにより学習された分類器３２から、分類推定確率が出力される。以下、欠陥画像Ｐｄのカテゴリの選択について具体的に説明する。

　本実施形態では、図１に示すように、分類装置３０は、表示部３３を備えている。図６に示すように、表示部３３は、分類実行手段３１ｂによるカテゴリとユーザによるカテゴリとが一致しない欠陥画像Ｐｄに関する、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリと、分類推定確率とを表示する。たとえば、図６では、ＡＤＣとＭＤＣとが一致しない、Ｎｏ．１～Ｎｏ．３の欠陥画像Ｐｄのカテゴリと、分類推定確率とが表示されている。また、図６では、Ｎｏ．１の欠陥画像Ｐｄが選択（ハイライト）されている。たとえば、Ｎｏ．１の欠陥画像Ｐｄでは、ＭＤＣでは、黒欠陥ｄｂと分類されている一方、ＡＤＣでは、白欠陥ｄｗとして分類されている。また、分類推定確率は、９０％である。

　そして、本実施形態では、図６に示すように、分類実行手段３１ｂによって分類された評価用データＤ２（第１評価用データＤ２１、第２評価用データＤ２２）の欠陥画像Ｐｄのカテゴリ（ＡＤＣ）と、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリ（ＭＤＣ）とが一致しない場合、表示部３３は、ユーザによるカテゴリの選択の入力を受け付けるように構成されている。具体的には、分類実行手段３１ｂによって分類された評価用データＤ２（第１評価用データＤ２１、第２評価用データＤ２２）の欠陥画像Ｐｄのカテゴリ（ＡＤＣ）と、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリ（ＭＤＣ）とが一致せず、さらに分類推定確率が所定の閾値以上の場合、表示部３３は、ユーザによるカテゴリの選択の入力を受け付けるように構成されている。

　たとえば、表示部３３に表示された画面３３ａにおいて、マウスなどにより、「手動フィードバック」（〇印）が選択される。また、画面３３ａには、欠陥画像Ｐｄ（たとえば、Ｎｏ．１の欠陥画像Ｐｄ）も表示される。ユーザは、表示された欠陥画像Ｐｄを見ながら、かつ、表示された分類推定確率を参照しながら、欠陥画像Ｐｄのカテゴリが、黒欠陥ｄｂか白欠陥ｄｗかを判定する。そして、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリ（ＭＤＣ）が誤っていると判定した場合、画面３３ａの「再判定」の「カテゴリ」を選択（たとえば、白欠陥ｄｗを選択）するとともに、「更新」のボタンを押す。これにより、Ｎｏ．１の欠陥画像ＰｄのＭＤＣのカテゴリが、白欠陥ｄｗに変更される。

　また、表示部３３の画面３３ａには、「学習ファイル名」（分類器３２の名前）と、「再学習」のボタンと、「別名で再学習」のボタンとが表示されている。そして、ユーザが「再学習」のボタン、または、「別名で再学習」のボタンを押下することにより、分類器３２が再学習される。なお、ユーザが「再学習」のボタンを押下した場合、再学習された分類器３２が、再学習前の分類器３２（ファイル）に書き換えられる。また、ユーザが「別名で再学習」のボタンを押下した場合、再学習された分類器３２が、新たな分類器３２（ファイル）として生成される。

　そして、本実施形態では、分類器学習手段３１ａは、ユーザによってカテゴリが選択されたカテゴリ選択画像Ｐｄ３を教師データＤ１に含めた状態で、教師データ（教師データＤ１１または教師データＤ１２）に基づいて分類器３２を再学習させるように構成されている。ここで、評価用データＤ２が第１評価用データＤ２１である場合、分類器学習手段３１ａは、カテゴリとして分類実行手段３１ｂによって分類されたカテゴリが選択されたカテゴリ選択画像Ｐｄ３が含まれるように教師データＤ１を更新した状態で、教師データ（更新された教師データＤ１１、図７参照）に基づいて分類器３２を再学習させるように構成されている。具体的には、教師データＤ１に含まれる複数の欠陥画像Ｐｄのうち、ＭＤＣとＡＤＣとが一致しない欠陥画像Ｐｄのカテゴリが変更されるよう、教師データＤ１が更新される。そして、更新された教師データＤ１（教師データＤ１１）に基づいて、分類器３２が再学習される。

　また、本実施形態では、評価用データＤ２が第２評価用データＤ２２である場合、分類器学習手段３１ａは、カテゴリとして分類実行手段３１ｂによって分類されたカテゴリが選択されたカテゴリ選択画像Ｐｄ３を教師データＤ１に含めた状態で、教師データ（更新された教師データＤ１２、図８参照）に基づいて分類器３２を再学習させるように構成されている。具体的には、ＭＤＣとＡＤＣとが一致しないカテゴリが変更された欠陥画像Ｐｄ（カテゴリ選択画像Ｐｄ３）が、教師データＤ１（または、更新された教師データＤ１１）に加えられる。そして、カテゴリ選択画像Ｐｄ３が加えられた教師データＤ１２に基づいて、分類器３２が再学習される。また、第２評価用データＤ２２において、カテゴリが分類実行手段３１ｂによって分類されたカテゴリに変更されるように（カテゴリ選択画像Ｐｄ３が含まれるように）、第２評価用データＤ２２が更新（第２評価用データＤ２３、図９参照）される。

　また、本実施形態では、図６に示すように、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致しない場合、表示部３３は、カテゴリの自動選択を受け付けるように構成されている。具体的には、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致せず、さらに分類推定確率が所定の閾値以上の場合、表示部３３は、カテゴリの自動選択を受け付けるように構成されている。

　たとえば、表示部３３に表示された画面３３ａにおいて、マウスなどにより、「自動フィードバック」（〇印）が選択される。また、画面３３ａは、ＡＤＣを正解（正しいカテゴリ）とする分類推定確率が入力可能に構成されている。たとえば、分類推定確率「８５％」が入力される。

　そして、本実施形態では、分類器学習手段３１ａは、自動選択が受け付けられた場合、欠陥画像Ｐｄのカテゴリを自動で選択するとともに、カテゴリが自動で選択されたカテゴリ選択画像Ｐｄ３を教師データＤ１に含めた状態で、教師データＤ１に基づいて分類器３２を再学習させるように構成されている。図６に示す例では、分類推定確率が８５％以上の欠陥画像Ｐｄのカテゴリは、ＡＤＣにより分類されたカテゴリに自動的に変更される。つまり、Ｎｏ．１～Ｎｏ．３の欠陥画像Ｐｄの全てのカテゴリが、ＡＤＣにより分類されたカテゴリに自動的に変更される。なお、ＡＤＣを正解とする分類推定確率は、特許請求の範囲の「所定の閾値」の一例である。ここで、上記の「手動フィードバック」と同様に、評価用データＤ２が第１評価用データＤ２１である場合、更新された教師データＤ１１（図７参照）に基づいて、分類器３２が再学習される。また、評価用データＤ２が第２評価用データＤ２２である場合、カテゴリ選択画像Ｐｄ３が加えられた教師データＤ１２（図８参照）に基づいて、分類器３２が再学習される。また、上記の「手動フィードバック」と同様に、ユーザが「再学習」のボタン、または、「別名で再学習」のボタンを押下することにより、分類器３２が再学習される。

　次に、分類器３２の再学習の手順について説明する。

　まず、図１０を参照して、撮像装置１０および検査装置２０側の動作について説明する。図１０に示すように、ステップＳ１において、撮像装置１０によって、半導体基板２００の表面が撮像される。撮像装置１０によって撮像された画像Ｐｓは、検査装置２０に送信される。

　次に、ステップＳ２において、検査装置２０（欠陥検出部２１）によって、半導体基板２００の画像Ｐｓから、欠陥ｄを含む欠陥画像Ｐｄが検出される。そして、検出された欠陥画像Ｐｄは、検査装置２０に設けられる記憶部２２に保存される。

　次に、図１１を参照して、分類装置３０側の動作について説明する。図１１に示すように、ステップＳ１１において、検査装置２０に保存されている複数の欠陥画像Ｐｄから、所望の欠陥画像Ｐｄが複数選定される。なお、所望の欠陥画像Ｐｄの選定は、たとえば、ユーザによって行われる。

　次に、ステップＳ１２において、選択された複数の欠陥画像Ｐｄの各々について、ユーザにより欠陥ｄのカテゴリが分類（ＭＤＣ）される。たとえば、表示部３３に欠陥画像Ｐｄが表示されるとともに、欠陥画像Ｐｄのカテゴリ（黒欠陥ｄｂまたは白欠陥ｄｗ）の入力が受け付けられる。

　次に、ステップＳ１３において、選択された複数の欠陥画像Ｐｄの各々について、特徴量（最大の輝度、最小の輝度、輝度の範囲など）が算出される。

　次に、ステップＳ１４において、カテゴリおよび特徴量が対応付けられた複数の欠陥画像Ｐｄが、教師データＤ１としてまとめられる。そして、カテゴリおよび特徴量が対応付けられた複数の欠陥画像Ｐｄが、たとえば、記憶部３４の１つのフォルダに保存される。　

　次に、ステップＳ１５において、分類器学習手段３１ａによって、教師データＤ１に基づいて、分類器３２が学習（生成）される。

　次に、ステップＳ１６において、学習された分類器３２が記憶部３４に保存される。

　[第１評価用データに基づく、分類器の評価]
　(手動フィードバック)
　次に、図１２を参照して、第１評価用データＤ２１（教師データＤ１そのもの）に基づく、分類器３２の評価の手順について説明する。また、図１２では、「手動フィードバック」が選択されている場合について説明する。

　まず、ステップＳ２１において、分類実行手段３１ｂによって、分類器学習手段３１ａによって学習された分類器３２に基づいて、第１評価用データＤ２１（教師データＤ１そのもの）に含まれる欠陥画像Ｐｄの各々のカテゴリが分類される。すなわち、分類器３２を学習（生成）するために用いられた教師データＤ１に含まれる欠陥画像Ｐｄの各々のカテゴリが分類される。

　次に、ステップＳ２２において、分類結果の検証が行われる。具体的には、ステップＳ２２において、分類器３２の性能が十分（ＯＫ）か、否かが判定される。ステップＳ２２において、ｙｅｓの場合、分類器３２の評価の動作は終了する。ステップＳ２２において、ｎｏの場合、ステップＳ２３に進む。なお、分類器３２の性能は、正解率（Ａｃｃｕｒａｃｙ）、適合率（Ｐｒｅｃｉｓｉｏｎ）、再現率（Ｒｅｃａｌｌ）などによって判定される。なお、分類器３２の性能が十分か否かの判定は、ユーザが行ってもよいし、制御部３１が自動で行ってもよい。

　次に、ステップＳ２３において、分類実行手段３１ｂによって分類（ＡＤＣ）された第１評価用データＤ２１の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類（ＭＤＣ）された欠陥画像Ｐｄのカテゴリとが一致しない欠陥画像Ｐｄ、ＡＤＣによるカテゴリ、ＭＤＣによるカテゴリ、および、分類推定確率が、表示部３３に表示（図６参照）される。

　次に、ステップＳ２４において、分類実行手段３１ｂによって分類（ＡＤＣ）された第１評価用データＤ２１の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類（ＭＤＣ）された欠陥画像Ｐｄのカテゴリとが一致せず、さらに分類推定確率が所定の閾値（たとえば、８５％）以上の場合、表示部３３は、ユーザによるカテゴリの選択の入力を受け付ける。そして、表示部３３に表示された欠陥画像Ｐｄおよび分類推定確率に基づいて、ユーザが欠陥画像Ｐｄのカテゴリを選択する。

　次に、ステップＳ２５において、教師データＤ１が更新される。つまり、ＭＤＣとＡＤＣとが一致しない欠陥画像Ｐｄのカテゴリが変更されるよう、教師データＤ１が更新（教師データＤ１１、図７参照）される。

　次に、ステップＳ２６において、ユーザが、表示部３３の画面３３ａの「再学習」のボタン（または、「別名で再学習」のボタン）をマウスなどでクリックすることにより、再学習が受け付けられる。そして、ステップＳ２１に戻る。そして、ステップＳ２１～Ｓ２６の動作が、分類器３２の性能が十分であると判定されるまで繰り返される。

　(自動フィードバック)
　次に、図１３を参照して、評価用データＤ２として、第１評価用データＤ２１（教師データＤ１そのもの）が用いられるとともに、「自動フィードバック」が選択されている場合について説明する。

　なお、ステップＳ３１～ステップＳ３３の動作は、それぞれ、上記のステップＳ２１～ステップＳ２３の動作と同様である。

　次に、ステップＳ３４において、分類実行手段３１ｂによって分類（ＡＤＣ）された第１評価用データＤ２１の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類（ＭＤＣ）された欠陥画像Ｐｄのカテゴリとが一致せず、さらに分類推定確率が所定の閾値（たとえば、８５％）以上の場合、表示部３３は、カテゴリの自動選択を受け付ける。そして、分類器学習手段３１ａは、自動選択が受け付けられた場合、欠陥画像Ｐｄのカテゴリを自動で選択する。

　なお、ステップＳ３５およびステップＳ３６の動作は、それぞれ、ステップＳ２５およびステップＳ２６の動作と同様である。

　[第２評価用データに基づく分類器の評価]
　（手動フィードバック）
　次に、図１４を参照して、第２評価用データＤ２２に基づく、分類器３２の評価の手順について説明する。また、図１４では、「手動フィードバック」が選択されている場合について説明する。

　まず、上記のステップＳ１およびＳ２（図１０参照）と同様に、撮像装置１０による半導体基板２００の表面の撮像、検査装置２０（欠陥検出部２１）による欠陥画像Ｐｄの検出、および、欠陥画像Ｐｄの保存が行われる。なお、撮像装置１０によって撮像される半導体基板２００は、教師データＤ１を作成するために撮像（ステップＳ１）された半導体基板２００とは異なる基板（または、異なる部分）である。

　次に、図１４に示すように、ステップＳ４１～Ｓ４４では、それぞれ、上記のステップＳ１１～Ｓ１４と同様の動作が行われる。すなわち、保存された欠陥画像Ｐｄの選定、選定した欠陥画像ＰｄのＭＤＣ、特徴量の算出、および、ＭＤＣの欠陥画像Ｐｄを第２評価用データＤ２２としてまとめることが行われる。

　そして、ステップＳ４５において、分類実行手段３１ｂによって、分類器学習手段３１ａによって学習された分類器３２に基づいて、第２評価用データＤ２２に含まれる欠陥画像Ｐｄの各々のカテゴリが分類される。

　なお、ステップＳ４６～Ｓ４８の動作は、上記のステップＳ２２～Ｓ２４の動作と同様である。

　次に、ステップＳ４９において、教師データＤ１および第２評価用データＤ２２が更新される。つまり、分類実行手段３１ｂによって分類されたカテゴリに変更された欠陥画像Ｐｄ（カテゴリ選択画像Ｐｄ３という）が教師データＤ１に加えられるよう、教師データＤ１が更新されて、教師データＤ１２（図８参照）が生成される。また、第２評価用データＤ２２において、ＭＤＣとＡＤＣとが一致しない欠陥画像Ｐｄのカテゴリが変更されるよう、第２評価用データＤ２２が更新されて、第２評価用データＤ２３（図９参照）が生成される。

　次に、ステップＳ５０では、ユーザによってカテゴリが選択（変更）された欠陥画像Ｐｄが教師データＤ１に加えられた教師データＤ１２に基づいて、再学習が行われる。

　(自動フィードバック)
　「自動フィードバック」が選択されている場合では、ステップＳ４６以降において、上記のステップＳ３３～Ｓ３６と同様の動作が行われる。

　（本実施形態の効果）
　次に、本実施形態の効果について説明する。

　本実施形態では、上記のように、分類器学習手段３１ａは、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致しない場合、カテゴリが一致しない欠陥画像Ｐｄのカテゴリとして、分類実行手段３１ｂによって分類されたカテゴリが選択されたカテゴリ選択画像Ｐｄ３を教師データＤ１に含めた状態で、教師データＤ１に基づいて分類器３２を再学習させるように構成されている。これにより、欠陥画像Ｐｄのカテゴリが、誤って分類されている場合でも、誤って分類された欠陥画像Ｐｄのカテゴリを、正しいカテゴリに変更することができる。そして、誤って分類されたカテゴリが正しいカテゴリに変更されたカテゴリ選択画像Ｐｄ３を教師データＤ１に含めた状態で、教師データＤ１（教師データＤ１１および／または教師データＤ１２）に基づいて分類器３２が再学習されるので、分類器３２の性能を向上させることができる。

　また、本実施形態では、上記のように、カテゴリ選択画像Ｐｄ３のカテゴリは、分類実行手段３１ｂによるカテゴリの分類の確かさの指標である分類推定確率に基づいて選択されるように構成されている。これにより、比較的高い分類推定確率を有する欠陥画像Ｐｄのカテゴリを選択することによって、カテゴリが誤って選択されてしまうのを抑制することができる。また、比較的低い分類推定確率を有する欠陥画像Ｐｄのカテゴリを選択しないことによって、同様に、カテゴリが誤って選択されてしまうのを抑制することができる。

　また、本実施形態では、上記のように、分類推定確率は、複数の分類器３２によるカテゴリの分類結果の多数決の割合と、単一の分類器３２から出力される分類推定確率とのうちの少なくとも一方を含む。これにより、複数の分類器３２によるカテゴリの分類結果の多数決の割合（単一の分類器３２から出力される分類推定確率）は、一般的な学習アルゴリズムから出力される値であるので、これらの値に基づいて、容易に、カテゴリを選択することができる。

　また、本実施形態では、上記のように、分類実行手段３１ｂによるカテゴリとユーザによるカテゴリとが一致しない欠陥画像Ｐｄに関する、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリと、分類推定確率とを表示する表示部３３を設ける。これにより、分類実行手段３１ｂによって分類された欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致しない場合があるか否かを、ユーザが容易に視認することができる。

　また、本実施形態では、上記のように、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致しない場合、表示部３３は、ユーザによるカテゴリの選択の入力を受け付けるように構成されており、分類器学習手段３１ａは、ユーザによってカテゴリが選択されたカテゴリ選択画像Ｐｄ３を教師データＤ１に含めた状態で、教師データＤ１（教師データＤ１１および／または教師データＤ１２）に基づいて分類器３２を再学習させるように構成されている。これにより、ユーザは、表示部３３に表示された分類推定確率を確認しながら、欠陥画像Ｐｄのカテゴリを選択することができる。すなわち、分類推定確率が、欠陥画像Ｐｄのカテゴリを選択するか否かの指標となるので、ユーザによるカテゴリの選択を容易化することができる。

　また、本実施形態では、上記のように、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致せず、さらに分類推定確率が所定の閾値以上の場合、表示部３３は、ユーザによるカテゴリの選択の入力を受け付けるように構成されている。これにより、分類推定確率が所定の閾値以上の場合のみ、ユーザによるカテゴリの選択の入力が受け付けられるので、カテゴリの選択を要しない場合、カテゴリの選択の入力を受け付ける制御を省略することができる。

　また、本実施形態では、上記のように、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致しない場合、表示部３３は、カテゴリの自動選択を受け付けるように構成されており、分類器学習手段３１ａは、自動選択が受け付けられた場合、欠陥画像Ｐｄのカテゴリを自動で選択するとともに、カテゴリが自動で選択されたカテゴリ選択画像Ｐｄ３を教師データＤ１に含めた状態で、教師データＤ１（教師データＤ１１および／または教師データＤ１２）に基づいて分類器３２を再学習させるように構成されている。これにより、ユーザによる（手動による）カテゴリの選択を行うことなく、カテゴリが自動で選択されるので、ユーザの手間を省くことができる。

　また、本実施形態では、上記のように、表示部３３は、分類実行手段３１ｂによって分類された評価用データＤ２の欠陥画像Ｐｄのカテゴリと、ユーザにより予め分類された欠陥画像Ｐｄのカテゴリとが一致せず、さらに分類推定確率が所定の閾値以上の場合、カテゴリの自動選択を受け付けるように構成されている。これにより、分類推定確率が所定の閾値以上の場合のみ、カテゴリの自動選択が受け付けられるので、カテゴリの選択を要しない場合、カテゴリの選択の入力を受け付ける制御を省略することができる。

　また、本実施形態では、上記のように、評価用データＤ２は、教師データＤ１を含み、分類実行手段３１ｂは、学習された分類器３２に基づいて、教師データＤ１に含まれる欠陥画像Ｐｄのカテゴリを分類するように構成されており、分類器学習手段３１ａは、カテゴリとして分類実行手段３１ｂによって分類されたカテゴリが選択されたカテゴリ選択画像Ｐｄ３が含まれるように教師データＤ１を更新した状態で、教師データＤ１（教師データＤ１１）に基づいて分類器３２を再学習させるように構成されている。これにより、教師データＤ１に含まれる欠陥画像Ｐｄのカテゴリが誤分類されている場合でも、教師データＤ１が更新されるので、ユーザによるカテゴリの誤分類に起因して、分類器３２の性能が低下するのを抑制することができる。

　また、本実施形態では、上記のように、評価用データＤ２（第２評価用データＤ２２）は、教師データＤ１と異なる欠陥画像Ｐｄを含み、分類実行手段３１ｂは、学習された分類器３２に基づいて、教師データＤ１と異なる評価用データＤ２に含まれる欠陥画像Ｐｄのカテゴリを分類するように構成されており、分類器学習手段３１ａは、カテゴリとして分類実行手段３１ｂによって分類されたカテゴリが選択されたカテゴリ選択画像Ｐｄ３を教師データＤ１に含めた状態で、教師データＤ１（教師データＤ１２）に基づいて分類器３２を再学習させるように構成されている。ここで、一旦生成された分類器３２の性能を向上させるために、教師データＤ１と異なる欠陥画像Ｐｄを含む評価用データＤ２のカテゴリを分類する場合がある。この場合においても、評価用データＤ２に含まれる欠陥画像Ｐｄのカテゴリは、予め、ユーザにより分類されている。そして、疲労などに起因して、ユーザは、誤ってカテゴリを分類してしまう場合がある。そこで、上記のように構成することによって、評価用データＤ２（第２評価用データＤ２２）に含まれる欠陥画像Ｐｄのカテゴリが誤分類されている場合でも、カテゴリが選択（修正）されるので、分類器３２の性能を向上させることができる。

　［変形例］
　なお、今回開示された実施形態および実施例は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態および実施例の説明ではなく特許請求の範囲によって示され、さらに特許請求の範囲と均等の意味および範囲内でのすべての変更（変形例）が含まれる。

　たとえば、上記実施形態では、ＡＤＣによる画像のカテゴリと、ＭＤＣによるカテゴリとが一致しない場合、カテゴリが一致しない画像のカテゴリを、ＡＤＣによるカテゴリに変更する例を示したが、本発明はこれに限られない。たとえば、ＡＤＣによる画像のカテゴリと、ＭＤＣによるカテゴリとが一致しない場合、カテゴリが一致しない画像のカテゴリを、ユーザが再判定したカテゴリに変更してもよい。たとえば、カテゴリが３種類以上（Ａ、Ｂ、Ｃ、・・・）存在する場合に、最初のＭＤＣによるカテゴリがＡ、ＡＤＣによるカテゴリがＢの場合において、ユーザの再判定によってカテゴリをＣに変更してもよい。

　また、上記実施形態では、分類器が、半導体基板の欠陥の種類（カテゴリ）を分類するように構成されている例を示したが、本発明はこれに限られない。たとえば、分類器を、半導体基板の欠陥とは異なる対象（たとえば、細胞など）を分類するように構成してもよい。また、分類器を、半導体基板の欠陥の有無を分類するように構成してもよい。

　また、上記実施形態では、ＡＤＣによるカテゴリとＭＤＣによるカテゴリが一致しない場合、分類推定確率に基づいて、カテゴリが変更される例を示したが、本発明はこれに限られない。たとえば、ＡＤＣによるカテゴリとＭＤＣによるカテゴリが一致しない場合、全て、ＡＤＣによるカテゴリに変更してもよい。

　また、上記実施形態では、分類推定確率が所定の閾値以上の場合に、ＭＤＣによるカテゴリが、ＡＤＣによるカテゴリに変更される例を示したが、本発明はこれに限られない。たとえば、分類推定確率以外の指標に基づいて、ＭＤＣによるカテゴリをＡＤＣによるカテゴリに変更してもよい。

　また、上記実施形態では、ＡＤＣによる欠陥画像のカテゴリと、ＭＤＣによる欠陥画像のカテゴリとが一致せず、さらに分類推定確率が所定の閾値以上の場合、表示部が、ユーザによるカテゴリの選択（カテゴリの自動選択）の入力を受け付けるように構成されている例を示したが、本発明はこれに限られない。たとえば、分類推定確率が所定の閾値以上でない場合でも、表示部が、ユーザによるカテゴリの選択（カテゴリの自動選択）の入力を受け付けるように構成してもよい。

　また、上記実施形態では、評価用データが、第１評価用データ（教師データそのもの）と、第２評価用データ（教師データと異なるデータ）を含む例を示したが、本発明はこれに限られない。たとえば、評価用データが、第１評価用データと第２評価用データとのうちの一方のみを含んでいてもよい。また、評価用データに、教師データと、教師データと異なるデータとが混在していてもよい。

　また、上記実施形態では、ＡＤＣによる欠陥画像のカテゴリと、ＭＤＣによる欠陥画像のカテゴリとが一致しない場合、ＭＤＣによるカテゴリが、ＡＤＣによるカテゴリに変更される例を示したが、本発明はこれに限られない。本発明では、ＡＤＣによる欠陥画像のカテゴリと、ＭＤＣによる欠陥画像のカテゴリとが一致しない場合、ＡＤＣによる欠陥画像のカテゴリと、ＭＤＣによる欠陥画像のカテゴリとが一致しない画像（以下、不一致画像という）のカテゴリとして、ユーザが再判定することによりＭＤＣのカテゴリを選択してもよい。すなわち、教師データと評価用データとが異なる場合において、ＡＤＣによるカテゴリとＭＤＣによるカテゴリが一致せず、かつユーザの再判定（確認）によって、ＭＤＣが正解のときは、ＭＤＣによって再判定されたカテゴリを、この不一致画像のカテゴリとした状態で教師データに追加するとともに、再学習を行う。たとえば、以下の図１５の例では、ＡＤＣによるカテゴリが選択されたＮｏ．１の欠陥画像と、ＭＤＣによるカテゴリが選択されたＮｏ．４の欠陥画像とが、教師データに含められるとともに再学習が行われる。

　また、上記実施形態では、分類推定確率が所定の閾値（８５％）以上の場合に、ＭＤＣによるカテゴリがＡＤＣによるカテゴリに自動で変更される例を示したが、本発明はこれに限られない。たとえば、上記の所定の閾値とは異なる比較的低い閾値（２０％など）を下回る場合に、ＭＤＣによるカテゴリを変更せずに教師データに含めるとともに、再学習を行ってよい。これにより、カテゴリの自動選択（自動フィードバック）が受け付けられた際に、分類推定確率が比較的低い閾値未満のときに、ＭＤＣによるカテゴリを有する欠陥画像を再学習に追加することが可能になる。たとえば、ＡＤＣを正解とする分類推定確率の閾値を８５％、ＭＤＣを正解とする分類推定確率の閾値を２０％以下に設定にした場合、以下の図１６の例では、Ｎｏ．１、Ｎｏ．２、Ｎｏ．４およびＮｏ．５の欠陥画像が教師データに含められるともに再学習が行われる。

　１０　撮像装置
　３０　分類装置
　３１ａ　分類器学習手段
　３１ｂ　分類実行手段
　３２　分類器
　３３　表示部
　１００　画像分類システム
　２００　半導体基板
　ｄ　欠陥
　ｄｂ　黒欠陥（欠陥）
　ｄｗ　白欠陥（欠陥）
　Ｄ１、Ｄ１１、Ｄ１２　教師データ
　Ｄ２、Ｄ２１、Ｄ２２、Ｄ２３　評価用データ
　Ｐｄ　欠陥画像（画像）
　Ｐｄ３　カテゴリ選択画像

Claims

　未知の画像のカテゴリを分類する分類装置であって、
　ユーザにより予め複数のカテゴリのうちのいずれかに分類された複数の画像からなる教師データに基づいて機械学習を行うことにより、前記分類器を学習させる分類器学習手段と、
　前記学習された分類器に基づいて、複数の画像からなる評価用データを、前記複数のカテゴリのうちのいずれかに分類する分類実行手段と、を備え、
　前記分類器学習手段は、前記分類実行手段によって分類された前記評価用データの画像のカテゴリと、前記ユーザにより予め分類された画像のカテゴリとが一致しない場合、カテゴリが一致しない前記画像のカテゴリとして、前記分類実行手段によって分類されたカテゴリもしくはユーザが再判定したカテゴリが選択されたカテゴリ選択画像を前記教師データに含めた状態で、前記教師データに基づいて前記分類器を再学習させるように構成されており、
　前記カテゴリ選択画像の前記カテゴリは、前記分類実行手段による前記カテゴリの分類の確かさの指標である分類推定確率に基づいて選択されるように構成されており、
　前記分類実行手段によるカテゴリと前記ユーザによるカテゴリとが一致しない画像に関する、前記分類実行手段によって分類された前記評価用データの画像のカテゴリと、前記ユーザにより予め分類された画像のカテゴリと、前記分類推定確率とを表示する表示部をさらに備え、
　前記分類実行手段によって分類された前記評価用データの画像のカテゴリと、前記ユーザにより予め分類された画像のカテゴリとが一致しない場合、前記表示部は、前記カテゴリの自動選択を受け付けるように構成されており、
　前記分類器学習手段は、前記自動選択が受け付けられた場合、前記画像の前記カテゴリを自動で選択するとともに、前記カテゴリが自動で選択された前記カテゴリ選択画像を前記教師データに含めた状態で、前記教師データに基づいて前記分類器を再学習させるように構成されている、分類装置。
　前記分類推定確率は、複数の前記分類器による前記カテゴリの分類結果の多数決の割合と、単一の前記分類器から出力される前記分類推定確率とのうちの少なくとも一方を含む、請求項１に記載の分類装置。
　前記分類実行手段によって分類された前記評価用データの画像のカテゴリと、前記ユーザにより予め分類された画像のカテゴリとが一致しない場合、前記表示部は、前記ユーザによる前記カテゴリの選択の入力を受け付けるように構成されており、
　前記分類器学習手段は、前記ユーザによって前記カテゴリが選択された前記カテゴリ選択画像を前記教師データに含めた状態で、前記教師データに基づいて前記分類器を再学習させるように構成されている、請求項１または請求項２に記載の分類装置。
　前記分類実行手段によって分類された前記評価用データの画像のカテゴリと、前記ユーザにより予め分類された画像のカテゴリとが一致せず、さらに前記分類推定確率が所定の閾値以上の場合、前記表示部は、前記ユーザによる前記カテゴリの選択の入力を受け付けるように構成されており、
　前記分類器学習手段は、前記ユーザによって前記カテゴリが選択された前記カテゴリ選択画像を前記教師データに含めた状態で、前記教師データに基づいて前記分類器を再学習させるように構成されている、請求項３に記載の分類装置。
　前記分類実行手段によって分類された前記評価用データの画像のカテゴリと、前記ユーザにより予め分類された画像のカテゴリとが一致せず、さらに前記分類推定確率が所定の閾値以上の場合、前記表示部は、前記カテゴリの自動選択を受け付けるように構成されており、
　前記分類器学習手段は、前記自動選択が受け付けられた場合、前記画像の前記カテゴリを自動で選択するとともに、前記カテゴリが自動で選択された前記カテゴリ選択画像を前記教師データに含めた状態で、前記教師データに基づいて前記分類器を再学習させるように構成されている、請求項１～４のいずれかに記載の分類装置。
　前記評価用データは、前記教師データを含み、
　前記分類実行手段は、前記学習された分類器に基づいて、前記教師データに含まれる前記画像の前記カテゴリを分類するように構成されており、
　前記分類器学習手段は、前記カテゴリとして前記分類実行手段によって分類されたカテゴリが選択された前記カテゴリ選択画像が含まれるように前記教師データを更新した状態で、前記教師データに基づいて前記分類器を再学習させるように構成されている、請求項１～５のいずれかに記載の分類装置。
　前記評価用データは、前記教師データと異なる画像を含み、
　前記分類実行手段は、前記学習された分類器に基づいて、前記教師データと異なる前記評価用データに含まれる画像のカテゴリを分類するように構成されており、
　前記分類器学習手段は、前記カテゴリとして前記分類実行手段によって分類されたカテゴリが選択された前記カテゴリ選択画像を前記教師データに含めた状態で、前記教師データに基づいて前記分類器を再学習させるように構成されている、請求項１～６のいずれかに記載の分類装置。
　画像を撮像するための撮像装置と、
　前記撮像部により撮像された、未知の画像のカテゴリを分類する分類装置とを備え、
　　前記分類装置は、
　ユーザにより予め複数のカテゴリのうちのいずれかに分類された複数の画像からなる教師データに基づいて機械学習を行うことにより、前記分類器を学習させる分類器学習手段と、
　前記学習された分類器に基づいて、複数の画像からなる評価用データを、前記複数のカテゴリのうちのいずれかに分類する分類実行手段と、を含み、
　前記分類器学習手段は、前記分類実行手段によって分類された前記評価用データの画像のカテゴリと、前記ユーザにより予め分類された画像のカテゴリとが一致しない場合、カテゴリが一致しない画像のカテゴリとして、前記分類実行手段によって分類されたカテゴリもしくはユーザが再判定したカテゴリが選択されたカテゴリ選択画像を前記教師データに含めた状態で、前記教師データに基づいて前記分類器を再学習させるように構成されており、
　前記カテゴリ選択画像の前記カテゴリは、前記分類実行手段による前記カテゴリの分類の確かさの指標である分類推定確率に基づいて選択されるように構成されており、
　　前記分類実行手段によるカテゴリと前記ユーザによるカテゴリとが一致しない画像に関する、前記分類実行手段によって分類された前記評価用データの画像のカテゴリと、前記ユーザにより予め分類された画像のカテゴリと、前記分類推定確率とを表示する表示部をさらに備え、
　前記分類実行手段によって分類された前記評価用データの画像のカテゴリと、前記ユーザにより予め分類された画像のカテゴリとが一致しない場合、前記表示部は、前記カテゴリの自動選択を受け付けるように構成されており、
　前記分類器学習手段は、前記自動選択が受け付けられた場合、前記画像の前記カテゴリを自動で選択するとともに、前記カテゴリが自動で選択された前記カテゴリ選択画像を前記教師データに含めた状態で、前記教師データに基づいて前記分類器を再学習させるように構成されている、画像分類システム。