JP7120528B2 - 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 - Google Patents

分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 Download PDF

Info

Publication number
JP7120528B2
JP7120528B2 JP2018178153A JP2018178153A JP7120528B2 JP 7120528 B2 JP7120528 B2 JP 7120528B2 JP 2018178153 A JP2018178153 A JP 2018178153A JP 2018178153 A JP2018178153 A JP 2018178153A JP 7120528 B2 JP7120528 B2 JP 7120528B2
Authority
JP
Japan
Prior art keywords
classifier
data
image
frequency distribution
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018178153A
Other languages
English (en)
Other versions
JP2020052474A (ja
Inventor
明 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2018178153A priority Critical patent/JP7120528B2/ja
Publication of JP2020052474A publication Critical patent/JP2020052474A/ja
Application granted granted Critical
Publication of JP7120528B2 publication Critical patent/JP7120528B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像を分類する分類器構築方法、画像分類方法、分類器構築装置および画像分類装置に関する。
半導体基板、ガラス基板、プリント基板等の製造では、異物や傷、エッチング不良等の欠陥を検査するために光学顕微鏡や走査電子顕微鏡等を用いて外観検査が行われる。従来、このような検査工程において検出された欠陥に対して、さらに詳細な解析を行うことによりその欠陥の発生原因を特定し、欠陥に対する対策が行われてきた。
近年では、基板上のパターンの複雑化および微細化に伴い、検出される欠陥の種類および数量が増加する傾向にあり、検査工程で検出された欠陥を自動的に分類する自動分類が提案されている。自動分類により欠陥の解析を迅速かつ効率的に行うことが実現され、発生頻度の高い欠陥の種類に注目して優先的に対策を施すことが可能となる。
自動分類では、欠陥を分類する際にニューラルネットワークや決定木、判別分析等を利用した分類器が用いられる。分類器に自動分類を行わせるには、欠陥画像(または、欠陥画像の特徴量)および欠陥画像の種類であるカテゴリを示す信号を含む教師データを用意して分類器を学習させる必要がある。
特許文献1には、このような教師データの作成を支援する方法が開示されている。特許文献1では、教師データに含まれる欠陥画像の複数種類の特徴量について、カテゴリ毎に、各特徴量の標準偏差に基づいて、当該特徴量の平均値を中心とする特徴量範囲を設定している。そして、対象となる欠陥画像の各特徴量がいずれのカテゴリの特徴量範囲に含まれるかに基づく投票によって、対象となる欠陥画像に付与されたカテゴリの妥当性を判定している。
また、特許文献2には、他の教師データの作成を支援する方法が開示されている。特許文献2では、複数種類の特徴量のそれぞれに関して、複数のカテゴリのそれぞれに割り振られた教師データに含まれる欠陥画像の特徴量のヒストグラムを生成している。そして、教師データに含まれる欠陥画像の特徴量を含む区画を注目区画として、各カテゴリに対するヒストグラムにおける注目区画の頻度に基づいて、複数のカテゴリのそれぞれに属するとした場合の妥当性を示す評価値が取得される。各欠陥画像において、特徴量の複数種類における評価値の代表値がカテゴリ毎に求められ、複数のカテゴリにおける複数の代表値に基づいて当該欠陥画像が属すべきものと判定されるカテゴリの候補が決定される。
特許第5045083号公報 特開2014-70944号公報
欠陥画像の特徴量を離散化してヒストグラムや度数分布表を作成する際の離散化の区画数(階級の数)としては100~500程度で良好な結果が得られることが経験的に分かっている。このとき、あまり区画数を増やすとメモリ消費量が爆発的に増大するので、可能な限り少ない区画数で演算処理することが望ましい。
一方で、ヒストグラムや度数分布表を作成する際に、サンプル数をNとして階級の数kの目安を得る方法としては、一般に以下の「スタージェスの公式」が知られている。
k=logN+1
しかし、この公式では、例えば5000個の欠陥データに対する階級数がk=13.29となり、経験的に得られた値の範囲(100~200)とは明らかに異なっている。このため、離散化の区画数を得ようとすると、試行錯誤で探らざるを得なかった。
そこで、本発明は、実際のデータに適した離散化の区画数を得ることを目的とする。
本発明に係る分類器構築方法は、
画像を複数のクラスのいずれかに分類する分類器を構築する分類器構築方法であって、
a)前記クラスが教示された教師画像、および、前記教師画像に基づく複数の特徴量軸毎の値を含む教師データを、前記複数のクラスの各々につき1つ以上の同数ずつ含むデータセットを複数セット準備する工程と、
b)前記教師データの全部に基づき、前記複数の特徴量軸毎に、該特徴量軸の値を離散化して所定数の区画に分割する工程と、
c)前記a)工程にて準備された前記複数のデータセットに基づき、前記複数の特徴量軸毎に、特徴量軸の値を前記b)工程にて分割された各区画における度数を前記クラス別に示す度数分布データを生成する工程と、
d)前記度数分布データが示す前記特徴量軸毎の各区画における前記クラス別の出現比率に基づき前記画像を分類する分類器を生成する工程と、
e)前記複数のデータセットの全部を前記分類器で分類する工程と、
f)前記度数分布データのうち前記e)工程において誤分類された教師データについて、当該教師データが有する特徴量軸の値に対応する対応区画を前記特徴量軸毎に特定し、特定された前記対応区画における当該教師データの前記教示されたクラスの度数を増加させるように前記度数分布データを修正する工程と、
g)前記f)工程にて修正された度数分布データに対して前記d)工程を繰り返す工程と、
h)前記複数のデータセットの全部を前記g)工程にて生成された分類器で分類し、分類成績を取得する工程と、
i)前記h)工程にて得られた前記分類成績が第1の基準を満たすか否か判断する工程と、
j)前記第1の基準を満たさない場合は、前記b)工程における前記区画の数を増やして設定し、前記b)工程から前記h)工程を繰り返す工程と、
k)前記第1の基準を満たす場合は、前記第1の基準を満たす前記分類器に対する前記区画の数から、より少ない前記区画の数であり、かつ、当該区画の数について前記b)工程から前記h)工程を行い、該h)工程にて得られた前記分類成績が第2の基準を満たす前記区画の数を取得する工程と、
l)複数の前記教師データに基づき、前記複数の特徴量軸毎に、該特徴軸の値を離散化して前記k)工程にて取得された数の前記区画に分割された各区画における度数を前記クラス別に示す度数分布データにて示される前記特徴量軸毎の各区画における前記クラス別の出現比率に基づき前記画像を分類する分類器を構築する工程と、
を備えることを特徴とする。
また、前記k)工程は、
m)前記第1の基準を満たす前記分類器に対する前記区画の数から、減らして設定された前記区画の数について、前記b)工程から前記h)工程を行い、該h)工程にて得られた前記分類成績が前記第2の基準を満たさない場合には、前記区画の数を増やして設定された前記区画の数について、前記b)工程から前記h)工程を行う工程、
を含むようにしてもよい。
また、前記f)工程において、前記度数分布データのうち前記e)工程において誤分類された教師データについて、当該教師データが有する特徴量軸の値に対応する対応区画を前記特徴量軸毎に特定し、特定された前記対応区画を含む複数の前記区画における、当該教師データの前記教示されたクラスの度数を、前記対応区画を中心とする正規分布に従って増加させるようにしてもよい。
また、前記第1の基準及び前記第2の基準は、前記データセットの全てについて正答率が100%であるようにしてもよい。
また、本発明に係る画像分類方法は、
画像を分類する画像分類方法であって、
分類対象画像を準備する工程と、
前記分類器構築方法により構築された分類器によって、前記分類対象画像を分類する工程と、
を含むことを特徴とする。
本発明に係る分類器構築装置は、
画像を複数のクラスのいずれかに分類する分類器を構築する分類器構築装置であって、
前記クラスが教示された教師画像、および、前記教師画像に基づく複数の特徴量軸毎の値を含む教師データと、該教師データを、前記複数のクラスの各々につき1つ以上の同数ずつ含むデータセットの複数セットとを記憶する教師データ記憶部と、
前記教師データ記憶部に記憶された前記教師データの全部に基づき、前記複数の特徴量軸毎に、該特徴量軸の値を離散化して分割する区画の数を設定する区画設定部と、
前記教師データ記憶部に記憶された前記複数のデータセットに基づき、前記複数の特徴量軸毎に、前記区画設定部にて設定された数の各区画における度数をクラス別に示す度数分布データを生成する度数分布データ生成部と、
前記度数分布データが示す前記特徴量軸毎の各区画における前記クラス別の出現比率に基づき前記画像を分類する分類器を生成する分類器生成部と、
前記複数のデータセットの一部または全部を前記分類器で分類したときに誤分類された教師データについて、当該教師データが有する特徴量軸の値に対する対応区画を前記特徴量軸毎に特定し、特定された前記対応区画における当該教師データの前記教示されたクラスの度数を増加させるように前記度数分布データを修正する度数分データ修正部と、
前記複数のデータセットの全部を前記分類器で分類した分類成績を取得する分類成績取得部と、
前記分類成績取得部で取得された分類成績が第1の基準を満たすまで、区画設定部における前記区画の数を増やす設定と、設定された当該区画の数に従った前記度数分布データ生成部における度数分布データの生成と、当該度数分布データに基づく前記分類器生成部における前記分類器の生成と、度数分布データ修正部における前記度数分布データの修正とを繰り返し実行させる繰返制御部と、
前記分類成績取得部で取得された分類成績が第1の基準を満たす場合に、前記第1の基準を満たす前記分類器に対する前記区画の数から、より少ない前記区画の数であり、かつ、当該区画の数に従った前記度数分布データ生成部における度数分布データの生成と、当該度数分布データに基づく前記分類器生成部における前記分類器の生成と、度数分布データ修正部における前記度数分布データの修正と、修正された前記度数分布データに基づく前記分類器生成部における前記分類器の生成と、当該生成された前記分類器で前記複数のデータセットの全部を分類した分類成績の、前記分類成績取得部における取得と、を行わせて取得された前記分類成績が第2の基準を満たす前記区画の数を取得する区画数探索部と、
を備え、
複数の前記教師データに基づき、前記複数の特徴量軸毎に、該特徴量軸の値を前記区画数探索部において取得された数の前記区画に分割された各区画における度数を前記クラス別に示す度数分布データにて示される前記特徴量軸毎の各区画における前記クラス別の出現比率に基づき前記画像を分類する分類器を構築することを
特徴とする。
本発明に係る画像分類装置は、
画像を分類する画像分類装置であって、
前記分類器構築装置と、
分類対象画像を記憶する分類対象画像記憶部と、
前記分類対象画像を前記分類器に分類させる分類制御部と、
を備えることを特徴とする。
発明によれば、実際のデータに適した離散化の区画数を得ることができる。
図1は、実施形態に係る検査・分類装置の概略構成を示す図である。 図2は、実施形態に係るコンピュータの構成を示す図である。 図3は、実施形態に係る検査・分類装置における機能構成を示すブロック図である。 図4Aは、実施形態に係る分類器構築装置による分類器の構築の際の度数分布のための最適な離散化の区画数決定の流れを示す図である。 図4Bは、実施形態に係る分類器構築装置による分類器の構築の際の度数分布のための最適な離散化の区画数決定の流れを示す図である。 図5は、分類器生成および再代入法による評価の流れを説明する図である。 図6は、実施形態に係る度数分布データの修正例を説明するための図である。 図7は、実施形態に係る区画数と再代入法で全正答したサブセット数の関係を示すグラフである。 図8は、離散化区画数を変えて分類器を構築した際のテスト用データの総正答率を示すグラフである。 図9は、実施形態に係る分類器の構築の流れを示す図である。 図10は、実施形態に係る新たな教師データの生成支援処理の流れを示す図である。
以下、図面を参照して、実施形態について説明する。以下に示す実施形態の構成は例示であり、開示の技術は実施形態の構成に限定されない。
≪実施形態≫
図1は、実施形態に係る検査・分類装置1の概略構成を示す図である。検査・分類装置1では、半導体基板(以下、単に「基板」という。)9上のパターンの欠陥を示す欠陥画像が取得され、当該欠陥画像の分類が行われる。欠陥画像の分類により、分類対象である当該欠陥が分類される。
検査・分類装置1は、撮像装置2、欠陥検出部41およびコンピュータ5を備える。撮像装置2は、基板9上の検査対象領域を撮像する。欠陥検出部41は、検査対象領域の画像データを処理しつつ欠陥を検出する。コンピュータ5は、欠陥検出部41において欠陥
が検出された場合に、欠陥が属すべき欠陥クラス(欠陥の種別であり、「カテゴリ」などとも呼ばれる。)へと欠陥を分類する。コンピュータ5は、検査・分類装置1の全体動作の制御、および、欠陥の分類に利用される分類器の構築も行う。基板9上に存在するパターンの欠陥のクラスは、たとえば、欠損、突起、断線、ショート、異物などである。撮像装置2は、基板9の製造ラインに組み込まれる。検査・分類装置1は、いわゆるインライン型のシステムとなっている。検査・分類装置1は、欠陥検査装置に自動欠陥分類の機能を付加した装置と捉えることもできる。
撮像装置2は、撮像部21、ステージ22およびステージ駆動部23を備える。撮像部21は、基板9の検査領域を撮像して、多値の撮像画像のデータを取得する。ステージ22は、基板9を保持する。ステージ駆動部23は、撮像部21に対してステージ22を基板9の表面に平行な方向に相対的に移動させる。ステージ駆動部23は、ボールねじ、ガイドレールおよびモータなどで構成される。コンピュータ5がステージ駆動部23および撮像部21を制御することにより、基板9上の検査領域が撮像される。
撮像部21は、照明部211、光学系212および撮像デバイス213を備える。照明部211は照明光を出射し、光学系212はその照明光を基板9に導く。基板9にて反射した光は、再び光学系212に入射する。撮像デバイス213は、光学系212によって結像された基板9の像を電気信号に変換する。
欠陥検出部41では、基板9の撮像画像と、当該撮像画像と同じ領域(正常な領域)を示す参照画像とを比較することにより差分画像(典型的には、両画像の差の絶対値を示す画像)が得られ、当該差分画像に基づいて、異常部分である欠陥が検出される。そして、欠陥部分の多値画像である欠陥画像が生成される。なお、欠陥検出部41は、他の手法により欠陥を検出してもよい。
図2は、実施形態のコンピュータ5の構成を示す図である。コンピュータ5は、CPU51、ROM52およびRAM53を有する。CPU51は、各種演算処理を行う演算回路を含む。ROM52は、基本プログラムを記憶している。RAM53は、各種情報を記憶する揮発性の主記憶装置である。コンピュータ5は、CPU51、ROM52およびRAM53をバスライン501で接続した一般的なコンピュータシステムの構成を備えている。
コンピュータ5は、固定ディスク54、ディスプレイ55、入力部56、読取装置57および通信部58を備えている。これらの要素は、適宜インターフェース(I/F)を介してバスライン501に接続されている。
固定ディスク54は、情報記憶を行う補助記憶装置である。ディスプレイ55は、画像などの各種情報を表示する表示部である。入力部56は、キーボード56aおよびマウス56bなどを含む入力用デバイスである。読取装置57は、光ディスク、磁気ディスク、光磁気ディスクなどのコンピュータ読み取り可能な記録媒体8から情報の読み取りを行う。通信部58は、検査・分類装置1の他の要素との間で信号を送受信する。
コンピュータ5は、読取装置57を介して記録媒体8からプログラム80を読み取り、固定ディスク54に記録する。当該プログラム80は、RAM53にコピーされる。CPU51は、RAM53内に格納されたプログラム80に従って、演算処理を実行する。
図3は、実施形態の検査・分類装置1における機能構成を示すブロック図である。図3では、コンピュータ5のCPU51、ROM52、RAM53および固定ディスク54などにより実現される機能構成を、符号5を付した矩形の破線で囲んでいる。
コンピュータ5は、特徴量算出部31、画像分類装置32および分類器構築装置33を有する。特徴量算出部31は、画像から各種特徴量を算出する。画像分類装置32は、欠陥が検出された場合に、当該欠陥を自動的に分類する。分類器構築装置33は、分類器330を構築する。
画像分類装置32は、画像記憶部321(分類対象画像記憶部)、分類制御部322、および入力部56(図2参照)を有する。分類制御部322は、分類器320を有する。分類器構築装置33により構築された当該分類器330は、画像分類装置32における分類器320として登録される。
分類器構築装置33は、教師データ記憶部331、度数分布データ生成部332、分類器生成部333、度数分布データ修正部334および繰返制御部335を有する。
特徴量算出部31、画像分類装置32および分類器構築装置33各々が実現する機能の詳細については後述する。なお、これらの各機能は専用の電気回路により構築されてもよく、部分的に専用の電気回路が利用されてもよい。
<分類器構築装置33における離散化された区画数の決定について>
検査・分類装置1では、事前準備として、分類器構築装置33による分類器330の構築が行われる。図4A、図4Bおよび図5は、実施形態の分類器構築装置33による分類器330の構築の際に各クラスの度数分布表を作成するために教師データについて離散化された適切な区画数を決定する流れを示す図である。本処理例における分類器330の構築では、分類器330の構造が実質的に予め決定されており、分類器330が含むパラメータに値を付与することにより、分類器330が生成される。
まず、欠陥検出部41にて検出された多数の欠陥画像が、教師データ記憶部331に記憶される。続いて、特徴量算出部31では、各欠陥画像に対して複数種類の特徴量の値、すなわち、複数の特徴量軸における値が取得される。複数の特徴量軸には、たとえば、欠陥の面積、周囲長、重心位置、モーメント量、階調値の平均、分散、最大、最小等の特徴量についての軸が含まれる。各欠陥画像に対する複数の特徴量軸の値の集合は、特徴量ベクトルとも呼ばれる。
また、各欠陥画像が示す欠陥に対して、ユーザにより、欠陥のクラスの教示(入力)が行われる。クラスの教示では、複数の欠陥画像が、コンピュータ5のディスプレイ55に表示される。そして、ユーザにより、各欠陥画像に対して複数のクラスのいずれか1つが決定され、クラスの入力が入力部56を介して行われる。これにより、複数の欠陥画像のそれぞれにおいて、複数のクラスのうちの1つが教示クラスとして教示される。以下、クラスの教示が行われた欠陥画像を、「教師画像」という。
教師データ記憶部331では、各教師画像の教示クラスと、当該教師画像に対して取得される複数の特徴量軸の値とが互いに関連付けられた状態で、これらの情報が記憶される。言い換えると、各教師画像の教示クラスと、当該教師画像における複数の特徴量軸の値とを含む教師データ81が複数生成され、教師データ記憶部331に記憶される。既述のように、欠陥検出部41では、基板9の撮像画像と参照画像とを比較することにより差分画像が得られ、当該差分画像に基づいて欠陥画像が生成される。したがって、欠陥画像(教師画像)と共に、参照画像および差分画像において欠陥画像と同じ領域を示す部分等を用いて、特徴量軸毎の値が取得されてもよい(後述する画像分類装置32による対象画像の分類において同様)。
このようにして生成された教師データ81から、全てのクラスから1つ以上の同数の教
師データを選出して複数の学習用データセット810を準備する(ステップS1)。
複数の学習用データセット810が準備されると、度数分布データ生成部332は、学習用データセット810に基づいて、特徴量軸毎の度数分布を表す度数分布データ82を生成する。度数分布データ82は、複数の教師データ81を標本とする度数分布を示すデータであって、特徴量軸毎に、各特徴量軸の値を離散化した各区画における度数(出現頻度)をクラス別に示すデータである。
具体的には、度数分布データ生成部332は、特徴量軸毎に、全ての教師データ81に含まれる各特徴量の値の中から、最大値および最小値を特定することにより、特徴量軸毎に値の分布範囲を取得する。そして、度数分布データ生成部332は、当該分布範囲を、所定の個数の区画に等分割(離散化)する。このときの区画の個数(区画数)としては、ステップS2において区画設定部83において設定された所定の値を用いる。以降、図4のステップS3を構成するサブルーチンである分類器生成および再代入法による評価の流れを図5に従って説明する。ここでは、ステップS1において準備された複数の学習用データセット810のうちのいずれか一つを選択し(ステップS31)。そして、この学習用データセット810に含まれる教師データ81について離散化された各区画(離散区画)におけるクラス毎の度数(出現頻度)が求められ、度数分布が作成される(ステップS32)。具体的には、特徴量軸毎に、1つの教師データ81につき、その教師データ81が持つ特徴量の値に対応する対応離散区画の度数を1つだけ加える。これを各教師データ81について行うことにより、度数分布データ82が生成される。後述するように、特徴量軸毎のクラス別の度数分布は、画像の分類(すなわち、クラス判別)に供される。このため、度数分布データ82は、クラス判別を行うための「判別情報」ともいえる。
分布範囲の分割数は、全ての特徴量軸について、ステップS2において区画設定部83によって設定された区画数と同一の値とする。
分類器生成部333は、各特徴量の値の入力により画像分類する(すなわち、クラス判別する)初期の分類器330を生成する(ステップS33)。当該初期の分類器330は、度数分布データ82が示す、特徴量軸毎の各区画におけるクラス別の出現比率に基づき、分類対象の画像を分類するように構成される。
ここでは、分類器330の基本的構造は予め決定されており、分類器330は、複数の特徴量軸各々について、演算を行う複数の弱分類器を含む。弱分類器各々は、分類対象の画像が持つ特徴量の値を参照して、当該値が取得された画像が、複数のクラスのそれぞれに属する確率(弱分類器各々が対応する特徴量軸のみに着目した確率)をクラス評価結果として求める。
ここで、教師データ81の総数をN、クラスの個数をn、クラスC(i=1,2,・・・,n)に属する(すなわち教示クラスがCである)教師データ81の総数をNとする。Nはどの特徴量軸についても同じ数である。したがって、クラスCに属する教師データ81の総数Nの全クラスの総和は、式(1)のように教師データ81の総数となる。
Figure 0007120528000001
また、特徴量軸の総数をm、特徴量軸Dj(j=1,2,・・・,m)の値を離散化したときの分割数をKとし、特徴量軸Djの区画k(k=1,2,・・・,K)におけるクラスCに属する教師データ81の個数をFij(k)で表すと、クラスCに属する教師データ81の総数Nは、式(2)のように表される。
Figure 0007120528000002
一方、1つの特徴量軸Djのみに着目した場合に、区画kにおいてクラスCに属する教師データ81の出現比率(個数Fij(k)のクラスCに属する教師データ81の総数Nに対する比率)は、当該特徴量軸Djの値が区画kに属する画像がクラスCに属する確率と考えることができる。以下、当該確率をPjk(Ci)と表す。この確率Pjk(Ci)は、式(3)のように表される。
Figure 0007120528000003
1つの特徴量軸において、確率Pjk(Ci)はn個(クラス数)だけ得られるが、全クラスの
確率Pjk(Ci)の総和は1にはならない。
分類器330を構成する複数の弱分類器各々は、対応する特徴量軸Djの値から度数分布データ82を参照することにより、クラス別に出現比率(確率Pjk(Ci))をクラス評価結
果として求める。当該弱分類器では、特徴量軸Djの値が取得された画像が、特定のクラスCiに属するとした場合の妥当性(確信度)を示す評価値がクラス評価値として求められるともいえる。
ところで、多くの特徴量軸におけるクラス別の度数分布では、互いに重なり合う部分が多く存在する場合があるため、各特徴量軸において求められる複数のクラスに対する確率によるクラスの予測精度は、あまり高いとは言えない(ただし、ランダムにクラスを予測するよりも精度は高いといえる。)。そこで、分類器330では、アンサンブル学習の考え方が取り入れられており、複数の特徴量軸に対する複数の弱分類器のクラス評価結果に基づいて分類クラスを決定する強分類器として、分類器330が構成される。
分類器330では、各特徴量軸に対するクラス評価結果として、複数のクラスの評価値(確率)が求められるが、クラス評価結果は、例えば、評価値が最大のクラスに1を付与し、他のクラスに0を付与するものであってもよい。この場合、実質的に、各特徴量軸において評価値が最大のクラスに投票を行う処理となり、複数の特徴量軸における得票数が最大のクラスが分類クラスとして決定される。
度数分布データ修正部334は、度数分布データ生成部332によって生成され、分類器生成部333に送られた度数分布データ82を修正する。以下、度数分布データ修正部334が度数分布データ82を修正する処理の流れについて説明する。具体的には、度数
分布データ修正部334は、修正対象の度数分布データ82に基づき画像分類を行う分類器330を用いて、複数の教師データ81を分類する(ステップS34)。本処理例では、度数分布データ修正部334は、教師データ81として、初期の分類器330を生成したとき(すなわち、初期の度数分布データ82を生成したとき)に使用された教師データ81全部を、分類器330に分類させる。教師データ81の分類では、各教師データ81の各特徴量軸Djの値が特定され、クラスCi別の出現比率(確率Pjk(Ci))がクラス評価結
果として取得される。
分類器330による分類では、さらに、特徴量軸各々の出現比率の代表値(例えば、平均値や中央値、加重平均値等)が求められる。そして、全クラスのうち代表値が最大であるクラスが、当該教師データの分類先のクラスに決定される。各教師データの分類クラスは、度数分布データ修正部334において記憶される。なお、分類器330による好ましい処理では、(1)最大の代表値が所定の閾値SH1未満である場合、または、(2)最大の代表値と2番目に大きい代表値との差(または比率)が所定の他の閾値SH2未満である場合などに、分類すべきクラスが不明であることを示す追加クラスが分類クラスとして決定される。以下の説明では、上記(1)、(2)の場合に、教師画像群の教師画像が、追加クラスに分類されるものとする。
続いて、度数分布データ修正部334は、教師データ81のうち、分類されたクラスが教示クラスと相違していた教師データ81(以下、このデータを「誤分類教師データ」とも称する。)が存在する場合、その教師データ各々に基づいて、度数分布データ82を修正する(ステップS35)。
この度数分布データ82の修正では、誤分類教師データを参酌することにより、特徴量軸各々に関して、その誤分類教師データが持つ特徴量の値に対応する区画(対応区画)が特定されるとともに、その対応区画における誤分類教師データの教示クラスの度数が、予め定められた正の値だけ増加される。すなわち、分類先のクラスが教示クラスと相違した誤分類教師データについて、特徴量軸毎のクラス別の度数分布を示す度数分布データ82において、重複して計数された度数分布データ82が生成されることとなる。この処理は、誤分類教師データの重みの変更と捉えることもできる。
図6は、度数分布データ82の修正例を説明するための図である。ここでは、誤分類教師データの教示クラスが「Class 2」であり、その誤分類教師データが持つ特徴量軸Dj
特徴量の値の対応区画が区画kであるとする。修正前の特徴量軸Dの度数分布を図6(
a)に示し、修正後の特徴量軸Dの度数分布を図6(c)に示す。ここでは、度数分布
データ修正部334は、「Class 2」の度数を、区画kを中心としてその両側の区画に、
図6(b)に示す{1,2,3,5,8,11,13,14,13,11,8,5,3,2,1}のように度数を増加させる。これは、kを平均値として、総数100、標準偏差3の正規分布(正確には正規分布を整数化したもの)に従って度数を増加させるものである。これにより、区画kを中心とする区画における「Class 2」の出現比率が見かけ上増
加することとなる。このような要領で、度数分布データ修正部334は、誤分類教師データの全ての特徴量軸に関して、対応区画の度数を増加させることにより、度数分布データ82を修正する。
ここで、誤分類された教師データ81の教示クラスに属する画像の特徴量は、通常、特定の対応区画とそれに隣接する隣接区画に分布しうる。このため、更新された分類器330が、対応区画または隣接区画の特徴量を持つ画像を、誤分類された教師データ81の教示クラスに分類する確率を上げることができる。
また、対応区間区画の増加数を隣接区間区画の増加数よりも多くする場合、対応区間区
画の出現比率を隣接区間区画の出現比率よりも相対的に大きく増加させることができる。したがって、更新された分類器330が、誤分類された教師データ81の教示クラスに分類されるべき画像、すなわち、上記対応区間区画の特徴量を持つ画像が、その教示クラスに分類される確率を上げることができる。
続いて、度数分布データ修正部334は、修正された度数分布データ82に基づく分類器330を用いて、複数の教師データ81を分類する(ステップS36)。そして、分類成績取得部において、分類成績(正答率)を取得する(ステップS37)。ここでは、ステップS31で準備された複数の教師データ81の全てを対象とする。
ここで、図5に示すサブルーチンを終了し、図4Aに示すステップS4に進む。ここでは、繰返制御部335により、ステップS1で準備された学習用データセットの全てについて、ステップS3を通じて分類成績が取得されたか否かが判断される。そして、分類成績を取得していない学習用データセットが存在する場合には、ステップS3に戻り、分類生成績を取得していない学習用セットのうちの一の学習用セットに対して分類器生成および再代入法による評価(ステップS31~S37)を実行する。ステップS4において、全ての学用データセットについて、ステップS3を通じて分類成績が取得されている場合には、ステップS5に進む。
ステップS5では、繰返制御部335により、取得された分類成績である正答率が、全ての学習用データセットについて100%であるか否かが判断される。ここで、繰返制御部335により、取得された分類成績である正答率が、全ての学習用データセットについて100%であることが第1の基準に相当する。そして、全ての学習用データセットについて正答率が100%ではない場合には、ステップS6において、区画数を増やし、新たな区画数をステップ2において設定する。さらに、増加した区画数に対してステップS3~S4を実行する。また、全ての学習用データセットについて正答率が100%である場合には、ステップS7に進む。ステップS5において、全ての学習用データセットについて正答率を100%か否かを判断条件としているが、判断条件はこれに限られず、全ての学習用データセットについて正答率が所定の閾値を超えるか否かを判断条件としてもよい(後述のステップS14についても同様)。
ステップS7では、区画数探索部337が、ステップS5において全ての学習用データセットについて正答率100%となった際の区画数(K(0)とする)を区画設定部83から取得する。そして、ステップS8において、最小区画数のための変数minKにK(0)を代入する。
次に、区画数をK(0)から減らし(ステップS9)、i=1とおいて(ステップS10)、区画数のための変数K(i)に減らした区画数を代入する(ステップS11)。
次に、ステップS12に進み、分類器生成および再代入法による評価を行う。この処理の内容はステップS3と同様であるので説明を省略する。そして、ステップS13では、繰返制御部335において全ての学習用データセットについて分類成績を取得したか否かが判断される。ここで、全ての学習用データセットについて分類成績を取得していないと判断された場合には、ステップS12に戻る。ステップS13において、全ての学習用データセットについて分類成績を取得していると判断された場合には、ステップS14に進む。
ステップS14では、繰返制御部335において、全ての学習用データセットについて正答率100%か否かが判断される。このとき、繰返制御部335において、全ての学習用データセットについて正答率100%であることが第2の基準に相当する。ここで、全
ての学習用データセットについては正答率100%ではないと判断された場合には、区画数を増やし(ステップS15)、iをインクリメントして(ステップS16)、新たな区画数K(i)を設定し(ステップS11)、ステップS12の処理を実行する。ステップS14において、全ての学習用データセットについて正答率100%であると判断された場合には、ステップS17に進む。
ステップS17では、区画数探索部337が、現在設定されている区画数K(i)とminを比較する。K(i)がminKよりも大きい場合には、区画数を減らし(ステップS18)、iをインクリメントして(ステップS19)、新たな区画数K(i)を設定し(ステップS11)、ステップS12の処理を実行する。K(i)がminKよりも小さい場合には、minKの値をK(i)に更新し(ステップS20)、区画数を減らし(ステップS21)、iをインクリメントして(ステップS22)、新たなく価格数K(i)を設定し(ステップS11)、ステップS12の処理を実行する。そして、K(i)がminKに等しい場合には、minKを最小の区画数と確定し(ステップS23)、処理を終了する。
このようにすれば、実際のデータに適した離散化の区画数を得ることができる。
図4A、図4Bおよび図5に示した処理について、ウェーハの外観検査装置によって取得した欠陥画像を用いた具体例に即して説明する。この欠陥画像には、3つの欠陥種別、すなわち3つのクラスの欠陥が含まれている。総データ数は5112個であり、特徴量数は174である。3つのクラスをC1、C2、C3としたとき、クラス毎のデータ数は、C1が1578個、C2が2846個、C3が688個である。
まず、この5112個の全てのデータについて、174個の特徴量毎に最大値と最小値を調べておく。また、教師データから、学習用サブセットを作る。ただし、このデータでは、最もデータ数の少ないC3についてデータの重複なくサブセットを作ろうとすれば、例えば、8個×86セットのようになるが、経験的にはこれでは教師データ数としてもサブセット数としても若干不足していると判断されるため、各クラスからランダムに10個ずつ取り出した(全30個の教師データからなる)もの100セットとした。
次に、離散化の区画数を16,32,64,128,256と増やしていったとき、用意した各学習用サブセットについて再代入法による評価結果が100%になるか(または予め決めた閾値を超えるか)否かを調べ、評価結果が100%となったもの(または閾値を超えたもの)を記録する。ここでは、評価結果が100%となったサブセットの数は、上記区画数に対応して、それぞれ3,18,69,97,100であった。この区画数と、再代入法で全正答したサブセット数の関係を図7に示す。ここでは、クラス毎のデータ数が10個で、サブセット数が100であるものに加えて、クラス毎のデータ数が1,2,5,20,50個で、サブセット数が各100である別の5群についても参考のためにプロットしている。図7では、クラス毎のデータ数を10とした上述のグラフを実線で示している。
この結果から、適正な区画数は128から256の間にあると考えられるので、128と256の中間である192を選び、同様に再代入法による評価を行い正答率が100%であるサブセットの数を調べて100を得た。これを192(100)と表記することにすると、以下、区画数は160(98)→176(100)→168(99)→172(99)→174(100)→173(100)と変更され、173でそれ以上変更できなくなり、繰返し処理を終了した。
上述の5112個の教師データを用いて、得られた区画数173でステップS32~S35に説明した処理により構築した分類器により、別途用意したテスト用データ(総データ数4865個)を分類したところ、約73%の総正答率を得た。離散化区画数を変えて分類器を構築したときの、テスト用データの総正答率は図8のようになっており、上述の
区画数173とした分類器は、必ずしも最高成績を示す区画数ではない。しかし、ここでは無駄に区画数を増やすことなく、つまりなるべく少ないメモリ消費量で安定した動作が得られるような区画数が重要である。分類成績については、追加学習によって分類器を更新するか、あるいはBoostingの手法を用いることにより向上させることができる。
<分類器構築装置33における分類器構築について>
図9は、実施形態の分類器構築装置33による分類器330の構築の流れを示す図である。
ステップS41において、教師データを準備する。教師データの準備については、図4A、図4Bおよび図5に関連して説明したところと同様であるため説明を省略する。
ステップS42において、特徴量毎にクラス各々の度数分布を作成する。この際に、上述の図4A、図4Bおよび図5に説明した方法によって決定した区画数を用いる。
ステップS43における分類器の生成は図5のステップS33と同様である。また、ステップS44における分類器を用いた教師データの分類は図5のステップS34と同様であり、ステップS45における誤分類された教師データについての度数分布の修正は、図5のステップS35と同様である。ただし、このとき、再代入法に用いられる教師データについて、初期の分類器330を生成したとき(すなわち、初期の度数分布データ82を生成したとき)に使用された教師データ81全部を、分類器330に分類させてもよいし教師データ81全部のうち一部のみを選択して、分類器330に分類させてもよい。また、ステップS44において、これまで使用されていない教師データ81(すなわち、度数分布データ82に反映されていない教師データ81)を含めて、分類器330に分類させてもよい。
ステップS46において、修正された度数分布データに基づく分類器330が、画像分類装置32における分類器320として登録される(ステップS46)。
分類器の構築においては、さらに、追加学習によって分類器を更新するようにしてもよい。また、さらにBoostingによって構築してもよい。
<教師データ81の生成支援処理について>
図10は、画像分類装置32による新たな教師データ81の生成支援処理の流れを示す図である。画像分類装置32が備える分類器320は、分類器構築装置33が図9に示す流れに沿って生成した分類器330である。画像分類装置32は、オペレータが未教示の欠陥画像から新たな教師画像(教師データ81)を生成する作業を支援することができる。
具体的には、画像分類装置32が分類器320を用いて未教示の欠陥画像を分類する(ステップS51)。画像分類装置32は、この分類結果を、ディスプレイ55に表示することにより、オペレータに提示する(ステップS52)。そして、画像分類装置32は、オペレータによる操作に応じて、教師データ81の登録を行う(ステップS53)。詳細には、オペレータが、分類された欠陥画像の分類結果が適切と判断した場合には、その分類結果を採用する操作を行う。これにより、画像分類装置32が、その分類結果に従って教師データ81を生成し、記憶部(教師データ記憶部331)に保存する。一方、分類結果が不適切であった場合には、オペレータが正しいクラスを入力する操作を行う。それに基づき、画像分類装置32がその入力に従って教師データ81を保存する。画像分類装置32は、教師データ数が目標数まで達したか否かを判断する(ステップS54)。目標数に達していない場合(ステップS54においてNO)、画像分類装置32はステップS51を再び実行する。また、目標数を達成した場合(ステップS54においてYES)には、画像分類装置32は教師データ81の生成支援処理を終了する。
このように、画像分類装置32を用いて教師データ81の生成する場合、オペレータに対して、各未教示の欠陥画像についての分類先のクラスを、所定の精度で提示することが
できる。したがって、オペレータが全ての欠陥画像を確認してクラスを決定する場合、たとえば、未教示の欠陥画像が1000あるいは10000個以上となると、オペレータにとって分類作業は極めて大きい負担となる。そこで、画像分類装置32を用いることにより、その負担を大幅に軽減できる。
なお、画像分類装置32を使って新たに取得された教師データ81を使って、再び分類器構築装置33において、分類器330を新たに構築してもよい。あるいは、既に保存されている分類器330について、新たに得られた教師データ81を使って更新することも考えられる。具体的には、度数分布データ修正部334が、新たな教師データ81の度数を、度数分布データ82が示す度数分布に加えることが考えられる。あるいは、度数分布データ修正部334が、それまでに得られている分類器330を使って新たな教師データ81を分類し、そのうちの誤分類された教師データ81に基づいて、図6に説明した要領で度数分布データ82を修正するとよい。
なお、ステップS51において、分類器320が未教示の欠陥画像を分類した場合に、分類先のクラスが不明とされ、追加クラスに分類される場合がある。このような欠陥画像については、任意の学習アルゴリズム(線形判別分析やSVMなど)で別途構築された分類器(以下、「追加的分類器」と称する。)を用いて分類を行い、その分類結果をステップS52においてオペレータに提示されてもよい。この場合、分類器320によって分類先不明とされた欠陥画像であっても、該当する蓋然性のあるクラスをオペレータに提示できる。
また、分類器320によって分類先不明とされた欠陥画像だけなく、分類器320によってクラスが決定された欠陥画像についても、上記追加的分類器で重複的に分類を行ってもよい。このとき、分類器320と追加的分類器の分類結果が一致した欠陥画像については、分類先のクラスを正式なクラスとする教師データ81を生成してもよい。また、分類器320と追加的分類器の分類結果が一致しない欠陥画像については、それぞれの結果をステップS22にてオペレータに提示するようにしてもよい。これにより、教師データ81を生成する際に、オペレータが確認する欠陥画像の数を軽減できることから、教師データ81の生成を適切に支援できる。
<画像分類装置32による画像分類について>
ここで、画像分類装置32による欠陥画像の分類について、簡単に説明する。既述のように、検査・分類装置1では、撮像装置2により基板9が撮像され、撮像画像が欠陥検出部41に入力される。欠陥検出部41では、検査対象領域の欠陥検査が行われ、欠陥が検出されると、欠陥部分の多値画像である欠陥画像が生成されて画像分類装置32に出力される。これにより、欠陥画像が、画像記憶部321に記憶された状態で準備される。当該欠陥画像は、画像分類装置32における分類対象の画像であるため、以下、「対象画像」とも称する。
続いて、特徴量算出部31により、対象画像に対して複数の特徴量軸の値(複数種類の特徴量の値)が算出される。分類制御部322には、分類器構築装置33により構築された分類器320が備えられており、複数の特徴量の値が分類器320に入力されると、当該対象画像の分類が行われる。
対象画像の分類は、図5のステップS34における教師データ81の分類と同様にして行われる。すなわち、特徴量軸毎に、対象画像の特徴量の値が属する区画が特定され、クラス別の評価値がクラス評価結果として取得される。続いて、特徴量軸毎に、クラス別の複数の評価値の代表値が求められ、各クラスのうち代表値が最大であるクラスが、当該対象画像の分類クラスとして決定される。なお、教師データ81の分類と同様に、必要に応
じて、分類すべきクラスが不明であることを示す追加クラスが分類クラスとして決定される場合もある。検査・分類装置1では、欠陥検出部41にて欠陥が検出される毎にこのような分類動作がリアルタイムにて行われ、多数の対象画像の自動分類が高速に行われる。
<変形例>
以上、実施形態について説明してきたが、本発明は上記のようなものに限定されるものではなく、様々な変形が可能である。
欠陥画像は、半導体基板以外の基板上の欠陥を示すものであってよい。当該基板として、ハードディスク基板等の薄膜デバイス、プラズマディスプレイや液晶ディスプレイ等の薄型ディスプレイに用いられるガラス基板、フォトマスク基板、フィルム基板、プリント配線基板等が例示される。
また、検査・分類装置1が、太陽電池パネルを撮像した欠陥画像を分類する用途に用いられてもよい。例えば、太陽電池パネルのEL(エレクトロ・ルミネッセンス)発光やPL(フォト・ルミネッセンス)発光を撮像して得られる画像や、レーザーテラヘルツエミッション顕微鏡(LTEM)を用いて得られる太陽電池パネルの画像において、参照画像が示す正常な領域とは異なる領域を含む部分を欠陥画像として扱って、検査・分類装置1において太陽電池パネルの欠陥が分類されてよい。さらに、欠陥画像は、電子線やX線などにより撮像される画像であってもよい。このように、検査・分類装置1では、可視光により撮像される画像のみならず、広義の放射線により撮像される画像が分類される。
検査・分類装置1において、画像分類装置32および分類器構築装置33の機能は、撮像装置2および欠陥検出部41とは独立して用いられてもよい。画像分類装置および分類器構築装置は、血液や培養液等の所定の液中の細胞を撮像した細胞画像を、複数のクラスに分類する用途に用いられうる。また、画像分類装置および分類器構築装置は、様々な分類対象を示す画像の分類に利用可能である。また、分類器構築装置は、画像分類装置に含まれてもよい。
この発明は詳細に説明されたが、上記の説明は、すべての局面において、例示であって、この発明がそれに限定されるものではない。例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。上記各実施形態及び各変形例で説明した各構成は、相互に矛盾しない限り適宜組み合わせたり、省略したりすることができる。
1 検査・分類装置
5 コンピュータ
8 記録媒体
9 基板
31 特徴量算出部
32 画像分類装置
320,330 分類器
321 画像記憶部
322 分類制御部
33 分類器構築装置
331 教師データ記憶部
332 度数分布データ生成部
333 分類器生成部
334 度数分布データ修正部
335 繰返制御部
41 欠陥検出部
56 入力部
81 教師データ
810 学習用データセット
82 度数分布データ
83 区画設定部

Claims (7)

  1. 画像を複数のクラスのいずれかに分類する分類器を構築する分類器構築方法であって、
    a)前記クラスが教示された教師画像、および、前記教師画像に基づく複数の特徴量軸毎の値を含む教師データを、前記複数のクラスの各々につき1つ以上の同数ずつ含むデータセットを複数セット準備する工程と、
    b)前記教師データの全部に基づき、前記複数の特徴量軸毎に、該特徴量軸の値を離散化して所定数の区画に分割する工程と、
    c)前記a)工程にて準備された前記複数のデータセットに基づき、前記複数の特徴量軸毎に、特徴量軸の値を前記b)工程にて分割された各区画における度数を前記クラス別に示す度数分布データを生成する工程と、
    d)前記度数分布データが示す前記特徴量軸毎の各区画における前記クラス別の出現比率に基づき前記画像を分類する分類器を生成する工程と、
    e)前記複数のデータセットの全部を前記分類器で分類する工程と、
    f)前記度数分布データのうち前記e)工程において誤分類された教師データについて、当該教師データが有する特徴量軸の値に対応する対応区画を前記特徴量軸毎に特定し、特定された前記対応区画における当該教師データの前記教示されたクラスの度数を増加させるように前記度数分布データを修正する工程と、
    g)前記f)工程にて修正された度数分布データに対して前記d)工程を繰り返す工程と、
    h)前記複数のデータセットの全部を前記g)工程にて生成された分類器で分類し、分類成績を取得する工程と、
    i)前記h)工程にて得られた前記分類成績が第1の基準を満たすか否か判断する工程と、
    j)前記第1の基準を満たさない場合は、前記b)工程における前記区画の数を増やして設定し、前記b)工程から前記h)工程を繰り返す工程と、
    k)前記第1の基準を満たす場合は、前記第1の基準を満たす前記分類器に対する前記区画の数から、より少ない前記区画の数であり、かつ、当該区画の数について前記b)工程から前記h)工程を行い、該h)工程にて得られた前記分類成績が第2の基準を満たす前記区画の数を取得する工程と、
    l)複数の前記教師データに基づき、前記複数の特徴量軸毎に、該特徴軸の値を離散化して前記k)工程にて取得された数の前記区画に分割された各区画における度数を前記クラス別に示す度数分布データにて示される前記特徴量軸毎の各区画における前記クラス別の出現比率に基づき前記画像を分類する分類器を構築する工程と、
    を備えることを特徴とする分類器構築方法。
  2. 前記k)工程は、
    m)前記第1の基準を満たす前記分類器に対する前記区画の数から、減らして設定された前記区画の数について、前記b)工程から前記h)工程を行い、該h)工程にて得られた前記分類成績が前記第2の基準を満たさない場合には、前記区画の数を増やして設定された前記区画の数について、前記b)工程から前記h)工程を行う工程、
    を含む請求項1に記載の分類器構築方法。
  3. 前記f)工程において、前記度数分布データのうち前記e)工程において誤分類された教師データについて、当該教師データが有する特徴量軸の値に対応する対応区画を前記特徴量軸毎に特定し、特定された前記対応区画を含む複数の前記区画における、当該教師データの前記教示されたクラスの度数を、前記対応区画を中心とする正規分布に従って増加させることを特徴とする請求項1または2に記載の分類器構築方法。
  4. 前記第1の基準及び前記第2の基準は、前記データセットの全てについて正答率が10
    0%であることを特徴とする請求項1ないし3のいずれか1項に記載の分類器構築方法。
  5. 画像を分類する画像分類方法であって、
    分類対象画像を準備する工程と、
    請求項1ないし4のいずれか1項に記載の分類器構築方法により構築された分類器によって、前記分類対象画像を分類する工程と、
    を含むことを特徴とする画像分類方法。
  6. 画像を複数のクラスのいずれかに分類する分類器を構築する分類器構築装置であって、
    前記クラスが教示された教師画像、および、前記教師画像に基づく複数の特徴量軸毎の値を含む教師データと、該教師データを、前記複数のクラスの各々につき1つ以上の同数ずつ含むデータセットの複数セットとを記憶する教師データ記憶部と、
    前記教師データ記憶部に記憶された前記教師データの全部に基づき、前記複数の特徴量軸毎に、該特徴量軸の値を離散化して分割する区画の数を設定する区画設定部と、
    前記教師データ記憶部に記憶された前記複数のデータセットに基づき、前記複数の特徴量軸毎に、前記区画設定部にて設定された数の各区画における度数をクラス別に示す度数分布データを生成する度数分布データ生成部と、
    前記度数分布データが示す前記特徴量軸毎の各区画における前記クラス別の出現比率に基づき前記画像を分類する分類器を生成する分類器生成部と、
    前記複数のデータセットの一部または全部を前記分類器で分類したときに誤分類された教師データについて、当該教師データが有する特徴量軸の値に対する対応区画を前記特徴量軸毎に特定し、特定された前記対応区画における当該教師データの前記教示されたクラスの度数を増加させるように前記度数分布データを修正する度数分データ修正部と、
    前記複数のデータセットの全部を前記分類器で分類した分類成績を取得する分類成績取得部と、
    前記分類成績取得部で取得された分類成績が第1の基準を満たすまで、区画設定部における前記区画の数を増やす設定と、設定された当該区画の数に従った前記度数分布データ生成部における度数分布データの生成と、当該度数分布データに基づく前記分類器生成部における前記分類器の生成と、度数分布データ修正部における前記度数分布データの修正とを繰り返し実行させる繰返制御部と、
    前記分類成績取得部で取得された分類成績が第1の基準を満たす場合に、前記第1の基準を満たす前記分類器に対する前記区画の数から、より少ない前記区画の数であり、かつ、当該区画の数に従った前記度数分布データ生成部における度数分布データの生成と、当該度数分布データに基づく前記分類器生成部における前記分類器の生成と、度数分布データ修正部における前記度数分布データの修正と、修正された前記度数分布データに基づく前記分類器生成部における前記分類器の生成と、当該生成された前記分類器で前記複数のデータセットの全部を分類した分類成績の、前記分類成績取得部における取得と、を行わせて取得された前記分類成績が第2の基準を満たす前記区画の数を取得する区画数探索部と、
    を備え、
    複数の前記教師データに基づき、前記複数の特徴量軸毎に、該特徴量軸の値を前記区画数探索部において取得された数の前記区画に分割された各区画における度数を前記クラス別に示す度数分布データにて示される前記特徴量軸毎の各区画における前記クラス別の出現比率に基づき前記画像を分類する分類器を構築することを
    特徴とする分類器構築装置。
  7. 画像を分類する画像分類装置であって、
    請求項6に記載の分類器構築装置と、
    分類対象画像を記憶する分類対象画像記憶部と、
    前記分類対象画像を前記分類器に分類させる分類制御部と、
    を備えることを特徴とする画像分類装置。
JP2018178153A 2018-09-21 2018-09-21 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 Active JP7120528B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018178153A JP7120528B2 (ja) 2018-09-21 2018-09-21 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018178153A JP7120528B2 (ja) 2018-09-21 2018-09-21 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Publications (2)

Publication Number Publication Date
JP2020052474A JP2020052474A (ja) 2020-04-02
JP7120528B2 true JP7120528B2 (ja) 2022-08-17

Family

ID=69997075

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018178153A Active JP7120528B2 (ja) 2018-09-21 2018-09-21 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Country Status (1)

Country Link
JP (1) JP7120528B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022114331A (ja) 2021-01-26 2022-08-05 日東電工株式会社 検査システム、検査方法及び検査プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018045673A (ja) 2016-09-09 2018-03-22 株式会社Screenホールディングス 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018045673A (ja) 2016-09-09 2018-03-22 株式会社Screenホールディングス 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
酒井 薫,特徴空間の再帰的分割に基づく半導体欠陥検査手法,電子情報通信学会技術研究報告 Vol.106 No.229,日本,社団法人電子情報通信学会,2006年09月01日,PRMU2006-69 (2006-09),P.65-72

Also Published As

Publication number Publication date
JP2020052474A (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
US10818000B2 (en) Iterative defect filtering process
JP4253522B2 (ja) 欠陥分類方法及び装置
JP6669453B2 (ja) 画像分類装置および画像分類方法
JP6063756B2 (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
JP6472621B2 (ja) 分類器構築方法、画像分類方法および画像分類装置
JP6113024B2 (ja) 分類器取得方法、欠陥分類方法、欠陥分類装置およびプログラム
JP2018045673A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
CN114155181B (zh) 检查方案的自动优化
JP2011214903A (ja) 外観検査装置、外観検査用識別器の生成装置及び外観検査用識別器生成方法ならびに外観検査用識別器生成用コンピュータプログラム
CN112528975A (zh) 工业质检方法、装置和计算机可读存储介质
KR20210042997A (ko) 반도체 제조에서 확률적 불량 메트릭의 사용
KR20220012217A (ko) 반도체 시편에서의 결함들의 기계 학습 기반 분류
JP2014070944A (ja) 教師データ検証装置、教師データ作成装置、画像分類装置、教師データ検証方法、教師データ作成方法および画像分類方法
JP2016191589A (ja) 欠陥分類装置および欠陥分類方法
JP6530688B2 (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP2020119135A (ja) 画像評価装置及び方法
JP2014137284A (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
JP7120528B2 (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP2006292615A (ja) 外観検査装置、外観検査方法、コンピュータを外観検査装置として機能させるためのプログラムおよび記録媒体
TW202125405A (zh) 分類裝置及圖像分類系統
JP6632124B2 (ja) 画像分類方法および画像分類装置
JP2020052475A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP2016051429A (ja) 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置
JP2004163416A (ja) 欠陥検査装置
JP7206892B2 (ja) 画像検査装置、画像検査のための学習方法および画像検査プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220725

R150 Certificate of patent or registration of utility model

Ref document number: 7120528

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150