JP2019057024A - 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 - Google Patents

分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 Download PDF

Info

Publication number
JP2019057024A
JP2019057024A JP2017180082A JP2017180082A JP2019057024A JP 2019057024 A JP2019057024 A JP 2019057024A JP 2017180082 A JP2017180082 A JP 2017180082A JP 2017180082 A JP2017180082 A JP 2017180082A JP 2019057024 A JP2019057024 A JP 2019057024A
Authority
JP
Japan
Prior art keywords
classifier
teacher data
image
class
frequency distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017180082A
Other languages
English (en)
Inventor
松村 明
Akira Matsumura
明 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2017180082A priority Critical patent/JP2019057024A/ja
Publication of JP2019057024A publication Critical patent/JP2019057024A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】精度よく画像分類を行う分類器を容易に構築することができる技術を提供する。【解決手段】度数分布データ生成部332は、複数の教師データ81に基づき、特徴量軸毎に、特徴量軸の値を離散化した各区間における度数をクラス別に示す度数分布データ82を生成する。分類器生成部333は、度数分布データ82に基づき画像を分類する分類器330を生成する。度数分布データ修正部334は、複数の教師データ81のうち分類器330で分類したときに誤分類される教師データ81について、その教師データ81が持つ特徴量の値に対応する対応区間を特徴量軸毎に特定し、特定された対応区間における当該教師データ81の教示されたクラスの度数を増加させるように度数分布データ82を修正する。繰返制御部335は、度数分布データ修正部334に度数分布データ82の修正を1回以上行わせる。【選択図】図3

Description

この発明は、画像を分類する分類器を構築する技術、および、当該分類器を用いて画像を分類する技術に関する。
従来、複数の弱分類器の分類結果を統合することにより、高精度な分類を行う分類器の構築手法(アンサンブル学習法)が提案されている。当該手法として、たとえばバギング、ブースティング、ランダムフォレストなどが知られている。
バギングでは、与えられたデータセットからブートストラップ法によるサンプリングで複数の教師データセットが作成され、当該複数の教師データセットから複数の弱分類器が構築される。そして、複数の弱分類器の分類結果の多数決により、最終的な分類結果が取得される(バギングについて、たとえば非特許文献1参照)。
ブースティングでは、与えられたデータセットを用いた弱分類器の取得と、当該弱分類器の分類結果に基づくデータの重みの調整とを繰り返して複数の弱分類器が構築される。そして、複数の弱分類器の分類結果の重み付き多数決により、最終的な分類結果が取得される(ブースティングについて、たとえば非特許文献2参照)。
ランダムフォレストでは、与えられたデータセットからブートストラップ法によるサンプリングで複数の教師データセットが作成され、当該複数の教師データセットから決定木である複数の弱分類器が構築される。そして、複数の決定木の多数決により、最終的な分類結果が取得される(ランダムフォレストについて、たとえば非特許文献3参照)。
また、特許文献1では、画像を分類する分類器の学習に使用される教師データを検証する手法が提案されている。当該手法では、特徴量の複数種類のそれぞれに関して、各教師画像が複数のクラスのそれぞれに属するとした場合の妥当性を示す評価値が取得される。各教師画像において、特徴量の複数種類における評価値の代表値がクラス毎に求められ、複数のクラスにおける複数の代表値に基づいて当該教師画像が属すべきものと判定されるクラスの候補が決定される。
特開2014−70944号公報
Leo Breiman, "Bagging Predictors", Machine Learning, 1996, 24, p.123-140 YoavFreund and Robert E. Schapire, "A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting", Journal of Computer and System Sciences, 1997, 55, p.119-139 Leo Breiman, "Random Forests", Machine Learning, 2001, 45, p.5-32
ところで、アンサンブル学習法に係る上記手法では、選択されたデータの偏りが無視できるほどの多数の教師データセットの作成(多数の弱分類器の構築)や、教師データに重みを付けて学習する複雑なアルゴリズムなどが必要となる。
そこで、本発明は、精度よく画像分類を行う分類器を容易に構築することができる技術を提供することを目的とする。
上記の課題を解決するため、第1態様は、画像を複数のクラスのいずれかに分類する分類器を構築する分類器構築方法であって、(a)前記クラスが教示された教師画像、および、前記教師画像に基づく複数の特徴量軸毎の値を含む教師データを、前記複数のクラス各々につき1つ以上ずつ準備する工程と、(b)前記工程(a)にて準備された前記複数の教師データに基づき、前記複数の特徴量軸毎に、特徴量軸の値を離散化して得た各区間における度数を前記クラス別に示す度数分布データを生成する工程と、(c)前記度数分布データが示す前記特徴量毎の各区間における前記クラス別の出現比率に基づき、前記画像を分類する分類器を生成する工程と、(d)前記複数の教師データのうち一部または全部を前記分類器で分類する工程と、(e)前記度数分布データのうち前記工程(d)において誤分類された教師データについて、その教師データが持つ特徴量の値に対応する対応区間を前記特徴量軸毎に特定し、特定された前記対応区間における当該教師データの前記教示されたクラスの度数を増加させるように前記度数分布データを修正する工程と、(f)前記工程(d)および前記工程(e)を1回以上行うことにより、前記複数の教師データの分類精度が所定の基準を満たす分類器を取得する工程とを含む。
また、第2態様は、第1態様の分類器構築方法であって、前記工程(e)は、前記対応する対応区間に隣接する第1隣接区間の度数が増加するように前記度数分布データを修正する工程を含む。
また、第3態様は、第2態様の分類器構築方法であって、前記工程(e)は、前記対応区間の度数の増加数を、前記隣接区間よりも多くする工程を含む。
また、第4態様は、第1から第3態様のいずれか1つの分類器構築方法であって、前記工程(f)は、前記複数の教師データのクラス判別の正答率が100%となる分類器が取得されるまで、前記工程(d)及び前記工程(e)を1回以上行う工程である。
また、第5態様は、第1から第4態様のいずれか1つの分類器構築方法であって、前記工程(b)は、(b−1)前記教師データが持つ特徴量の値に対応する対応離散区間を前記特徴量軸毎に特定する工程と、(b−2)前記対応離散区間において、前記教師データの前記教示されたクラスの度数を増加させる工程と、(b−3)前記対応離散区間に隣接する区間において、前記教師データの前記教示されたクラスの度数を増加させる工程とを含む。
また、第6態様は、第5態様の分類器構築方法であって、前記(b−2)における前記対応離散区間の度数の増加数が、前記(b−3)における前記対応離散区間に隣接する区間の度数の増加数よりも多い。
また、第7態様は、画像を分類する画像分類方法であって、分類対象画像を準備する工程と、第1から第6態様のいずれか1つの分類器構築方法により取得された分類器によって、前記分類対象画像を分類する工程とを含む。
また、第8態様は、画像を複数のクラスのいずれかに分類する分類器を構築する分類器構築装置であって、前記クラスが教示された教師画像、および、前記教師画像が示す複数の特徴量軸毎の値を含む教師データを、前記複数のクラス各々につき1つ以上ずつ記憶する教師データ記憶部と、前記教師データ記憶部に記憶された前記複数の教師データに基づき、前記複数の特徴量軸毎に、特徴量軸の値を離散化した各区間における度数をクラス別に示す度数分布データを生成する度数分布データ生成部と、前記度数分布データが示す前記特徴量毎の各区間における前記クラス別の出現比率に基づき前記画像を分類する分類器を生成する分類器生成部と、前記複数の教師データのうち一部または全部を前記分類器で分類したときに誤分類される教師データについて、その教師データが持つ特徴量の値に対応する対応区間を前記特徴量軸毎に特定し、特定された前記対応区間における当該教師データの前記教示されたクラスの度数を増加させるように前記度数分布データを修正する度数分布データ修正部と、前記度数分布データ修正部に前記度数分布データの修正を1回以上行わせることにより、前記複数の教師データについての分類精度が所定の基準を満たす分類器を取得する繰返制御部とを備える。
また、第9態様は、画像を分類する画像分類装置であって、第8態様の分類器構築装置と、分類対象画像を記憶する分類対象画像記憶部と、前記分類対象画像を前記分類器に分類させる分類制御部とを備える。
第1態様の分類器構築方法によると、分類器が度数分布データに基づいて教師データを分類し、その際に誤分類された教師データに基づき度数分布データが修正される。このとき、特徴量軸毎に、誤分類された教師データが持つ特徴量の値に対応する対応区間の度数が増加するように度数分布データが修正される。これにより、誤分類された教師データ81各々の各特徴量の値が属する区間の出現比率が、見かけ上増加した度数分布データが生成される。このため、分類器がこの修正された度数分布データに基づき画像分類を行うことにより、誤分類された教師データを予め教示されたクラスに正しく分類する確率が上昇する。したがって、このような度数分布データの修正を繰り返し行うことにより、分類器の分類精度を向上できる。
第2態様の分類器構築方法によると、誤分類された教師データが持つ特徴量が属する対応区間および隣接区間の度数を増加させることにより、それらの区間の出現比率を見かけ上増加させた度数分布データを生成できる。誤分類された教師データの教示クラスに属する画像の特徴量は、通常、特定の対応区間とそれに隣接する隣接区間に分布しうる。このため、更新された分類器により、対応区間または隣接区間の特徴量を持つ画像が、誤分類された教師データの教示クラスに分類される確率を上げることができる。
第3態様の分類器構築方法によると、対応区間の度数の増加数が隣接区間の増加数よりも多いため、対応区間の出現比率を隣接区間の出現比率よりも相対的に大きく増加する。したがって、誤分類された教師データの教示クラスに分類されるべき画像、すなわち、上記対応区間の特徴量を持つ画像が、更新された分類器により、その教示クラスに分類される確率を上げることができる。したがって、分類器の精度向上を期待できる。
第4態様の分類器構築方法によると、誤分類される教師データがなくなるまで、度数分布データの修正が行われるため、分類精度の高い分類器を取得することができる。
第5態様の分類器構築方法によると、対応離散区間およびこれに隣接する区間の度数を増加させることにより、それらの区間の出現比率を見かけ上増加させた度数分布データを生成できる。教師データの教示クラスに属する画像の特徴量は、通常、特定の対応離散区間とそれに隣接する区間に分布しうる。このため、分類器により、対応離散区間またはそれに隣接する区間の特徴量を持つ画像が教師データの教示クラスに分類される確率を上げることができる。
第6態様の分類器構築方法によると、対応離散区間の度数の増加数が隣接する区間の増加数よりも多いため、対応離散区間の出現比率が隣接する区間の出現比率よりも相対的に大きく増加する。したがって、教師データの教示クラスに分類されるべき画像、すなわち、上記対応区間の特徴量を持つ画像が、分類器により、その教示クラスに分類される確率を上げることができる。
第7態様の画像分類方法によると、教師データが少ない場合でも、分類精度の高い分類器を取得できるため、その分類器を用いることにより、クラスが未教示である画像を精度良く分類することができる。
第8態様の分類器構築装置によると、第1態様と同様の効果を奏する。
第9態様の画像分類装置によると、第7態様と同様の効果を奏する。
実施形態の検査・分類装置1の概略構成を示す図である。 実施形態のコンピュータ5の構成を示す図である。 実施形態の検査・分類装置1における機能構成を示すブロック図である。 実施形態の分類器構築装置33による分類器330の構築の流れを示す図である。 度数分布データ82が示す第1の特徴量軸における複数のクラスの度数分布表を示す図である。 度数分布データ82が示す第1の特徴量軸におけるクラス別のヒストグラムを示す図である。 度数分布データ82が示す第2の特徴量軸における複数のクラスの度数分布表を示す図である。 度数分布データ82が示す第2の特徴量軸におけるクラス別のヒストグラムを示す図である。 分類器330による教師データ81の分類結果の一例を示す図である。 度数分布データ82の修正例を説明するための図である。 度数分布データ82の他の修正例を説明するための図である。 画像分類装置32による新たな教師データ81の生成支援処理の流れを示す図である。 教示数(教師データ数)と分類器330の正答率の関係を示すグラフである。 教示数と分類器330の正答率の関係を示す他のグラフである。 初期の度数分布データ82を生成する様子を説明するための図である。
以下、添付の図面を参照しながら、本発明の実施形態について説明する。なお、この実施形態に記載されている構成要素はあくまでも例示であり、本発明の範囲をそれらのみに限定する趣旨のものではない。図面においては、理解容易のため、必要に応じて各部の寸法や数が誇張又は簡略化して図示されている場合がある。
<1. 実施形態>
図1は、実施形態に係る検査・分類装置1の概略構成を示す図である。検査・分類装置1では、半導体基板(以下、単に「基板」という。)9上のパターンの欠陥を示す欠陥画像が取得され、当該欠陥画像の分類が行われる。欠陥画像の分類により、分類対象である当該欠陥が分類される。
検査・分類装置1は、撮像装置2、欠陥検出部41およびコンピュータ5を備える。撮像装置2は、基板9上の検査対象領域を撮像する。欠陥検出部41は、検査対象領域の画像データを処理しつつ欠陥を検出する。コンピュータ5は、欠陥検出部41において欠陥が検出された場合に、欠陥が属すべき欠陥クラス(欠陥の種別であり、「カテゴリ」などとも呼ばれる。)へと欠陥を分類する。コンピュータ5は、検査・分類装置1の全体動作の制御、および、欠陥の分類に利用される分類器の構築も行う。基板9上に存在するパターンの欠陥のクラスは、たとえば、欠損、突起、断線、ショート、異物などである。撮像装置2は、基板9の製造ラインに組み込まれる。検査・分類装置1は、いわゆるインライン型のシステムとなっている。検査・分類装置1は、欠陥検査装置に自動欠陥分類の機能を付加した装置と捉えることもできる。
撮像装置2は、撮像部21、ステージ22およびステージ駆動部23を備える。撮像部21は、基板9の検査領域を撮像して、多値の撮像画像のデータを取得する。ステージ22は、基板9を保持する。ステージ駆動部23は、撮像部21に対してステージ22を基板9の表面に平行な方向に相対的に移動させる。ステージ駆動部23は、ボールねじ、ガイドレールおよびモータなどで構成される。コンピュータ5がステージ駆動部23および撮像部21を制御することにより、基板9上の検査領域が撮像される。
撮像部21は、照明部211、光学系212および撮像デバイス213を備える。照明部211は照明光を出射し、光学系212はその照明光を基板9に導く。基板9にて反射した光は、再び光学系212に入射する。撮像デバイス213は、光学系212によって結像された基板9の像を電気信号に変換する。
欠陥検出部41では、基板9の撮像画像と、当該撮像画像と同じ領域(正常な領域)を示す参照画像とを比較することにより差分画像(典型的には、両画像の差の絶対値を示す画像)が得られ、当該差分画像に基づいて、異常部分である欠陥が検出される。そして、欠陥部分の多値画像である欠陥画像が生成される。なお、欠陥検出部41は、他の手法により欠陥を検出してもよい。
図2は、実施形態のコンピュータ5の構成を示す図である。コンピュータ5は、CPU51、ROM52およびRAM53を有する。CPU51は、各種演算処理を行う演算回路を含む。ROM52は、基本プログラムを記憶している。RAM53は、各種情報を記憶する揮発性の主記憶装置である。コンピュータ5は、CPU51、ROM52およびRAM53をバスライン501で接続した一般的なコンピュータシステムの構成を備えている。
コンピュータ5は、固定ディスク54、ディスプレイ55、入力部56、読取装置57および通信部58を備えている。これらの要素は、適宜インターフェース(I/F)を介してバスライン501に接続されている。
固定ディスク54は、情報記憶を行う補助記憶装置である。ディスプレイ55は、画像などの各種情報を表示する表示部である。入力部56は、キーボード56aおよびマウス56bなどを含む入力用デバイスである。読取装置57は、光ディスク、磁気ディスク、光磁気ディスクなどのコンピュータ読み取り可能な記録媒体8から情報の読み取りを行う。通信部58は、検査・分類装置1の他の要素との間で信号を送受信する。
コンピュータ5は、読取装置57を介して記録媒体8からプログラム80を読み取り、固定ディスク54に記録する。当該プログラム80は、RAM53にコピーされる。CPU51は、RAM53内に格納されたプログラム80に従って、演算処理を実行する。
図3は、実施形態の検査・分類装置1における機能構成を示すブロック図である。図3では、コンピュータ5のCPU51、ROM52、RAM53および固定ディスク54などにより実現される機能構成を、符号5を付した矩形の破線で囲んでいる。
コンピュータ5は、特徴量算出部31、画像分類装置32および分類器構築装置33を有する。特徴量算出部31は、画像から各種特徴量を算出する。画像分類装置32は、欠陥が検出された場合に、当該欠陥を自動的に分類する。分類器構築装置33は、分類器330を構築する。
画像分類装置32は、画像記憶部321(分類対象画像記憶部)、分類制御部322、および入力部56(図2参照)を有する。分類制御部322は、分類器320を有する。分類器構築装置33により構築された当該分類器330は、画像分類装置32における分類器320として登録される。
分類器構築装置33は、教師データ記憶部331、度数分布データ生成部332、分類器生成部333、度数分布データ修正部334および繰返制御部335を有する。
特徴量算出部31、画像分類装置32および分類器構築装置33各々が実現する機能の詳細については後述する。なお、これらの各機能は専用の電気回路により構築されてもよく、部分的に専用の電気回路が利用されてもよい。
検査・分類装置1では、事前準備として、分類器構築装置33による分類器330の構築が行われる。図4は、実施形態の分類器構築装置33による分類器330の構築の流れを示す図である。本処理例における分類器330の構築では、分類器330の構造が実質的に予め決定されており、分類器330が含むパラメータに値を付与することにより、分類器330が生成される。
まず、欠陥検出部41にて検出された多数の欠陥画像が、教師データ記憶部331に記憶される。続いて、特徴量算出部31では、各欠陥画像に対して複数種類の特徴量の値、すなわち、複数の特徴量軸における値が取得される。複数の特徴量軸には、たとえば、欠陥の面積、周囲長、重心位置、モーメント量、階調値の平均、分散、最大、最小等の特徴量についての軸が含まれる。各欠陥画像に対する複数の特徴量軸の値の集合は、特徴量ベクトルとも呼ばれる。
また、各欠陥画像が示す欠陥に対して、ユーザにより、欠陥のクラスの教示(入力)が行われる。クラスの教示では、複数の欠陥画像が、コンピュータ5のディスプレイ55に表示される。そして、ユーザにより、各欠陥画像に対して複数のクラスのいずれか1つが決定され、クラスの入力が入力部56を介して行われる。これにより、複数の欠陥画像のそれぞれにおいて、複数のクラスのうちの1つが教示クラスとして教示される。以下、クラスの教示が行われた欠陥画像を、「教師画像」という。
教師データ記憶部331では、各教師画像の教示クラスと、当該教師画像に対して取得される複数の特徴量軸の値とが互いに関連付けられた状態で、これらの情報が記憶される。言い換えると、各教師画像の教示クラスと、当該教師画像における複数の特徴量軸の値とを含む教師データ81が複数生成され、教師データ記憶部331に記憶される(図4:ステップS11)。既述のように、欠陥検出部41では、基板9の撮像画像と参照画像とを比較することにより差分画像が得られ、当該差分画像に基づいて欠陥画像が生成される。したがって、欠陥画像(教師画像)と共に、参照画像および差分画像において欠陥画像と同じ領域を示す部分等を用いて、特徴量軸毎の値が取得されてもよい(後述する画像分類装置32による対象画像の分類において同様)。
複数の教師データ81が準備されると、度数分布データ生成部332は、複数の教師データ81に基づいて、特徴量軸毎の度数分布を表す度数分布データ82を生成する(図4:ステップS12)。度数分布データ82は、複数の教師データ81を標本とする度数分布を示すデータであって、特徴量軸毎に、各特徴量軸の値を離散化した各区間における度数(出現頻度)をクラス別に示すデータである。
具体的には、度数分布データ生成部332は、特徴量軸毎に、複数の教師データ81に含まれる各特徴量の値の中から、最大値および最小値を特定することにより、特徴量軸毎に値の分布範囲を取得する。そして、度数分布データ生成部332は、当該分布範囲を、適当な個数の区間に等分割(離散化)する。分布範囲の分割数は、たとえば、2の1乗(即ち、2)以上、2の10乗以下としうる。そして、離散化された各区間(離散区間)におけるクラス毎の度数(出現頻度)が求められる。具体的には、特徴量軸毎に、1つの教師データ81につき、その教師データ81が持つ特徴量の値に対応する対応離散区間の度数を1つだけ加える。これを各教師データ81について行うことにより、度数分布データ82が生成される。
図5は、度数分布データ82が示す第1の特徴量軸における複数のクラスの度数分布表を示す図である。図6は、度数分布データ82が示す第1の特徴量軸におけるクラス別のヒストグラムを示す図である。また、図7は、度数分布データ82が示す第2の特徴量軸における複数のクラスの度数分布表を示す図である。図8は、度数分布データ82が示す第2の特徴量軸におけるクラス別のヒストグラムを示す図である。図5および図7では、複数(ここでは3種類)のクラスをそれぞれ「Class 1」、「Class 2」、「Class 3」と表し、特徴量軸における区間を、見出しに「bin」と記す行に0〜15の番号で示している(以下同様)。
図5から図8では、各特徴量軸の値の分布範囲の分割数は14(区間(1)〜区間(14))であり、当該分布範囲よりも小さい値の区間(0)および大きい値の区間(15)も設けられている。区間(0)および区間(15)は、クラスが教示されていない未知の画像が示す値が、教師データ81に基づく分布範囲の外側となる場合に用いられる。後述するように、特徴量軸毎のクラス別の度数分布は、画像の分類(すなわち、クラス判別)に供される。このため、度数分布データ82は、クラス判別を行うための「判別情報」ともいえる。
分布範囲の分割数は、特徴量軸毎に異なっていてもよいし、全特徴量軸について同一としてもよい。たとえば、全区間において度数が1となる区間が1つのみ存在するような分割数のうち、最小のものが分割数の上限として設定されうる。これにより、度数が1以上となる区間が不連続となることが抑制される。また、複数の特徴量軸により規定される特徴量空間において、複数の特徴量軸の区間により表現される領域(セル)の個数が、教師画像の総数よりも十分に多くなるように、分割数の下限が設定されることが好ましい。通常、教師画像の個数は多くとも10000個程度である。たとえば、特徴量軸の個数を20個とした場合であって、分割数を2としたとき、特徴量空間におけるセルの個数は、2の20乗個となる。この場合、セルの個数は、教師画像の数よりも十分に多くなる。
分類器生成部333は、各特徴量の値の入力により画像分類する(すなわち、クラス判別する)初期の分類器330を生成する(図4:ステップS13)。当該初期の分類器330は、度数分布データ82が示す、特徴量軸毎の各区間におけるクラス別の出現比率に基づき、分類対象の画像を分類するように構成される。
ここでは、分類器330の基本的構造は予め決定されており、分類器330は、複数の特徴量軸各々について、演算を行う複数の弱分類器を含む。弱分類器各々は、分類対象の画像が持つ特徴量の値を参照して、当該値が取得された画像が、複数のクラスのそれぞれに属する確率(弱分類器各々が対応する特徴量軸のみに着目した確率)をクラス評価結果として求める。
ここで、教師データ81の総数をN、クラスの個数をn、クラスC(i=1,2,・・・,n)に属する(すなわち教示クラスがCである)教師データ81の総数をNとする。Nはどの特徴量軸についても同じ数である。したがって、クラスCに属する教師データ81の総数Nの全クラスの総和は、式(1)のように教師データ81の総数となる。
Figure 2019057024
また、特徴量軸の総数をm、特徴量軸Dj(j=1,2,・・・,m)の値を離散化したときの分割数をKとし、特徴量軸Djの区間k(k=1,2,・・・,K)におけるクラスCに属する教師データ81の個数をFij(k)で表すと、クラスCに属する教師データ81の総数Nは、式(2)のように表される。
Figure 2019057024
一方、1つの特徴量軸Djのみに着目した場合に、区間kにおいてクラスCに属する教師データ81の出現比率(個数Fij(k)のクラスCに属する教師データ81の総数Nに対する比率)は、当該特徴量軸Djの値が区間kに属する画像がクラスCに属する確率と考えることができる。以下、当該確率をPjk(Ci)と表す。この確率Pjk(Ci)は、式(3)のように表される。
Figure 2019057024
たとえば、第1の特徴量軸(特徴量軸D1)の9番の区間(9)について確率Pjk(Ci)を求めた場合、たとえば、クラス1(C1)の確率P1,9(C1)は、0.031(=49/1578)となる。また、クラス2(C2)の確率P1,9(C2)は、0.171(=486/2849)となる。さらに、クラス3(C3)の確率P1,9(C3)は、0.013(=9/688)となる。1つの特徴量軸において、確率Pjk(Ci)はn個(クラス数)だけ得られるが、全クラスの確率Pjk(Ci)の総和は1にはならない。
分類器330を構成する複数の弱分類器各々は、対応する特徴量軸Djの値から度数分布データ82を参照することにより、クラス別に出現比率(確率Pjk(Ci))をクラス評価結果として求める。当該弱分類器では、特徴量軸Djの値が取得された画像が、特定のクラスCiに属するとした場合の妥当性(確信度)を示す評価値がクラス評価値として求められるともいえる。
ところで、多くの特徴量軸におけるクラス別の度数分布では、図6および図8のヒストグラムのように、互いに重なり合う部分が多く存在するため、各特徴量軸において求められる複数のクラスに対する確率によるクラスの予測精度は、あまり高いとは言えない(ただし、ランダムにクラスを予測するよりも精度は高いといえる。)。そこで、分類器330では、アンサンブル学習の考え方が取り入れられており、複数の特徴量軸に対する複数の弱分類器のクラス評価結果に基づいて分類クラスを決定する強分類器として、分類器330が構成される。
分類器330では、各特徴量軸に対するクラス評価結果として、複数のクラスの評価値(確率)が求められるが、クラス評価結果は、例えば、評価値が最大のクラスに1を付与し、他のクラスに0を付与するものであってもよい。この場合、実質的に、各特徴量軸において評価値が最大のクラスに投票を行う処理となり、複数の特徴量軸における得票数が最大のクラスが分類クラスとして決定される。
度数分布データ修正部334は、度数分布データ生成部332によって生成され、分類器生成部333に送られた度数分布データ82を修正する。以下、度数分布データ修正部334が度数分布データ82を修正する処理の流れについて説明する。具体的には、度数分布データ修正部334は、修正対象の度数分布データ82に基づき画像分類を行う分類器330を用いて、複数の教師データ81を分類する(図4:ステップS14)。本処理例では、度数分布データ修正部334は、教師データ81として、初期の分類器330を生成したとき(すなわち、初期の度数分布データ82を生成したとき)に使用された教師データ81全部を、分類器330に分類させる。なお、度数分布データ修正部334が、教師データ81全部のうち一部のみを選択して、分類器330に分類させてもよい。また、ステップS14において、これまで使用されていない教師データ81(すなわち、度数分布データ82に反映されていない教師データ81)を含めて、分類器330に分類させてもよい。教師データ81の分類では、各教師データ81の各特徴量軸Djの値が特定され、クラスCi別の出現比率(確率Pjk(Ci))がクラス評価結果として取得される。
分類器330による分類では、さらに、特徴量軸各々の出現比率の代表値(例えば、平均値や中央値、加重平均値等)が求められる。そして、全クラスのうち代表値が最大であるクラスが、当該教師データの分類先のクラスに決定される。各教師データの分類クラスは、度数分布データ修正部334において記憶される。なお、分類器330による好ましい処理では、(1)最大の代表値が所定の閾値SH1未満である場合、または、(2)最大の代表値と2番目に大きい代表値との差(または比率)が所定の他の閾値SH2未満である場合などに、分類すべきクラスが不明であることを示す追加クラスが分類クラスとして決定される。以下の説明では、上記(1)、(2)の場合に、教師画像群の教師画像が、追加クラスに分類されるものとする。
図9は、分類器330による教師データ81の分類結果の一例を示す図である。図9は、分類結果をまとめたコンフュージョンマトリクス(混同行列)である。図9では、3種類の教示クラスを行見出しに記し、不明を含む4種類の分類クラスを列見出しに記している。教示クラスが「A」である複数の教師データ81のうち、クラス「B」に分類された教師データ81の個数は、「A」の行と「B」の列とが交差するセルに示される。たとえば、教示クラスが「Class 1」である複数の教師データ81のうち、「Class 2」に誤分類された教師データ81の数は、143個である。また、「Precision」の行と「Recall」の列とが交差するセルは、分類器330により分類された教師データ81の総数のうち、分類器330により分類されたクラスと教示クラスとが一致した教師データ81の総数の比率(正答率:Accuracy)である。全ての教師データ81が分類対象とされている場合、図9の分類結果は、いわゆる再代入法評価の結果である。
続いて、度数分布データ修正部334は、教師データ81のうち、分類されたクラスが教示クラスと相違していた教師データ81(以下、このデータを「誤分類教師データ」とも称する。)が存在する場合、その教師データ各々に基づいて、度数分布データ82を修正する(図4:ステップS15)。
この度数分布データ82の修正では、誤分類教師データを参酌することにより、特徴量軸各々に関して、その誤分類教師データが持つ特徴量の値に対応する区間(対応区間)が特定されるとともに、その対応区間における誤分類教師データの教示クラスの度数が、予め定められた正の値(たとえば「1」)だけ増加される。すなわち、分類先のクラスが教示クラスと相違した誤分類教師データについて、特徴量軸毎のクラス別の度数分布を示す度数分布データ82において、重複して計数された度数分布データ82が生成されることとなる。この処理は、誤分類教師データの重みの変更と捉えることもできる。
図10は、度数分布データ82の修正例を説明するための図である。ここでは、誤分類教師データの教示クラスが「Class 2」であり、その誤分類教師データが持つ特徴量軸Djの特徴量の値の対応区間が区間kであるとする。すると、この場合、図10に示すように、度数分布データ修正部334は、区間kにおける「Class 2」の度数(個数F2j(k))を「1」だけ増加させる。これにより、区間kにおける「Class 2」の出現比率(確率Pjk(C2))が見かけ上増加することとなる。このような要領で、度数分布データ修正部334は、誤分類教師データの全ての特徴量軸に関して、対応区間の度数を増加させることにより、度数分布データ82を修正する。
続いて、度数分布データ修正部334は、修正された度数分布データ82に基づき画像を分類されるように、分類器330を更新する(図4:ステップS16)。新たな度数分布データ82では、誤分類された教師データ81について、特徴量軸毎に対応する対応区間の出現比率が増加している。このため、新たな分類器330では、この誤分類された教師データ81を教示クラスに正しく分類する確率を上げることができる。
続いて、度数分布データ修正部334は、修正された度数分布データ82に基づく分類器330を用いて、複数の教師データ81を分類する(図4:ステップS17)。ここでは、ステップS11で準備された複数の教師データ81の全てを対象としてもよいし、そのうちの一部を対象としてもよい。また、ステップS17において、これまで使用されていない教師データ81(すなわち、度数分布データ82に反映されていない教師データ81)を含めて、分類器330に分類させてもよい。
繰返制御部335は、分類器330の教師データ81の分類精度が所定の基準を満たすまで、度数分布データ修正部334に度数分布データ82の修正を行わせる。具体的には、繰返制御部335は、図4のステップS17の分類結果に基づき、分類器330による複数の教師データ81のクラス判別の正答率が所定基準を満たすか否かを判断する(図4:ステップS18)。所定基準は、たとえば正答率100%とすることが考えられる。正答率が所定基準を満たさない場合(ステップS18においてNOの場合)、ステップS15戻って、度数分データ修正部334が、ステップS17において誤分類された教師データ81に基づいて、度数分布データ82をさらに修正する処理を行う。このように、分類器330による複数の教師データ81のクラス判別の正答率が100%となるまで、ステップS15からステップS17までが繰り返し行われる(ステップS18)。
ステップS18において、所定基準を満たす分類器330が得られた場合(ステップS18においてYESの場合)、その分類器330が画像分類装置32における分類器320として登録される(ステップS19)。
このように、分類器構築装置33では、分類器330が度数分布データ82に基づいて教師データ81を分類し、度数分布データ修正部334が誤分類された教師データ81に基づき度数分布データ82を修正する。このとき、度数分布データ修正部334は、特徴量軸毎に、誤分類された教師データ81が持つ特徴量の値に対応する対応区間の度数が増大するように度数分布データ82を修正する。これにより、誤分類された教師データ81各々の各特徴量の値が属する区間の出現比率が見かけ上増加した度数分布データ82が生成される。このため、分類器330がこの修正された度数分布データ82に基づき画像分類を行うように更新されることにより、誤分類された教師データ81を予め教示されたクラスに正しく分類する確率が上昇する。したがって、このような度数分布データ82の修正を繰り返し行うことにより、分類器330の分類精度を向上できる。
図11は、度数分布データ82の他の修正例を説明するための図である。図10に示す例では、対応区間kのみの度数を「1」だけ増加させている。しかしながら、図11に示すように、対応区間である区間kだけでなく、その区間kに隣接する区間k+1,k−1(隣接区間)についても、度数を増加させてよい。また、図11に示す例では、区間kの増加数は「2」としており、区間k+1,k−1の増加数「1」としている。このように、対応区間の増加数と隣接区間の増加数とを異ならせてもよいし、一致させてもよい。
また、度数を増加させる区間は、対応区間及びその両側の隣接区間に限定されない。たとえば、対応区間kとその両側の複数区間、あるいは、対応区間kとその片側の複数区間について、度数を増加させてもよい。また、対応区間kを中心とするガウス分布(詳細には、ガウス分布を整数化したもの)に従って、両側(または片側)の各区間における度数の増加数を決定してもよい。
誤分類された教師データ81が持つ特徴量が属する対応区間および隣接区間の度数を増加させることにより、それらの区間の出現比率を見かけ上増加させた度数分布データ82を生成できる。ここで、誤分類された教師データ81の教示クラスに属する画像の特徴量は、通常、特定の対応区間とそれに隣接する隣接区間に分布しうる。このため、更新された分類器330が、対応区間または隣接区間の特徴量を持つ画像を、誤分類された教師データ81の教示クラスに分類する確率を上げることができる。
また、対応区間の増加数を隣接区間の増加数よりも多くする場合、対応区間の出現比率を隣接区間の出現比率よりも相対的に大きく増加させることができる。したがって、更新された分類器330が、誤分類された教師データ81の教示クラスに分類されるべき画像、すなわち、上記対応区間の特徴量を持つ画像が、その教示クラスに分類される確率を上げることができる。
図12は、画像分類装置32による新たな教師データ81の生成支援処理の流れを示す図である。画像分類装置32が備える分類器320は、分類器構築装置33が図4に示す流れに沿って生成した分類器330である。画像分類装置32は、オペレータが未教示の欠陥画像から新たな教師画像(教師データ81)を生成する作業を支援することができる。
具体的には、画像分類装置32が分類器320を用いて未教示の欠陥画像を分類する(ステップS21)。画像分類装置32は、この分類結果を、ディスプレイ55に表示することにより、オペレータに提示する(ステップS22)。そして、画像分類装置32は、オペレータによる操作に応じて、教師データ81の登録を行う(ステップS23)。詳細には、オペレータが、分類された欠陥画像の分類結果が適切と判断した場合には、その分類結果を採用する操作を行う。これにより、画像分類装置32が、その分類結果に従って教師データ81を生成し、記憶部(教師データ記憶部331)に保存する。一方、分類結果が不適切であった場合には、オペレータが正しいクラスを入力する操作を行う。それに基づき、画像分類装置32がその入力に従って教師データ81を保存する。画像分類装置32は、教師データ数が目標数まで達したか否かを判断する(ステップS24)。目標数に達していない場合(ステップS24においてNO)、画像分類装置32はステップS21を再び実行する。また、目標数を達成した場合(ステップS24においてYES)には、画像分類装置32は教師データ81の生成支援処理を終了する。
このように、画像分類装置32を用いて教師データ81の生成する場合、オペレータに対して、各未教示の欠陥画像についての分類先のクラスを、所定の精度で提示することができる。したがって、オペレータが全ての欠陥画像を確認してクラスを決定する場合、たとえば、未教示の欠陥画像が1000あるいは10000個以上となると、オペレータにとって分類作業は極めて大きい負担となる。そこで、画像分類装置32を用いることにより、その負担を大幅に軽減できる。
なお、画像分類装置32を使って新たに取得された教師データ81を使って、再び分類器構築装置33において、分類器330を新たに構築してもよい。あるいは、既に保存されている分類器330について、新たに得られた教師データ81を使って更新することも考えられる。具体的には、度数分布データ修正部334が、新たな教師データ81の度数を、度数分布データ82が示す度数分布に加えることが考えられる。あるいは、度数分布データ修正部334が、それまでに得られている分類器330を使って新たな教師データ81を分類し、そのうちの誤分類された教師データ81に基づいて、図10または図11に説明した要領で度数分布データ82を修正するとよい。
なお、ステップS21において、分類器320が未教示の欠陥画像を分類した場合に、分類先のクラスが不明とされ、追加クラスに分類される場合がある。このような欠陥画像については、任意の学習アルゴリズム(線形判別分析やSVMなど)で別途構築された分類器(以下、「追加的分類器」と称する。)を用いて分類を行い、その分類結果をステップS22においてオペレータに提示されてもよい。この場合、分類器320によって分類先不明とされた欠陥画像であっても、該当する蓋然性のあるクラスをオペレータに提示できる。
また、分類器320によって分類先不明とされた欠陥画像だけなく、分類器320によってクラスが決定された欠陥画像についても、上記追加的分類器で重複的に分類を行ってもよい。このとき、分類器320と追加的分類器の分類結果が一致した欠陥画像については、分類先のクラスを正式なクラスとする教師データ81を生成してもよい。また、分類器320と追加的分類器の分類結果が一致しない欠陥画像については、それぞれの結果をステップS22にてオペレータに提示するようにしてもよい。これにより、教師データ81を生成する際に、オペレータが確認する欠陥画像の数を軽減できることから、教師データ81の生成を適切に支援できる。
<画像分類装置32による画像分類について>
ここで、画像分類装置32による欠陥画像の分類について、簡単に説明する。既述のように、検査・分類装置1では、撮像装置2により基板9が撮像され、撮像画像が欠陥検出部41に入力される。欠陥検出部41では、検査対象領域の欠陥検査が行われ、欠陥が検出されると、欠陥部分の多値画像である欠陥画像が生成されて画像分類装置32に出力される。これにより、欠陥画像が、画像記憶部321に記憶された状態で準備される。当該欠陥画像は、画像分類装置32における分類対象の画像であるため、以下、「対象画像」とも称する。
続いて、特徴量算出部31により、対象画像に対して複数の特徴量軸の値(複数種類の特徴量の値)が算出される。分類制御部322には、分類器構築装置33により構築された分類器320が備えられており、複数の特徴量の値が分類器320に入力されると、当該対象画像の分類が行われる。
対象画像の分類は、図4のステップS14における教師データ81の分類と同様にして行われる。すなわち、特徴量軸毎に、対象画像の特徴量の値が属する区間が特定され、クラス別の評価値がクラス評価結果として取得される。続いて、特徴量軸毎に、クラス別の複数の評価値の代表値が求められ、各クラスのうち代表値が最大であるクラスが、当該対象画像の分類クラスとして決定される。なお、教師データ81の分類と同様に、必要に応じて、分類すべきクラスが不明であることを示す追加クラスが分類クラスとして決定される場合もある。検査・分類装置1では、欠陥検出部41にて欠陥が検出される毎にこのような分類動作がリアルタイムにて行われ、多数の対象画像の自動分類が高速に行われる。
<教示数と分類器の正答率の関係について>
図13は、教示数(教師データ数)と分類器330の正答率の関係を示すグラフである。このグラフにおいて、横軸は教示数(クラスが教示された教師データ81の数)を示しており、縦軸はその教示数で分類器構築装置33が生成した分類器330の正答率を示している。このグラフは、分類器330が全データ数5112個の欠陥画像(特徴量軸の数は174次元)を3クラスに分類したときの例を示している。なお、正答率を算出するために、5112個のデータ全てには予めクラスラベルが付与されているが、分類器330の分類処理中には参照されない。たとえば、分類器330を生成する際、1クラスにつき1つの教師データ81を使用した場合、教示数が3となる。また、1クラスにつき2つの教師データ81を使用した場合、教示数が6となる。教師データ81の選出はランダムに行っている。
また、図13では、分類器330を取得する際、度数分布データ修正部334が度数分布データ82を修正するときに(図4:ステップS15参照)、対応区間(注目区画)を中心にしてその両側に{1,3,1}(総数5、標準偏差1)のように度数を増加させている。どの教示数についても、正答率の評価が100回ずつ独立して行われている。グラフ中、黒丸で示される点が100回の評価により得られた正答率の平均値を示しており、上下の「ひげ」は正答率の分布範囲(最大および最小)を示している。また、比較のため、度数分布データ82を修正する際に対応区間に+1だけ増加させる単純な方法で生成された分類器330の正答率を破線で示している。
図13に示すように、教示数を増やすことにより、分類器330の正答率が向上している。また、対応区間に度数を1だけ増加させる場合よりも、対応区間およびその隣接区間にも度数を増加させる場合の方が、正答率の高い分類器330を得ることができている。この傾向は、教示数が少ないほど特に顕著である。
図14は、教示数と分類器330の正答率の関係を示す他のグラフである。このグラフにおいて、横軸は教示数を示しており、縦軸は分類器構築装置33が生成した分類器330の正答率を示している。このグラフは、欠陥画像ではなく、細胞画像を教師データ81として生成された分類器330を用いて、全データ数5000個の細胞画像(特徴量軸の数は11次元)を3クラスに分類したときの正答率を示している。
また、図14では、分類器330を生成する際、度数分布データ修正部334が度数分布データ82を修正するときに(図4:ステップS15参照)、対応区間(注目区画)を中心にしてその両側に{1,2,3,5,8,11,13,14,13,11,8,5,3,2,1}(総数100,標準偏差3)のように度数を増加させている。グラフ中、黒丸で示される点が100回の評価により得られた正答率の平均値を示しており、上下の「ひげ」は正答率の分布範囲(最大および最小)を示している。また、比較のため、度数分布データ82を修正する際に対応区間に+1だけ増加させる単純な方法で生成された分類器330の正答率を破線で示している。
図14に示す例においても、図13に示した例と同様に、教示数を増やすことにより、分類器330の正答率が向上している。また、対応区間に度数を1だけ増加させる場合よりも、対応区間及びその周辺の区間にも度数を増加させる場合の方が、正答率の高い分類器330を得ることができている。この傾向は、教示数が少ないほど特に顕著である。
なお、図13及び図14に示すように、同じ教示数であっても、教師データ81の選び方により正答率のばらつきが発生する。たとえば、図13に示すように、教示数を3とした場合には平均50%程度の正答率であるが、最初にオペレータが教師データ81を適切に選べば、65%以上の正答率が得られる可能性がある。また、たとえば、ステップS17において、新たな教師データ81を各クラスに1つずつ追加していけば、50回の繰り返しで分類器330の正答率が80%近くに到達すると期待できる。
<度数分布データ82のその他の生成例について>
上記説明では、ステップS12において初期の度数分布データ82を生成する際、特徴量軸毎に、1つの教師データ81につき、その教師データ81が持つ特徴量の値に対応する対応離散区間の度数を1つ加える。そして、この処理を各教師データ81について行うことにより、度数分布データ82(以下、初期の度数分布データ82と称する。)が生成される。しかしながら、初期の度数分布データ82を生成する際、このように度数を加えていくことは必須ではない。
図15は、初期の度数分布データ82を生成する様子を説明するための図である。図15中、上側は度数追加前の度数分布データ82の一部(ヒストグラム)を示しており、下側は度数追加後の度数分布データ82の一部(ヒストグラム)を示している。
度数を追加する場合、まず、対称軸毎に、集計対象である教師データ81が持つ特徴量の値に対応する対応離散区間が特定される。ここでは、教示クラスが「Class 2」である教師データ81の特徴量軸Djの値が対応離散区間kに対応しているものとする。すると、度数分布データ生成部332は、図15に示すように、対応離散区間kについて、教示クラス(Class 2)の度数を増加させる。ここでは、「1」よりも大きい値(ここでは「2」)が加えられている。また、図15に示すように、度数分布データ生成部332は、対応離散区間kに隣接する区間k−1,k+1についても、教示クラス(Class 2)の度数を増加させる。ここでは、対応離散区間の増加数(「2」)よりも小さい値(ここでは「1」)が加えられている。このように、初期の教師データ81を生成する際に、対応離散区間に隣接する区間にも度数を加えてもよい。
なお、度数分布データ生成部332が初期の教師データ81を生成する際に、度数を増加させる区間は、対応離散区間及びその両側に隣接する区間の3区間に限定されない。たとえば、対応離散区間kとその両側の4区間以上、あるいは、対応区間kとその片側の複数区間の2区間以上について、度数を増加させてもよい。また、対応区間kを中心とするガウス分布(詳細には、ガウス分布を整数化したもの)に従って、両側の各区間の増加数を決定してもよい。
このように、教師データ81が持つ特徴量に対応する対応離散区間およびそれに隣接する区間の度数を増加させることにより、それらの区間の出現比率を見かけ上増加させた度数分布データ82を生成できる。ここで、教師データ81の教示クラスに属する画像の特徴量は、通常、特定の対応区間とそれに隣接する隣接区間に分布しうる。このため、更新された分類器330が、対応離散区間またはそれに隣接する区間の特徴量を持つ画像を、教師データ81の教示クラスに分類する確率を上げることができる。
また、対応離散区間の増加数を隣接する区間の増加数よりも多くする場合、対応離散区間の出現比率を隣接する区間の出現比率よりも相対的に大きく増加させることができる。これにより、教師データ81の教示クラスに分類されるべき画像、すなわち、上記対応隣接区間の特徴量を持つ画像が、生成された分類器330により、その教示クラスに分類される確率を上げることができる。
<2. 変形例>
以上、実施形態について説明してきたが、本発明は上記のようなものに限定されるものではなく、様々な変形が可能である。
欠陥画像は、半導体基板以外の基板上の欠陥を示すものであってよい。当該基板として、ハードディスク基板等の薄膜デバイス、プラズマディスプレイや液晶ディスプレイ等の薄型ディスプレイに用いられるガラス基板、フォトマスク基板、フィルム基板、プリント配線基板等が例示される。
また、検査・分類装置1が、太陽電池パネルを撮像した欠陥画像を分類する用途に用いられてもよい。例えば、太陽電池パネルのEL(エレクトロ・ルミネッセンス)発光やPL(フォト・ルミネッセンス)発光を撮像して得られる画像や、レーザーテラヘルツエミッション顕微鏡(LTEM)を用いて得られる太陽電池パネルの画像において、参照画像が示す正常な領域とは異なる領域を含む部分を欠陥画像として扱って、検査・分類装置1において太陽電池パネルの欠陥が分類されてよい。さらに、欠陥画像は、電子線やX線などにより撮像される画像であってもよい。このように、検査・分類装置1では、可視光により撮像される画像のみならず、広義の放射線により撮像される画像が分類される。
検査・分類装置1において、画像分類装置32および分類器構築装置33の機能は、撮像装置2および欠陥検出部41とは独立して用いられてもよい。画像分類装置および分類器構築装置は、血液や培養液等の所定の液中の細胞を撮像した細胞画像を、複数のクラスに分類する用途に用いられうる(図14参照)。また、画像分類装置および分類器構築装置は、様々な分類対象を示す画像の分類に利用可能である。また、分類器構築装置は、画像分類装置に含まれてもよい。
この発明は詳細に説明されたが、上記の説明は、すべての局面において、例示であって、この発明がそれに限定されるものではない。例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。上記各実施形態及び各変形例で説明した各構成は、相互に矛盾しない限り適宜組み合わせたり、省略したりすることができる。
1 検査・分類装置
5 コンピュータ
8 記録媒体
9 基板
31 特徴量算出部
32 画像分類装置
320,330 分類器
321 画像記憶部
322 分類制御部
33 分類器構築装置
331 教師データ記憶部
332 度数分布データ生成部
333 分類器生成部
334 度数分布データ修正部
335 繰返制御部
41 欠陥検出部
56 入力部
81 教師データ
82 度数分布データ

Claims (9)

  1. 画像を複数のクラスのいずれかに分類する分類器を構築する分類器構築方法であって、
    (a)前記クラスが教示された教師画像、および、前記教師画像に基づく複数の特徴量軸毎の値を含む教師データを、前記複数のクラス各々につき1つ以上ずつ準備する工程と、
    (b)前記工程(a)にて準備された前記複数の教師データに基づき、前記複数の特徴量軸毎に、特徴量軸の値を離散化して得た各区間における度数を前記クラス別に示す度数分布データを生成する工程と、
    (c)前記度数分布データが示す前記特徴量毎の各区間における前記クラス別の出現比率に基づき前記画像を分類する分類器を生成する工程と、
    (d)前記複数の教師データのうち一部または全部を前記分類器で分類する工程と、
    (e)前記度数分布データのうち前記工程(d)において誤分類された教師データについて、その教師データが持つ特徴量の値に対応する対応区間を前記特徴量軸毎に特定し、特定された前記対応区間における当該教師データの前記教示されたクラスの度数を増加させるように前記度数分布データを修正する工程と、
    (f)前記工程(d)および前記工程(e)を1回以上行うことにより、前記複数の教師データの分類精度が所定の基準を満たす分類器を取得する工程と、
    を含む、分類器構築方法。
  2. 請求項1の分類器構築方法であって、
    前記工程(e)は、前記対応する対応区間に隣接する第1隣接区間の度数が増加するように前記度数分布データを修正する工程を含む、分類器構築方法。
  3. 請求項2の分類器構築方法であって、
    前記工程(e)は、前記対応区間の度数の増加数を、前記隣接区間よりも多くする工程を含む、分類器構築方法。
  4. 請求項1から請求項3のいずれか1項の分類器構築方法であって、
    前記工程(f)は、前記複数の教師データのクラス判別の正答率が100%となる分類器が取得されるまで、前記工程(d)及び前記工程(e)を1回以上行う工程である、分類器構築方法。
  5. 請求項1から請求項4のいずれか1項の分類器構築方法であって、
    前記工程(b)は、
    (b−1)前記教師データが持つ特徴量の値に対応する対応離散区間を前記特徴量軸毎に特定する工程と、
    (b−2)前記対応離散区間において、前記教師データの前記教示されたクラスの度数を増加させる工程と、
    (b−3)前記対応離散区間に隣接する区間において、前記教師データの前記教示されたクラスの度数を増加させる工程と、
    を含む、
    分類器構築方法。
  6. 請求項5の分類器構築方法であって、
    前記(b−2)における前記対応離散区間の度数の増加数が、前記(b−3)における前記対応離散区間に隣接する区間の度数の増加数よりも多い、分類器構築方法。
  7. 画像を分類する画像分類方法であって、
    分類対象画像を準備する工程と、
    請求項1から請求項6のいずれか1項の分類器構築方法により取得された分類器によって、前記分類対象画像を分類する工程と、
    を含む、画像分類方法。
  8. 画像を複数のクラスのいずれかに分類する分類器を構築する分類器構築装置であって、
    前記クラスが教示された教師画像、および、前記教師画像が示す複数の特徴量軸毎の値を含む教師データを、前記複数のクラス各々につき1つ以上ずつ記憶する教師データ記憶部と、
    前記教師データ記憶部に記憶された前記複数の教師データに基づき、前記複数の特徴量軸毎に、特徴量軸の値を離散化した各区間における度数をクラス別に示す度数分布データを生成する度数分布データ生成部と、
    前記度数分布データが示す前記特徴量毎の各区間における前記クラス別の出現比率に基づき、前記画像を分類する分類器を生成する分類器生成部と、
    前記複数の教師データのうち一部または全部を前記分類器で分類したときに誤分類される教師データについて、その教師データが持つ特徴量の値に対応する対応区間を前記特徴量軸毎に特定し、特定された前記対応区間における当該教師データの前記教示されたクラスの度数を増加させるように前記度数分布データを修正する度数分布データ修正部と、
    前記度数分布データ修正部に前記度数分布データの修正を1回以上行わせることにより、前記複数の教師データについての分類精度が所定の基準を満たす分類器を取得する繰返制御部と、
    を備える、分類器構築装置。
  9. 画像を分類する画像分類装置であって、
    請求項8の分類器構築装置と、
    分類対象画像を記憶する分類対象画像記憶部と、
    前記分類対象画像を前記分類器に分類させる分類制御部と、
    を備える、画像分類装置。
JP2017180082A 2017-09-20 2017-09-20 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置 Pending JP2019057024A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017180082A JP2019057024A (ja) 2017-09-20 2017-09-20 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017180082A JP2019057024A (ja) 2017-09-20 2017-09-20 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Publications (1)

Publication Number Publication Date
JP2019057024A true JP2019057024A (ja) 2019-04-11

Family

ID=66106455

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017180082A Pending JP2019057024A (ja) 2017-09-20 2017-09-20 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Country Status (1)

Country Link
JP (1) JP2019057024A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115151367A (zh) * 2020-02-17 2022-10-04 株式会社神户制钢所 自动焊接系统、自动焊接方法、学习装置、已学习模型的生成方法、已学习模型、推定装置、推定方法以及程序

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100121A (ja) * 2003-09-25 2005-04-14 Fuji Photo Film Co Ltd 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JP2005122720A (ja) * 2003-09-25 2005-05-12 Fuji Photo Film Co Ltd 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
JP2015087903A (ja) * 2013-10-30 2015-05-07 ソニー株式会社 情報処理装置及び情報処理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100121A (ja) * 2003-09-25 2005-04-14 Fuji Photo Film Co Ltd 識別処理に用いる特徴量の種類と識別条件を決定する装置、プログラムならびにプログラムを記録した記録媒体、および特定内容のデータを選別する装置
JP2005122720A (ja) * 2003-09-25 2005-05-12 Fuji Photo Film Co Ltd 特定シーンの画像を選別する装置、プログラムおよびプログラムを記録した記録媒体
JP2015087903A (ja) * 2013-10-30 2015-05-07 ソニー株式会社 情報処理装置及び情報処理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
山下 隆義、藤吉 弘亘: ""Online Real Boostingによる物体追跡のための特徴選択"", 情報処理学会研究報告 コンピュータビジョンとイメージメディア(CVIM), JPN6021031151, 15 October 2011 (2011-10-15), JP, pages 1 - 7, ISSN: 0004709977 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115151367A (zh) * 2020-02-17 2022-10-04 株式会社神户制钢所 自动焊接系统、自动焊接方法、学习装置、已学习模型的生成方法、已学习模型、推定装置、推定方法以及程序
CN115151367B (zh) * 2020-02-17 2024-01-12 株式会社神户制钢所 自动焊接系统、自动焊接方法、学习装置、神经网络系统以及推定装置

Similar Documents

Publication Publication Date Title
US10818000B2 (en) Iterative defect filtering process
JP2018045673A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP6472621B2 (ja) 分類器構築方法、画像分類方法および画像分類装置
JP6063756B2 (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
JP6669453B2 (ja) 画像分類装置および画像分類方法
US11886990B2 (en) Classification device, classification method, and computer program product
JP6113024B2 (ja) 分類器取得方法、欠陥分類方法、欠陥分類装置およびプログラム
JP6401648B2 (ja) 欠陥分類装置および欠陥分類方法
JP6531036B2 (ja) 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置
JP2014070944A (ja) 教師データ検証装置、教師データ作成装置、画像分類装置、教師データ検証方法、教師データ作成方法および画像分類方法
JP2019197355A (ja) クラスタリング装置、クラスタリング方法およびプログラム
TWI601098B (zh) 影像分類裝置及影像分類方法
US20220156585A1 (en) Training point cloud processing neural networks using pseudo-element - based data augmentation
US11373285B2 (en) Image generation device, image generation method, and image generation program
JP6763673B2 (ja) 教師データ作成支援装置、画像分類装置、教師データ作成支援方法および画像分類方法
JP2020052475A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP2019057024A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP6632124B2 (ja) 画像分類方法および画像分類装置
JP2018205860A (ja) 分類器構築方法、分類器および分類器構築装置
JP6425468B2 (ja) 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置
JP7120528B2 (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
US11983241B2 (en) Method and system for training a neural network
WO2020026395A1 (ja) モデル作成装置、モデル作成方法、及び、モデル作成プログラムが記録された記録媒体
CN111401528A (zh) 基于模拟退火遗传算法的生成对抗网络过采样方法及装置
KR20190078710A (ko) 이미지 분류 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200622

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210817

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220222