JP6531036B2 - 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置 - Google Patents

教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置 Download PDF

Info

Publication number
JP6531036B2
JP6531036B2 JP2015239156A JP2015239156A JP6531036B2 JP 6531036 B2 JP6531036 B2 JP 6531036B2 JP 2015239156 A JP2015239156 A JP 2015239156A JP 2015239156 A JP2015239156 A JP 2015239156A JP 6531036 B2 JP6531036 B2 JP 6531036B2
Authority
JP
Japan
Prior art keywords
class
image
teacher
teacher data
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015239156A
Other languages
English (en)
Other versions
JP2017107313A (ja
Inventor
松村 明
明 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2015239156A priority Critical patent/JP6531036B2/ja
Publication of JP2017107313A publication Critical patent/JP2017107313A/ja
Application granted granted Critical
Publication of JP6531036B2 publication Critical patent/JP6531036B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像を分類する分類器の学習に使用される教師データの作成を支援する技術、および、画像を分類する技術に関する。
従来より、分類器を用いた画像の自動分類が行われている。画像の自動分類では、教師画像およびそのクラス(すなわち、教師画像が示す対象物の種別であり、カテゴリとも呼ばれる。)を示す教師データを用意して分類器を学習させる必要がある。典型的には、各教師画像のクラスをオペレータが決定することにより、教師データが作成される。
オペレータによるクラスの決定により作成される教師データには、矛盾したデータが含まれやすくなる。分類器の学習は、そのような矛盾したデータにも汎用的に対応するように行われるため、分類器の性能が低下してしまうおそれがある。そこで、特許文献1では、正確な教師データの作成を支援する手法が開示されている。当該手法では、教師データを使用した学習により判別関数が求められ、当該判別関数を用いて教師データに含まれる各欠陥画像がいずれかのクラスに分類される。そして、分類結果である分類クラスと教師データのクラスとが一致しないデータが、オペレータに提示される。オペレータにより、当該データのクラスが修正され、または、当該データが教師データから除外される。
なお、特許文献2では、欠陥画像に付与されたクラスが当該欠陥画像が属すべきクラスか否かを判定する手法が開示されている。当該手法では、各種類の特徴量の分散に基づいて設定されたクラス毎の特徴量範囲に欠陥画像の当該種類の特徴量が含まれる場合、当該特徴量範囲に対応するクラスへの投票が行われ、当該欠陥画像に付与されたクラスと得票数が最も多いクラスとが異なる場合にその旨が出力される。
特開平11−344450号公報 特開2010−91401号公報
既述のように、特許文献1の手法では、教師データを用いて取得される判別関数による分類結果と、教師データのクラスとが一致しないデータがオペレータに提示されるが、教師データをより正確に作成するには、例えば、判別関数による境界近傍に位置する教師画像も、オペレータによる確認が行われることが好ましい場合がある。したがって、オペレータによる確認用に表示部に表示すべき教師画像をより適切に選別することが可能な新規な手法が求められる。
本発明は上記課題に鑑みなされたものであり、オペレータによる確認用に表示部に表示すべき教師画像をより適切に選別することを目的としている。
請求項1に記載の発明は、画像を分類する分類器の学習に使用される教師データの作成を支援する教師データ作成支援方法であって、a)それぞれが複数の初期クラスのいずれかに割り振られた複数の教師画像と、前記複数の教師画像のそれぞれの初期クラスを教示結果として示す教示情報とを含む第1仮教師データを準備する工程と、b)前記第1仮教師データを用いて第1分類器を構築する工程と、c)前記第1分類器を用いて前記複数の教師画像を分類する工程と、d)前記第1分類器による第1分類結果が前記教示結果と一致する教師画像に対して前記教示結果の初期クラスを割り振り、前記第1分類結果が前記教示結果と相違する教師画像に対して、前記教示結果および前記第1分類結果の初期クラスの組合せ毎に設定される補助クラスを割り振ることにより、第2仮教師データを作成する工程と、e)前記第2仮教師データを用いて第2分類器を構築する工程と、f)前記第2分類器を用いて前記複数の教師画像を分類する工程と、g)前記第2分類器による第2分類結果が前記教示結果と相違する教師画像の集合をクラス相違画像群として、前記クラス相違画像群のうち少なくとも一部の画像を表示部への表示対象として特定する工程とを備える。
請求項2に記載の発明は、請求項1に記載の教師データ作成支援方法であって、前記g)工程において、前記クラス相違画像群のうち前記第2分類結果が補助クラスである画像が、補助クラス画像として前記表示対象に含まれる。
請求項3に記載の発明は、請求項2に記載の教師データ作成支援方法であって、前記g)工程において、前記第2分類結果が前記教示結果と一致する教師画像の集合をクラス一致画像群として、前記クラス一致画像群のうち各初期クラスに含まれる画像から、複数の特徴量軸のそれぞれにおいて取得される値の分布を示す分布情報が取得され、前記g)工程が、g1)一の補助クラス画像の補助クラスに係る2つの初期クラスのそれぞれを注目クラスとして、前記複数の特徴量軸のそれぞれにおいて、前記補助クラス画像から取得される値が、前記注目クラスの前記分布情報に基づいて設定されるクラス分布範囲内に含まれるか否かを判定する工程と、g2)前記2つの初期クラスの双方において、前記補助クラス画像の前記値が前記クラス分布範囲外となる特徴量軸が存在する場合に、前記補助クラス画像を、前記表示対象を示す一の特定画像群に含める工程とを備える。
請求項4に記載の発明は、請求項1ないし3のいずれかに記載の教師データ作成支援方法であって、前記g)工程において、前記クラス相違画像群のうち前記第2分類結果が補助クラスではない画像が、初期クラス相違画像として前記表示対象に含まれる。
請求項5に記載の発明は、請求項4に記載の教師データ作成支援方法であって、前記g)工程において、前記第2分類結果が前記教示結果と一致する教師画像の集合をクラス一致画像群として、前記クラス一致画像群のうち各初期クラスに含まれる画像から、複数の特徴量軸のそれぞれにおいて取得される値の分布を示す分布情報が取得され、前記g)工程が、g3)前記複数の特徴量軸のそれぞれにおいて、一の初期クラス相違画像から取得される値が、前記初期クラス相違画像の前記第2分類結果である初期クラスの前記分布情報に基づいて設定されるクラス分布範囲内に含まれるか否かを判定する工程と、g4)前記初期クラス相違画像の前記値が前記クラス分布範囲外となる特徴量軸が存在する場合に、前記初期クラス相違画像を、前記表示対象を示す一の特定画像群に含める工程とを備える。
請求項6に記載の発明は、請求項5に記載の教師データ作成支援方法であって、前記g)工程が、g5)前記初期クラス相違画像の前記値が前記クラス分布範囲外となる特徴量軸が存在しない場合に、前記初期クラス相違画像を、前記表示対象を示す他の一の特定画像群に含める工程をさらに備える。
請求項7に記載の発明は、画像を分類する画像分類方法であって、請求項1ないし6のいずれかに記載の教師データ作成支援方法を利用して作成された教師データを用いて分類器を学習させる工程と、前記分類器により画像を分類する工程とを備える。
請求項8に記載の発明は、画像を分類する分類器の学習に使用される教師データの作成を支援する教師データ作成支援装置であって、それぞれが複数の初期クラスのいずれかに割り振られた複数の教師画像と、前記複数の教師画像のそれぞれの初期クラスを教示結果として示す教示情報とを含む第1仮教師データを記憶する記憶部と、分類器を構築する分類器構築部と、前記第1仮教師データを用いて前記分類器構築部に第1分類器を構築させ、前記第1分類器を用いて前記複数の教師画像を分類する第1分類制御部と、前記第1分類器による第1分類結果が前記教示結果と一致する教師画像に対して前記教示結果の初期クラスを割り振り、前記第1分類結果が前記教示結果と相違する教師画像に対して、前記教示結果および前記第1分類結果の初期クラスの組合せ毎に設定される補助クラスを割り振ることにより、第2仮教師データを作成する仮教師データ作成部と、前記第2仮教師データを用いて前記分類器構築部に第2分類器を構築させ、前記第2分類器を用いて前記複数の教師画像を分類する第2分類制御部と、前記第2分類器による第2分類結果が前記教示結果と相違する教師画像の集合をクラス相違画像群として、前記クラス相違画像群のうち少なくとも一部の画像を表示部への表示対象として特定する表示対象特定部とを備える。
請求項9に記載の発明は、請求項8に記載の教師データ作成支援装置であって、前記表示対象特定部が、前記クラス相違画像群のうち前記第2分類結果が補助クラスである画像を、補助クラス画像として前記表示対象に含める。
請求項10に記載の発明は、請求項9に記載の教師データ作成支援装置であって、前記第2分類結果が前記教示結果と一致する教師画像の集合をクラス一致画像群として、前記クラス一致画像群のうち各初期クラスに含まれる画像から、複数の特徴量軸のそれぞれにおいて取得される値の分布を示す分布情報が取得され、前記表示対象特定部が、一の補助クラス画像の補助クラスに係る2つの初期クラスのそれぞれを注目クラスとして、前記複数の特徴量軸のそれぞれにおいて、前記補助クラス画像から取得される値が、前記注目クラスの前記分布情報に基づいて設定されるクラス分布範囲内に含まれるか否かを判定し、前記2つの初期クラスの双方において、前記補助クラス画像の前記値が前記クラス分布範囲外となる特徴量軸が存在する場合に、前記補助クラス画像を、前記表示対象を示す一の特定画像群に含める。
請求項11に記載の発明は、請求項8ないし10のいずれかに記載の教師データ作成支援装置であって、前記表示対象特定部が、前記クラス相違画像群のうち前記第2分類結果が補助クラスではない画像を、初期クラス相違画像として前記表示対象に含める。
請求項12に記載の発明は、請求項11に記載の教師データ作成支援装置であって、前記第2分類結果が前記教示結果と一致する教師画像の集合をクラス一致画像群として、前記クラス一致画像群のうち各初期クラスに含まれる画像から、複数の特徴量軸のそれぞれにおいて取得される値の分布を示す分布情報が取得され、前記表示対象特定部が、前記複数の特徴量軸のそれぞれにおいて、一の初期クラス相違画像から取得される値が、前記初期クラス相違画像の前記第2分類結果である初期クラスの前記分布情報に基づいて設定されるクラス分布範囲内に含まれるか否かを判定し、前記初期クラス相違画像の前記値が前記クラス分布範囲外となる特徴量軸が存在する場合に、前記初期クラス相違画像を、前記表示対象を示す一の特定画像群に含める。
請求項13に記載の発明は、請求項12に記載の教師データ作成支援装置であって、前記表示対象特定部が、前記初期クラス相違画像の前記値が前記クラス分布範囲外となる特徴量軸が存在しない場合に、前記初期クラス相違画像を、前記表示対象を示す他の一の特定画像群に含める。
請求項14に記載の発明は、画像を分類する画像分類装置であって、請求項8ないし13のいずれかに記載の教師データ作成支援装置と、前記教師データ作成支援装置を利用して作成された教師データを用いて学習が行われるとともに、画像を分類する分類器とを備える。
本発明によれば、オペレータによる確認用に表示部に表示すべき教師画像を適切に選別することができる。
画像分類装置の構成を示す図である。 欠陥画像の分類の流れを示す図である。 ホストコンピュータの構成を示す図である。 ホストコンピュータの機能を示すブロック図である。 教師データ作成部の機能を示すブロック図である。 教師データを作成して分類器を学習させる処理の流れを示す図である。 教師データを作成して分類器を学習させる処理の流れを示す図である。 教師画像を示す図である。 コンフュージョンマトリクスを示す図である。 教師画像を示す図である。 コンフュージョンマトリクスを示す図である。 コンフュージョンマトリクスを示す図である。 第1ないし第5特定画像群を説明するための図である。 教師画像を示す図である。 教師画像を示す図である。
図1は本発明の一の実施の形態に係る画像分類装置1の概略構成を示す図である。画像分類装置1では、半導体基板9(以下、単に「基板9」という。)等の対象物上の欠陥を示す欠陥画像が取得され、当該欠陥画像の分類が行われる。
画像分類装置1は、撮像装置2と、検査・分類装置4と、ホストコンピュータ5とを備える。撮像装置2は、基板9上の検査対象領域を撮像する。検査・分類装置4は、撮像装置2からの画像データに基づいて検査対象領域の欠陥検査を行い、欠陥が検出された場合に当該欠陥が属すべきクラス(種別)へと欠陥を自動分類する。ホストコンピュータ5は、画像分類装置1の全体動作を制御するとともに、検査・分類装置4における欠陥の分類に利用される分類器421を生成する。撮像装置2は、基板9の製造ラインに組み込まれ、画像分類装置1はいわゆるインライン型のシステムとなっている。画像分類装置1は、欠陥検査装置に自動欠陥分類の機能を付加した装置と捉えることもできる。
撮像装置2は、撮像部21と、ステージ22と、ステージ駆動部23とを備える。撮像部21は、基板9上の検査対象領域を撮像して画像データを取得する。ステージ22は、基板9を保持する。ステージ駆動部23は、撮像部21に対してステージ22を相対的に移動する。撮像部21は、照明部211と、光学系212と、撮像デバイス213とを備える。照明部211は、照明光を出射する。光学系212は、基板9に照明部211からの照明光を導く。また、基板9からの光は光学系212に入射する。撮像デバイス213は、光学系212により結像された基板9の像を電気信号に変換する。ステージ駆動部23は、ボールねじ、ガイドレール、モータ等により構成される。ホストコンピュータ5が、ステージ駆動部23および撮像部21を制御することにより、基板9上の検査対象領域が撮像される。
検査・分類装置4は、検査対象領域の画像データを処理しつつ欠陥を検出する欠陥検出部41、および、欠陥画像を分類する自動欠陥分類部42を有する。欠陥検出部41は検査対象領域の画像データを高速に処理する専用の電気的回路を有し、撮像された画像と欠陥が存在しない参照画像との比較や画像処理により検査対象領域の欠陥検査を行う。自動欠陥分類部42は、各種演算処理を行うCPUや各種情報を記憶するメモリ等により構成される。自動欠陥分類部42は、ニューラルネットワーク、決定木、判別分析等を利用する分類器421を用いて欠陥の分類(すなわち、欠陥画像の分類)を実行する。
図2は、画像分類装置1による欠陥画像の分類の流れを示す図である。まず、図1に示す撮像装置2が基板9を撮像することにより、検査・分類装置4の欠陥検出部41が画像データを取得する(ステップS11)。次に、欠陥検出部41が検査対象領域の欠陥検査を行い、欠陥が検出されると(ステップS12)、欠陥部分の画像(すなわち、欠陥画像)のデータが自動欠陥分類部42へと送信される。自動欠陥分類部42は、欠陥画像の複数種類の特徴量の値を算出し(ステップS13)、当該特徴量の値が分類器421に入力されて分類結果が出力される。すなわち、分類器421により、欠陥画像が複数のクラスのいずれかに分類される(ステップS14)。画像分類装置1では、欠陥検出部41にて欠陥が検出される毎に、特徴量の値の算出がリアルタイムにて行われ、多数の欠陥画像の自動分類が高速に行われる。
次に、ホストコンピュータ5による分類器の学習について説明する。図3は、ホストコンピュータ5の構成を示す図である。ホストコンピュータ5は、各種演算処理を行うCPU51、基本プログラムを記憶するROM52、および、各種情報を記憶するRAM53を含む一般的なコンピュータシステムの構成となっている。ホストコンピュータ5は、情報記憶を行う固定ディスク54、画像等の各種情報の表示を行う表示部であるディスプレイ55、オペレータからの入力を受け付けるキーボード56aおよびマウス56b(以下、「入力部56」と総称する。)、光ディスク、磁気ディスク、光磁気ディスク等のコンピュータ読み取り可能な記録媒体8から情報の読み取りを行う読取装置57、並びに、画像分類装置1の他の構成との間で信号を送受信する通信部58をさらに含む。
ホストコンピュータ5では、事前に読取装置57を介して記録媒体8からプログラム80が読み出されて固定ディスク54に記憶される。CPU51は、プログラム80に従ってRAM53や固定ディスク54を利用しつつ演算処理を実行する。
図4は、分類器を学習させるための機能構成を示すブロック図である。当該機能は、ホストコンピュータ5のCPU51、ROM52、RAM53、固定ディスク54等により実現される。図4では、検査・分類装置4も併せて示す。ホストコンピュータ5は、分類器の学習に使用される教師データを作成する教師データ作成部61、および、教師データを用いて分類器を学習させる学習部62を有する。
教師データは、欠陥画像である教師画像のデータ、教師画像の特徴量の値、および、欠陥のクラスを示す情報である教示情報を含む。教師画像の特徴量として、例えば、欠陥の面積、明度平均、周囲長、扁平度、欠陥を楕円に近似した場合の長軸の傾き等が採用される。学習部62では、教師データから読み出された教師画像の特徴量の値が、ホストコンピュータ5内の分類器(図示省略)に入力される。そして、分類器の出力が欠陥のクラスを示す教示情報と同じになるように学習が行われ、学習結果、すなわち、学習後の分類器421(正確には、分類器421の構造や変数の値を示す情報)が自動欠陥分類部42へと転送される。このように、教師データを使用して分類器421が構築される。分類器の構築とは、分類器が含むパラメータに値を付与したり、構造を決定すること等により分類器を生成することを意味する。
図5は、ホストコンピュータ5の教師データ作成部61の機能構成を示すブロック図である。教師データ作成部61は、データ演算部610と、ディスプレイ55と、入力部56とを備える。データ演算部610は、記憶部611と、分類器構築部612と、第1分類制御部613と、第2分類制御部614と、仮教師データ作成部615と、表示対象特定部616と、表示制御部617と、特徴量算出部618とを備える。データ演算部610の処理の詳細については後述する。なお、データ演算部610(および学習部62)の機能は、専用の電気回路により構築されてもよく、部分的に専用の電気回路が利用されてもよい。
図6および図7は、教師データを作成して分類器を学習させる処理の流れを示す図である。教師データ作成部61では、まず、教師データ作成用の欠陥画像である複数の教師画像(例えば、数千個〜数万個の教師画像)のデータが、図5に示す記憶部611に記憶されて準備される(ステップS21)。なお、教師画像は、図1に示す撮像装置2および欠陥検出部41を利用して取得されてもよく、あるいは、別途用意されてもよい。
続いて、特徴量算出部618により、各教師画像の複数種類の特徴量の値が算出され、記憶部611に記憶される。また、表示制御部617により、ディスプレイ55に各教師画像が表示されるとともに、当該教師画像のクラスの入力を促す表示が行われる。そして、入力部56において、オペレータによる各教師画像のクラスの入力が受け付けられる。以下の説明では、クラスの入力の際にオペレータにより決定された複数種類のクラスのそれぞれを「初期クラス」と呼ぶ。
上記処理により、それぞれが複数の初期クラスのいずれかに割り振られた複数の教師画像と、複数の教師画像のそれぞれの初期クラス(すなわち、各教師画像に対して入力(教示)された初期クラス)を教示結果として示す教示情報とを含む第1仮教師データ71が準備され、記憶部611に記憶される(ステップS22)。第1仮教師データ71には、各教師画像の上述の複数種類の特徴量の値が含まれてよい。本実施の形態では、複数種類のクラスに対して番号が割り当てられており、各教師画像に対する初期クラスの決定により、当該教師画像に関連付けられたクラス変数(ラベル)の値が当該初期クラスの番号に変更される。クラス変数の値は、教示結果として教示情報に含まれる。
図8は、複数の教師画像を示す図である。図8では、各教師画像の下方に当該教師画像の教示結果を示す欄が設けられる。本処理例では、各教師画像に対して、異物、不良および気泡の3種類の初期クラスのいずれかが教示結果として決定されている。図8の上段は、教示結果が異物である教師画像を示し、中段は、教示結果が不良である教師画像を示し、下段は、教示結果が気泡である教師画像を示す。なお、第1仮教師データ71の教示情報には、オペレータにより誤った初期クラスに教示された教師画像の教示結果が含まれる可能性がある。
第1仮教師データ71が準備されると、第1分類制御部613の制御に応じて、分類器構築部612により、第1仮教師データ71を用いた第1分類器601の構築が行われる(ステップS23)。具体的には、分類器構築部612が、複数の教師画像における特徴量の値、および、教示情報を用いて第1分類器601を学習させることにより、異物、不良および気泡の3種類の初期クラスのいずれかに画像を分類する第1分類器601が構築される。分類器を学習により構築する方法(学習アルゴリズム)または機構としては、例えば、線形判別法、ニューラルネットワーク、サポートベクターマシン(SVM)等が採用可能であり、本処理例では、線形カーネルSVMが利用される。分類器構築部612の機能の一部または全部が、図4の学習部62と共有されてよい。
続いて、第1分類制御部613により、第1分類器601を用いた複数の教師画像の分類が行われ、各教師画像が複数の初期クラスのいずれかに分類される(ステップS24)。各教師画像が分類されたクラスは、第1分類結果として仮教師データ作成部615に出力される。また、第1分類制御部613では、図9に示すようにコンフュージョンマトリクス(混同行列)が、必要に応じて作成される。
図9のコンフュージョンマトリクスは、第1分類器601による分類結果をまとめたものである。図9では、3種類の教示結果を「異物」、「不良」、「気泡」として行見出しに記し、3種類の第1分類結果を同様に「異物」、「不良」、「気泡」として列見出しに記している。教示結果が「A」である複数の教師画像のうち、第1分類結果が「B」とされた教師画像の個数は、「A」の行と「B」の列との交差位置に示される。また、「Precision」の行と「Recall」の列との交差位置は、分類が行われた教師画像の総数のうち、教示結果と第1分類結果とが一致した教師画像の個数の比率(総正答率)を示す。
複数の教師画像の第1分類結果が取得されると、仮教師データ作成部615では、教示結果が異物であり、かつ、第1分類結果が不良である教師画像、および、教示結果が不良であり、かつ、第1分類結果が異物である教師画像に対して、異物−不良の新たなクラス(2つの初期クラスの組合せに係るクラスであり、以下、「補助クラス」という。)が割り振られる。異物−不良の補助クラスに割り振られる教師画像の多くは、異物の初期クラスまたは不良の初期クラスのいずれに属するかが明確ではないもの、すなわち、どちらのクラスであるかが紛らわしいものであると考えられる。補助クラスに割り振られる教師画像には、オペレータによる教示結果が誤っているものが含まれている可能性もある(以下同様)。
同様に、教示結果が不良であり、かつ、第1分類結果が気泡である教師画像、および、教示結果が気泡であり、かつ、第1分類結果が不良である教師画像に対して、不良−気泡の補助クラスが割り振られ、教示結果が気泡であり、かつ、第1分類結果が異物である教師画像、および、教示結果が異物であり、かつ、第1分類結果が気泡である教師画像に対して、気泡−異物の補助クラスが割り振られる。第1分類結果が教示結果と一致する教師画像については、当該教示結果の初期クラスが割り振られる。
図9の例では、教示結果が異物であり、かつ、第1分類結果が不良である教師画像が130個であり、教示結果が不良であり、かつ、第1分類結果が異物である教師画像が87個である。したがって、217個の教師画像が、異物−不良の補助クラスに割り振られる。また、教示結果が不良であり、かつ、第1分類結果が気泡である教師画像が46個であり、教示結果が気泡であり、かつ、第1分類結果が不良である教師画像が64個である。したがって、110個の教師画像が、不良−気泡の補助クラスに割り振られる。なお、図9の例では、気泡−異物の補助クラスに割り振られる教師画像は0個である。
以上のように、第1分類器601による第1分類結果が教示結果と一致する教師画像に対して教示結果の初期クラスを割り振り、第1分類結果が教示結果と相違する教師画像に対して、教示結果および第1分類結果の初期クラスの組合せ毎に設定される補助クラスを割り振ることにより、第2仮教師データ72が作成される(ステップS25)。第2仮教師データ72は、複数の教師画像と、複数の教師画像のそれぞれに対して仮教師データ作成部615により割り振られたクラス(補助クラスまたは初期クラス)を示す割振情報とを含む。第2仮教師データ72は記憶部611に記憶される。なお、第2仮教師データ72は、各教師画像に個別に付与された番号に対して、仮教師データ作成部615により当該教師画像に対して割り振られたクラスを関連付ける情報のみを含んでもよい。この場合も、実質的に、第2仮教師データ72が複数の教師画像のデータを含むものと捉えられる(第1仮教師データ71において同様)。
図10は、複数の教師画像を示す図である。図10では、異物−不良の補助クラスが割り振られた教師画像を上段に示し、不良−気泡の補助クラスが割り振られた教師画像を下段に示している。なお、図10では、装置の都合上、各教師画像の下方に設けられた欄に、「10−20」と記して異物−不良の補助クラスを表し、「20−30」と記して不良−気泡の補助クラスを表している。既述のように、本処理例では、気泡−異物の補助クラスに割り振られる教師画像は存在しない。
第2仮教師データ72が作成されると、第2分類制御部614の制御に応じて、分類器構築部612により、第2仮教師データ72を用いた第2分類器602の構築が行われる(ステップS26)。具体的には、分類器構築部612が、複数の教師画像における特徴量の値、および、割振情報を用いて第2分類器602を学習させることにより、異物、不良、気泡、異物−不良、不良−気泡の5種類のクラス(3種類の初期クラスおよび2種類の補助クラス)のいずれかに画像を分類する第2分類器602が構築される。第2分類器602は、第1分類器601と同じ学習アルゴリズムにて構築されることが好ましい。
続いて、第2分類制御部614により、第2分類器602を用いた複数の教師画像の分類が行われ、各教師画像が複数のクラスのいずれかに分類される(ステップS27)。各教師画像が分類されたクラスは、第2分類結果として表示対象特定部616に出力される。また、第2分類制御部614では、図11に示すようにコンフュージョンマトリクスが、必要に応じて作成される。図11では、割振情報が示す5種類のクラスを「異物」、「不良」、「気泡」、「異物−不良」、「不良−気泡」として行見出しに記し、5種類の第2分類結果を同様に「異物」、「不良」、「気泡」、「異物−不良」、「不良−気泡」として列見出しに記している。
表示対象特定部616では、図11のコンフュージョンマトリクスにおいて、行見出しを3種類の教示結果に変更したものが、図12に示すように作成される。図12のコンフュージョンマトリクスは、教示結果が各初期クラスである教師画像が、第2分類器602により5種類のクラスのそれぞれに分類される個数を示す。
続いて、表示対象特定部616では、第2分類結果が教示結果と一致する教師画像の集合がクラス一致画像群として特定される(ステップS28)。クラス一致画像群に含まれる教師画像では、教示結果および第2分類結果が同じ初期クラスであるため、当該教師画像はオペレータによる初期クラスの教示が信用できるものであるといえる。図12の例では、クラス一致画像群のうち教示結果が異物である教師画像が1429個であり、教示結果が不良である教師画像が2697個であり、教示結果が気泡である教師画像が622個である。
そして、クラス一致画像群のうち教示結果が同じ教師画像の集合、すなわち、各初期クラスに含まれる教師画像の集合において、各種類の特徴量の値の分布(各特徴量軸上の値の分布)を示す分布情報が取得される(ステップS29)。分布情報は、複数の特徴量軸のそれぞれにおいて、上記教師画像の集合から取得される値の分布を示す統計量であり、例えば、平均や分散等を含む。
各初期クラスの特徴量軸毎の分布情報が取得されると、表示対象特定部616では、第2分類結果が補助クラスである教師画像が補助クラス画像として特定される(ステップS30)。ここで、全ての教師画像のうちクラス一致画像群に含まれない教師画像の集合、すなわち、第2分類器602による第2分類結果が教示結果と相違する教師画像の集合をクラス相違画像群と呼ぶと、補助クラス画像はクラス相違画像群に含まれる画像である。図12の例では、9個の教師画像が異物−不良の補助クラス画像であり、1個の教師画像が不良−気泡の補助クラス画像である。
続いて、各補助クラス画像を対象補助クラス画像として着目しつつ、各特徴量軸において対象補助クラス画像から取得される値が、初期クラスの分布情報と比較される(ステップS31)。詳細には、まず、対象補助クラス画像の補助クラス(すなわち、対象補助クラス画像の第2分類結果である補助クラス)に係る2つの初期クラスが特定される。例えば、異物−不良の補助クラス画像では、当該2つの初期クラスとして異物および不良が特定され、不良−気泡の補助クラス画像では、当該2つの初期クラスとして不良および気泡が特定される。次に、当該2つの初期クラスのそれぞれを注目クラスとして、各特徴量軸において、注目クラスの分布情報に基づいてクラス分布範囲が設定される。分布情報が平均および分散を含む場合に、クラス分布範囲は、例えば、標準偏差σ(分散の平方根)の3倍の値を平均μから引いて得た値を下限値とし、標準偏差σの3倍の値を平均μに足して得た値を上限値とする範囲(すなわち、(μ±3σ)の範囲)である。そして、当該特徴量軸において対象補助クラス画像から取得される値が、注目クラスのクラス分布範囲内に含まれるか否かが判定される。
当該2つの初期クラスの双方において、対象補助クラス画像の値がクラス分布範囲外となる特徴量軸が存在する場合に、対象補助クラス画像が、新たなクラスに属する可能性がある教師画像として特定され、第1特定画像群に含められる(ステップS32)。特定画像群は、後述の処理におけるディスプレイ55への表示対象(すなわち、ディスプレイ55に表示すべき画像)を示す。第1特定画像群が新たなクラスに属する可能性がある教師画像である理由については、図6および図7の全体処理の説明後に述べる(第2ないし第5特定画像群において同様)。
上記ステップS31の処理は、対象補助クラス画像が、その補助クラスに係る2つの初期クラスのそれぞれに属すると仮定して、各特徴量軸において、対象補助クラス画像の値を当該初期クラスのクラス分布範囲と比較するものである。また、上記ステップS32の処理は、対象補助クラス画像が当該2つの初期クラスのいずれに属すると仮定した場合でも、少なくとも1つの特徴量軸における値がクラス分布範囲を外れる対象補助クラス画像を第1特定画像群に含めるものである。クラス分布範囲は、注目クラスの分布情報に基づいて設定されるのであるならば、(μ±2σ)の範囲等であってよく、平均および分散以外の統計量により表される範囲であってもよい。
続いて、残りの全ての補助クラス画像(すなわち、第1特定画像群に含められなかった補助クラス画像であり、以下、「未特定補助クラス画像群」という。)が抽出され、未特定補助クラス画像群に対して一個抜き交差検証(leave-one-out cross-validation(LOOCV))が行われる(ステップS33)。一個抜き交差検証は、未特定補助クラス画像群のうち一の補助クラス画像をテスト事例とし、残りの補助クラス画像群を訓練事例として行う検証を、未特定補助クラス画像群に含まれる全ての補助クラス画像が一回ずつテスト事例となるように繰り返すものである。当該検証では、例えば、k近傍法が用いられる。k近傍法では、複数の特徴量軸にて規定される多次元の特徴量空間において、テスト事例である一の補助クラス画像に近接するk個の補助クラス画像(訓練事例の補助クラス画像)が抽出される。そして、当該k個の補助クラス画像のうち最も多くの補助クラス画像が教示結果とする初期クラスが、テスト事例の補助クラス画像の分類結果とされる。
また、上記検証において、特開2010−91401号公報(上記特許文献2)に記載される分類方法が用いられてもよい。当該分類方法では、訓練事例の補助クラス画像群のうち教示結果が同じ初期クラスである補助クラス画像から、複数の特徴量軸のそれぞれにおいて取得される値の分散に基づいて、当該初期クラスの特徴量範囲が設定される。そして、各特徴量軸において、テスト事例である一の補助クラス画像の値が含まれる特徴量範囲に対応する初期クラスに投票が行われ、得票数が最も多い初期クラスが、テスト事例の補助クラス画像の分類結果とされる。上記検証では、他の分類方法が用いられてよい。
未特定補助クラス画像群のうち、上記検証による分類結果が教示結果と異なる補助クラス画像は、オペレータが教示を間違いやすい教師画像(不明確な教師画像)として特定され、第2特定画像群に含められる(ステップS34)。また、上記検証による分類結果が教示結果と一致する補助クラス画像は、当該補助クラス画像の補助クラスに係る2つの初期クラスの間の中間クラスに教示すべき可能性がある教師画像として特定され、第3特定画像群に含められる(ステップS35)。
表示対象特定部616では、第2分類器602を用いて分類された教師画像のうちクラス一致画像群に含まれず、かつ、補助クラス画像にも該当しない残りの教師画像が、初期クラス相違画像として特定される(ステップS36)。初期クラス相違画像は、クラス相違画像群のうち第2分類結果が補助クラスではない画像、すなわち、第2分類結果が教示結果とは異なる初期クラスである画像である。図12の例では、教示結果が異物であり、かつ、第2分類結果が不良である初期クラス相違画像が144個であり、教示結果が不良であり、かつ、第2分類結果が異物である初期クラス相違画像が99個である。また、教示結果が不良であり、かつ、第2分類結果が気泡である初期クラス相違画像が48個であり、教示結果が気泡であり、かつ、第2分類結果が不良である初期クラス相違画像が66個である。
続いて、各初期クラス相違画像を対象初期クラス相違画像として着目しつつ、各特徴量軸において対象初期クラス相違画像から取得される値が、初期クラスの分布情報と比較される(ステップS37)。具体的には、各特徴量軸において、対象初期クラス相違画像の第2分類欠陥である初期クラスの分布情報に基づいてクラス分布範囲が設定される。初期クラスの分布情報は、ステップS29にて取得されており、クラス分布範囲は、ステップS31と同様にして設定される。そして、当該特徴量軸において対象初期クラス相違画像から取得される値が、当該初期クラスのクラス分布範囲内に含まれるか否かが判定される。
対象初期クラス相違画像の値がクラス分布範囲外となる特徴量軸が存在する場合に、対象初期クラス相違画像が、他の新たなクラスに属する可能性がある教師画像として特定され、第4特定画像群に含められる(ステップS38)。一方、対象初期クラス相違画像の値がクラス分布範囲外となる特徴量軸が存在しない場合、すなわち、全ての特徴量軸において対象初期クラス相違画像の値がクラス分布範囲内となる場合に、対象初期クラス相違画像が、オペレータによる教示に誤りがある可能性が高い教師画像として特定され、第5特定画像群に含められる(ステップS39)。
上記ステップS37の処理は、対象初期クラス相違画像が、その第2分類結果の初期クラスに属すると仮定して、各特徴量軸において、対象初期クラス相違画像の値を当該初期クラスのクラス分布範囲と比較するものである。また、上記ステップS38,S39の処理は、対象初期クラス相違画像が当該初期クラスに属すると仮定した場合に、少なくとも1つの特徴量軸における値がクラス分布範囲を外れる対象初期クラス相違画像を第4特定画像群に含め、いずれの特徴量軸上の値もクラス分布範囲を外れない対象初期クラス相違画像を第5特定画像群に含めるものである。
表示制御部617では、入力部56を介したオペレータの入力に従って、第1ないし第5特定画像群に含まれる教師画像がディスプレイ55に表示される。例えば、ディスプレイ55には、「新たなクラスに属する可能性がある教師画像」、「教示を間違いやすい教師画像」、「中間クラスに教示すべき可能性がある教師画像」、「他の新たなクラスに属する可能性がある教師画像」、「教示に誤りがある可能性が高い教師画像」の項目が表示される。これらの項目は、第1ないし第5特定画像群にそれぞれ対応しており、一の項目が選択されると、当該項目に対応する特定画像群に含まれる教師画像がディスプレイ55に表示される。これにより、新たなクラスに属する可能性がある教師画像、教示を間違いやすい教師画像、中間クラスに教示すべき可能性がある教師画像、他の新たなクラスに属する可能性がある教師画像、および、教示に誤りがある可能性が高い教師画像をオペレータが容易に特定することが可能となる。
そして、オペレータがディスプレイ55上の教師画像を観察しつつ当該教師画像のクラスを再検討し、必要に応じて当該教師画像を他のクラスまたは新たなクラスに再教示する。教師画像は、教示結果、第1分類結果および第2分類結果のそれぞれのクラスが識別可能な状態で表示されることが好ましい。同様に、第2、第3および第5特定画像群に含まれる教師画像では、全ての特徴量軸において値がクラス分布範囲内となる初期クラスが表示されてよい。第2特定画像群に含まれる教師画像は、さらに、一個抜き交差検証による分類結果が表示されてよい。
以上のように、第1ないし第5特定画像群に含まれる教師画像を表示対象として、オペレータの入力に応じて表示対象の教師画像をディスプレイ55に表示しつつ、教示情報に含まれる教示結果が修正され、最終的な教師データが作成される(ステップS40)。最終的な教師データは、複数の教師画像と、修正後の教示情報とを含む。なお、教師画像は、必ずしも特定画像群毎に表示される必要はない。例えば、各教師画像が属する特定画像群が識別可能な状態で、クラス相違画像群に含まれる複数の教師画像がディスプレイ55に表示されてもよい。
図12の例では、5115個の教師画像のうちクラス相違画像群に含まれる367個の教師画像をオペレータが確認するのみで、最終的な教師データが作成される。これにより、教示の誤りが甚大な教師画像を効率よく、かつ、迅速に発見することが可能となる。教示結果の修正は、オペレータの判断に委ねられるため、第1特定画像群の教師画像の教示結果が必ずしも新たなクラスに修正される訳ではない(第2ないし第5特定画像群の教師画像において同様)。
画像分類装置1では、最終的な教師データを用いて分類器421の学習が行われる。換言すれば、ステップS21〜S40に示す教師データ作成支援方法を利用して作成された教師データを用いて分類器421を学習させる処理が行われる(ステップS41)。その後、当該分類器421により、図2のステップS11〜S14に示すように、画像の分類が行われる。その結果、様々な欠陥画像の分類を高精度に行うことができる。
ここで、図6および図7の処理にて取得される第1ないし第5特定画像群について説明する。説明を簡略化するために、以下、2つの初期クラスのみに着目し、また、2次元の特徴量空間を想定する。図13は、第1ないし第5特定画像群を説明するための図であり、特徴量空間における初期クラスAの分布範囲および初期クラスBの分布範囲をそれぞれ符号A1,B1を付す領域にて抽象的に示している。各初期クラスの分布範囲は、特徴量空間において、当該初期クラスに含まれる画像(の特徴量ベクトルが示す位置)が分布する範囲である。
上記処理では、概念的には、第1分類器601により、図13中の破線L1が初期クラスAと初期クラスBとを区別するための境界線として設定される。また、第2分類器602により、図13中の実線L21が初期クラスAと補助クラスとを区別するための境界線として設定され、実線L22が初期クラスBと補助クラスとを区別するための境界線として設定される。なお、初期クラスAを陽性、初期クラスBを陰性とすると、補助クラスは偽陽性と捉えることができる。
第1特定画像群に含められる教師画像は、第2分類結果が補助クラスである補助クラス画像であり、かつ、当該補助クラスに係る2つの初期クラスA、Bの双方において、値がクラス分布範囲外となる特徴量軸が存在するものである。したがって、第1特定画像群の教師画像は、特徴量空間において、実線L21,L22に挟まれる領域C1(以下、「補助クラス領域C1」という。」の内部、かつ、領域A1および領域B1の外部に位置する(例えば、図13中の点P)。後述するように、中間クラスは、領域A1または領域B1に含まれることが前提であるため、補助クラス領域C1において、領域A1および領域B1の外部に位置する第1特定画像群の教師画像は、新たなクラスに属する可能性がある教師画像として特定される。
第2および第3特定画像群に含められる教師画像は、第2分類結果が補助クラスである補助クラス画像であり、かつ、当該補助クラスに係る2つの初期クラスA、Bの少なくとも一方において全ての特徴量軸における値がクラス分布範囲内となるものである。したがって、第2および第3特定画像群の教師画像は、特徴量空間において、補助クラス領域C1の内部、かつ、領域A1または領域B1の内部に位置する。そして、本処理例では、第2および第3特定画像群の教師画像の集合において、一個抜き交差検証による分類結果が教示結果と異なる第2特定画像群の教師画像は、オペレータが教示を間違いやすい教師画像、すなわち、教示に誤りがある可能性がある教師画像として特定される。また、一個抜き交差検証による分類結果が教示結果と一致する第3特定画像群の教師画像は、新たなクラスに属するものでなく、教示を間違いやすいものでもないため、当該教師画像の補助クラスに係る2つの初期クラスの間の中間クラスに教示すべき可能性がある教師画像として特定される。なお、第2特定画像群も、中間クラスに教示すべき可能性がある教師画像として特定されてよい。
第4特定画像群に含められる教師画像は、教示結果および第2分類結果が互いに異なる初期クラスである初期クラス相違画像であり、かつ、値が第2分類結果の初期クラスのクラス分布範囲外となる特徴量軸が存在するものである。したがって、第4特定画像群の教師画像は、特徴量空間において、補助クラス領域C1の外部、かつ、領域A1および領域B1の外部に位置し(例えば、図13中の点Q)、他の新たなクラスに属する可能性がある教師画像として特定される。
ここで、仮に、実線L21,L22、または、破線L1により分類を行う場合、このような教師画像は、一方の初期クラスに分類されるのみであり、この場合、オペレータが判定結果に大きな違和感をもつことがある。これに対し、特徴量軸毎に教師画像の値を初期クラスのクラス分布範囲と比較する上記処理では、値がクラス分布範囲外となる特徴量軸が存在する教師画像を第4特定画像群に含めて、新たなクラスに属する可能性を報告することにより、オペレータが違和感をもつ判定結果となることが防止される。
第5特定画像群に含められる教師画像は、教示結果および第2分類結果が互いに異なる初期クラスである初期クラス相違画像であり、かつ、全ての特徴量軸において値が第2分類結果の初期クラスのクラス分布範囲内となるものである。したがって、第5特定画像群の教師画像は、特徴量空間において、補助クラス領域C1の外部、かつ、第2分類結果の初期クラスの領域A1または領域B1の内部に位置する。よって、第5特定画像群の教師画像は、第2分類結果の初期クラスに属する可能性が高いといえ、オペレータによる教示に誤りがある可能性が高い教師画像として特定される。
以上に説明したように、教師データ作成部61では、各教師画像の教示結果を示す第1仮教師データ71を用いて第1分類器601が構築され、第1分類器601を用いて複数の教師画像が分類される。続いて、第1分類器601による第1分類結果が教示結果と相違する教師画像に対して補助クラスを割り振ることにより、第2仮教師データ72が作成され、第2仮教師データ72を用いて第2分類器602が構築される。そして、第2分類器602を用いて複数の教師画像が分類され、第2分類器602による第2分類結果が教示結果と相違するクラス相違画像群がディスプレイ55への表示対象として特定される。これにより、特徴量空間においてオペレータが教示した初期クラスとは異なる領域に位置する教師画像のみならず、2つの初期クラスの分布の境界近傍に位置する教師画像も表示対象とすることができ、オペレータによる確認用にディスプレイ55に表示すべき教師画像を適切に選別することができる。その結果、教師データを正確に作成することができ、分類性能が高い分類器を構築することができる。
ここで、第1分類器601による第1分類結果と教示結果とが相違する教師画像を表示対象として特定する比較例の処理を想定する。比較例の処理では、表示対象として特定される教師画像については、教示が妥当ではないという判定が(実質的に)なされ、表示対象に含まれない教師画像については、教示が妥当であるという判定がなされる。この場合に、比較例の処理による教師画像に対する判定が誤っていても、当該教師画像が実際に紛らわしいと考えられるものであるときには、比較例の処理に対するオペレータの(主観的な)信頼性は低下しない。しかしながら、比較例の処理による判定が何故誤ったのか理解に苦しむようなものであるときには(すなわち、違和感が大きいときには)、比較例の処理による判定結果の全体に対して信頼性が著しく低下する。比較例の処理による判定の誤りの数は、必ずしも僅少であることは求められないが、違和感が大きい誤りはないことが求められる。
これに対し、教師データ作成部61では、クラス相違画像群のうち、第2分類結果が補助クラスである補助クラス画像と、第2分類結果が補助クラスではない初期クラス相違画像とを区別しつつ、両者が表示対象に含められる。これにより、教示に誤りがある可能性が高い、または、新たなクラスに属する可能性がある初期クラス相違画像を、比較的紛らわしい補助クラス画像と区別して、オペレータに報告することが可能となる。また、初期クラス相違画像の第2分類結果の初期クラスに関して、当該初期クラス相違画像の値がクラス分布範囲外となる特徴量軸が存在する場合と、存在しない場合とで、当該初期クラス相違画像が含められる特定画像群が区別される。同様に、補助クラス画像の補助クラスに係る2つの初期クラスの双方に関して、当該補助クラス画像の値がクラス分布範囲外となる特徴量軸が存在する場合と、他の場合とで、当該補助クラス画像が含められる特定画像群が区別される。このように、値がクラス分布範囲外となる特徴量軸が存在する初期クラス相違画像および補助クラス画像を、他の場合と区別して、新たなクラスへの教示を提案することにより、判定結果に対して大きな違和感が生じることを防止することができる。その結果、教師データ作成部61による判定結果の全体に対する信頼性を維持することが可能となる。
教師データ作成部61では、第2仮教師データ72の割振情報を考慮しつつ、教師画像が各種特定画像群に含められてもよい。例えば、図11のコンフュージョンマトリクスにおいて、割振情報が示すクラスが異物であり、かつ、第2分類結果が異物−不良である3個の教師画像(図14参照)と、割振情報が示すクラスおよび第2分類結果の双方が異物−不良である6個の教師画像(図15参照)とが区別して扱われてもよい。このような処理の一例では、図7のステップS35にて、図14の教師画像と、図15の教師画像とが共に、異物−不良の中間クラスに教示すべき可能性がある教師画像として特定される(第3特定画像群に含まれる)場合に、図15の教師画像を中間クラスに教示すべき度合いが、図14の教師画像よりも高い旨が、ステップS40における教示結果の修正の際にオペレータに報告される。なお、図14の教師画像については、特徴量空間において、異物の領域と不良の領域との間に、補助クラス領域が設けられることにより(境界(超)平面が移動したことにより)、割振情報が示すクラスが異物であるにもかかわらず、第2分類結果が異物−不良となっていると考えられる。
また、図12のコンフュージョンマトリクスにおいて、教示結果が異物であり、かつ、第2分類結果が不良である144個の教師画像のうち、図11のコンフュージョンマトリクスにおいて割振情報が示すクラスが異物であり、かつ、第2分類結果が不良である21個の教師画像が、残りの123個の教師画像と区別して扱われてもよい。例えば、図7のステップS39にて、上記21個の教師画像に含まれる教師画像と、上記123個の教師画像に含まれる教師画像とが共に、オペレータによる教示に誤りがある可能性が高い教師画像として特定される(第5特定画像群に含まれる)場合、ステップS39における教示結果の修正の際に、両教師画像において教示に誤りがある可能性が、その度合いを異ならせてオペレータに報告される。他の組合せにおいて同様である。
上述の画像分類装置1および教師データ作成部61では、様々な変更が可能である。
例えば、図6および図7の教師データ作成支援処理は、繰り返し行われてもよい。この場合、第1および第2分類器601,602の構築(ステップS23,S26)において、繰返処理毎に異なる学習アルゴリズムが採用されることが好ましい。
また、各分類器601,602が、異なる学習アルゴリズムにて構築された複数のサブ分類器により実現されてもよい。この場合、例えば、異物の初期クラスと、異物でないものの初期クラスとの2つの初期クラスのみを設定して、当該複数のサブ分類器により並列的に処理が行われる。ステップS24では、教師画像に対して当該複数のサブ分類器の全てにおいて教示結果と同じ分類結果が得られた場合に、当該教師画像の第1分類結果が教示結果と同じ初期クラスとして扱われ、他の場合には、当該教師画像の第1分類結果が教示結果と異なる初期クラスとして扱われる(ステップS27において同様)。上記処理は、不良の初期クラスと、不良でないものの初期クラスとの2つの初期クラスのみを設定して繰り返され、気泡の初期クラスと、気泡でないものの初期クラスとの2つの初期クラスのみを設定してさらに繰り返される。
図6および図7の教師データ作成支援処理では、例えば、ステップS36〜S39における初期クラス相違画像に対する処理が、ステップS30〜S35における補助クラス画像に対する処理よりも先に行われてもよい。このように、教師データ作成支援処理における処理の順序は適宜変更されてよい。
画像分類の目的によっては、値がクラス分布範囲外となる特徴量軸が存在する初期クラス相違画像(すなわち、第4特定画像群)を表示対象に含めることなく、当該初期クラス相違画像の教示結果が、自動的に新たなクラスに変更されてもよい。このように、表示対象特定部616では、クラス相違画像群のうち少なくとも一部の画像がディスプレイ55への表示対象として特定される。
画像分類装置1により分類される欠陥画像は、半導体基板以外の基板の外観を示すものであってよい。すなわち、欠陥画像は、半導体基板以外の基板上の欠陥を示すものであってよい。当該基板として、ハードディスク基板等の薄膜デバイス、プラズマディスプレイや液晶ディスプレイ等の薄型ディスプレイに用いられるガラス基板、フォトマスク基板、フィルム基板、プリント配線基板等が例示される。
また、画像分類装置1が、太陽電池パネルを撮像した欠陥画像を分類する用途に用いられてもよい。例えば、太陽電池パネルのEL(エレクトロ・ルミネッセンス)発光やPL(フォト・ルミネッセンス)発光を撮像して得られる画像や、レーザーテラヘルツエミッション顕微鏡(LTEM)を用いて得られる太陽電池パネルの画像において、参照画像が示す正常な領域とは異なる領域を含む部分を欠陥画像として扱って、画像分類装置1において太陽電池パネルの欠陥が分類されてよい。さらに、欠陥画像は、電子線やX線等により撮像される画像であってもよい。このように、画像分類装置1では、可視光により撮像される画像のみならず、広義の放射線により撮像される画像が分類される。
画像分類装置1は、血液や培養液等の所定の液中の細胞を撮像した細胞画像を分類する用途に用いられてもよい。画像分類装置1は、様々な分類対象を示す画像の分類に利用可能である。また、記憶部611、分類器構築部612、第1分類制御部613、第2分類制御部614、仮教師データ作成部615および表示対象特定部616を主たる構成として実現される教師データ作成支援装置も、様々な対象物の教師画像を含む教師データの作成の支援に用いられてよい。
上記実施の形態および各変形例における構成は、相互に矛盾しない限り適宜組み合わされてよい。
1 画像分類装置
55 ディスプレイ
71 第1仮教師データ
72 第2仮教師データ
421 分類器
601 第1分類器
602 第2分類器
611 記憶部
612 分類器構築部
613 第1分類制御部
614 第2分類制御部
615 仮教師データ作成部
616 表示対象特定部
S11〜S14,S21〜S41 ステップ

Claims (14)

  1. 画像を分類する分類器の学習に使用される教師データの作成を支援する教師データ作成支援方法であって、
    a)それぞれが複数の初期クラスのいずれかに割り振られた複数の教師画像と、前記複数の教師画像のそれぞれの初期クラスを教示結果として示す教示情報とを含む第1仮教師データを準備する工程と、
    b)前記第1仮教師データを用いて第1分類器を構築する工程と、
    c)前記第1分類器を用いて前記複数の教師画像を分類する工程と、
    d)前記第1分類器による第1分類結果が前記教示結果と一致する教師画像に対して前記教示結果の初期クラスを割り振り、前記第1分類結果が前記教示結果と相違する教師画像に対して、前記教示結果および前記第1分類結果の初期クラスの組合せ毎に設定される補助クラスを割り振ることにより、第2仮教師データを作成する工程と、
    e)前記第2仮教師データを用いて第2分類器を構築する工程と、
    f)前記第2分類器を用いて前記複数の教師画像を分類する工程と、
    g)前記第2分類器による第2分類結果が前記教示結果と相違する教師画像の集合をクラス相違画像群として、前記クラス相違画像群のうち少なくとも一部の画像を表示部への表示対象として特定する工程と、
    を備えることを特徴とする教師データ作成支援方法。
  2. 請求項1に記載の教師データ作成支援方法であって、
    前記g)工程において、前記クラス相違画像群のうち前記第2分類結果が補助クラスである画像が、補助クラス画像として前記表示対象に含まれることを特徴とする教師データ作成支援方法。
  3. 請求項2に記載の教師データ作成支援方法であって、
    前記g)工程において、前記第2分類結果が前記教示結果と一致する教師画像の集合をクラス一致画像群として、前記クラス一致画像群のうち各初期クラスに含まれる画像から、複数の特徴量軸のそれぞれにおいて取得される値の分布を示す分布情報が取得され、
    前記g)工程が、
    g1)一の補助クラス画像の補助クラスに係る2つの初期クラスのそれぞれを注目クラスとして、前記複数の特徴量軸のそれぞれにおいて、前記補助クラス画像から取得される値が、前記注目クラスの前記分布情報に基づいて設定されるクラス分布範囲内に含まれるか否かを判定する工程と、
    g2)前記2つの初期クラスの双方において、前記補助クラス画像の前記値が前記クラス分布範囲外となる特徴量軸が存在する場合に、前記補助クラス画像を、前記表示対象を示す一の特定画像群に含める工程と、
    を備えることを特徴とする教師データ作成支援方法。
  4. 請求項1ないし3のいずれかに記載の教師データ作成支援方法であって、
    前記g)工程において、前記クラス相違画像群のうち前記第2分類結果が補助クラスではない画像が、初期クラス相違画像として前記表示対象に含まれることを特徴とする教師データ作成支援方法。
  5. 請求項4に記載の教師データ作成支援方法であって、
    前記g)工程において、前記第2分類結果が前記教示結果と一致する教師画像の集合をクラス一致画像群として、前記クラス一致画像群のうち各初期クラスに含まれる画像から、複数の特徴量軸のそれぞれにおいて取得される値の分布を示す分布情報が取得され、
    前記g)工程が、
    g3)前記複数の特徴量軸のそれぞれにおいて、一の初期クラス相違画像から取得される値が、前記初期クラス相違画像の前記第2分類結果である初期クラスの前記分布情報に基づいて設定されるクラス分布範囲内に含まれるか否かを判定する工程と、
    g4)前記初期クラス相違画像の前記値が前記クラス分布範囲外となる特徴量軸が存在する場合に、前記初期クラス相違画像を、前記表示対象を示す一の特定画像群に含める工程と、
    を備えることを特徴とする教師データ作成支援方法。
  6. 請求項5に記載の教師データ作成支援方法であって、
    前記g)工程が、
    g5)前記初期クラス相違画像の前記値が前記クラス分布範囲外となる特徴量軸が存在しない場合に、前記初期クラス相違画像を、前記表示対象を示す他の一の特定画像群に含める工程をさらに備えることを特徴とする教師データ作成支援方法。
  7. 画像を分類する画像分類方法であって、
    請求項1ないし6のいずれかに記載の教師データ作成支援方法を利用して作成された教師データを用いて分類器を学習させる工程と、
    前記分類器により画像を分類する工程と、
    を備えることを特徴とする画像分類方法。
  8. 画像を分類する分類器の学習に使用される教師データの作成を支援する教師データ作成支援装置であって、
    それぞれが複数の初期クラスのいずれかに割り振られた複数の教師画像と、前記複数の教師画像のそれぞれの初期クラスを教示結果として示す教示情報とを含む第1仮教師データを記憶する記憶部と、
    分類器を構築する分類器構築部と、
    前記第1仮教師データを用いて前記分類器構築部に第1分類器を構築させ、前記第1分類器を用いて前記複数の教師画像を分類する第1分類制御部と、
    前記第1分類器による第1分類結果が前記教示結果と一致する教師画像に対して前記教示結果の初期クラスを割り振り、前記第1分類結果が前記教示結果と相違する教師画像に対して、前記教示結果および前記第1分類結果の初期クラスの組合せ毎に設定される補助クラスを割り振ることにより、第2仮教師データを作成する仮教師データ作成部と、
    前記第2仮教師データを用いて前記分類器構築部に第2分類器を構築させ、前記第2分類器を用いて前記複数の教師画像を分類する第2分類制御部と、
    前記第2分類器による第2分類結果が前記教示結果と相違する教師画像の集合をクラス相違画像群として、前記クラス相違画像群のうち少なくとも一部の画像を表示部への表示対象として特定する表示対象特定部と、
    を備えることを特徴とする教師データ作成支援装置。
  9. 請求項8に記載の教師データ作成支援装置であって、
    前記表示対象特定部が、前記クラス相違画像群のうち前記第2分類結果が補助クラスである画像を、補助クラス画像として前記表示対象に含めることを特徴とする教師データ作成支援装置。
  10. 請求項9に記載の教師データ作成支援装置であって、
    前記第2分類結果が前記教示結果と一致する教師画像の集合をクラス一致画像群として、前記クラス一致画像群のうち各初期クラスに含まれる画像から、複数の特徴量軸のそれぞれにおいて取得される値の分布を示す分布情報が取得され、
    前記表示対象特定部が、一の補助クラス画像の補助クラスに係る2つの初期クラスのそれぞれを注目クラスとして、前記複数の特徴量軸のそれぞれにおいて、前記補助クラス画像から取得される値が、前記注目クラスの前記分布情報に基づいて設定されるクラス分布範囲内に含まれるか否かを判定し、前記2つの初期クラスの双方において、前記補助クラス画像の前記値が前記クラス分布範囲外となる特徴量軸が存在する場合に、前記補助クラス画像を、前記表示対象を示す一の特定画像群に含めることを特徴とする教師データ作成支援装置。
  11. 請求項8ないし10のいずれかに記載の教師データ作成支援装置であって、
    前記表示対象特定部が、前記クラス相違画像群のうち前記第2分類結果が補助クラスではない画像を、初期クラス相違画像として前記表示対象に含めることを特徴とする教師データ作成支援装置。
  12. 請求項11に記載の教師データ作成支援装置であって、
    前記第2分類結果が前記教示結果と一致する教師画像の集合をクラス一致画像群として、前記クラス一致画像群のうち各初期クラスに含まれる画像から、複数の特徴量軸のそれぞれにおいて取得される値の分布を示す分布情報が取得され、
    前記表示対象特定部が、前記複数の特徴量軸のそれぞれにおいて、一の初期クラス相違画像から取得される値が、前記初期クラス相違画像の前記第2分類結果である初期クラスの前記分布情報に基づいて設定されるクラス分布範囲内に含まれるか否かを判定し、前記初期クラス相違画像の前記値が前記クラス分布範囲外となる特徴量軸が存在する場合に、前記初期クラス相違画像を、前記表示対象を示す一の特定画像群に含めることを特徴とする教師データ作成支援装置。
  13. 請求項12に記載の教師データ作成支援装置であって、
    前記表示対象特定部が、前記初期クラス相違画像の前記値が前記クラス分布範囲外となる特徴量軸が存在しない場合に、前記初期クラス相違画像を、前記表示対象を示す他の一の特定画像群に含めることを特徴とする教師データ作成支援装置。
  14. 画像を分類する画像分類装置であって、
    請求項8ないし13のいずれかに記載の教師データ作成支援装置と、
    前記教師データ作成支援装置を利用して作成された教師データを用いて学習が行われるとともに、画像を分類する分類器と、
    を備えることを特徴とする画像分類装置。
JP2015239156A 2015-12-08 2015-12-08 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置 Active JP6531036B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015239156A JP6531036B2 (ja) 2015-12-08 2015-12-08 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015239156A JP6531036B2 (ja) 2015-12-08 2015-12-08 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置

Publications (2)

Publication Number Publication Date
JP2017107313A JP2017107313A (ja) 2017-06-15
JP6531036B2 true JP6531036B2 (ja) 2019-06-12

Family

ID=59059617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015239156A Active JP6531036B2 (ja) 2015-12-08 2015-12-08 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置

Country Status (1)

Country Link
JP (1) JP6531036B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019059011A1 (ja) * 2017-09-19 2019-03-28 富士フイルム株式会社 教師データ作成方法及び装置並びに欠陥検査方法及び装置
JP7083721B2 (ja) * 2018-07-31 2022-06-13 株式会社Screenホールディングス 分類器生成方法および分類器生成装置
JP7161948B2 (ja) * 2018-09-07 2022-10-27 株式会社フジクラ 機械学習装置、機械学習方法、機械学習プログラム、及び検査装置
JP7070334B2 (ja) * 2018-10-30 2022-05-18 オムロン株式会社 画像分類装置、画像検査装置、及び画像分類方法
US11861883B2 (en) 2019-05-16 2024-01-02 Sony Group Corporation Information processing apparatus and information processing method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6999614B1 (en) * 1999-11-29 2006-02-14 Kla-Tencor Corporation Power assisted automatic supervised classifier creation tool for semiconductor defects
JP4908995B2 (ja) * 2006-09-27 2012-04-04 株式会社日立ハイテクノロジーズ 欠陥分類方法及びその装置並びに欠陥検査装置
JP5022174B2 (ja) * 2007-10-22 2012-09-12 株式会社日立製作所 欠陥分類方法及びその装置
JP5075111B2 (ja) * 2008-12-29 2012-11-14 株式会社日立ハイテクノロジーズ 画像分類基準更新方法、プログラムおよび画像分類装置

Also Published As

Publication number Publication date
JP2017107313A (ja) 2017-06-15

Similar Documents

Publication Publication Date Title
JP6531036B2 (ja) 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置
JP6924413B2 (ja) データ生成装置、データ生成方法及びデータ生成プログラム
JP6472621B2 (ja) 分類器構築方法、画像分類方法および画像分類装置
JP6063756B2 (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
JP6113024B2 (ja) 分類器取得方法、欠陥分類方法、欠陥分類装置およびプログラム
JP6669453B2 (ja) 画像分類装置および画像分類方法
CN110494894A (zh) 基于轮廓的缺陷检测
US20160163038A1 (en) Iterative defect filtering process
JP2019109563A (ja) データ生成装置、データ生成方法及びデータ生成プログラム
US10803575B2 (en) System, method and computer program product for generating a training set for a classifier
CN108830332A (zh) 一种视觉车辆检测方法及系统
JP6059486B2 (ja) 教師データ検証装置、教師データ作成装置、画像分類装置、教師データ検証方法、教師データ作成方法および画像分類方法
CN103502801A (zh) 缺陷分类方法以及缺陷分类系统
CN113763312A (zh) 使用弱标记检测半导体试样中的缺陷
JP2016191589A (ja) 欠陥分類装置および欠陥分類方法
JP2018045673A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP6763673B2 (ja) 教師データ作成支援装置、画像分類装置、教師データ作成支援方法および画像分類方法
JP2014137284A (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
JP6430228B2 (ja) 画像分類装置および画像分類方法
JP6425468B2 (ja) 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置
JP6871807B2 (ja) 分類器構築方法、分類器および分類器構築装置
TW202125405A (zh) 分類裝置及圖像分類系統
JP2017107422A (ja) 画像分類方法および画像分類装置
JP2020052475A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置
JP2019057024A (ja) 分類器構築方法、画像分類方法、分類器構築装置および画像分類装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190520

R150 Certificate of patent or registration of utility model

Ref document number: 6531036

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250