JP6425468B2 - 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置 - Google Patents

教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置 Download PDF

Info

Publication number
JP6425468B2
JP6425468B2 JP2014177885A JP2014177885A JP6425468B2 JP 6425468 B2 JP6425468 B2 JP 6425468B2 JP 2014177885 A JP2014177885 A JP 2014177885A JP 2014177885 A JP2014177885 A JP 2014177885A JP 6425468 B2 JP6425468 B2 JP 6425468B2
Authority
JP
Japan
Prior art keywords
image
image group
category
classification
teacher data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014177885A
Other languages
English (en)
Other versions
JP2016051429A (ja
Inventor
松村 明
明 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Screen Holdings Co Ltd
Original Assignee
Screen Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Screen Holdings Co Ltd filed Critical Screen Holdings Co Ltd
Priority to JP2014177885A priority Critical patent/JP6425468B2/ja
Publication of JP2016051429A publication Critical patent/JP2016051429A/ja
Application granted granted Critical
Publication of JP6425468B2 publication Critical patent/JP6425468B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像を分類する分類器の学習に使用される教師データの作成を支援する技術、および、当該技術を利用して画像を分類する技術に関する。
半導体基板、ガラス基板、プリント配線基板等の製造では、異物や傷、エッチング不良等の欠陥を検査するために光学顕微鏡や走査電子顕微鏡等を用いて外観検査が行われる。また、このような検査工程において検出された欠陥に対して、詳細な解析を行うことによりその欠陥の発生原因を特定し、欠陥に対する対策が施される。
近年では、基板上のパターンの複雑化および微細化に伴い、検出される欠陥の種類および数量が増加する傾向にあり、検査工程で検出された欠陥を自動的に分類する自動分類も用いられる。自動分類により欠陥の解析を迅速かつ効率的に行うことが実現される。自動分類では、ニューラルネットワークや決定木、判別分析等を利用した分類器が用いられる。分類器に自動分類を行わせるには、欠陥画像およびそのカテゴリ(すなわち、欠陥画像の種類)を示す信号を含む教師データを用意して分類器を学習させる必要がある(分類器の生成について、例えば、特許文献1参照)。典型的には、各欠陥画像のカテゴリをオペレータが決定することにより、教師データが作成される。
教師データの作成では、オペレータによるカテゴリの判定があいまいである場合、分類器の学習用データに矛盾したデータが含まれ、分類器の性能が低下してしまうおそれがある。そこで、特許文献2の欠陥分類方法では、上記矛盾したデータの抽出を図る技術が開示されている。当該欠陥分類方法では、教師データを使用した学習により判別関数が求められ、当該判別関数を用いて教師データに含まれる各欠陥画像が各カテゴリに分類される。そして、分類結果である分類カテゴリと教師データ内の初期カテゴリとが一致しないデータが、オペレータに提示される。オペレータは、当該データの初期カテゴリを修正し、または、当該データを教師データから除外する。
また、教師データの作成では、分類器の分類性能を向上するために、多数の欠陥画像に対してオペレータがカテゴリを決定する必要があり、オペレータの作業負担が大きい。そこで、特許文献3の欠陥検査方法では、少数の適切な欠陥画像に対するカテゴリ決定を行うことにより、分類性能の向上を図る技術が開示されている。当該欠陥検査方法では、欠陥画像のカテゴリをオペレータが決定する毎に、分類基準の算出(すなわち、分類器の学習)が行われるとともに、新たな分類器の分類性能が算出される。そして、分類性能が向上しなくなるまで、オペレータによる新たな欠陥画像のカテゴリ決定、分類基準の算出、および、分類性能の算出が繰り返される。
特許文献4〜6では、分類器の学習に利用される教師データを作成する際に、未分類の教師画像(欠陥画像)のカテゴリを自動的に決定する技術が提案されている。特許文献4の教示用データ作成方法では、新たに入力された教師画像を分類器により分類した結果と、最近傍法により分類した結果とが比較され、妥当性が高いカテゴリが当該教師画像のカテゴリとして自動的に決定される。特許文献5の教師データ作成方法では、未分類の教師画像について、特徴量空間における当該教師画像と分類済みの教師画像である典型画像との距離に応じて当該教師画像を仮分類し、仮分類された教師画像を分類器により再分類する工程が、教師画像の全てについての分類結果が変化しなくなるまで繰り返される。特許文献6の教師データ作成方法では、分類済みの教師画像である典型画像に基づいて、未分類の教師画像における複数の特徴量のそれぞれについてカテゴリへの投票が行われ、得票数が最も多いカテゴリが未分類の教師画像のカテゴリとして自動的に決定される。
特許文献7〜9では、欠陥画像の分類について、分類器による事例学習型以外の分類方法(例えば、怠惰学習型の分類方法)が開示されている。特許文献7の教師データ作成支援方法では、分類済みの欠陥画像のカテゴリの妥当性を検証する技術が提案されている。当該教師データ作成支援方法では、各特徴量の分散に基づいて設定された特徴量範囲に欠陥画像の特徴量が含まれる場合、当該特徴量範囲に対応するカテゴリへの投票が行われ、当該欠陥画像が属する初期カテゴリと得票数が最も多いカテゴリとが一致するか否かが検証される。
特許文献8の類似画像探索方法では、基準画像を表す複数の特徴量をそれぞれ座標軸とする多次元の特徴量空間において、各座標軸にて基準画像が位置する基準座標点の近傍に共通して位置する画像が、基準画像に類似した画像として特定される。また、特許文献9の教師データ検証装置では、各教師画像が複数のカテゴリにそれぞれ属すると仮定した場合の妥当性を示す複数の評価値が取得され、当該複数の評価値から求められる教師画像のカテゴリと、当該教師画像が属する初期カテゴリとが一致するか否かが検証される。
特開2003−317083号公報 特開平11−344450号公報 特開2010−54346号公報 特開2000−57349号公報 特開2011−158373号公報 特開2010−71826号公報 特開2010−91401号公報 特開2014−6613号公報 特開2014−70944号公報
ところで、分類器の学習に利用される教師データの作成では、上述のように、多数の欠陥画像に対して適切なカテゴリを決定する必要がある。特許文献3の方法では、欠陥画像のカテゴリをオペレータが決定する毎に、分類器の学習および分類性能の算出が行われるため、教師データの作成に長時間を要する。また、分類性能を向上させるためのカテゴリ決定の方針が不明であるため、教師データを容易に作成することができないおそれがある。
特許文献4では、未分類の全ての教師画像について、分類器による分類と最近傍法による分類とを行う必要があり、教師データの作成が複雑化してしまう。特許文献5および特許文献6では、少数の典型画像による教師画像の自動分類が行われるが、適切な典型画像が選択されない場合、各教師画像に対して適切な分類が行われず、汎化能力が高い分類器を生成するための教師データの作成が困難となるおそれがある。しかしながら、教師データに含まれる予定の教師画像が多数存在する場合、オペレータが好ましい典型画像を選択することは容易ではない。
本発明は、上記課題に鑑みなされたものであり、汎化能力が高い分類器を生成するための教師データを容易に作成することを目的としている。
請求項1に記載の発明は、画像を分類する分類器の学習に使用される教師データの作成を支援する教師データ作成支援をコンピュータ実行する教師データ作成支援方法であって、a)それぞれが複数のカテゴリのいずれかを初期カテゴリとして割り振られた複数の対象画像である対象画像群と前記複数の対象画像の初期カテゴリとの関係を示す初期データを準備する工程と、b)前記対象画像群のうち少なくとも一部の画像の集合である学習対象画像群と初期カテゴリとの関係を示すデータを用いて学習を行うことにより生成される分類器により、前記対象画像群に含まれる各対象画像の分類カテゴリを取得する工程と、c)前記b)工程にて取得された分類カテゴリと前記a)工程にて準備された初期カテゴリとが異なる対象画像を前記対象画像群から除去して前記対象画像群を更新する工程と、d)前記c)工程において予め定められた純化条件が満たされるまで、前記b)工程および前記c)工程を行う工程と、e)前記d)工程よりも後に、最新の前記対象画像群と初期カテゴリとの関係を示すマスタデータを用いて学習を行うことにより生成される分類器により、前記c)工程にて除去された対象画像の集合である除去画像群の各除去画像について分類カテゴリを取得する工程と、f)前記e)工程にて取得された分類カテゴリと前記a)工程にて準備された初期カテゴリとが等しい除去画像を、前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する工程とを備える。
請求項2に記載の発明は、請求項1に記載の教師データ作成支援方法であって、前記b)工程において、最初の前記学習対象画像群が、初期状態の前記対象画像群と同じである。
請求項3に記載の発明は、請求項1または2に記載の教師データ作成支援方法であって、g)前記f)工程よりも後に、最新の前記対象画像群と初期カテゴリとの関係を示すデータを用いて学習を行うことにより生成される分類器により、最新の前記除去画像群の各除去画像について分類カテゴリを取得する工程と、h)前記g)工程にて取得された分類カテゴリと前記a)工程にて準備された初期カテゴリとが等しい除去画像を、前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する工程と、i)前記h)工程において前記対象画像群に戻される除去画像が存在する限り、前記g)工程および前記h)工程を繰り返す工程とをさらに備える。
請求項4に記載の発明は、請求項3に記載の教師データ作成支援方法であって、j)前記i)工程よりも後に、最新の前記除去画像群に含まれる各除去画像について、前記g)工程における最新の前記データを用いた画像の特徴量に基づく近傍探索法により、分類カテゴリを取得する工程と、k)前記j)工程にて取得された分類カテゴリと前記a)工程にて準備された初期カテゴリとが等しい除去画像を、前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する工程とをさらに備える。
請求項5に記載の発明は、請求項1ないし4のいずれかに記載の教師データ作成支援方法であって、l)初期カテゴリの割り振りが行われていない要教示画像群を準備する工程と、m)前記d)工程よりも後に、前記マスタデータを用いた画像の特徴量に基づく近傍探索法により、前記要教示画像群に含まれる各要教示画像の分類カテゴリを取得する工程と、n)前記要教示画像群と前記m)工程にて取得された分類カテゴリとの関係を示すデータを前記マスタデータに追加して追加済マスタデータを生成する工程とをさらに備える。
請求項6に記載の発明は、請求項5に記載の教師データ作成支援方法であって、o)前記n)工程よりも前に、前記m)工程にて取得された分類カテゴリの妥当性を示す評価値が予め定められた閾値未満である要教示画像を、前記要教示画像群から削除するとともに要検討画像群に追加して前記要教示画像群および前記要検討画像群を更新する工程をさらに備える。
請求項7に記載の発明は、請求項6に記載の教師データ作成支援方法であって、p)前記n)工程よりも後に、最新の前記追加済マスタデータを用いた前記近傍探索法により、前記要検討画像群に含まれる各要検討画像の分類カテゴリを取得する工程と、q)前記p)工程にて取得された分類カテゴリの妥当性を示す前記評価値が前記閾値以上である要検討画像を、追加教示画像に変更するとともに前記要検討画像群から削除して前記要検討画像群を更新する工程と、r)前記追加教示画像と前記p)工程にて取得された分類カテゴリとの関係を示すデータを前記追加済マスタデータに追加して前記追加済マスタデータを更新する工程と、s)前記q)工程において前記追加教示画像に変更される要検討画像が存在する限り、前記p)工程ないし前記r)工程を繰り返す工程とをさらに備える。
請求項8に記載の発明は、画像を分類する画像分類方法であって、請求項1ないし7のいずれかに記載の教師データ作成支援方法を利用して作成された教師データを用いて分類器を学習させる工程と、前記分類器により画像を分類する工程とを備える。
請求項9に記載の発明は、画像を分類する分類器の学習に使用される教師データの作成を支援する教師データ作成支援装置であって、それぞれが複数のカテゴリのいずれかを初期カテゴリとして割り振られた複数の対象画像である対象画像群と前記複数の対象画像の初期カテゴリとの関係を示す初期データを記憶する記憶部と、前記対象画像群に含まれる各対象画像について、前記対象画像群のうち少なくとも一部の画像の集合である学習対象画像群と初期カテゴリとの関係を示すデータを用いて学習を行うことにより生成される分類器により取得された分類カテゴリと、前記記憶部に記憶された初期カテゴリとが異なる場合に、対象画像を前記対象画像群から除去して前記対象画像群を更新する処理を純化処理として、予め定められた純化条件が満たされるまで前記純化処理を行う純化処理部と、前記純化処理部により除去された対象画像の集合である除去画像群の各除去画像について、前記純化処理後の最新の前記対象画像群と初期カテゴリとの関係を示すマスタデータを用いて学習を行うことにより生成される分類器により取得された分類カテゴリと、前記記憶部に記憶された初期カテゴリとが等しい場合に、除去画像を前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する非純化処理を行う非純化処理部とを備える。
請求項10に記載の発明は、請求項9に記載の教師データ作成支援装置であって、前記純化処理部において、最初の前記学習対象画像群が、初期状態の前記対象画像群と同じである。
請求項11に記載の発明は、請求項9または10に記載の教師データ作成支援装置であって、前記非純化処理後の最新の前記除去画像群に含まれる各除去画像について、前記非純化処理後の最新の前記対象画像群と初期カテゴリとの関係を示すデータを用いて学習を行うことにより生成される分類器により取得された分類カテゴリと、前記記憶部に記憶された初期カテゴリとが等しい場合に、除去画像を前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する再非純化処理を、前記再非純化処理において前記対象画像群に戻される除去画像が存在する限り前記非純化処理部に繰り返させる非純化処理制御部をさらに備える。
請求項12に記載の発明は、請求項11に記載の教師データ作成支援装置であって、前記再非純化処理の繰り返し後の最新の前記除去画像群に含まれる各除去画像について、前記再非純化処理の繰り返し後の最新の前記データを用いた画像の特徴量に基づく近傍探索法により取得された分類カテゴリと、前記記憶部に記憶された初期カテゴリとが等しい場合に、除去画像を前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する追加非純化処理部をさらに備える。
請求項13に記載の発明は、請求項9ないし12のいずれかに記載の教師データ作成支援装置であって、前記記憶部が、初期カテゴリの割り振りが行われていない要教示画像群を記憶し、前記教師データ作成支援装置が、前記マスタデータを用いた画像の特徴量に基づく近傍探索法により、前記要教示画像群に含まれる各要教示画像の分類カテゴリを取得する要教示画像分類部と、前記要教示画像群と前記要教示画像分類部により取得された分類カテゴリとの関係を示すデータを、前記マスタデータに追加して追加済マスタデータを生成するデータ更新部とをさらに備える。
請求項14に記載の発明は、請求項13に記載の教師データ作成支援装置であって、前記要教示画像分類部により取得された分類カテゴリの妥当性を示す評価値が予め定められた閾値未満である要教示画像を、前記データ更新部による前記追加済マスタデータの生成よりも前に、前記要教示画像群から削除するとともに要検討画像群に追加して前記要教示画像群および前記要検討画像群を更新する要検討画像抽出部をさらに備える。
請求項15に記載の発明は、請求項14に記載の教師データ作成支援装置であって、前記要検討画像群に含まれる各要検討画像について、最新の前記追加済マスタデータを用いた前記近傍探索法により取得された分類カテゴリの妥当性を示す前記評価値が前記閾値以上である場合に、要検討画像を追加教示画像に変更するとともに前記要検討画像群から削除して前記要検討画像群を更新し、前記追加教示画像と前記分類カテゴリとの関係を示すデータを前記追加済マスタデータに追加して前記追加済マスタデータを更新する追加教示処理を行う追加教示処理部と、前記追加教示処理において前記追加教示画像に変更される要検討画像が存在する限り、前記追加教示処理を前記追加教示処理部に繰り返させる追加教示処理制御部とをさらに備える。
請求項16に記載の発明は、画像を分類する画像分類装置であって、請求項9ないし15のいずれかに記載の教師データ作成支援装置と、前記教師データ作成支援装置を利用して作成された教師データを用いて学習が行われるとともに、画像を分類する分類器とを備える。
本発明では、汎化能力が高い分類器を生成するための教師データを容易に作成することができる。
画像分類装置の構成を示す図である。 欠陥画像の分類の流れを示す図である。 ホストコンピュータの構成を示す図である。 ホストコンピュータの機能を示すブロック図である。 教師データ作成部の機能を示すブロック図である。 教師データを作成して分類器を学習させる処理の流れを示す図である。 教師データを作成して分類器を学習させる処理の流れを示す図である。 教師データを作成して分類器を学習させる処理の流れを示す図である。 教師データを作成して分類器を学習させる処理の流れを示す図である。 教師データを作成して分類器を学習させる処理の流れを示す図である。
図1は本発明の一の実施の形態に係る画像分類装置1の概略構成を示す図である。画像分類装置1では、半導体基板9(以下、単に「基板9」という。)等の対象物上の欠陥を示す欠陥画像が取得され、当該欠陥画像の分類が行われる。基板9上に存在する欠陥の種類(カテゴリ)は、例えば、欠損、突起、断線、ショート、異物である。
画像分類装置1は、撮像装置2と、検査・分類装置4と、ホストコンピュータ5とを備える。撮像装置2は、基板9上の検査対象領域を撮像する。検査・分類装置4は、撮像装置2からの画像データに基づいて検査対象領域の欠陥検査を行い、欠陥が検出された場合に当該欠陥が属すべきカテゴリへと欠陥を自動分類する。ホストコンピュータ5は、画像分類装置1の全体動作を制御するとともに、検査・分類装置4における欠陥の分類に利用される分類器421を生成する。撮像装置2は、基板9の製造ラインに組み込まれ、画像分類装置1はいわゆるインライン型のシステムとなっている。画像分類装置1は、欠陥検査装置に自動欠陥分類の機能を付加した装置と捉えることもできる。
撮像装置2は、撮像部21と、ステージ22と、ステージ駆動部23とを備える。撮像部21は、基板9上の検査対象領域を撮像して画像データを取得する。ステージ22は、基板9を保持する。ステージ駆動部23は、撮像部21に対してステージ22を相対的に移動する。撮像部21は、照明部211と、光学系212と、撮像デバイス213とを備える。照明部211は、照明光を出射する。光学系212は、基板9に照明部211からの照明光を導く。また、基板9からの光は光学系212に入射する。撮像デバイス213は、光学系212により結像された基板9の像を電気信号に変換する。ステージ駆動部23は、ボールねじ、ガイドレール、モータ等により構成される。ホストコンピュータ5が、ステージ駆動部23および撮像部21を制御することにより、基板9上の検査対象領域が撮像される。
検査・分類装置4は、検査対象領域の画像データを処理しつつ欠陥を検出する欠陥検出部41、および、欠陥画像を分類する自動欠陥分類部42を有する。欠陥検出部41は検査対象領域の画像データを高速に処理する専用の電気的回路を有し、撮像された画像と欠陥が存在しない参照画像との比較や画像処理により検査対象領域の欠陥検査を行う。自動欠陥分類部42は、各種演算処理を行うCPUや各種情報を記憶するメモリ等により構成される。自動欠陥分類部42は、ニューラルネットワーク、決定木、判別分析等を利用する分類器421を用いて欠陥の分類(すなわち、欠陥画像の分類)を実行する。
図2は、画像分類装置1による欠陥画像の分類の流れを示す図である。まず、図1に示す撮像装置2が基板9を撮像することにより、検査・分類装置4の欠陥検出部41が画像データを取得する(ステップS11)。次に、欠陥検出部41が検査対象領域の欠陥検査を行い、欠陥が検出されると(ステップS12)、欠陥部分の画像(すなわち、欠陥画像)のデータが自動欠陥分類部42へと送信される。自動欠陥分類部42は、欠陥画像の複数種類の特徴量の値を算出し(ステップS13)、欠陥画像の特徴量の値が自動欠陥分類部42の分類器421に入力されて分類結果が出力される。すなわち、分類器421により、欠陥画像が複数のカテゴリのいずれかに分類される(ステップS14)。画像分類装置1では、欠陥検出部41にて欠陥が検出される毎に、特徴量の値の算出がリアルタイムにて行われ、多数の欠陥画像の自動分類が高速に行われる。
次に、ホストコンピュータ5による分類器の学習について説明する。図3は、ホストコンピュータ5の構成を示す図である。ホストコンピュータ5は、各種演算処理を行うCPU51、基本プログラムを記憶するROM52、および、各種情報を記憶するRAM53をバスラインに接続した一般的なコンピュータシステムの構成となっている。バスラインにはさらに、情報記憶を行う固定ディスク54、画像等の各種情報の表示を行う表示部であるディスプレイ55、オペレータからの入力を受け付けるキーボード56aおよびマウス56b(以下、「入力部56」と総称する。)、光ディスク、磁気ディスク、光磁気ディスク等のコンピュータ読み取り可能な記録媒体8から情報の読み取りを行う読取装置57、並びに、画像分類装置1の他の構成との間で信号を送受信する通信部58が、適宜、インターフェイス(I/F)を介する等して接続される。
ホストコンピュータ5では、事前に読取装置57を介して記録媒体8からプログラム80が読み出されて固定ディスク54に記憶される。さらに、プログラム80はRAM53にコピーされ、CPU51によりRAM53内のプログラム80に従って演算処理が実行される。
図4は、分類器を学習させるための機能構成を示すブロック図である。当該機能は、ホストコンピュータ5のCPU51、ROM52、RAM53、固定ディスク54等により実現される。図4では、検査・分類装置4も併せて示す。ホストコンピュータ5は、分類器の学習に使用される教師データを作成する教師データ作成部61、および、教師データを用いて分類器を学習させる学習部62を有する。
教師データは、欠陥画像である教師画像のデータ、教師画像の特徴量の値、および、欠陥のカテゴリを示す情報である教示信号を含む。教師画像の特徴量として、例えば、欠陥の面積、明度平均、周囲長、扁平度、欠陥を楕円に近似した場合の長軸の傾き等が採用される。学習部62では、教師データから読み出された教師画像の特徴量の値が、ホストコンピュータ5内の分類器(図示省略)に入力され、分類器の出力が欠陥のカテゴリを示す教示信号と同じとなるように学習が行われ、学習結果、すなわち、学習後の分類器421(正確には、分類器421の構造や変数の値を示す情報)が自動欠陥分類部42へと転送される。
図5は、ホストコンピュータ5の教師データ作成部61の機能構成を示すブロック図である。図5では、学習部62も併せて示す。教師データ作成部61は、データ演算部610と、ディスプレイ55と、入力部56とを備える。データ演算部610は、記憶部611と、純化処理部612と、非純化処理部613と、非純化処理制御部614と、追加非純化処理部615と、特徴量算出部616と、要教示画像分類部641と、データ更新部642と、要検討画像抽出部643と、追加教示処理部644と、追加教示処理制御部645とを備える。データ演算部610の処理の詳細については後述する。なお、データ演算部610および学習部62の機能は、専用の電気回路により構築されてもよく、部分的に専用の電気回路が利用されてもよい。
図6および図7は、教師データを作成して分類器を学習させる処理の流れを示す図である。教師データ作成部61では、まず、教師データ作成用の欠陥画像である複数の教師画像(例えば、数千個〜数万個の教師画像)のデータが、図5に示す記憶部611に記憶されて準備される(ステップS21)。なお、教師画像は、図1に示す撮像装置2および欠陥検出部41を利用して取得されてもよく、あるいは、別途用意されてもよい。
続いて、特徴量算出部616により、各教師画像の複数種類の特徴量が算出され、記憶部611に記憶される。また、ディスプレイ55に、各教師画像が表示されるとともに、当該教師画像のカテゴリの入力を促す表示が行われる。そして、入力部56において、オペレータによる各教師画像のカテゴリの入力が受け付けられる。以下の説明では、オペレータにより各教師画像に対して入力(教示)された当該カテゴリを「初期カテゴリ」という。オペレータによる初期カテゴリの教示が行われる際には、例えば、特徴量算出部616により算出された各教師画像の複数種類の特徴量が、初期カテゴリを決定するための参考資料としてディスプレイ55等に表示されてもよい。
このようにして、それぞれが上記複数のカテゴリのいずれかを初期カテゴリとして割り振られた複数の教師画像(以下、「対象画像群」という。)と、当該複数の教師画像の初期カテゴリとの関係を示すデータである初期データ710が準備されて記憶部611に記憶される(ステップS22)。以下の説明では、対象画像群に含まれる各教師画像を「対象画像」とも呼ぶ。初期データ710には、各対象画像の上述の複数種類の特徴量も含まれる。初期データ710では、また、複数種類のカテゴリのそれぞれに対して番号が割り当てられており、各対象画像に対する初期カテゴリの決定により、当該対象画像に関連付けられたカテゴリ変数の値が初期カテゴリの番号に変更される。
ステップS22では、ステップS21にて準備された全ての教師画像に対してオペレータにより初期カテゴリが教示されてもよく、当該全ての教師画像のうち一部の教師画像に対してのみ初期カテゴリが教示されてもよい。すなわち、ステップS21にて準備された全ての教師画像のうち、少なくとも一部の教師画像が、ステップS22において初期カテゴリが教示される対象画像となる。以下の説明では、まず、ステップS22において全ての教師画像に対して初期カテゴリが教示される場合について説明し、その後、ステップS22において一部の教師画像に対してのみ初期カテゴリが教示される場合について説明する。
ステップS21にて準備された全ての教師データと初期カテゴリとの関係を示す初期データ710が準備されると、学習部62において、初期データ710に含まれる全ての対象画像と初期カテゴリとの関係を用いて学習を行うことにより、図示省略の分類器(すなわち、ホストコンピュータ5内の分類器)が生成される(ステップS23)。換言すれば、学習部62は、初期データ710に含まれる全ての対象画像と初期カテゴリとの関係を用いて分類器を学習させる。そして、当該分類器により、対象画像群に含まれる各対象画像が、複数のカテゴリのいずれかに分類される(ステップS24)。以下の説明では、分類器により対象画像が分類されたカテゴリを「分類カテゴリ」と呼ぶ。ステップS24では、分類器により各対象画像の分類カテゴリが取得される。
続いて、純化処理部612により、対象画像群に含まれる各対象画像について、ステップS24にて取得された分類カテゴリと、ステップS22にて準備された初期カテゴリ(すなわち、記憶部611に記憶された初期データ710が示す初期カテゴリ)とが比較される。純化処理部612による当該比較処理は、対象画像群に含まれる全ての対象画像の初期カテゴリに基づく学習にて生成された分類器により、当該全ての対象画像の初期カテゴリを評価する評価方法(いわゆる、全数学習全数評価法)である。
そして、予め定められた条件(以下、「純化条件」という。)が満たされるか否かが、純化処理部612により判断される(ステップS25)。ステップS25の純化条件が満たされる状態とは、例えば、以下の第1純化条件および第2純化条件の少なくとも一方が満たされる状態である。第1純化条件とは、ステップS25における各対象画像の分類カテゴリと初期カテゴリとの比較において、分類カテゴリと初期カテゴリとが異なる対象画像が存在しない条件である。換言すれば、第1純化条件とは、ステップS24において取得された全ての対象画像の分類カテゴリが初期カテゴリと一致する条件である。第2純化条件とは、ステップS25において分類カテゴリが初期カテゴリと異なる対象画像を、仮に対象画像群から除去して対象画像群を更新したとすると、更新後の対象画像群において、上記複数のカテゴリのうち少なくとも1つのカテゴリに対応付けられる対象画像の数が、予め定められた閾値(例えば、10個)よりも小さくなる条件である。
ステップS25において純化条件が満たされない場合、純化処理部612により、分類カテゴリと初期カテゴリとが異なる対象画像が対象画像群から除去されて対象画像群が更新される(ステップS26)。以下の説明では、ステップS26の処理を「純化処理」と呼ぶ。純化処理において対象画像群から除去された対象画像は、除去画像として記憶部611に記憶される。以下、記憶部611に記憶される除去画像の集合を「除去画像群」と呼ぶ。
純化処理が終了すると、ステップS23に戻り、最新の(すなわち、直前の)ステップS26による更新後の対象画像群と、当該更新後の対象画像群の初期カテゴリとの関係を示すデータを用いて学習を行うことにより、学習部62において新たな分類器が生成される(ステップS23)。ステップS23において分類器の生成に用いられる対象画像群を「学習対象画像群」と呼ぶと、上述の例では、1回目のステップS23における最初の学習対象画像群は、初期データ710に含まれる全ての対象画像の集合、すなわち、初期状態の対象画像群である。また、2回目以降のステップS23における学習対象画像群は、最新のステップS26において更新された対象画像群である。
続いて、上記新たな分類器により、更新後の対象画像群に含まれる各対象画像の分類カテゴリが取得される(ステップS24)。次に、純化処理部612により、当該更新後の対象画像群に含まれる各対象画像について、最新の(すなわち、直前の)ステップS24にて取得された分類カテゴリと、ステップS22にて準備された初期カテゴリとが比較される。そして、純化条件が満たされない場合(ステップS25)、純化処理部612により、分類カテゴリと初期カテゴリとが異なる対象画像が対象画像群から除去されて対象画像群が更新される(すなわち、純化処理が行われる。)(ステップS26)。また、純化処理部612により対象画像群から除去された除去画像は、上述の除去画像群に追加される。
データ演算部610では、純化条件が満たされるまで、ステップS23〜S26に示す工程(すなわち、純化処理を含む工程)が行われる。ステップS25において純化条件が満たされると、最新の対象画像群(すなわち、最後のステップS26における純化処理後の対象画像群)と、当該最新の対象画像群の初期カテゴリとの関係を示すデータが、マスタデータ711として記憶部611に記憶される。以下の説明では、マスタデータ711に対応する最新の分類器、すなわち、マスタデータ711を用いて学習部62において学習を行うことにより最後のステップS23にて生成された分類器を、「マスタ分類器」と呼ぶ。
続いて、記憶部611に記憶されている最新の除去画像群に含まれる各除去画像について、マスタ分類器による分類が行われて分類カテゴリが取得される(ステップS27)。次に、非純化処理部613が非純化処理制御部614により制御されることにより、除去画像群の各除去画像について、ステップS27にてマスタ分類器により取得された分類カテゴリと、ステップS22にて準備された初期カテゴリ(すなわち、記憶部611に記憶された初期カテゴリ)とが比較される。そして、分類カテゴリと初期カテゴリとが等しい除去画像が存在する場合(ステップS28)、非純化処理部613により、当該除去画像が除去画像群から削除されるとともに対象画像群へと戻され、対象画像群および除去画像群が更新される(ステップS29)。以下の説明では、ステップS29の処理を「非純化処理」と呼ぶ。
非純化処理が終了すると、学習部62において、ステップS29の非純化処理後の最新の対象画像群と、当該最新の対象画像群の初期カテゴリとの関係を示すデータを用いて学習を行うことにより、新たな分類器が生成される(ステップS30)。そして、ステップS27に戻り、ステップS29の非純化処理後の最新の除去画像群に含まれる各除去画像について、ステップS30にて生成された最新の分類器による分類が行われて分類カテゴリが取得される(ステップS27)。
ステップS27が終了すると、非純化処理部613が非純化処理制御部614により制御されることにより、ステップS27にて取得された分類カテゴリと、ステップS22にて準備された初期カテゴリ(すなわち、記憶部611に記憶された初期カテゴリ)とが比較される。そして、分類カテゴリと初期カテゴリとが等しい除去画像が存在する場合(ステップS28)、非純化処理部613により、当該除去画像が除去画像群から削除されるとともに対象画像群へと戻され、対象画像群および除去画像群が更新される(ステップS29)。以下の説明では、2回目およびそれ以降のステップS29における非純化処理を、1回目のステップS29における非純化処理と区別する場合には「再非純化処理」と呼ぶ。再非純化処理が終了すると、学習部62において、最新の対象画像群と初期カテゴリとの関係を示すデータを用いて学習を行うことにより、新たな分類器が生成される(ステップS30)。
データ演算部610では、ステップS28において分類カテゴリと初期カテゴリとが等しい除去画像が存在しなくなるまで、すなわち、ステップS29の再非純化処理において対象画像群に戻される除去画像が存在する限り、非純化処理制御部614により制御される非純化処理部613により、ステップS27〜S30(すなわち、再非純化処理を含む工程)が繰り返される。
ステップS28において分類カテゴリと初期カテゴリとが等しい除去画像が存在しない場合、最新の対象画像群(すなわち、最後のステップS29における非純化処理後の対象画像群)と、当該最新の対象画像群の初期カテゴリとの関係を示すデータが、準マスタデータ712として記憶部611に記憶される。換言すれば、準マスタデータ712は、非純化処理および再非純化処理の繰り返し後の最新のデータであり、ステップS30における最後の学習にて利用された最新のデータである。準マスタデータ712に含まれる対象画像群を、初期データ710に含まれる対象画像群から除いたものは、非純化処理および再非純化処理の繰り返し後の最新の除去画像群である。
続いて、追加非純化処理部615により、当該最新の除去画像群に含まれる各除去画像について、準マスタデータ712を用いた画像の特徴量に基づく近傍探索法により、分類カテゴリが取得される(ステップS31)。ステップS31の近傍探索法としては、例えば、怠惰学習型の分類方法の1つであるk近傍法が用いられる。k近傍法では、上述のように記憶部611に記憶されている教師画像の複数種類の特徴量に基づいて、特徴量空間において除去画像に近接するk個の対象画像が抽出され、当該k個の対象画像のうち最も多くの対象画像が分類されているカテゴリが、除去画像の分類カテゴリとされる。
ステップS31の近傍探索法としては、例えば、特開2010−91401号公報に記載される分類方法が用いられてもよい。当該分類方法では、上述の複数種類の特徴量について、対象画像群における各特徴量の分散に基づいて特徴量範囲が設定される。そして、除去画像の特徴量が含まれる特徴量範囲に対応するカテゴリに投票が行われ、得票数が最も多いカテゴリが、除去画像の分類カテゴリとされる。
また、ステップS31の近傍探索法としては、例えば、特開2014−6613号公報に記載される分類方法が用いられてもよい。当該分類方法では、上記複数種類の特徴量をそれぞれ座標軸とする多次元の特徴量空間において、各座標軸にて対象画像が位置する座標点の近傍に共通して位置する除去画像が、当該対象画像に類似した画像として特定され、当該対象画像が分類されているカテゴリが、除去画像の分類カテゴリとされる。
あるいは、ステップS31の近傍探索法としては、例えば、特開2014−70944号公報に記載される分類方法が用いられてもよい。当該分類方法では、除去画像が上記複数種類のカテゴリにそれぞれ属すると仮定した場合の妥当性を示す複数の評価値が、準マスタデータ712に基づいて取得され、当該複数の評価値に基づいて除去画像の分類カテゴリが取得される。
ステップS31が終了すると、追加非純化処理部615により、除去画像群の各除去画像について、ステップS31にて取得された分類カテゴリと、ステップS22にて準備された初期カテゴリ(すなわち、記憶部611に記憶された初期カテゴリ)とが比較される。そして、分類カテゴリと初期カテゴリとが等しい除去画像が、追加非純化処理部615により、除去画像群から削除されるとともに対象画像群に戻され、対象画像群および除去画像群が更新される(ステップS32)。以下の説明では、ステップS32の処理を「追加非純化処理」と呼ぶ。
追加非純化処理が終了すると、対象画像群の分類結果がディスプレイ55に表示される。分類結果は、例えば、表1に示す混同行列(コンフュージョンマトリクス、分類表または混同対照表とも呼ばれる。)として表示される。
Figure 0006425468
表1では、3種類の初期カテゴリを「初期カテゴリA」、「初期カテゴリB」、「初期カテゴリC」として行見出しに記し、3種類の分類カテゴリを「分類カテゴリA」、「分類カテゴリB」、「分類カテゴリC」として列見出しに記す。見出しに「Sum」と記す行および列は、各カテゴリに分類された対象画像の合計数を示す。
表1では、例えば、初期カテゴリAとしてオペレータにより教示された1524個の対象画像のうち、分類器により初期カテゴリと同じく分類カテゴリAとして分類された対象画像は1511個であり、分類カテゴリB,Cとして分類された対象画像がそれぞれ13個および0個である。初期カテゴリおよび分類カテゴリが共に「A」である対象画像は、ステップS31よりも前に対象画像群に含められた対象画像であり、初期カテゴリが「A」であり、分類カテゴリが「B」または「C」の対象画像は、ステップS32にて対象画像群に含められた対象画像である。
表1では、また、初期カテゴリBとしてオペレータにより教示された2444個の対象画像のうち、分類器により初期カテゴリと同じく分類カテゴリBとして分類された対象画像は2338個であり、分類カテゴリA,Cとして分類された対象画像がそれぞれ58個および48個である。さらに、初期カテゴリCとしてオペレータにより教示された669個の対象画像のうち、分類器により初期カテゴリと同じく分類カテゴリCとして分類された対象画像は667個であり、分類カテゴリA,Bとして分類された対象画像がそれぞれ0個および2個である。
見出しに「Purity」と記す行は、分類器により各分類カテゴリに分類された対象画像のうち、初期カテゴリが当該分類カテゴリと一致する対象画像の数の比率を示す。見出しに「Accuracy」と記す列は、各初期カテゴリに分類された対象画像のうち、分類器による分類カテゴリが当該初期カテゴリと一致する対象画像の比率を示す。また、「Purity」の行と「Accuracy」の列とが交差するセルは、対象画像群のうち初期カテゴリと分類器による分類カテゴリとが一致した対象画像の比率を示す。換言すれば、当該交差するセルは、ステップS32の追加非純化処理後の最新の対象画像群を、最新の分類器(すなわち、最後のステップS30にて生成された分類器)により分類した場合の正答率を示す。表1に示す例では、正答率は97.4%である。
表2は、ステップS23にて初期データ710に基づいて生成された初期状態の分類器により、初期データ710に含まれる教師画像を分類した場合の分類結果(すなわち、ステップS24にて取得された分類結果)を、仮に混合行列として表示した「比較例の混合行列」である。比較例の混合行列では、分類された教師画像は5115個であり、正答率は89.9%である。
Figure 0006425468
これに対し、図5に示す教師データ作成部61では、では、表1に示すように正答率が97.4%であり、初期状態の分類器による分類結果に比べて、正答率が向上している。また、表1に示すように、対象画像群に含まれる対象画像は4637個であり、表2の教師画像の合計数よりも多少減少しているが、画像分類装置1における分類の汎化能力を担保するために十分といえる程度の画像数が確保されている。このように、教師データ作成部61では、分類精度が高く、かつ、汎化能力も高い分類器421(図4参照)を生成するための教師データを容易に作成することができる。
画像分類装置1では、表1に示す対象画像群の各対象画像と初期カテゴリとの関係を示すデータを教師データとして、当該教師データを用いて分類器421の学習が行われる。換言すれば、ステップS21〜S32に示す教師データ作成支援方法を利用して作成された教師データを用いて分類器421を学習させる処理が行われる(ステップS33)。その後、当該分類器421により、ステップS11〜S14に示すように、画像の分類が行われる。その結果、様々な欠陥画像の分類を高精度に行うことができる。
上述のように、教師データ作成部61では、1回目のステップS23における最初の学習対象画像群は、初期データ710に含まれる全ての対象画像の集合、すなわち、初期状態の対象画像群である。したがって、ステップS23において学習部62にて生成される分類器の精度を向上することができる。これにより、ステップS26の純化処理における分類精度を向上することができる。その結果、分類精度が高い分類器421を生成するための教師データを容易に作成することができる。
ステップS23では、最初の学習対象画像群が、初期データ710に含まれる対象画像群の一部の対象画像の集合であってもよい。すなわち、ステップS23における最初の学習対象画像群は、対象画像群の少なくとも一部の画像の集合であればよい。ステップS23では、当該対象画像群の少なくとも一部の画像の集合と初期カテゴリとの関係を示すデータを用いて学習が行われることにより分類器が生成される。また、ステップS24では、当該分類器により、対象画像群に含まれる各対象画像群の分類カテゴリが取得される。
教師データ作成部61では、ステップS27〜S30に示すように、最新の分類器により最新の除去画像群の各除去画像について分類カテゴリを取得し、分類カテゴリと初期カテゴリとが等しい除去画像を、除去画像群から削除するとともに対象画像群へと戻す処理(すなわち、非純化処理を含む処理)が繰り返される。これにより、対象画像群に含まれる対象画像を適切に増加させることができる。すなわち、最終的な教師データに含まれるデータ要素(すなわち、教師画像とカテゴリとの組み合わせ)の数を適切に増加させることができる。その結果、分類精度および汎化能力がさらに高い分類器421を生成するための教師データを容易に作成することができる。
また、教師データ作成部61では、上述の非純化処理を含む処理が繰り返された後、ステップS31,S32に示すように、最新の除去画像群に含まれる各除去画像について近傍探索法により分類カテゴリが取得され、分類カテゴリと初期カテゴリとが等しい除去画像が、除去画像群から削除されるとともに対象画像群へと戻される。これにより、対象画像群に含まれる対象画像を適切にさらに増加させることができる。すなわち、最終的な教師データに含まれるデータ要素数を適切にさらに増加させることができる。その結果、分類精度および汎化能力がより一層高い分類器421を生成するための教師データを容易に作成することができる。
教師データ作成部61では、ステップS32の終了後における最新の除去画像群に含まれる除去画像は、ステップS22においてオペレータにより入力(教示)された初期カテゴリが誤っている可能性がある画像として、教師データに含められることなく、混同行列等を利用してオペレータに提示される。例えば、上述の例では、表2に示す合計画像数5115個と表1に示す合計対象画像数4637個の差である478個の画像が、最終的な除去画像としてオペレータに提示される。オペレータは、例えば、必要に応じて除去画像のカテゴリを修正して当該除去画像を教師データに追加してもよい。あるいは、オペレータは、複数の除去画像が分類される新たなカテゴリを作成した上で、当該複数の除去画像を、新たなカテゴリに分類される画像として教師データに追加してもよい。また、除去画像は、教師データに適さない画像として、教師データに含められることなく放置されてもよい。
次に、ステップS22において、ステップS21にて準備された教師データのうち一部の教師画像に対してのみ、オペレータにより初期カテゴリが教示される場合について、図8ないし図10を参照しつつ説明する。上述のように、教師データ作成部61では、複数の教師画像のデータが記憶部611に準備されると(図6:ステップS21)、当該複数の教師画像のうち一部の教師画像である対象画像群に対して、オペレータにより初期カテゴリが入力(教示)される。これにより、当該対象画像群と初期カテゴリとの関係を示す初期データ710が準備されて記憶部611に記憶される(ステップS22)。一方、上記複数の教師画像のうちオペレータにより初期カテゴリが教示されない画像の集合は、初期カテゴリの割り振りが行われていない要教示画像群として準備される(ステップS41)。ステップS41が終了すると、ステップS23〜S26(すなわち、上述の純化処理を含む処理)が繰り返される。なお、ステップS41は、必ずしもステップS22とステップS23との間に行われる必要はなく、ステップS22と並行して、あるいは、ステップS21とステップS22との間に行われてもよい。
ステップS23〜S26の繰り返しにおいて、ステップS25にて上述の純化条件が満たされると、上記マスタデータ711(図5参照)を用いた画像の特徴量に基づく近傍探索法により、記憶部611に記憶されている要教示画像群に含まれる各要教示画像の分類カテゴリが、要教示画像分類部641により取得される(ステップS51)。ステップS51の近傍探索法としては、例えば、ステップS31の近傍探索法として例示した様々な方法が用いられる。なお、ステップS51の近傍探索法およびステップS31の近傍探索法として、同じ方法が利用されてもよく、互いに異なる方法が利用されてもよい。
続いて、要検討画像抽出部643により、ステップS51にて要教示画像分類部641により取得された各要教示画像の分類カテゴリの妥当性を示す評価値が、要教示画像の上記複数の特徴量等に基づいて求められる。例えば、ステップS51において近傍探索法としてk近傍法が用いられる場合、要教示画像に最も近接しているカテゴリの対象画像の数と、2番目に近接しているカテゴリの対象画像の数との差が小さくなるに従って、妥当性を示す評価値は小さくなる。また、要教示画像に最も近接している対象画像と要教示画像との間の距離が大きくなるに従って、当該評価値は小さくなる。妥当性を示す評価値が小さいということは、すなわち、要教示画像に教示すべき適切な分類カテゴリを決定することが比較的難しいことを意味する。
要検討画像抽出部643では、当該評価値が予め定められた閾値未満である要教示画像が、要教示画像群から削除されるとともに要検討画像群へと追加されて、要教示画像群および要検討画像群が更新される(ステップS52)。そして、要教示画像群の各要教示画像と、各要教示画像についてステップS51にて要教示画像分類部641により取得された分類カテゴリとの関係を示すデータが、データ更新部642によりマスタデータ711に追加され、追加済マスタデータ713が生成される(ステップS53)。追加済マスタデータ713は、図5に示す記憶部611に記憶される。
次に、ステップS53にて生成された最新の追加済マスタデータ713を用いた上述の近傍探索法により、要検討画像群に含まれる各要検討画像の分類カテゴリが、追加教示処理部644により取得される(ステップS54)。さらに、ステップS54にて取得された各要検討画像の分類カテゴリの妥当性を示す上記評価値が、要検討画像の上記複数の特徴量等に基づいて求められ、予め定められた上記閾値と比較される。評価値が閾値以上である要検討画像が存在する場合(ステップS55)、評価値が閾値以上である要検討画像が、追加教示画像に変更されるとともに要検討画像群から削除されて、要検討画像群が更新される(ステップS56)。そして、各追加教示画像とステップS54にて取得された分類カテゴリとの関係を示すデータが、追加教示処理部644により追加済マスタデータ713に追加され、追加済マスタデータ713が更新される(ステップS57)。以下の説明では、ステップS54〜S57における処理を追加教示処理という。
ステップS57が終了すると、ステップS54に戻り、ステップS57にて更新された最新の追加済マスタデータ713を用いた上述の近傍探索法により、要検討画像群に含まれる各要検討画像の分類カテゴリが取得される(ステップS54)。また、ステップS54にて取得された各要検討画像の分類カテゴリの妥当性を示す上記評価値が求められ、評価値が閾値以上である要検討画像が、追加教示画像に変更されるとともに要検討画像群から削除されて、要検討画像群が更新される(ステップS55,S56)。そして、各追加教示画像とステップS54にて取得された分類カテゴリとの関係を示すデータが、追加済マスタデータ713に追加され、追加済マスタデータ713が更新される(ステップS57)。
教師データ作成部61では、追加教示処理制御部645により追加教示処理部644が制御されることにより、ステップS55において評価値が閾値以上である要検討画像が存在する限り(すなわち、上記追加教示処理において追加教示画像に変更される要検討画像が存在する限り)、最新の追加済マスタデータ713を用いてステップS54〜S57が繰り返される。そして、ステップS55において、評価値が閾値以上である要検討画像が存在しなくなると、最新の追加済マスタデータ713を用いて学習を行うことにより、新たな分類器421(以下、「追加済マスタ分類器」という。)が生成される(ステップS58)。
ステップS58が終了した時点の要検討画像群に含まれる画像、すなわち、ステップS41において準備された要教示画像群のうち追加済マスタデータ713に含まれない画像は、最終的な要検討画像としてオペレータに提示される。オペレータは、例えば、必要に応じて要検討画像のカテゴリを修正して、当該要検討画像を後述する教師データに追加してもよい。あるいは、オペレータは、複数の要検討画像が分類される新たなカテゴリを作成した上で、当該複数の要検討画像を、新たなカテゴリに分類される画像として教師データに追加してもよい。また、要検討画像は、教師データに適さない画像として、教師データに含められることなく放置されてもよい。
ステップS58が終了すると、図6に示すステップS27に進む。そして、新たな分類器である追加済マスタ分類器により、上記と同様に最新の除去画像群に含まれる各除去画像について分類が行われ、各除去画像の分類カテゴリが取得される(ステップS27)。教師データ作成部61では、上記説明と同様に、ステップS27〜S32(すなわち、非純化処理および追加非純化処理を含む処理)が行われる。
このとき、ステップS30における分類器の生成は、ステップS29にて対象画像群に戻された除去画像と初期カテゴリとの関係を示すデータを追加済マスタデータ713にさらに追加したデータを用いて行われる。また、ステップS31における除去画像の分類カテゴリの近傍探索法による取得は、最新のステップS30にて分類器の生成に用いられた上記データを用いて行われる。さらに、ステップS33における分類器421の生成は、最新のステップS30にて分類器の生成に用いられた上記データに、ステップS32にて対象画像群に戻された除去画像と初期カテゴリとの関係を示すデータを追加したデータ(すなわち、最新の教師データ)を用いて行われる。
ステップS22において一部の教師画像に対してのみオペレータにより初期カテゴリが教示される場合、必ずしもステップS51〜S58の全てのステップが行われる必要はない。例えば、ステップS54〜S57が省略され、ステップS51〜S53の終了後、ステップS58において、ステップS53にて生成された追加済マスタデータ713を用いて新たな分類器が生成されてもよい。さらに、ステップS52も省略され、ステップS51,S53,S58が行われることにより、当該新たな分類器が生成されてもよい。
教師データ作成部61では、ステップS51,S53において、初期カテゴリの割り振りが行われていない要教示画像群の各要教示画像の分類カテゴリが取得され、要教示画像群と分類カテゴリとの関係を示すデータがマスタデータ711に追加されて追加済マスタデータ713が生成される。そして、ステップS27〜S32において、非純化処理および追加非純化処理にて対象画像群に戻される除去画像と初期カテゴリとの関係を示すデータが追加済マスタデータ713に追加され、教師データが生成される。このように、教師データ作成部61においてステップS51,S53が行われることにより、カテゴリが未分類の教師画像を自動的に分類し、取得された分類カテゴリと共に教師データに自動的に追加することができる。これにより、多数のデータ要素(すなわち、教師画像とカテゴリとの組み合わせ)を有する教師データを、容易に作成することができる。
また、教師データ作成部61では、ステップS52において、評価値が閾値未満の要教示画像が要教示画像群から削除され、要検討画像群に追加される。これにより、適切な分類カテゴリに分類することが比較的難しい画像が、教師データに含まれることを防止または抑制することができる。その結果、分類精度が高い分類器421を生成するための教師データを容易に作成することができる。
さらに、教師データ作成部61では、ステップS54〜S57の追加教示処理が行われることにより、最終的な教師データに含まれるデータ要素(すなわち、教師画像とカテゴリとの組み合わせ)の数を適切に増加させることができる。その結果、分類精度および汎化能力が高い分類器421を生成するための教師データを容易に作成することができる。
ステップS22において一部の教師画像に対してのみオペレータにより初期カテゴリが教示される場合、ステップS51〜S58は、ステップS21〜S26よりも後に行われるのであれば、必ずしもステップS25とステップS27との間に行われる必要はない。ステップS51〜S58は、例えば、ステップS28とステップS31との間に行われてもよく、ステップS32とステップS33との間に行われてもよい。
上述の画像分類装置1および教師データ作成部61では、様々な変更が可能である。
教師データ作成部61では、ステップS31,S32(すなわち、追加非純化処理を含む処理)は省略されてもよい。また、ステップS27〜S30は1回のみ行われてもよい。換言すれば、2回目以降のステップS27〜S30(すなわち、再非純化処理を含む処理)は省略されてもよい。いずれの場合であっても、教師データ作成部61により、分類精度が高く、かつ、汎化能力も高い分類器421を生成するための教師データを容易に作成することができる。
画像分類装置1において、教師データに利用される教師画像の特徴量の値は、検査・分類装置4にて算出されてもよい。また、教師データから特徴量が省略され、学習部62において教師画像のデータに基づいて特徴量の値が求められてもよい。
上記実施の形態では、欠陥検査装置に自動欠陥分類の機能を付加した画像分類装置1について説明したが、他の欠陥検査装置にて検出された基板上の欠陥を観察する観察装置(レビュー装置とも呼ばれる。)に自動欠陥分類の機能を付加した装置(同様に、画像分類装置として捉えることができる。)において、上記教師データ作成部61が用いられてもよい。
図1の画像分類装置1では、半導体基板に代えて、ガラス基板(例えば、平面表示装置用のガラス基板)、プリント配線基板、あるいは、基板の露光に使用するマスク基板等の検査が行われてもよい。
また、画像分類装置1が、血液や培養液等の所定の液中の細胞を撮像した細胞画像を分類する用途に用いられてもよい。このように、画像分類装置1は、様々な対象物を示す画像の分類に利用可能である。さらに、画像分類装置1では、可視光により撮像される画像以外に、電子線やX線等により撮像される画像が分類されてもよい。
画像分類装置1では、教師データ作成部61に設けられる記憶部611、純化処理部612および非純化処理部613を主たる構成として、教師データの作成を支援する教師データ作成支援装置が実現される。教師データ作成支援装置は、非純化処理制御部614を備えていてもよく、さらに追加非純化処理部615を備えていてもよい。教師データ作成支援装置は、要教示画像分類部641およびデータ更新部642を備えていてもよく、さらに要検討画像抽出部643を備えていてもよい。また、教師データ作成支援装置は、要検討画像抽出部643に加えて、追加教示処理部644および追加教示処理制御部645をさらに備えていてもよい。教師データ作成支援装置は、画像分類装置1から分離した専用の装置として実現されてもよい。
上記実施の形態および各変形例における構成は、相互に矛盾しない限り適宜組み合わされてよい。
1 画像分類装置
61 教師データ作成部
421 分類器
610 データ演算部
611 記憶部
612 純化処理部
613 非純化処理部
614 非純化処理制御部
615 追加非純化処理部
641 要教示画像分類部
642 データ更新部
643 要検討画像抽出部
644 追加教示処理部
645 追加教示処理制御部
710 初期データ
711 マスタデータ
712 準マスタデータ
713 追加済マスタデータ
S11〜S14,S21〜S33,S41,S51〜S58 ステップ

Claims (16)

  1. 画像を分類する分類器の学習に使用される教師データの作成を支援する教師データ作成支援をコンピュータ実行する教師データ作成支援方法であって、
    a)それぞれが複数のカテゴリのいずれかを初期カテゴリとして割り振られた複数の対象画像である対象画像群と前記複数の対象画像の初期カテゴリとの関係を示す初期データを準備する工程と、
    b)前記対象画像群のうち少なくとも一部の画像の集合である学習対象画像群と初期カテゴリとの関係を示すデータを用いて学習を行うことにより生成される分類器により、前記対象画像群に含まれる各対象画像の分類カテゴリを取得する工程と、
    c)前記b)工程にて取得された分類カテゴリと前記a)工程にて準備された初期カテゴリとが異なる対象画像を前記対象画像群から除去して前記対象画像群を更新する工程と、
    d)前記c)工程において予め定められた純化条件が満たされるまで、前記b)工程および前記c)工程を行う工程と、
    e)前記d)工程よりも後に、最新の前記対象画像群と初期カテゴリとの関係を示すマスタデータを用いて学習を行うことにより生成される分類器により、前記c)工程にて除去された対象画像の集合である除去画像群の各除去画像について分類カテゴリを取得する工程と、
    f)前記e)工程にて取得された分類カテゴリと前記a)工程にて準備された初期カテゴリとが等しい除去画像を、前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する工程と、
    を備えることを特徴とする教師データ作成支援方法。
  2. 請求項1に記載の教師データ作成支援方法であって、
    前記b)工程において、最初の前記学習対象画像群が、初期状態の前記対象画像群と同じであることを特徴とする教師データ作成支援方法。
  3. 請求項1または2に記載の教師データ作成支援方法であって、
    g)前記f)工程よりも後に、最新の前記対象画像群と初期カテゴリとの関係を示すデータを用いて学習を行うことにより生成される分類器により、最新の前記除去画像群の各除去画像について分類カテゴリを取得する工程と、
    h)前記g)工程にて取得された分類カテゴリと前記a)工程にて準備された初期カテゴリとが等しい除去画像を、前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する工程と、
    i)前記h)工程において前記対象画像群に戻される除去画像が存在する限り、前記g)工程および前記h)工程を繰り返す工程と、
    をさらに備えることを特徴とする教師データ作成支援方法。
  4. 請求項3に記載の教師データ作成支援方法であって、
    j)前記i)工程よりも後に、最新の前記除去画像群に含まれる各除去画像について、前記g)工程における最新の前記データを用いた画像の特徴量に基づく近傍探索法により、分類カテゴリを取得する工程と、
    k)前記j)工程にて取得された分類カテゴリと前記a)工程にて準備された初期カテゴリとが等しい除去画像を、前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する工程と、
    をさらに備えることを特徴とする教師データ作成支援方法。
  5. 請求項1ないし4のいずれかに記載の教師データ作成支援方法であって、
    l)初期カテゴリの割り振りが行われていない要教示画像群を準備する工程と、
    m)前記d)工程よりも後に、前記マスタデータを用いた画像の特徴量に基づく近傍探索法により、前記要教示画像群に含まれる各要教示画像の分類カテゴリを取得する工程と、
    n)前記要教示画像群と前記m)工程にて取得された分類カテゴリとの関係を示すデータを前記マスタデータに追加して追加済マスタデータを生成する工程と、
    をさらに備えることを特徴とする教師データ作成支援方法。
  6. 請求項5に記載の教師データ作成支援方法であって、
    o)前記n)工程よりも前に、前記m)工程にて取得された分類カテゴリの妥当性を示す評価値が予め定められた閾値未満である要教示画像を、前記要教示画像群から削除するとともに要検討画像群に追加して前記要教示画像群および前記要検討画像群を更新する工程をさらに備えることを特徴とする教師データ作成支援方法。
  7. 請求項6に記載の教師データ作成支援方法であって、
    p)前記n)工程よりも後に、最新の前記追加済マスタデータを用いた前記近傍探索法により、前記要検討画像群に含まれる各要検討画像の分類カテゴリを取得する工程と、
    q)前記p)工程にて取得された分類カテゴリの妥当性を示す前記評価値が前記閾値以上である要検討画像を、追加教示画像に変更するとともに前記要検討画像群から削除して前記要検討画像群を更新する工程と、
    r)前記追加教示画像と前記p)工程にて取得された分類カテゴリとの関係を示すデータを前記追加済マスタデータに追加して前記追加済マスタデータを更新する工程と、
    s)前記q)工程において前記追加教示画像に変更される要検討画像が存在する限り、前記p)工程ないし前記r)工程を繰り返す工程と、
    をさらに備えることを特徴とする教師データ作成支援方法。
  8. 画像を分類する画像分類方法であって、
    請求項1ないし7のいずれかに記載の教師データ作成支援方法を利用して作成された教師データを用いて分類器を学習させる工程と、
    前記分類器により画像を分類する工程と、
    を備えることを特徴とする画像分類方法。
  9. 画像を分類する分類器の学習に使用される教師データの作成を支援する教師データ作成支援装置であって、
    それぞれが複数のカテゴリのいずれかを初期カテゴリとして割り振られた複数の対象画像である対象画像群と前記複数の対象画像の初期カテゴリとの関係を示す初期データを記憶する記憶部と、
    前記対象画像群に含まれる各対象画像について、前記対象画像群のうち少なくとも一部の画像の集合である学習対象画像群と初期カテゴリとの関係を示すデータを用いて学習を行うことにより生成される分類器により取得された分類カテゴリと、前記記憶部に記憶された初期カテゴリとが異なる場合に、対象画像を前記対象画像群から除去して前記対象画像群を更新する処理を純化処理として、予め定められた純化条件が満たされるまで前記純化処理を行う純化処理部と、
    前記純化処理部により除去された対象画像の集合である除去画像群の各除去画像について、前記純化処理後の最新の前記対象画像群と初期カテゴリとの関係を示すマスタデータを用いて学習を行うことにより生成される分類器により取得された分類カテゴリと、前記記憶部に記憶された初期カテゴリとが等しい場合に、除去画像を前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する非純化処理を行う非純化処理部と、
    を備えることを特徴とする教師データ作成支援装置。
  10. 請求項9に記載の教師データ作成支援装置であって、
    前記純化処理部において、最初の前記学習対象画像群が、初期状態の前記対象画像群と同じであることを特徴とする教師データ作成支援装置。
  11. 請求項9または10に記載の教師データ作成支援装置であって、
    前記非純化処理後の最新の前記除去画像群に含まれる各除去画像について、前記非純化処理後の最新の前記対象画像群と初期カテゴリとの関係を示すデータを用いて学習を行うことにより生成される分類器により取得された分類カテゴリと、前記記憶部に記憶された初期カテゴリとが等しい場合に、除去画像を前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する再非純化処理を、前記再非純化処理において前記対象画像群に戻される除去画像が存在する限り前記非純化処理部に繰り返させる非純化処理制御部をさらに備えることを特徴とする教師データ作成支援装置。
  12. 請求項11に記載の教師データ作成支援装置であって、
    前記再非純化処理の繰り返し後の最新の前記除去画像群に含まれる各除去画像について、前記再非純化処理の繰り返し後の最新の前記データを用いた画像の特徴量に基づく近傍探索法により取得された分類カテゴリと、前記記憶部に記憶された初期カテゴリとが等しい場合に、除去画像を前記除去画像群から削除するとともに前記対象画像群に戻して前記対象画像群および前記除去画像群を更新する追加非純化処理部をさらに備えることを特徴とする教師データ作成支援装置。
  13. 請求項9ないし12のいずれかに記載の教師データ作成支援装置であって、
    前記記憶部が、初期カテゴリの割り振りが行われていない要教示画像群を記憶し、
    前記教師データ作成支援装置が、
    前記マスタデータを用いた画像の特徴量に基づく近傍探索法により、前記要教示画像群に含まれる各要教示画像の分類カテゴリを取得する要教示画像分類部と、
    前記要教示画像群と前記要教示画像分類部により取得された分類カテゴリとの関係を示すデータを、前記マスタデータに追加して追加済マスタデータを生成するデータ更新部と、
    をさらに備えることを特徴とする教師データ作成支援装置。
  14. 請求項13に記載の教師データ作成支援装置であって、
    前記要教示画像分類部により取得された分類カテゴリの妥当性を示す評価値が予め定められた閾値未満である要教示画像を、前記データ更新部による前記追加済マスタデータの生成よりも前に、前記要教示画像群から削除するとともに要検討画像群に追加して前記要教示画像群および前記要検討画像群を更新する要検討画像抽出部をさらに備えることを特徴とする教師データ作成支援装置。
  15. 請求項14に記載の教師データ作成支援装置であって、
    前記要検討画像群に含まれる各要検討画像について、最新の前記追加済マスタデータを用いた前記近傍探索法により取得された分類カテゴリの妥当性を示す前記評価値が前記閾値以上である場合に、要検討画像を追加教示画像に変更するとともに前記要検討画像群から削除して前記要検討画像群を更新し、前記追加教示画像と前記分類カテゴリとの関係を示すデータを前記追加済マスタデータに追加して前記追加済マスタデータを更新する追加教示処理を行う追加教示処理部と、
    前記追加教示処理において前記追加教示画像に変更される要検討画像が存在する限り、前記追加教示処理を前記追加教示処理部に繰り返させる追加教示処理制御部と、
    をさらに備えることを特徴とする教師データ作成支援装置。
  16. 画像を分類する画像分類装置であって、
    請求項9ないし15のいずれかに記載の教師データ作成支援装置と、
    前記教師データ作成支援装置を利用して作成された教師データを用いて学習が行われるとともに、画像を分類する分類器と、
    を備えることを特徴とする画像分類装置。
JP2014177885A 2014-09-02 2014-09-02 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置 Active JP6425468B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014177885A JP6425468B2 (ja) 2014-09-02 2014-09-02 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014177885A JP6425468B2 (ja) 2014-09-02 2014-09-02 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置

Publications (2)

Publication Number Publication Date
JP2016051429A JP2016051429A (ja) 2016-04-11
JP6425468B2 true JP6425468B2 (ja) 2018-11-21

Family

ID=55658855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014177885A Active JP6425468B2 (ja) 2014-09-02 2014-09-02 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置

Country Status (1)

Country Link
JP (1) JP6425468B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6985856B2 (ja) * 2017-08-31 2021-12-22 キヤノン株式会社 情報処理装置、情報処理装置の制御方法及びプログラム
JP6844564B2 (ja) * 2018-03-14 2021-03-17 オムロン株式会社 検査システム、識別システム、及び学習データ生成装置
JP7117934B2 (ja) * 2018-08-07 2022-08-15 日本放送協会 画像分類装置及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5075083B2 (ja) * 2008-10-08 2012-11-14 大日本スクリーン製造株式会社 教師データ作成支援方法、並びに、画像分類方法および画像分類装置
JP6063756B2 (ja) * 2013-01-25 2017-01-18 株式会社Screenホールディングス 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法

Also Published As

Publication number Publication date
JP2016051429A (ja) 2016-04-11

Similar Documents

Publication Publication Date Title
JP6063756B2 (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
US10818000B2 (en) Iterative defect filtering process
JP6059486B2 (ja) 教師データ検証装置、教師データ作成装置、画像分類装置、教師データ検証方法、教師データ作成方法および画像分類方法
JP6113024B2 (ja) 分類器取得方法、欠陥分類方法、欠陥分類装置およびプログラム
JP6472621B2 (ja) 分類器構築方法、画像分類方法および画像分類装置
TWI845781B (zh) 半導體缺陷偵測及分類的方法及系統,以及非暫時性電腦可讀儲存媒體
CN110245657B (zh) 病理图像相似性检测方法及检测装置
JP2005293264A (ja) 学習型分類装置及び学習型分類方法
JP2011158373A (ja) 自動欠陥分類のための教師データ作成方法、自動欠陥分類方法および自動欠陥分類装置
KR20210150970A (ko) 약한 라벨링을 사용한 반도체 시편들에서의 결함들의 검출
JP2006098151A (ja) パターン検査装置およびパターン検査方法
CN116935092A (zh) 自动化缺陷分类和检测
JP2016191589A (ja) 欠陥分類装置および欠陥分類方法
JP2016181098A (ja) 領域検出装置および領域検出方法
JP2014137284A (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
CN112513927A (zh) 基于卷积神经网络的风力涡轮机叶片缺陷检查
JP6425468B2 (ja) 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置
JP5075070B2 (ja) 教師データ作成方法、並びに、画像分類方法および画像分類装置
JP2022512292A (ja) 半導体試料の欠陥の分類
JP2017107313A (ja) 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置
JP6763673B2 (ja) 教師データ作成支援装置、画像分類装置、教師データ作成支援方法および画像分類方法
JP6871807B2 (ja) 分類器構築方法、分類器および分類器構築装置
JP2021157607A (ja) 破断面解析装置及び破断面解析方法
JP5592414B2 (ja) テンプレート評価装置、顕微鏡装置及びプログラム
JP2020085705A (ja) 判定装置及び判定方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181023

R150 Certificate of patent or registration of utility model

Ref document number: 6425468

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250