JP6573226B2 - データ生成装置、データ生成方法及びデータ生成プログラム - Google Patents

データ生成装置、データ生成方法及びデータ生成プログラム Download PDF

Info

Publication number
JP6573226B2
JP6573226B2 JP2017240292A JP2017240292A JP6573226B2 JP 6573226 B2 JP6573226 B2 JP 6573226B2 JP 2017240292 A JP2017240292 A JP 2017240292A JP 2017240292 A JP2017240292 A JP 2017240292A JP 6573226 B2 JP6573226 B2 JP 6573226B2
Authority
JP
Japan
Prior art keywords
image
unit
learning
detection target
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017240292A
Other languages
English (en)
Other versions
JP2019109563A (ja
Inventor
雄希 半澤
雄希 半澤
真嗣 栗田
真嗣 栗田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp filed Critical Omron Corp
Priority to JP2017240292A priority Critical patent/JP6573226B2/ja
Priority to PCT/JP2018/045252 priority patent/WO2019117065A1/ja
Publication of JP2019109563A publication Critical patent/JP2019109563A/ja
Application granted granted Critical
Publication of JP6573226B2 publication Critical patent/JP6573226B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Length Measuring Devices By Optical Means (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
  • Image Processing (AREA)

Description

データ生成装置、データ生成方法及びデータ生成プログラムに関する。
近年、ニューラルネットワーク等の識別器を用いて画像の識別を行う技術が研究されている。識別器は、学習用画像と、その画像のラベルとを含むデータ(教師データ)を用いて学習されることがある。
効率的に学習用データを生成することに関して、下記特許文献1には、被検体の不良画像から良品との差分データを抽出し、良品画像と差分データとを合成して疑似不良画像を作成する疑似不良画像自動作成装置が記載されている。
特開2005−156334号公報
例えば検査対象物の画像に欠陥等の検出対象部位が含まれているか否かを識別器によって判定する場合、検出対象部位を見逃してしまう誤判定が起こり得る。このような誤判定を減らすために、見逃された検出対象部位を含む画像を回転させたり、平行移動させたりして、画像のバリエーションを増やすデータオーグメンテーション(Data Augmentation)を行って学習用データを増やし、より検出対象部位の見逃しが起こりづらくなるように識別器を学習させることがある。例えば、特許文献1では、良品画像と不良品画像の差分データを抽出し、乱数値によって合成条件を設定して、差分データを良品画像に合成することでデータオーグメンテーションを行っている。
しかしながら、乱数値によって合成条件を設定する場合、必ずしも現場で撮像されるような検出対象部位を含む合成画像が生成されるとは限らない。そのため、データオーグメンテーションによって学習用データを増やして識別器の学習を行っても、その識別器を現場で使用した場合に、必ずしも良い識別性能が得られるとは限らなかった。
そこで、本発明は、検査対象物について実際に生じ得る検出対象部位を含むような合成画像により学習用データを生成するデータ生成装置、データ生成方法及びデータ生成プログラムを提供する。
本開示の一態様に係るデータ生成装置は、検査対象物に含まれる検出対象部位の有無を識別する識別器を学習させるための学習用データを生成するデータ生成装置であって、検査対象物の画像を取得する取得部と、画像の一部であって、検出対象部位を含む部分画像の指定を受け付ける入力部と、部分画像を、検出対象部位の特徴量に基づいて補正する補正部と、補正部により補正された部分画像と、部分画像を含む画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を合成画像に関連付けて、識別器を学習させるための新たな学習用データを生成する生成部と、を備える。ここで、学習用データは、識別器に入力される画像データと、少なくとも当該画像データに関する正しい判定結果を示し、識別器の出力と比較可能なデータと、を含む。また、補正部による補正方法は、例えば、部分画像の変形方法、すなわち、部分画像に含まれる検出対象部位の形状の変更であったり、部分画像の明るさの変更方法であったりしてよい。また、生成部による合成画像の生成方法は、例えば、部分画像を合成する箇所を決定する方法であったり、部分画像を合成する背景画像を選択する方法であったりしてよい。また、検出対象部位は、検査対象物に含まれる任意の部位であってよく、例えば、検査対象物に含まれる欠陥の部位であってよい。
この態様によれば、検出対象部位の特徴量に基づいて部分画像を補正することで、検査対象物について実際に生じ得る様々な検出対象部位のバリエーションを作り出すことができ、実際に生じ得る検出対象部位を含むような合成画像を生成することができる。また、生成された学習用データを用いることで、現場で使用した場合に良好な識別結果を得ることのできる識別器が得られる。なお、検出対象部位が含まれていることを示す情報、とは、検出対象部位の有無に関する情報に加えて、当該検出対象部位の含まれている位置の情報等の、画像データに関する正しい判定結果に関する情報であって、検出対象部位の有無に関する情報以外の情報を含んでいてよい。
上記態様において、入力部は、補正部による補正方法及び生成部による合成画像の生成方法のうち少なくともいずれかの指定を受け付けてもよい。
この態様によれば、入力部により補正方法及び生成方法のうち少なくともいずれかの入力を受け付けることで、検査対象物について実際に生じ得る検出対象部位を含むように学習用データを生成することができる。これにより、検査対象物について実際に生じ得る様々な検出対象部位のバリエーションを作り出すことができ、実際に生じ得る検出対象部位を含むような合成画像を生成することができる。
上記態様において、学習用データを用いて学習された識別器によって、取得部で取得された画像に検出対象部位が含まれているか否かを判定する判定部をさらに備え、入力部は、判定部による判定結果が正しいか否かに関する入力を受け付け、補正部は、判定部により画像に検出対象部位が含まれていないと判定され、入力部により判定部による判定結果が正しくないと入力された場合に、部分画像を補正してもよい。
この態様によれば識別器によって検出対象部位が含まれていないと誤判定された画像に基づいて合成画像を生成し、識別器によって識別しづらい検出対象部位を含んだ画像を増やすことができ、識別器の識別性能をより向上させることのできる学習用データが生成される。
上記態様において、識別器は、学習用データを用いた学習によって、検出対象部位に対応する画像の特徴量を学習しており、補正部は、識別器が学習した特徴量とは異なる特徴量を有するように、部分画像を補正してもよい。ここで、識別器は、例えば、検出対象部位の長さ、検出対象部位を含む領域の面積、検出対象部位の曲率等の検出対象部位の形状に関する特徴量や、画像の明るさ、検出対象部位に沿った画像の明るさの変化及び検出対象部位と検出対象部位の周囲とのコントラスト等の検出対象部位の見え方に関する特徴量を学習していてよい。
この態様によれば、学習用データを用いた学習によって識別器が学習することのできなかった特徴量を有する部分画像を生成することができ、識別器が学習できる特徴量のバリエーションを増やすような新たな学習用データを生成することができる。
上記態様において、合成画像に検出対象部位が含まれているか否かを判定部により判定させ、部分画像を含む画像に検出対象部位が含まれているか否かを判定部により判定させた場合と類似の判定結果が得られるか検証する検証部をさらに備え、前記生成部は、前記検証部が類似の判定結果を得た場合に、前記合成画像を新たな学習データとして登録してもよい。ここで、類似の判定結果とは、例えば、合成画像に検出対象部位が含まれているか否かを判定部により判定させると、部分画像が抽出された画像(すなわち、検査対象物の計測画像)と同様に検出対象部位が含まれていないとの誤判定が生じる判定結果である。すなわち、類似の判定結果とは、同様の判定結果であったり、対応する判定結果といった意味を含む。
この態様によれば、識別器によって検出対象部位が含まれていないと誤判定される合成画像が生成されたか検証され、識別器によって識別しづらい検出対象部位を含んだ画像を増やすことができ、識別器の識別性能をより向上させることのできる学習用データが生成される。
上記態様において、生成部は、補正部により複数の補正方法で補正された部分画像と、部分画像を含む画像とは異なる画像とを合成した複数の合成画像を生成し、検出対象部位が含まれていることを示す情報を複数の合成画像に関連付けて、複数の学習用データを生成してもよい。
この態様によれば、複数の補正方法で検出対象部位を含む部分画像を補正し、複数の合成画像を生成することで、検出対象部位を含む少数の画像から、様々な態様の検出対象部位を含む複数の合成画像を生成することができ、識別器の汎化性能をより向上させることのできる学習用データを生成することができる。
上記態様において、生成部は、補正部により補正された部分画像を、部分画像を含む画像とは異なる複数の画像に合成して複数の合成画像を生成し、検出対象部位が含まれていることを示す情報を複数の合成画像に関連付けて、複数の学習用データを生成してもよい。
この態様によれば、検出対象部位が含まれていない検査対象物の複数の画像に対して、検出対象部位を含む部分画像を合成し、複数の合成画像を生成することで、検出対象部位を含む少数の画像から、様々な背景において検出対象部位を含む合成画像を生成することができ、識別器の汎化性能をより向上させることのできる学習用データを生成することができる。
上記態様において、複数の学習用データそれぞれを、異なる識別器の学習に適用して、入力された画像に基づいて検査対象物に検出対象部位が含まれているか否かを識別する複数の識別器を学習させる学習部と、学習部により学習された、複数の学習済みの識別器の識別性能に基づいて、複数の学習用データから1又は複数の学習用データを選択する選択部と、をさらに備えてもよい。
この態様によれば、生成された複数の学習用データをそれぞれ独立に用いて識別器を学習させ、その識別性能に基づいて1又は複数の学習用データを選択することで、識別器の学習に用いた場合に識別器の識別性能をより良く向上させる学習用データを選択することができ、識別器の識別性能及び学習効率を向上させることができる。
上記態様において、生成部は、検出対象部位の周囲の背景模様が、部分画像を含む画像と合成画像とで類似するように、部分画像の合成箇所を選択し、合成画像を生成してもよい。
この態様によれば、部分画像が合成先において自然に見えるように合成され、検査対象物について実際に生じ得る検出対象部位を含むようにデータオーグメンテーションを行うことができる。
上記態様において、補正部は、部分画像の明るさを補正してもよい。
この態様によれば、照明条件の違いや、検出対象部位の発生箇所の違いによって識別器が検出対象部位を見逃すことのないように、識別器を学習させることのできる学習用データが得られる。
上記態様において、補正部は、部分画像の形状を補正してもよい。
この態様によれば、検出対象部位の形状の違いによって識別器が検出対象部位を見逃すことのないように、識別器を学習させることのできる学習用データが得られる。ここで、部分画像の形状を補正することにより、部分画像に含まれる検出対象部位の形状が変更されることが好ましい。
上記態様において、補正部は、部分画像の形状が、複数の形状テンプレートのうちいずれかに近付くように、部分画像の形状を補正してもよい。
この態様によれば、変更自在な状態で予め記憶され、複数用意された形状テンプレートに基づいて、検査対象物について実際に生じ得る検出対象部位を簡単に合成することができ、形状の指定に不慣れな作業者であっても、現場で識別器を使用した場合の識別性能がより向上する学習用データを生成することができる。
上記態様において、生成部は、複数の形状テンプレートを用いて補正された部分画像を、部分画像を含む画像とは異なる画像にそれぞれ合成して複数の合成画像を生成し、判定部は、複数の合成画像に検出対象部位が含まれているか否かを判定し、補正部は、判定部による判定の信頼度に基づいて、複数の形状テンプレートのうちいずれかを選択し、部分画像の形状を補正してもよい。
この態様によれば、識別器の識別性能を向上させるのに適した形状テンプレートを用いて部分画像の形状の補正が行われ、識別器の識別性能及び学習効率を向上させることができる。ここで、信頼度とは、合成画像に含まれる、補正された部分画像の領域(合成領域)の検出対象部位らしさの確度を示し、例えば、「検出対象部位有」とした判定結果を0から1の数値で表した指標であって、数値が1に近いほど、判定結果の確からしさが高いことを意味するものであってよい。
上記態様において、生成部は、検査対象物のうち統計的に検出対象部位が生じやすい箇所の画像に部分画像が合成されるように、合成画像を生成してもよい。
この態様によれば、検査対象物のうち統計的に検出対象部位が生じやすい箇所に部分画像を合成することで、現場で実際に発生しやすい箇所に部分画像を合成することができ、検査対象物について実際に生じ得る検出対象部位を含むようにデータオーグメンテーションを行うことができる。
上記態様において、検出対象部位は、検査対象物に含まれる欠陥の部位であり、特徴量は、欠陥の形状、画像の明るさ、欠陥に沿った画像の明るさの変化、及び欠陥と欠陥の周囲とのコントラストのうち少なくともいずれかを含んでよい。
この態様によれば、識別器によって欠陥を見逃す誤判定が起こりやすい欠陥の特徴量を捉えて、当該特徴量に基づいて部分画像を補正し、合成画像を生成することで、識別器によって識別しづらい欠陥を含んだ画像を増やすことができ、識別器の識別性能をより向上させることのできる学習用データが生成される。
本開示の他の態様に係るデータ生成方法は、検査対象物に含まれる検出対象部位の有無を識別する識別器を学習させるための学習用データを生成するデータ生成方法であって、検査対象物の画像を取得することと、画像の一部であって、検出対象部位を含む部分画像の指定を受け付けることと、部分画像を、検出対象部位の特徴量に基づいて補正することと、補正された部分画像と、部分画像を含む画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を合成画像に関連付けて、識別器を学習させるための新たな学習用データを生成することと、を含む。
この態様によれば、検出対象部位の特徴量に基づいて部分画像を補正することで、検査対象物について実際に生じ得る様々な検出対象部位のバリエーションを作り出すことができ、実際に生じ得る検出対象部位を含むような合成画像を生成することができる。また、生成された学習用データを用いることで、現場で使用した場合に良好な識別結果を得ることのできる識別器が得られる。
本開示の他の態様に係るデータ生成プログラムは、検査対象物に含まれる検出対象部位の有無を識別する識別器を学習させるための学習用データを生成するデータ生成装置に備えられた演算装置を、検査対象物の画像を取得する取得部、画像の一部であって、検出対象部位を含む部分画像の指定を受け付ける入力部、部分画像を、検出対象部位の特徴量に基づいて補正する補正部、及び補正部により補正された部分画像と、部分画像を含む画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を合成画像に関連付けて、識別器を学習させるための新たな学習用データを生成する生成部、として動作させる。
この態様によれば、検出対象部位の特徴量に基づいて部分画像を補正することで、検査対象物について実際に生じ得る様々な検出対象部位のバリエーションを作り出すことができ、実際に生じ得る検出対象部位を含むような合成画像を生成することができる。また、生成された学習用データを用いることで、現場で使用した場合に良好な識別結果を得ることのできる識別器が得られる。
検査対象物について実際に生じ得る検出対象部位を含むような合成画像により学習用データを生成するデータ生成装置、データ生成方法及びデータ生成プログラムを提供する。
本発明の実施形態に係るデータ生成装置の機能ブロック図である。 本実施形態に係るデータ生成装置の第1学習部及び第2学習部における処理の内容を示す概念図である。 本実施形態に係るデータ生成装置の計測部における処理の内容を示す概念図である。 本実施形態に係るデータ生成装置のハードウェア構成を示すブロック図である。 本実施形態に係るデータ生成装置により実行される第1処理の内容を示すフローチャートである。 本実施形態に係るデータ生成装置により実行される補正処理の内容を示すフローチャートである。 本実施形態に係るデータ生成装置により実行される合成処理の内容を示すフローチャートである。 本実施形態に係るデータ生成装置により実行される補正処理及び合成処理の概要を示す図である。 本実施形態に係るデータ生成装置により実行される補正処理の概要を示す図である。 本実施形態に係るデータ生成装置により実行されるマスク処理の概要を示す図である。 本実施形態に係るデータ生成装置により実行される第2処理の内容を示すフローチャートである。
以下、本発明の一側面に係る実施の形態(以下、「本実施形態」と表記する。)を、図面に基づいて説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。
§1 適用例
まず、図1を用いて、本発明が適用される場面の一例について説明する。図1は、本実施形態に係るデータ生成装置100の適用場面の一例を模式的に例示した機能ブロック図である。本実施形態に係るデータ生成装置100は、検査対象物の画像に検出対象部位が含まれている場合に、ユーザインタフェース170によって検出対象部位が含まれる部分画像の補正方法及び合成画像の生成方法の入力を受け付けて、検出対象部位の特徴量に基づいて部分画像を補正し、補正された部分画像を、部分画像を含む画像とは異なる画像に合成して新たな学習用データを生成する装置である。
図1に示すように、データ生成装置100は、検査対象物の画像を取得する撮像装置153と、当該画像のうち検出対象部位を含む部分画像を、検出対象部位の特徴量に基づいて補正する補正部121と、補正された部分画像と、部分画像を含む画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を合成画像に関連付けて、識別器(a、b、c、A、B、…)を学習させるための新たな学習用データを生成する生成部122と、補正部121による部分画像の補正方法及び生成部122による合成画像の生成方法のうち少なくともいずれかの入力を受け付けるユーザインタフェース170と、を備える。ここで、撮像装置153は、本発明の「取得部」の一例であり、ユーザインタフェース170は、本発明の「入力部」の一例である。本明細書では、撮像装置153により新たに撮像される検査対象物の画像を「計測画像」と呼び、識別器(a、b、c、A、B、…)を学習するため予め収集される検査対象物の画像を「サンプル画像」と呼ぶ。なお、データ生成装置100は、必ずしも撮像装置153を備えていなくてもよく、別体で設けられた撮像装置から計測画像を取得するものであってもよい。本実施形態では、検出対象部位が、検査対象物に含まれる欠陥の部位である場合について説明する。しかしながら、検出対象部位は、検査対象物に含まれる欠陥の部位に限られず、検査対象物に含まれる任意の部位であってよい。
撮像装置153により撮像された検査対象物の計測画像は、第2作業者のユーザインタフェース170に表示される。第2作業者は、計測画像のうち欠陥が含まれている部分画像をユーザインタフェース170によって指定する。また、第2作業者は、部分画像を補正部121によってどのように補正するか(補正方法)をユーザインタフェース170によって指定し、補正された部分画像を生成部122によってどのように他の画像に合成するか(生成方法)をユーザインタフェース170によって指定する。
補正部121は、欠陥の長さ、欠陥を含む領域の面積、欠陥の曲率等の欠陥の形状や、画像の明るさ、欠陥に沿った画像の明るさの変化、及び欠陥と欠陥の周囲とのコントラスト等の欠陥の特徴量に基づいて、部分画像を補正してよい。補正部121は、識別器(a、b、c、A、B、…)によって欠陥を見逃す誤判定が起こりやすい欠陥の特徴量を捉えて、当該特徴量に基づいて部分画像を補正してよい。具体的には、識別器(a、b、c、A、B、…)が、比較的長い欠陥であれば識別できるが、比較的短い欠陥を見逃すような場合に、補正部121は、欠陥が短くなるように部分画像を補正して、識別器(a、b、c、A、B、…)が識別を苦手とするような欠陥のバリエーションを増やすこととしてよい。補正部121による補正方法は、ユーザインタフェース170によって詳細な方法が指定されてもよいし、ユーザインタフェース170によって大まかな方法が指定されるか又は指定を受け付けずに、補正部121によって補正方法の詳細を自動で判別することとしてもよい。
生成部122は、補正部121により補正された部分画像を、部分画像を含む画像とは異なる画像に合成して合成画像を生成し、欠陥が含まれていることを示す情報を合成画像に関連付けて、識別器(a、b、c、A、B、…)を学習させるための新たな学習用データを生成する。ここで、部分画像を含む画像とは異なる画像は、欠陥が全く含まれていない画像の他に、欠陥をマスクによって隠した画像であってもよい。生成部122による合成画像の生成方法は、ユーザインタフェース170によって詳細な方法が指定されてもよいし、ユーザインタフェース170によって大まかな方法が指定されるか又は指定を受け付けずに、生成部122によって生成方法の詳細を自動で判別することとしてもよい。
このように、欠陥の特徴量に基づいて部分画像を補正することで、検査対象物について実際に生じ得る様々な欠陥のバリエーションを作り出すことができ、実際に生じ得る欠陥を含むような合成画像を生成することができる。また、ユーザインタフェース170により補正部121による部分画像の補正方法及び生成部122による合成画像の生成方法のうち少なくともいずれかの入力を受け付けることで、検査対象物について実際に生じ得る欠陥を含むように学習用データを生成することができる。そして、生成された学習用データを用いることで、現場で使用した場合に良好な識別性能を得ることのできる識別器が得られる。本実施形態に係るデータ生成装置100によれば、現場で実際に発生するような欠陥を含む合成画像を生成することができるため、識別器の学習処理を行う場合に、比較的少ない演算量で現場での識別性能がより高くなるような識別器を生成することができる。また、識別器によって欠陥を見逃す誤判定が起こりやすい欠陥の特徴量を捉えて、当該特徴量に基づいて部分画像を補正し、合成画像を生成することで、識別器によって識別しづらい欠陥を含んだ画像を増やすことができ、識別器の識別性能をより向上させることのできる学習用データが生成される。
§2 構成例
[機能構成]
次に、図1を用いて、本実施形態に係るデータ生成装置100の機能構成の一例を説明する。データ生成装置100は、学習用データを用いて、検査対象物の欠陥の有無と、検査対象物に欠陥が含まれる場合には、その欠陥の位置と、その欠陥の種類と、を含む属性情報(ラベル)を出力する識別器を生成する機能を備える。ここで、検査対象物に複数の欠陥が含まれる場合には、属性情報は、欠陥の有無と、複数の欠陥の位置と、それらの欠陥の種類と、を含んでよい。また、データ生成装置100は、検査対象物を測定した計測画像を取得し、生成された識別器を用いて、検査対象物の属性情報を出力する機能を備える。したがって、データ生成装置100は、検査対象物の計測画像を取得し、計測画像に基づいて検査対象物の欠陥の有無に関する情報を含む計測結果を出力する検査装置又は検査システムとして機能する。
図1に示すように、データ生成装置100は、学習用データを生成及び格納する画像収集部110と、指定された補正方法及び生成方法に基づいて、計測した画像(計測画像)の修正を行う画像修正部120と、画像収集部110及び画像修正部120の少なくともいずれかにより生成された学習用データを用い、検査対象物の欠陥の有無と、検査対象物に欠陥が含まれる場合には、その欠陥の位置と、その欠陥の種類と、を含む属性情報を出力する識別器を生成する、第1学習部130及び第2学習部140と、検査対象物を測定した計測画像を取得し、第1学習部130及び第2学習部140の少なくともいずれかにより生成された識別器を用いて、検査対象物の属性情報を出力する計測部150と、計測画像とその属性情報とを関連付けて、計測結果として記憶する計測結果管理部160と、を備える。ここで、計測結果は、計測画像と、識別器により出力された検査対象物の属性情報と、判定部152による判定結果とを含む。なお、学習用データとは、単一の学習用データのみならず、複数の学習用データを有するデータセットであってよい。
ここで、欠陥とは、検査対象物が有する異常であって、例えば、傷、色等のムラ、汚れ、欠け、バリ、異物、印字のかすれ、印字等の位置ずれ等を含む。
また、属性情報とは、各画像に含まれる欠陥の有無に関する情報、画像に欠陥が含まれる場合には、当該欠陥の位置を示す情報及び当該欠陥の種類を示す情報を少なくとも含むものである。なお、属性情報は、欠陥の有無、欠陥の位置に関する情報及び欠陥の種類に関する情報に限られず、例えば、識別器により出力される欠陥の有無、欠陥の位置に関する情報及び欠陥の種類に関する情報の信頼度に関する情報を含んでいてもよい。
データ生成装置100は、ソフトウェアプログラム及び当該ソフトウェアプログラムの実行に用いられるデータを記憶する記憶部(例えば、図4に示す補助記憶部102、103)と、ソフトウェアプログラムを呼び出し、実行する演算部(例えば、図4に示すプロセッサ104)と、を有する1又は複数の情報処理装置により構成される。すなわち、画像収集部110、画像修正部120、第1学習部130、第2学習部140、計測部150及び計測結果管理部160の各機能ブロックのそれぞれは、補助記憶部102、103等の記憶部に記憶された所定のソフトウェアプログラムがプロセッサ104等のハードウェアプロセッサによって実行されることで実現される。すなわち、画像収集部110、画像修正部120、第1学習部130、第2学習部140、計測部150及び計測結果管理部160の各機能のそれぞれは、ソフトウェアプログラムがハードウェアプロセッサによって実行されることにより実現される所定の処理を示す。また、画像収集部110、画像修正部120、第1学習部130、第2学習部140、計測部150及び計測結果管理部160のそれぞれは、単独で、又は、複数が組み合わされて、情報処理装置として構成される。なお、データ生成装置100を、単一の情報処理装置により構成してもよい。本実施形態における情報処理装置のハードウェア構成については後述する。
<画像収集部の構成>
画像収集部110は、学習用データを生成するためのサンプル画像を取得する。サンプル画像は、検査対象物を撮像した画像でもよく、また、公知の画像合成技術により生成されたCG画像であってもよい。画像収集部110が取得したサンプル画像は、属性付与部111にて、各画像に対して、又は、複数の画像に対して、属性情報の付与が行われる。すなわち、属性付与部111は、サンプル画像に対して属性情報を付与することで、サンプル画像を学習用データにする。
本実施形態において、属性情報の付与(ラベル付け)は、任意のユーザインタフェース180を介して、第1作業者により行われる。例えば、サンプル画像に欠陥が含まれる場合には、第1作業者は、ユーザインタフェース180としての、表示装置(液晶表示装置等)及び入力装置(タッチパネル、キーボード、マウス等)を用いて、所定の形状の枠により当該欠陥を囲うことで、欠陥の有無及び欠陥の位置を含む属性情報を付与することができる。また、ユーザインタフェース180を用いて、当該欠陥の種類を含む属性情報をサンプル画像に付与することもできる。なお、属性情報の付与の方法は、特に限定されない。例えば、画像と、その画像に付与すべき属性情報との関係性を学習済みの識別器を用いて、画像に対して属性情報を自動的に付与するようにしてもよいし、公知の統計的手法により、複数の画像をクラスタリングして、クラスタに対して属性情報の付与を行うこととしてもよい。
属性付与部111において属性情報が付与された画像(学習用データ)は、画像データベース(以下、「画像DB」と称す。)112に格納され、記憶される。
画像収集部110は、例えば、取得するサンプル画像の多少や、画像DB112に格納されている学習用データの多少に応じて、学習用データの拡張を行う画像補正部113を備えている。画像補正部113は、ユーザインタフェース180を介して行われる第1作業者の補正操作に基づいて、サンプル画像の拡張を行ってよい。なお、画像補正部113は、画像収集部110に必ずしも必須の要素ではない。また、学習用データの拡張とは、学習に用いるデータセットを増やすデータオーグメンテーションのことをいう。
学習用データの拡張(オーグメンテーション)は、例えば、サンプル画像を平行移動させたり、回転させたり、色を変えたり、拡大させたり、縮小させたりすることで行ってよい。なお、画像補正部113は、画像収集部110に必須の構成要素ではなく、データ生成装置100を用いて実現する画像計測処理に必要な学習用データの必要量に応じて、適宜設けてよい。また、上記オーグメンテーションは、任意のユーザインタフェース180を介して、作業者自らが、部分画像の抽出、背景画像との合成等の各処理の指示を行うことで実現されてもよい。画像補正部113により拡張された学習用データは、画像DB112に格納され、記憶される。
ここで、背景画像は、部分画像に合成される画像であって、部分画像が抽出された計測画像とは異なる画像を含む。なお、背景画像は、計測画像であってもよいが、計測画像を背景画像として用いる場合には、計測画像から抽出された部分画像以外の領域に部分画像が合成されるように、合成箇所を制限して用いることができる。また、背景画像は、計測画像以外の画像に基づいて生成されてよく、計測画像の欠陥以外の領域の画像と同一の模様を有していてもよいし、また、有していなくてもよい。また、背景画像は一様な背景模様の画像の場合もあれば、ヘアラインのような背景模様を有する画像であったり、また、文字等が印字されている画像であったりしてよく、多種多様な画像であってよい。
画像DB112は、属性付与部111及び画像補正部113から、学習用データを取得する。画像DB112は、学習用データを、付与された属性情報に基づいて分類した状態で記憶してよい。また、画像DB112は、画像収集部110が取得したサンプル画像にすでに属性情報が付与されている場合には、当該サンプル画像を、属性付与部111及び画像補正部113を介さずに取得して、記憶してよい。なお、画像DB112は、学習用データを、後述する識別器を生成するための学習処理に使用する学習処理用の学習用データと、生成された識別器が、所望の属性情報を出力するか否かを評価するための評価処理用のテスト用データと、に区別して記憶してもよい。もっとも、学習用データとテスト用データを区別せずに画像DB112に記憶しておき、学習処理を行う際に、画像DB112に記憶されたデータセットを任意の手法で学習用とテスト用等に分けることとしてもよい。
<第1学習部の構成>
図2は、本実施形態に係るデータ生成装置の第1学習部130及び第2学習部140における処理の内容を示す概念図である。第1学習部130は、画像収集部110から、学習用データを取得する。なお、第1学習部130は、後述する画像修正部120から、学習用データを取得してもよい。第1学習部130は、取得した学習用データを用いた機械学習を実行し、識別器(a、b、c、・・・)を生成する第1学習処理部131を有する。識別器(a、b、c、・・・)は、画像データを入力とし、当該画像に含まれる欠陥の有無、1又は複数の欠陥が含まれる場合にはその位置及びその種類、を含む属性情報を出力するものである。なお、識別器(a、b、c、・・・)には、画像データ以外のデータが入力されてもよい。例えば、識別器(a、b、c、・・・)には、検査対象物の画像を撮像した条件(光量や撮像装置の露光時間等)が入力されたり、検査対象物の識別情報が入力されたりしてもよい。
識別器(a、b、c、・・・)は、任意の機械学習モデルに対して学習処理と評価処理とを行うことにより生成される。機械学習モデルは、所定のモデル構造と、学習処理によって変動する処理パラメータと、を有し、学習用データから得られる経験に基づいてその処理パラメータが最適化されることで、識別精度が向上するモデルである。すなわち、機械学習モデルは、学習処理によって、最適な処理パラメータを学習するモデルである。機械学習モデルのアルゴリズムは、例えば、サポートベクターマシン、ロジスティック回帰、ニューラルネットワーク等を用いることができるが、その種類は特に限定されない。本実施形態では、ニューラルネットワークであって、特に階層が3層以上であるディープニューラルネットワークのうち、画像認識に適したコンボリューショナルニューラルネットワーク(Convolutional Neural Network)を用いた例について説明する。なお、第1学習部130は、機械学習モデルを生成するためのモデル生成部(図示せず)を備えていてもよい。また、第1学習部130は、予め生成された機械学習モデルを、外部から取得してもよい。
本実施の形態における識別器は、学習用データを用いた事前学習によって、欠陥に対応する画像の特徴量であって、所定の幅を有する特徴量を学習している。ここで、所定の幅を有する特徴量とは、所定の数値範囲を有する特徴量であってよく、例えば特徴量が欠陥の長さを表す量であれば、特徴量は、長さの数値範囲を有してよい。学習される特徴量の種別は、識別器に固有に設定することができる。また、学習される特徴量の幅は、学習用データの内容に依存する。ここで、特徴量とは、例えば、欠陥の長さ、欠陥を含む領域の面積、欠陥の曲率等の欠陥の形状に関する特徴量や、画像の明るさ、欠陥に沿った画像の明るさの変化、及び欠陥と欠陥の周囲とのコントラストのうち少なくともいずれかを含んでよい。また、特徴量を、欠陥の種類に応じて、例えば、白点、黒点、白線、黒線の4つに分類してもよい。後述する計測部150は、識別器を用いて、計測画像の中に、識別器が学習している所定の幅の特徴量に合致する部分があるか否かを識別させ、その識別結果に基づいて、欠陥の有無の情報を含む判定結果を出力する。
なお、識別器は、処理パラメータにより表現されてよい。処理パラメータとは、識別器を表現する情報であって、識別器としてニューラルネットワーク(以下、単に「ネットワーク」ということもある。)を例にすれば、ニューラルネットワークのレイヤ数、各レイヤに関するノード数、ノード間を繋ぐリンクの重みパラメータ、各ノードに関するバイアスパラメータ及び各ノードに関する活性化関数の関数形に関する情報等、を示すものである。内部パラメータにより、欠陥として検出すべき特徴量の幅が規定される。
第1学習処理部131は、学習用データを用いて、取得した画像のデータを入力すると、属性情報で表現される計測画像の属性に対応する出力値を出力するように、機械学習モデルを学習させる学習処理を行う。第1学習処理部131は、さらに、学習処理によって生成された識別器(a、b、c、・・・)に対し、テスト用データを用いて、識別器(a、b、c、・・・)の出力と、テスト用データに対して付与された属性情報とを比較する評価処理を行う。識別器(a、b、c、・・・)の出力と、テスト用データに付与された属性情報とが一致している場合には、識別器(a、b、c、・・・)の生成条件を満たしたと判断し、識別器(a、b、c、・・・)の生成処理を完了させる。
第1学習部130は、生成した識別器(a、b、c、・・・)のモデル構造及び処理パラメータを含む情報を、学習結果データとして、後述する計測部150及び第2学習部140に出力する。
<第2学習部の構成>
引き続き、図2を用いて、第2学習部140における処理の内容を説明する。第2学習部140は、所定の生成処理によって生成された識別器に対する追加学習(再学習)を行う。なお、第2学習部140について、第1学習部130と共通する要素については、その記載を省略する。
第2学習部140は、第1学習部130で生成された学習済みの識別器(a、b、c、・・・)の学習結果データを取得する。なお、第2学習部140は、所定の生成処理によって生成された識別器に関する学習結果データを、外部から取得してもよい。第2学習部140は、画像収集部110から、学習用データを取得する。なお、第2学習部140は、後述する画像修正部120から、学習用データを取得してもよい。
第2学習部140は、学習用データを用いた機械学習による追加学習(再学習)を実行し、識別器(A、B、C、・・・)を生成する第2学習処理部141を有する。識別器(A、B、C、・・・)は、所定の学習処理により生成された識別器(a、b、c、・・・)に対して学習処理と評価処理とを行うことにより生成される。換言すれば、第2学習処理部141は、学習用データを用いて、識別器(a、b、c、・・・)のモデル構造及び処理パラメータを含む学習結果データに対する学習処理と評価処理とを実行することで、識別器(A、B、C、・・・)を生成する。識別器(A、B、C、・・・)は、画像データを入力とし、当該画像に含まれる欠陥の有無と、1又は複数の欠陥が含まれる場合には、その位置及びその種類と、を含む属性情報を出力するものである。
第2学習処理部141は、学習用データを用いて、取得した画像のデータを入力すると、属性情報で表現される計測画像の属性に対応する出力値を出力するように、識別器(a、b、c、・・・)の学習結果データによって表現される機械学習モデルを学習させる学習処理(追加学習の学習処理)を行う。ここで、第2学習処理部141が行う追加学習の学習処理は、後述する画像修正部120から取得した学習用データを用いて行われてよい。これにより、検査対象物を撮像した画像に基づいて新たに生成された学習用データを用いることができ、識別器の識別精度を向上させることができるからである。
第2学習処理部141は、さらに、学習処理によって生成された識別器(A、B、C、・・・)に対し、テスト用データを用いて、識別器(A、B、C、・・・)の出力と、テスト用データに対して付与された属性情報とを比較する評価処理を行う。識別器(A、B、C、・・・)の出力と、テスト用データに付与された属性情報とが一致している場合には、識別器(A、B、C、・・・)の生成条件を満たしたと判断し、識別器(A、B、C、・・・)の生成処理を完了させる。ここで、第2学習処理部141が行う評価処理は、後述する画像修正部120から取得したテスト用データを用いて行われてよい。これにより、検査対象物を撮像した画像に基づいて新たに生成された学習用データを用いて評価を行うことができ、識別器の認識精度を向上させることができるからである。
第2学習部140は、生成した識別器(A、B、C、・・・)のモデル構造及び処理パラメータを含む情報を、学習結果データとして、後述する計測部150に出力する。
なお、第1学習部130と第2学習部140とを一体に構成し、第1学習処理部131が、追加学習の学習処理と評価処理とを実行するようにしてもよい。
<計測部の構成>
図3は、本実施形態に係るデータ生成装置100の計測部150における処理の内容を示す概念図である。計測部150は、学習用データを用いた学習処理及び評価処理によって生成された識別器を用いて、撮像装置153により撮像された検査対象物の計測画像の属性情報を出力させ、判定部152により検査対象物に欠陥が含まれているか否かを判定して、計測画像、属性情報及び判定結果を含む計測結果を出力する。属性情報は、欠陥の有無、1又は複数の欠陥が含まれる場合にはその欠陥の位置及び種類、を含む。
計測部150は、第1学習部130及び第2学習部140から、識別器のモデル構造及び処理パラメータを含む情報を、学習結果データとして取得する。計測部150は、取得した学習結果データを格納する学習結果DB151を有する。また、計測部150は、検査対象物を撮像する撮像装置153を有する。撮像装置153は、例えば、工場の製造ラインを撮像するように設置され、製造ラインの一部を構成する。撮像装置153は、製造ラインを流れる検査対象物としての部品及び製品(以下、部品と製品とを合わせて「ワーク」と称することがある。)の画像を計測画像として撮像する。
計測部150は、学習結果DB151に格納された学習結果データに基づき構成される識別器を用いて、計測画像の属性情報を出力する判定部152を有する。判定部152は、学習用データを用いて学習された識別器(a、b、c、A、B、…)によって、撮像装置153で撮像された計測画像に欠陥が含まれているか否かを判定する。
計測部150は、計測画像と、識別器により出力された計測画像の属性情報と、判定部152による判定結果と、を含む計測結果を、計測結果管理部160に出力する。なお、計測部150は、個々の検査対象物を識別するための識別情報を、計測結果とともに、計測結果管理部160に出力してもよい。このとき、検査対象物の識別情報は、計測画像から取得してもよく、所定のインタフェースを介して外部より取得してもよい。識別情報としては、例えば、製造番号や、製造番号を符号化した図形を用いることができる。よって、識別情報とは、検査対象物の個体を識別することができる情報であることが好ましい。なお、計測部150は、検査対象物の計測結果を、計測結果管理部160以外に出力してもよい。例えば、後述するユーザインタフェース170に対し、計測結果及び識別情報を出力するようにしてもよい。また、例えば、計測結果を仕分け装置(図示せず)に対して直接的または間接的に出力してもよい。仕分け装置は、取得した計測結果に基づいて、検査対象物の仕分けを行う。
<計測結果管理部の構成>
計測結果管理部160は、計測結果に含まれる計測画像と、識別器により出力された属性情報及び判定部152による判定結果とを関連付けて記憶する計測結果DB161を有する。なお、計測結果管理部160は、検査対象物を識別するための識別情報を、計測結果とともに取得してもよい。このとき、検査対象物の識別情報は、計測部150から取得してもよく、所定のインタフェースを介して外部より取得してもよい。また、計測結果DB161は、属性情報に含まれる属性の種別に応じて、例えば、欠陥の種別の属性に関連付けて、計測画像を分類して記憶してもよい。
計測結果管理部160は、計測結果を、ユーザインタフェース170に対して出力する。このとき、計測結果管理部160は、あわせて、検査対象物の識別情報をユーザインタフェース170に対して出力してよい。また、計測結果管理部160は、計測結果を、後述する画像修正部120に対して出力する。このとき、計測結果管理部160は、あわせて検査対象物の識別情報を、画像修正部120に対して出力してもよい。
<ユーザインタフェース>
本実施形態において、ユーザインタフェース170は、第2作業者が、判定部152による判定結果を確認するために用いられたり、計測画像に含まれる欠陥を含む部分画像を指定するために用いられたり、判定部152による判定結果が正しいか否かに関する入力を受け付けたり、補正部121による補正方法を指定するために用いられたり、生成部122による合成画像の生成方法を指定するために用いられたりする。ユーザインタフェース170は、少なくとも計測画像及び計測部150による計測結果を表示するための表示部(液晶表示装置等)、及び、第2作業者による部分画像の指定、判定部152による判定結果が正しいか否かの入力、補正方法の指定及び生成方法の指定等を行うための入力部(タッチパネル、キーボード、マウス等)を有する。第2作業者は、表示部に表示された計測画像及び当該計測画像の計測結果に基づいて、計測結果の正誤を判断し、入力部を用いて計測結果の正誤を入力し、欠陥を含む部分画像の領域を入力してよい。そして、第2作業者は、表示部に表示された計測画像及び当該計測画像の計測結果に基づいて、指定した部分画像をどのように補正するか、補正された部分画像を他の画像にどのように合成するかを、入力部を用いて指定してよい。
<画像修正部の構成>
画像修正部120は、取得された部分画像を補正して、学習用データの生成を行う。画像修正部120は、補正部121、生成部122、修正画像データベース(以下、「修正画像DB」と称す。)123、検証部124及び選択部125を有し、ユーザインタフェース170によって受け付けた部分画像を補正して、補正した部分画像を他の画像に合成して学習用データを生成する。なお、以下では、画像修正部120は、ユーザインタフェース170によって受け付けた部分画像を補正して、新たな学習用データを生成する例について説明するが、ユーザインタフェース180によって受け付けた部分画像を補正して、新たな学習用データを生成してもよい。
補正部121は、画像のうち欠陥を含む部分画像を、欠陥の特徴量に基づいて補正する。補正部121は、判定部152により画像に欠陥が含まれていないと判定され、ユーザインタフェース170により判定部152による判定結果が正しくないと入力された場合に、部分画像を補正してもよい。例えば、補正部121は、欠陥の部分画像が有する特徴量と、判定部152が使用した識別器が学習した特徴量とを比較して、識別器が学習した特徴量とは異なる特徴量を有するように、部分画像を補正してもよい。より具体的には、識別器が、学習用データを用いた事前学習によって、欠陥に対応する画像の特徴量の範囲を学習している場合に、補正部121は、欠陥の特徴が、識別器が学習した特徴量の範囲に含まれないように、部分画像を補正してよい。例えば、識別器が学習した欠陥に対応する画像の特徴量が、欠陥の長さの範囲を表すものである場合、補正部121は、識別器が学習した欠陥の長さの範囲から逸脱するように、伸縮により欠陥を含む部分画像を補正してよい。これにより、識別器によって欠陥が含まれていないと誤判定された画像に基づいて合成画像を生成し、識別器によって識別しづらい欠陥を含んだ画像を増やすことができ、識別器の識別性能をより向上させることのできる学習用データを生成することができる。また、学習用データを用いた学習によって識別器が学習することのできなかった特徴量を有する部分画像を生成することができ、識別器が学習できる特徴量のバリエーションを増やすような新たな学習用データを生成することができる。
補正部121は、ユーザインタフェース170により指定された部分画像に対して複数の異なる補正を行ってもよい。より具体的には、補正部121は、部分画像の明るさを補正したり、部分画像の形状を補正したりしてよい。部分画像の明るさを補正することで、照明条件の違いや、欠陥の発生箇所の違いによって識別器が欠陥を見逃すことのないように、識別器を学習させることのできる学習用データが得られる。また、部分画像の形状を補正することで、欠陥の形状の違いによって識別器が欠陥を見逃すことのないように、識別器を学習させることのできる学習用データが得られる。
また、補正部121は、部分画像の形状が、複数の形状テンプレートのうちいずれかに近付くように、部分画像の形状を補正してもよい。このような補正の例については、図9を用いてより具体的に説明する。複数の形状テンプレートを用意し、形状テンプレートを選択させて、選択された形状テンプレートに近付くように、部分画像の形状を補正することで、様々な変形のバリエーションを簡単に指定することができ、補正方法の指定を容易に行うことができる。これにより、検査対象物について実際に生じ得る形状の欠陥を簡単に合成することができ、形状の指定に不慣れな作業者であっても、現場で識別器を使用した場合の識別性能がより向上する学習用データを生成することができる。
補正部121は、判定部152による判定の信頼度に基づいて、複数の形状テンプレートのうちいずれかを選択し、部分画像の形状を補正してもよい。ここで、信頼度とは、合成画像に含まれる、補正された部分画像の領域(合成領域)の欠陥らしさの確度を示し、例えば、「欠陥有」とした判定結果を0から1の数値で表した指標であって、数値が1に近いほど、判定結果の確からしさが高いことを意味する。この場合、判定部152は、複数の形状テンプレートを用いて補正された部分画像を、部分画像を含む画像とは異なる画像にそれぞれ合成して生成された複数の合成画像に欠陥が含まれているか否かを判定し、それぞれの判定の信頼度を出力する。例えば、補正部121は、判定部152による判定の信頼度が比較的低くなる形状テンプレートを選択し、部分画像の形状を補正してもよい。このようにして、識別器の識別性能を向上させるのに適した形状テンプレートを用いて部分画像の形状の補正が行われ、識別器の識別性能及び学習効率を向上させることができる。
生成部122は、補正部121により補正された部分画像と、部分画像を含む画像とは異なる画像とを合成した合成画像を生成し、欠陥が含まれていることを示す情報を合成画像に関連付けて、識別器を学習させるための新たな学習用データを生成する。生成部122は、補正部121により複数の補正方法で補正された部分画像と、部分画像を含む画像とは異なる検査対象物の画像とを合成した複数の合成画像を生成し、欠陥が含まれていることを示す情報を複数の合成画像に関連付けて、複数の学習用データの候補を生成してよい。複数の補正方法で欠陥を含む部分画像を補正し、複数の合成画像を生成することで、欠陥を含む少数の画像から、様々な態様の欠陥を含む複数の合成画像を生成することができ、識別器の汎化性能をより向上させることのできる学習用データの候補を生成することができる。
また、生成部122は、補正部121により補正された部分画像を、部分画像を含む画像とは異なる複数の画像に合成して複数の合成画像を生成し、欠陥が含まれていることを示す情報を複数の合成画像に関連付けて、複数の学習用データの候補を生成してもよい。欠陥が含まれていない検査対象物の複数の画像に対して、欠陥を含む部分画像を合成し、複数の合成画像を生成することで、欠陥を含む少数の画像から、様々な背景において欠陥を含む複数の合成画像を生成することができ、識別器の汎化性能をより向上させることのできる学習用データの候補を生成することができる。
生成部122は、欠陥の周囲の背景模様が、部分画像を含む画像と合成画像とで類似するように、部分画像の合成箇所を選択し、合成画像を生成してもよい。より具体的には、例えば、部分画像を含む画像と合成画像とで、それぞれの画像の、撮像対象物のテクスチャに依存しない画素値の濃淡度の変動が所定の範囲に収まるように、部分画像の合成箇所を選択し、合成画像を生成してもよい。これにより、部分画像が合成先において自然に見えるように合成され、検査対象物について実際に生じ得る欠陥を含むようにデータオーグメンテーションを行うことができる。また、生成部122は、検査対象物のうち統計的に欠陥が生じやすい箇所に部分画像が合成さえるように、合成画像を生成してもよい。検査対象物のうち統計的に欠陥が生じやすい箇所は、検査対象物について過去に生じた欠陥の箇所の履歴に基づいて特定してよい。検査対象物のうち統計的に欠陥が生じやすい箇所に部分画像を合成することで、現場で実際に発生しやすい箇所に部分画像を合成することができ、検査対象物について実際に生じ得る欠陥を含むようにデータオーグメンテーションを行うことができる。
修正画像DB123は、生成部122により生成された新たな学習用データを格納し、記憶する。修正画像DB123は、計測画像及びユーザインタフェース170から受け付けた部分画像を一時的に記憶してもよいし、サンプル画像及びユーザインタフェース180から受け付けた部分画像を一時的に記憶してもよい。
検証部124は、合成画像に欠陥が含まれているか否かを判定部152により判定させ、合成画像の合成元となった画像に欠陥が含まれているか否かを判定部152により判定させた場合と類似の判定結果が得られるか検証する。例えば、合成画像の合成元となった計測画像について、判定部152によって欠陥が含まれていないと誤判定された場合、検証部124は、合成画像に欠陥が含まれているか否かを判定部152により判定させ、判定部152によって欠陥が含まれていないと誤判定されるか否かを検証する。これにより、識別器によって欠陥が含まれていないと誤判定される合成画像が生成されたか検証され、識別器によって識別しづらい欠陥を含んだ画像を増やすことができ、識別器の識別性能をより向上させることのできる学習用データが生成される。
画像修正部120は、生成部122により生成した複数の学習用データの候補それぞれを、異なる識別器の学習に適用して、入力された画像に欠陥が含まれているか否かを識別する複数の識別器(a、b、c、A、B、・・・)を第1学習部130又は第2学習部140によって学習させてよい。画像修正部120は、例えば、補正部121によりN通りの方法で補正された部分画像と、欠陥が含まれていない検査対象物のM枚の画像と、のN×Mの組合せについて生成部122によって合成画像を生成して複数の学習用データの候補を生成し、N×Mの学習用データを用いて、複数の識別器(a、b、c、A、B、・・・)を第1学習部130又は第2学習部140によって学習させてよい。このとき、N×Mの学習用データをそれぞれ独立に用いて、複数の識別器(a、b、c、A、B、・・・)を第1学習部130又は第2学習部140によって学習させてよい。これにより、いずれの補正方法及び生成方法が複数の識別器(a、b、c、A、B、・・・)の識別性能を向上させるのに最適であるかを試行することができる。
選択部125は、第1学習部130又は第2学習部140により学習された、複数の学習済みの識別器の識別性能に基づいて、複数の学習用データの候補から1又は複数の学習用データを選択する。選択部125は、生成された複数の学習用データの候補を用いて複数の識別器を学習させたときの識別性能に基づいて1又は複数の学習用データを選択することで、識別器の学習に用いた場合に識別器の識別性能をより良く向上させる学習用データを選択することができ、識別器の識別性能及び学習効率を向上させることができる。
[ハードウェア構成]
次に、図4を用いて、本実施形態に係るデータ生成装置100のハードウェア構成の一例を説明する。本実施形態に係るデータ生成装置100は、演算装置101、出力装置191、入力装置192及び撮像装置153を備えるものであってよい。ここで、出力装置191及び入力装置192は、ユーザインタフェース170及びユーザインタフェース180を構成する。
演算装置101は、補助記憶部102、103、プロセッサ104、主記憶部105及び外部インタフェース(以下、「外部I/F」と称す。)を含むものであってよい。
演算装置101は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等を含み、情報処理に応じて各構成要素の制御を行う。プロセッサ104は、CPUを含んでよく、補助記憶部102、103及び主記憶部105は、RAM及びROMを含んでよい。補助記憶部102は、例えば、ハードディスクドライブ、ソリッドステートドライブ等であってもよく、プロセッサ104で実行されるデータ生成プログラム102a、撮像装置153により撮像された計測画像102b及び学習用データ102c等を記憶してよい。補助記憶部103及び主記憶部105は、補助記憶部102と同様に、例えば、ハードディスクドライブやソリッドステートドライブ等であってもよい。データ生成プログラム102aは、前述の、画像収集部110、画像修正部120、第1学習部130、第2学習部140、計測部150及び計測結果管理部160の機能を実現するための処理を行うためのプログラムであり、当該プログラムがプロセッサ104によって実行されることにより、各機能が実現される。なお、データ生成プログラム102aは、画像収集部110、画像修正部120、第1学習部130、第2学習部140、計測部150及び計測結果管理部160のうち一部の機能を実現するための処理を行うためのプログラムであってもよいし、これら以外の機能を実現するための処理を行うためのプログラムを含んでもよい。
外部I/F106は、USB(Universal Serial Bus)ポート等であり、出力装置191、入力装置192及び撮像装置153等の外部装置と接続するためのインタフェースである。なお、データ生成装置は、有線LAN(Local Area Network)モジュールや無線LANモジュール等、ネットワークを介した有線又は無線通信を行うためのインタフェースを備えてもよい。
記憶媒体は、コンピュータ等の装置によって、記憶されたプログラム等の情報を読み取り可能なように、当該プログラム等の情報を、電気的、磁気的、光学的、機械的又は化学的作用によって蓄積する媒体である。記憶媒体は、例えば、CD(Compact Disk)やDVD(Digital Versatile Disk)等であり、データ生成プログラム102aを記憶したものであってよい。記憶媒体に記憶されたデータ生成プログラム102aは、補助記憶部103にコピーされ、補助記憶部102や主記憶部105にコピーされてよい。図4では、記憶媒体の一例として、CD、DVD等のディスク型の記憶媒体を例示している。しかしながら、記憶媒体の種類は、ディスク型に限定される訳ではなく、ディスク型以外であってもよい。ディスク型以外の記憶媒体として、例えば、フラッシュメモリ等の半導体メモリを挙げることができる。また、データ生成装置100は、データ生成プログラム102a等のデータを、有線又は無線通信によってネットワークを介して取得してもよい。
なお、データ生成装置100の具体的なハードウェア構成は、実施形態に応じて、適宜、構成要素を省略、置換及び追加されてもよい。例えば、演算装置101は、複数のプロセッサを含んでもよいし、GPU(Graphical Processing Unit)やFPGA(Field Programmable Gate Array)を含んでもよい。また、データ生成装置100は、複数台の情報処理装置で構成されてもよい。データ生成装置100は、提供されるサービス専用に設計された情報処理装置の他、汎用のデスクトップPC(Personal Computer)、タブレットPC等で構成されてもよい。
§3 動作例
図5は、本実施形態に係るデータ生成装置100により実行される第1処理の内容を示すフローチャートである。第1処理は、ユーザインタフェース170によって判定部152による判定結果が正しくないと入力された場合に、生成部122によって新たな学習用データを生成する処理である。データ生成装置100は、はじめに検査対象物の画像を取得する(S10)。ここで、画像は、予め画像DB112に記憶されたサンプル画像であってもよいし、撮像装置153によって新たに撮像された計測画像であってもよい。
データ生成装置100の判定部152は、学習用データを用いて学習された識別器によって、取得された画像に欠陥が含まれているか否かを判定する(S11)。第2作業者は、ユーザインタフェース170によって判定対象となった画像及び判定結果を確認し、ユーザインタフェース170は、判定部152による判定結果が正しいか否かに関する入力を受け付ける(S12)。
判定部152により画像に欠陥が含まれていないと判定され、ユーザインタフェース170により判定部152による判定結果が正しくないと入力された場合(S13:NO)、すなわち識別器によって欠陥が見逃された場合、ユーザインタフェース170は、画像のうち欠陥を含む部分画像の指定を受け付ける(S14)。なお、判定部152により欠陥の有無を正しく判定できた場合(S13:YES)、第1処理は終了する。
データ生成装置100の補正部121は、指定された部分画像の補正を行う(S15)。補正処理の詳細については、次図を用いて詳細に説明する。また、データ生成装置100の生成部122は、補正部121により補正された部分画像と、部分画像を含む画像とは異なる画像とを合成した合成画像を生成する(S16)。合成処理の詳細については、図7を用いて詳細に説明する。
データ生成装置100の検証部124は、生成された合成画像に欠陥が含まれているか否かを判定部152により判定させる(S17)。判定させた結果、部分画像を含む画像を判定部152により判定させた場合と類似して、合成した部分画像に含まれる欠陥について、欠陥が含まれていないという判定結果が得られるか検証する(S18)。なお、検証部124は、合成画像のうち部分画像が合成された領域について、判定部125による判定結果の検証を行えばよく、合成画像のうち部分画像が合成された領域以外の領域に関する判定部125による判定結果の検証は必ずしも行わなくてもよい。合成元となった検査対象物の画像(以下、合成元画像という。)と類似の判定結果が得られない場合(S18:NO)、データ生成装置100は、部分画像の補正処理(S15)及び合成処理(S16)を異なる方法で再度行い、生成された合成画像に欠陥が含まれているか否かを判定部152により判定させ(S17)、合成元画像と類似の判定結果が得られるか検証する。合成元画像と類似の判定結果が得られた場合(S18:YES)、生成部122は、欠陥が含まれていることを示す情報を合成画像に関連付けて、識別器を学習させるための新たな学習用データを生成し、修正画像DB123に格納する(S19)。以上により第1処理が終了する。
図6は、本実施形態に係るデータ生成装置100により実行される補正処理(S15)の内容を示すフローチャートである。データ生成装置100は、はじめに、ユーザインタフェース170によって補正方法の選択を受け付ける(S151)。補正方法の選択は、補正に用いる欠陥の特徴量の選択、部分画像の形状の補正の有無の選択及び部分画像の明るさの補正の有無の選択等の少なくともいずれかを含んでよい。以下では、部分画像の形状の補正を行い、部分画像の明るさの補正を選択に応じて行う場合について説明する。
部分画像の形状の補正においてデータ生成装置100によって形状テンプレートを自動選択しない場合(S152:NO)、ユーザインタフェース170は、形状テンプレートの選択を受け付ける(S153)。一方、データ生成装置100によって形状テンプレートを自動選択する場合(S152:YES)、判定部152によって複数の形状テンプレートを用いて生成された合成画像に欠陥が含まれているか否かを判定した履歴を参照し(S154)、判定部152による判定の信頼度に基づいて、複数の形状テンプレートのうちいずれかを選択する(S155)。例えば、判定部152による判定の信頼度が比較的低くなる合成画像を生成することのできる形状テンプレートを選択することとしてよい。そのような選択により、識別器による識別が難しい合成画像を生成することができ、識別器の識別性能をより向上させることのできる合成画像を生成することができる。
補正部121は、部分画像の形状が、選択された形状テンプレートに近付くように、部分画像の形状を補正する(S156)。その後、部分画像の明るさの補正を行う場合(S157:YES)、補正部121は、部分画像の明るさが変化するように、部分画像を補正する(S158)。ここで、明るさの変化率や変化の態様は、ユーザインタフェース170によって指定されてもよいし、補正部121によって自動的に調整されてもよい。補正部121によって明るさの補正方法を自動で調整する場合、形状の補正の場合と同様に、複数の方法で補正された部分画像を欠陥が含まれていない検査対象物の画像にそれぞれ合成して複数の合成画像を生成し、生成された複数の合成画像に欠陥が含まれているか否かを判定部152によって判定させて、判定部による判定の信頼度に基づいて、複数の補正方法のうちいずれかを選択することとしてもよい。以上により、補正処理(S15)が終了する。なお、補正に用いる欠陥の特徴量の選択、部分画像の形状の補正の有無の選択及び部分画像の明るさの補正の有無の選択等のそれぞれの補正方法は、単独で、または、複数組み合わせて用いることができる。
図7は、本実施形態に係るデータ生成装置100により実行される合成処理(S16)の内容を示すフローチャートである。データ生成装置100は、はじめに、ユーザインタフェース170によって合成先とする背景画像(以下、合成先画像という。)の選択を受け付ける(S161)。合成先画像は、合成元である検査対象物の画像(合成元画像)に写された検査対象物と同じ検査対象物を撮像したものであってもよいし、合成元画像に写された検査対象物と異なる検査対象物を撮像したものであってもよい。さらに、ユーザインタフェース170は、合成画像の生成方法の選択を受け付ける(S162)。生成方法の選択は、合成先画像にマスクを設定するか否かの選択、欠陥が生じやすい箇所への合成を優先するか否かの選択及び部分画像の合成箇所の選択等の少なくともいずれかを含んでよい。
ユーザインタフェース170によりマスクの設定が選択された場合(S163:YES)、データ生成装置100は、合成先画像にマスクを設定し、部分画像を合成する箇所を制限する(S164)。マスクを設定する場合、マスクの形状をユーザインタフェース170によって受け付けることとしてもよい。
その後、データ生成装置100は、欠陥が生じやすい箇所への部分画像の合成を優先するか否かを判定する(S165)。欠陥が生じやすい箇所への合成を優先する場合(S165:YES)、生成部122は、検査対象物について検出された欠陥の箇所の履歴に基づき、検査対象物のうち統計的に欠陥が生じやすい箇所を特定する(S166)。そして、生成部122は、検査対象物のうち統計的に欠陥が生じやすい箇所に部分画像を合成し、合成画像を生成する(S167)。
一方、欠陥が生じやすい箇所への合成を優先しない場合(S165:NO)、欠陥の周囲の背景模様が合成元画像と合成先画像とで類似する箇所を特定する(S168)。例えば、合成元画像の欠陥の周囲にヘアライン加工が施されており、合成先画像においてもヘアライン加工がされている場合、合成元と合成先とでヘアラインの方向が一致するような合成箇所を特定してよい。また、合成元画像に含まれる欠陥が検査対象物のエッジや印字に重畳している場合、合成先画像においてもエッジや印字に重畳するように部分画像の合成箇所を特定してよい。生成部122は、特定された合成箇所に部分画像を合成し、合成画像を生成する(S169)。以上により、合成処理(S16)が終了する。なお、合成先画像にマスクを設定するか否かの選択、欠陥が生じやすい箇所への合成を優先するか否かの選択及び部分画像の合成箇所の選択等のそれぞれの生成方法は、単独で、または、複数組み合わせて用いることができる。
図8は、本実施形態に係るデータ生成装置100により実行される補正処理及び合成処理の概要を示す図である。データ生成装置100は、合成元画像P1を取得し、ユーザインタフェース170からの指定に基づいて部分画像P2を抽出する。本例の場合、合成元画像P1は、ヘアライン加工され、表面に薄い傷が付いた検査対象物の画像である。部分画像P2は、傷の部分を切り出した画像である。
補正部121は、部分画像P2を複数の補正方法で補正してよい。本例では、部分画像P2は、第1補正によって第1補正画像P3に補正され、第2補正によって第2補正画像P4に補正される。第1補正と第2補正は、次図を用いて説明するように、異なる形状テンプレートを用いて行われる補正である。
生成部122は、第1補正画像P3を、表面が梨地加工された検査対象物の画像である第1合成先画像P10と合成して、第1合成画像P11を生成する。また、生成部122は、第2補正画像P4を、表面が粗く研磨された検査対象物の画像である第2合成先画像P20と合成して、第2合成画像P21を生成する。
このように、本実施形態に係るデータ生成装置100によれば、欠陥を含む一つの合成元画像P1から、第1合成画像P11や第2合成画像P21といった複数の合成画像を生成することができる。そして、複数の合成画像は、それぞれ実際に生じ得る欠陥を含むように生成される。データ生成装置100は、部分画像を複数の補正方法で補正し、複数の合成先画像に合成することで、実際に生じ得る欠陥を含む多様な合成画像を生成することができる。
図9は、本実施形態に係るデータ生成装置100により実行される補正処理の概要を示す図である。同図では、一つの合成元画像P1の形状を、複数の形状テンプレートにそれぞれ近付けるように補正して、複数の合成画像を生成する例を示している。
本例では、合成元画像P1の形状を、第1形状テンプレートに近付けるように補正して第1補正画像P3を生成する場合と、合成元画像P1の形状を、第2形状テンプレートに近付けるように補正して第2補正画像P4を生成する場合と、合成元画像P1の形状を、第3形状テンプレートに近付けるように補正して第3補正画像P5を生成する場合と、合成元画像P1の形状を、第4形状テンプレートに近付けるように補正して第4補正画像P6を生成する場合と、を示している。同図に示すように、第1形状テンプレートに基づく補正は、部分画像の形状に対して非線形変換を施すような補正であり、第1形状テンプレートに基づく補正は、部分画像の形状の太さを変化させ、掠れを加えるような補正であり、第3形状テンプレートに基づく補正は、部分画像の形状を複製して並べるような補正であり、第4形状テンプレートに基づく補正は、部分画像の形状に対して線形変換を施すような補正である。
図10は、本実施形態に係るデータ生成装置100により実行されるマスク処理の概要を示す図である。マスク処理は、合成先画像のうち部分画像の合成箇所を制限する処理であり、マスクで隠された領域には部分画像の合成を行わないようにする処理である。
本例のマスク前の画像P30は、欠陥Dを含み、画像の右側に検査対象物のエッジが写されている。画像の右側の黒色の領域は、検査対象物が存在しない領域である。データ生成装置100は、ユーザインタフェース170によってマスクMの設定を受け付けて、第3合成先画像P31を生成する。第3合成先画像P31のうち黒色のマスクMで隠された領域は、部分画像の合成箇所から除外される領域である。黒色のマスクMで隠された領域は、欠陥Dと、検査対象物が存在しない領域を覆っている。このようにマスクMを設定することで、欠陥Dに重ねて部分画像が合成されたり、検査対象物が存在しない領域に部分画像が合成されたりすることが防止され、より現実的な態様で欠陥を含んだ合成画像を生成することができる。
図11は、本実施形態に係るデータ生成装置100により実行される第2処理の内容を示すフローチャートである。第2処理は、ユーザインタフェース170によって判定部152による判定結果が正しくないと入力されるか否かに関わらず、生成部122によって新たな学習用データを生成する処理である。データ生成装置100は、はじめに検査対象物の画像を取得する(S20)。ここで、画像は、予め画像DB112に記憶されたサンプル画像であってもよいし、撮像装置153によって新たに撮像された計測画像であってもよい。
次に、ユーザインタフェース170は、画像のうち欠陥を含む部分画像の指定を受け付ける(S21)。その後、データ生成装置100の補正部121は、指定された部分画像の補正を行う(S22)。補正処理の詳細は、図6に示す内容と同様であってよい。
データ生成装置100の生成部122は、補正部121により補正された部分画像と、部分画像を含む画像とは異なる画像とを合成した合成画像を生成する(S23)。合成処理の詳細は、図7に示す内容と同様であってよい。
データ生成装置100の検証部124は、生成された合成画像に欠陥が含まれているか否かを判定部152により判定させる(S24)。判定させた結果、部分画像を含む画像を判定部152により判定させた場合と類似して、合成した部分画像に含まれる欠陥について、欠陥が含まれてないという判定結果が得られるか検証する(S25)。なお、検証部124は、合成画像のうち部分画像が合成された領域について、判定部125による判定結果の検証を行えばよく、合成画像のうち部分画像が合成された領域以外の領域に関する判定部125による判定結果の検証は必ずしも行わなくてもよい。合成元である検査対象物の画像(合成元画像)と類似の判定結果が得られない場合(S25:NO)、データ生成装置100は、部分画像の補正処理(S22)及び合成処理(S23)を異なる方法で再度行い、生成された合成画像に欠陥が含まれているか否かを判定部152により判定させ(S24)、合成元画像と類似の判定結果が得られるか検証する。元画像と同様の判定結果が得られた場合(S25:YES)、生成部122は、欠陥が含まれていることを示す情報を合成画像に関連付けて、識別器を学習させるための新たな学習用データを生成し、修正画像DB123に格納する(S26)。以上により第2処理が終了する。
以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。
[付記1]
検査対象物に含まれる検出対象部位の有無を識別する識別器(a、b、c、A、B)を学習させるための学習用データを生成するデータ生成装置(100)であって、
検査対象物の画像を取得する取得部(153)と、
前記画像の一部であって、検出対象部位を含む部分画像の指定を受け付ける入力部(170、180)と、
前記部分画像を、前記検出対象部位の特徴量に基づいて補正する補正部(121)と、
前記補正部(121)により補正された前記部分画像と、前記部分画像を含む前記画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を前記合成画像に関連付けて、前記識別器(a、b、c、A、B)を学習させるための新たな学習用データを生成する生成部(122)と、
を備えるデータ生成装置(100)。
[付記2]
前記入力部(170、180)は、前記補正部(121)による補正方法及び前記生成部(122)による前記合成画像の生成方法のうち少なくともいずれかの指定を受け付ける、
付記1に記載のデータ生成装置(100)。
[付記3]
学習用データを用いて学習された前記識別器(a、b、c、A、B)によって、前記取得部(153)で取得された画像に検出対象部位が含まれているか否かを判定する判定部(152)をさらに備え、
前記入力部(170、180)は、前記判定部(152)による判定結果が正しいか否かに関する入力を受け付け、
前記補正部(121)は、前記判定部(152)により前記画像に検出対象部位が含まれていないと判定され、前記入力部(170、180)により前記判定部(152)による判定結果が正しくないと入力された場合に、前記部分画像を補正する、
付記1又は2に記載のデータ生成装置(100)。
[付記4]
前記識別器(a、b、c、A、B)は、学習用データを用いた学習によって、検出対象部位に対応する画像の特徴量を学習しており、
前記補正部(121)は、前記識別器(a、b、c、A、B)が学習した特徴量とは異なる特徴量を有するように、前記部分画像を補正する、
付記3に記載のデータ生成装置(100)。
[付記5]
前記合成画像に検出対象部位が含まれているか否かを前記判定部(152)により判定させ、前記部分画像を含む前記画像に検出対象部位が含まれているか否かを前記判定部(152)により判定させた場合と類似の判定結果が得られるか検証する検証部(124)をさらに備え、
前記生成部(122)は、前記検証部(124)が類似の判定結果を得た場合に、前記合成画像を新たな学習データとして登録する、
付記3又は4に記載のデータ生成装置(100)。
[付記6]
前記生成部(122)は、前記補正部(121)により複数の補正方法で補正された前記部分画像と、前記部分画像を含む前記画像とは異なる画像とを合成した複数の合成画像を生成し、検出対象部位が含まれていることを示す情報を前記複数の合成画像に関連付けて、複数の学習用データを生成する、
付記1から5のいずれか一項に記載のデータ生成装置。
[付記7]
前記生成部(122)は、前記補正部(121)により補正された前記部分画像を、前記部分画像を含む前記画像とは異なる複数の画像に合成して複数の合成画像を生成し、検出対象部位が含まれていることを示す情報を前記複数の合成画像に関連付けて、複数の学習用データを生成する、
付記1から6のいずれか一項に記載のデータ生成装置(100)。
[付記8]
前記複数の学習用データそれぞれを、異なる識別器(a、b、c、A、B)の学習に適用して、入力された画像に基づいて前記検査対象物に検出対象部位が含まれているか否かを識別する複数の識別器(a、b、c、A、B)を学習させる学習部(130、140)と、
前記学習部(130、140)により学習された、複数の学習済みの識別器(a、b、c、A、B)の識別性能に基づいて、前記複数の学習用データから1又は複数の学習用データを選択する選択部(125)と、をさらに備える、
付記6又は7に記載のデータ生成装置(100)。
[付記9]
前記生成部(122)は、前記検出対象部位の周囲の背景模様が、前記部分画像を含む前記画像と前記合成画像とで類似するように、前記部分画像の合成箇所を選択し、前記合成画像を生成する、
付記1から8のいずれか一項に記載のデータ生成装置(100)。
[付記10]
前記補正部(121)は、前記部分画像の明るさを補正する、
付記1から9のいずれか一項に記載のデータ生成装置(100)。
[付記11]
前記補正部(121)は、前記部分画像の形状を補正する、
付記3から10のいずれか一項に記載のデータ生成装置(100)。
[付記12]
前記補正部(121)は、前記部分画像の形状が、複数の形状テンプレートのうちいずれかに近付くように、前記部分画像の形状を補正する、
付記11に記載のデータ生成装置。
[付記13]
前記生成部(122)は、前記複数の形状テンプレートを用いて補正された前記部分画像を、前記部分画像を含む前記画像とは異なる画像にそれぞれ合成して複数の合成画像を生成し、
前記判定部(152)は、前記複数の合成画像に検出対象部位が含まれているか否かを判定し、
前記補正部(121)は、前記判定部(152)による判定の信頼度に基づいて、前記複数の形状テンプレートのうちいずれかを選択し、前記部分画像の形状を補正する、
付記12に記載のデータ生成装置。
[付記14]
前記生成部(122)は、前記検査対象物のうち統計的に検出対象部位が生じやすい箇所の画像に前記部分画像が合成されるように、前記合成画像を生成する、
付記1から13のいずれか一項に記載のデータ生成装置(100)。
[付記15]
前記検出対象部位は、前記検査対象物に含まれる欠陥の部位であり、
前記特徴量は、前記欠陥の形状、前記画像の明るさ、前記欠陥に沿った前記画像の明るさの変化、及び前記欠陥と前記欠陥の周囲とのコントラストのうち少なくともいずれかを含む、
付記1から14のいずれか一項に記載のデータ生成装置(100)。
[付記16]
検査対象物に含まれる検出対象部位の有無を識別する識別器(a、b、c、A、B)を学習させるための学習用データを生成するデータ生成方法であって、
検査対象物の画像を取得することと、
前記画像の一部であって、検出対象部位を含む部分画像の指定を受け付けることと、
前記部分画像を、前記検出対象部位の特徴量に基づいて補正することと、
補正された前記部分画像と、前記部分画像を含む前記画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を前記合成画像に関連付けて、前記識別器(a、b、c、A、B)を学習させるための新たな学習用データを生成することと、
を含むデータ生成方法。
[付記17]
検査対象物に含まれる検出対象部位の有無を識別する識別器(a、b、c、A、B)を学習させるための学習用データを生成するデータ生成装置(100)に備えられた演算装置を、
検査対象物の画像を取得する取得部(153)、
前記画像の一部であって、検出対象部位を含む部分画像をの指定を受け付ける入力部(170、180)、
前記部分画像を、前記検出対象部位の特徴量に基づいて補正する補正部(121)、及び
前記補正部(121)により補正された前記部分画像と、前記部分画像を含む前記画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を前記合成画像に関連付けて、識別器(a、b、c、A、B)を学習させるための新たな学習用データを生成する生成部(122)、
として動作させるデータ生成プログラム。
100…データ生成装置、101…演算装置、102…補助記憶部、102a…データ生成プログラム、102b…計測画像、102c…学習用データ、103…補助記憶部、104…プロセッサ、105…主記憶部、106…外部I/F、110…画像収集部、111…属性付与部、112…画像DB、113…画像補正部、120…画像修正部、121…補正部、122…生成部、123…修正画像DB、124…検証部、125…選択部、130…第1学習部、131…第1学習処理部、140…第2学習部、141…第2学習処理部、150…計測部、151…学習結果DB、152…判定部、153…撮像装置、160…計測結果管理部、161…計測結果DB、170…ユーザインタフェース、180…ユーザインタフェース、191…出力装置、192…入力装置、D…欠陥、M…マスク、P1…合成元画像、P2…部分画像、P3…第1補正画像、P4…第2補正画像、P5…第3補正画像、P6…第4補正画像、P10…第1合成先画像、P11…第1合成画像、P20…第2合成先画像、P21…第2合成画像、P30…マスク前の画像、P31…第3合成先画像

Claims (17)

  1. 検査対象物に含まれる検出対象部位の有無を識別する識別器を学習させるための学習用データを生成するデータ生成装置であって、
    検査対象物の画像を取得する取得部と、
    前記画像の一部であって、検出対象部位を含む部分画像の指定を受け付ける入力部と、 前記部分画像を、前記検出対象部位の特徴量に基づいて補正する補正部と、
    前記補正部により補正された前記部分画像と、前記部分画像を含む前記画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を前記合成画像に関連付けて、前記識別器を学習させるための新たな学習用データを生成する生成部と、
    を備えるデータ生成装置。
  2. 前記入力部は、前記補正部による補正方法及び前記生成部による前記合成画像の生成方法のうち少なくともいずれかの指定を受け付ける、
    請求項1に記載のデータ生成装置。
  3. 学習用データを用いて学習された前記識別器によって、前記取得部で取得された画像に検出対象部位が含まれているか否かを判定する判定部をさらに備え、
    前記入力部は、前記判定部による判定結果が正しいか否かに関する入力を受け付け、
    前記補正部は、前記判定部により前記画像に検出対象部位が含まれていないと判定され、前記入力部により前記判定部による判定結果が正しくないと入力された場合に、前記部分画像を補正する、
    請求項1又は2に記載のデータ生成装置。
  4. 前記識別器は、学習用データを用いた学習によって、検出対象部位に対応する画像の特徴量を学習しており、
    前記補正部は、前記識別器が学習した特徴量とは異なる特徴量を有するように、前記部分画像を補正する、
    請求項3に記載のデータ生成装置。
  5. 前記合成画像に検出対象部位が含まれているか否かを前記判定部により判定させ、前記部分画像を含む前記画像に検出対象部位が含まれているか否かを前記判定部により判定させた場合と類似の判定結果が得られるか検証する検証部をさらに備え、
    前記生成部は、前記検証部が類似の判定結果を得た場合に、前記合成画像を新たな学習データとして登録する、
    請求項3又は4に記載のデータ生成装置。
  6. 前記補正部は、前記部分画像の形状を補正する、
    請求項3から5のいずれか一項に記載のデータ生成装置。
  7. 前記補正部は、前記部分画像の形状が、複数の形状テンプレートのうちいずれかに近付くように、前記部分画像の形状を補正する、
    請求項6に記載のデータ生成装置。
  8. 前記生成部は、前記複数の形状テンプレートを用いて補正された前記部分画像を、前記部分画像を含む前記画像とは異なる画像にそれぞれ合成して複数の合成画像を生成し、
    前記判定部は、前記複数の合成画像に検出対象部位が含まれているか否かを判定し、
    前記補正部は、前記判定部による判定の信頼度に基づいて、前記複数の形状テンプレートのうちいずれかを選択し、前記部分画像の形状を補正する、
    請求項7に記載のデータ生成装置。
  9. 前記生成部は、前記補正部により複数の補正方法で補正された前記部分画像と、前記部分画像を含む前記画像とは異なる画像とを合成した複数の合成画像を生成し、検出対象部位が含まれていることを示す情報を前記複数の合成画像に関連付けて、複数の学習用データを生成する、
    請求項1からのいずれか一項に記載のデータ生成装置。
  10. 前記生成部は、前記補正部により補正された前記部分画像を、前記部分画像を含む前記画像とは異なる複数の画像に合成して複数の合成画像を生成し、検出対象部位が含まれていることを示す情報を前記複数の合成画像に関連付けて、複数の学習用データを生成する、
    請求項1からのいずれか一項に記載のデータ生成装置。
  11. 前記複数の学習用データそれぞれを、異なる識別器の学習に適用して、入力された画像に基づいて前記検査対象物に検出対象部位が含まれているか否かを識別する複数の識別器を学習させる学習部と、
    前記学習部により学習された、複数の学習済みの識別器の識別性能に基づいて、前記複数の学習用データから1又は複数の学習用データを選択する選択部と、をさらに備える、 請求項9又は10に記載のデータ生成装置。
  12. 前記生成部は、前記検出対象部位の周囲の背景模様が、前記部分画像を含む前記画像と前記合成画像とで類似するように、前記部分画像の合成箇所を選択し、前記合成画像を生成する、
    請求項1から11のいずれか一項に記載のデータ生成装置。
  13. 前記補正部は、前記部分画像の明るさを補正する、
    請求項1から12のいずれか一項に記載のデータ生成装置。
  14. 前記生成部は、前記検査対象物のうち統計的に検出対象部位が生じやすい箇所の画像に前記部分画像が合成されるように、前記合成画像を生成する、
    請求項1から13のいずれか一項に記載のデータ生成装置。
  15. 前記検出対象部位は、前記検査対象物に含まれる欠陥の部位であり、
    前記特徴量は、前記欠陥の形状、前記画像の明るさ、前記欠陥に沿った前記画像の明るさの変化、及び前記欠陥と前記欠陥の周囲とのコントラストのうち少なくともいずれかを含む、
    請求項1から14のいずれか一項に記載のデータ生成装置。
  16. 検査対象物に含まれる検出対象部位の有無を識別する識別器を学習させるための学習用データを生成するデータ生成方法であって、
    検査対象物の画像を取得することと、
    前記画像の一部であって、検出対象部位を含む部分画像の指定を受け付けることと、
    前記部分画像を、前記検出対象部位の特徴量に基づいて補正することと、
    補正された前記部分画像と、前記部分画像を含む前記画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を前記合成画像に関連付けて、前記識別器を学習させるための新たな学習用データを生成することと、
    を含むデータ生成方法。
  17. 検査対象物に含まれる検出対象部位の有無を識別する識別器を学習させるための学習用データを生成するデータ生成装置に備えられた演算装置を、
    検査対象物の画像を取得する取得部、
    前記画像の一部であって、検出対象部位を含む部分画像の指定を受け付ける入力部、
    前記部分画像を、前記検出対象部位の特徴量に基づいて補正する補正部、及び
    前記補正部により補正された前記部分画像と、前記部分画像を含む前記画像とは異なる画像とを合成した合成画像を生成し、検出対象部位が含まれていることを示す情報を前記合成画像に関連付けて、前記識別器を学習させるための新たな学習用データを生成する生成部、
    として動作させるデータ生成プログラム。

JP2017240292A 2017-12-15 2017-12-15 データ生成装置、データ生成方法及びデータ生成プログラム Active JP6573226B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017240292A JP6573226B2 (ja) 2017-12-15 2017-12-15 データ生成装置、データ生成方法及びデータ生成プログラム
PCT/JP2018/045252 WO2019117065A1 (ja) 2017-12-15 2018-12-10 データ生成装置、データ生成方法及びデータ生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017240292A JP6573226B2 (ja) 2017-12-15 2017-12-15 データ生成装置、データ生成方法及びデータ生成プログラム

Publications (2)

Publication Number Publication Date
JP2019109563A JP2019109563A (ja) 2019-07-04
JP6573226B2 true JP6573226B2 (ja) 2019-09-11

Family

ID=66820305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017240292A Active JP6573226B2 (ja) 2017-12-15 2017-12-15 データ生成装置、データ生成方法及びデータ生成プログラム

Country Status (2)

Country Link
JP (1) JP6573226B2 (ja)
WO (1) WO2019117065A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112021000027T5 (de) 2020-03-26 2022-01-13 Panasonic Intellectual Property Management Co., Ltd. Trainingsdatenerzeugungsverfahren, Trainingsdatenerzeugungsvorrichtung und Programm

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112150398B (zh) * 2019-06-27 2024-03-22 杭州海康威视数字技术股份有限公司 图像合成方法、装置及设备
WO2021010269A1 (ja) * 2019-07-18 2021-01-21 三菱電機株式会社 検査装置、検査方法及びプログラム
JP7383946B2 (ja) * 2019-09-12 2023-11-21 株式会社アイシン 画像復元装置、画像復元方法、画像復元プログラム、復元器生成装置、復元器生成方法、復元器生成プログラム、判定器生成装置、判定器生成方法、判定器生成プログラム、物品判定装置、物品判定方法、および物品判定プログラム
JP7335545B2 (ja) * 2019-09-30 2023-08-30 ブラザー工業株式会社 学習画像データの生成方法、予測モデル
CN114556416A (zh) * 2019-10-18 2022-05-27 株式会社日立高新技术 检查系统以及非临时性计算机可读介质
JP6744536B1 (ja) * 2019-11-01 2020-08-19 株式会社アップステアーズ 目線撮像方法及び目線撮像システム
JP2021096581A (ja) * 2019-12-16 2021-06-24 株式会社日立製作所 状態判定装置および状態判定方法
JP6898020B1 (ja) * 2020-02-17 2021-07-07 クリスタルメソッド株式会社 情報処理装置及び情報処理方法
WO2021193347A1 (ja) * 2020-03-26 2021-09-30 パナソニックIpマネジメント株式会社 データ生成システム、データ生成方法、データ生成装置および追加学習要否装置
CN115699085A (zh) * 2020-04-21 2023-02-03 株式会社岛津制作所 细胞图像解析装置
WO2022065271A1 (ja) * 2020-09-25 2022-03-31 ファナック株式会社 画像作成装置
KR102374840B1 (ko) * 2020-10-20 2022-03-15 두산중공업 주식회사 딥러닝 학습용 결함 이미지 생성 방법 및 이를 위한 시스템
KR102509581B1 (ko) * 2020-11-19 2023-03-13 한양대학교 산학협력단 영상 판단 장치 및 그 판단 방법
US11521313B2 (en) * 2021-02-11 2022-12-06 Panasonic Intellectual Property Management Co., Ltd. Method and system for checking data gathering conditions associated with image-data during AI enabled visual-inspection process
JP2022123217A (ja) * 2021-02-12 2022-08-24 オムロン株式会社 画像検査装置、画像検査方法、及び学習済みモデル生成装置
JPWO2022173037A1 (ja) * 2021-02-15 2022-08-18
JP6955734B1 (ja) * 2021-03-08 2021-10-27 株式会社データグリッド 画像データ生成方法、学習方法、画像データ生成システム、学習システムおよびプログラム
WO2023175905A1 (ja) * 2022-03-18 2023-09-21 日本電気株式会社 メーター識別システム、メーター識別方法および記録媒体
JP2023183808A (ja) * 2022-06-16 2023-12-28 株式会社日立製作所 画像生成方法及び外観検査装置
KR102446658B1 (ko) * 2022-07-07 2022-09-26 주식회사 아이브 인공지능 기반의 영상 인식을 활용한 부품 결함 검사 장치 및 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6403261B2 (ja) * 2014-12-03 2018-10-10 タカノ株式会社 分類器生成装置、外観検査装置、分類器生成方法、及びプログラム
US10984538B2 (en) * 2016-03-09 2021-04-20 Nec Corporation Image-processing device, image-processing method, and recording medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112021000027T5 (de) 2020-03-26 2022-01-13 Panasonic Intellectual Property Management Co., Ltd. Trainingsdatenerzeugungsverfahren, Trainingsdatenerzeugungsvorrichtung und Programm

Also Published As

Publication number Publication date
WO2019117065A1 (ja) 2019-06-20
JP2019109563A (ja) 2019-07-04

Similar Documents

Publication Publication Date Title
JP6573226B2 (ja) データ生成装置、データ生成方法及びデータ生成プログラム
JP6924413B2 (ja) データ生成装置、データ生成方法及びデータ生成プログラム
CN109767418B (zh) 检査装置、数据生成装置、数据生成方法及存储介质
JP6936958B2 (ja) データ生成装置、データ生成方法及びデータ生成プログラム
TWI737659B (zh) 半導體試樣的基於深度學習之檢查的方法及其系統
CN110945528B (zh) 产生可用于检查半导体样品的训练集的方法及其系统
JP6544716B2 (ja) データ生成装置、データ生成方法及びデータ生成プログラム
TWI670781B (zh) 疊代式缺陷濾除製程
JP5546317B2 (ja) 外観検査装置、外観検査用識別器の生成装置及び外観検査用識別器生成方法ならびに外観検査用識別器生成用コンピュータプログラム
TWI748122B (zh) 用於對多個項進行分類的系統、方法和電腦程式產品
TW202044067A (zh) 基於機器學習之半導體樣本中的缺陷分類
JP2022027473A (ja) 半導体試料の検査に使用可能な訓練データの生成
JP2021143884A (ja) 検査装置、検査方法、プログラム、学習装置、学習方法、および学習済みデータセット
CN115131596A (zh) 缺陷分类装置、方法以及程序
JP7206892B2 (ja) 画像検査装置、画像検査のための学習方法および画像検査プログラム
KR102621884B1 (ko) 상품불량 선별을 위한 딥러닝 기반의 이미지 분석 방법 및 이를 위한 시스템
TWM631676U (zh) 具人工智慧模組進行檢測緊固件的設備
JP2022139417A (ja) 統合モデルの生成方法、画像検査システム、画像検査用モデルの生成装置、画像検査用モデルの生成プログラム及び画像検査装置
TW202401358A (zh) 不適合檢測裝置及不適合檢測方法
JP2022123234A (ja) 画像検査装置、画像検査方法及び学習済みモデル生成装置
CN114266298A (zh) 基于一致流形逼近与投影聚类集成的图像分割方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190401

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190401

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190527

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190722

R150 Certificate of patent or registration of utility model

Ref document number: 6573226

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190804