JP2021033564A - 画像分類方法、画像分類装置および画像分類プログラム - Google Patents

画像分類方法、画像分類装置および画像分類プログラム Download PDF

Info

Publication number
JP2021033564A
JP2021033564A JP2019152058A JP2019152058A JP2021033564A JP 2021033564 A JP2021033564 A JP 2021033564A JP 2019152058 A JP2019152058 A JP 2019152058A JP 2019152058 A JP2019152058 A JP 2019152058A JP 2021033564 A JP2021033564 A JP 2021033564A
Authority
JP
Japan
Prior art keywords
classification
image
learning
classifier
classes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019152058A
Other languages
English (en)
Inventor
達也 亀津
Tatsuya Kametsu
達也 亀津
雅昭 泉
Masaaki Izumi
雅昭 泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YE Digital Co Ltd
Original Assignee
YE Digital Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YE Digital Co Ltd filed Critical YE Digital Co Ltd
Priority to JP2019152058A priority Critical patent/JP2021033564A/ja
Publication of JP2021033564A publication Critical patent/JP2021033564A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】機械学習用の画像を収集する手間を大幅に削減すること。【解決手段】実施形態の一態様に係る画像分類方法は、第1学習工程と、第2学習工程と、第1分類工程と、第2分類工程とを含む。第1学習工程は、検査対象画像を複数の分類クラスのいずれかに分類する第1識別器を生成する。第2学習工程は、分類クラスのそれぞれに分類される学習用画像が有する特徴量を獲得する第2識別器を分類クラスごとにそれぞれ生成する。第1分類工程は、第1識別器を用いて、検査対象画像を複数の分類クラスのいずれかに分類する。第2分類工程は、第2識別器に検査対象画像を入力して得られる出力値に基づいて、検査対象画像を分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類する。【選択図】図2

Description

開示の実施形態は、画像分類方法、画像分類装置および画像分類プログラムに関する。
従来、機械学習を利用して、画像解析を行う技術が知られている。たとえば、特許文献1に開示の技術は、分類結果が既知である複数の画像について算出した特徴ベクトルを用いて機械学習を実行し、機械学習で得られた結果に基づいて、分類結果が未知である画像の分類を行うものである。
こうした技術を応用したシステムを、たとえば製品の生産ラインなどに導入することにより、たとえば製造された製品の画像から、かかる製品が正常品であるか否か、また、正常品でなければ何が異常か、を分類することができる。
特開2015−011552号公報
しかしながら、上述した従来技術には、機械学習用の画像を収集する手間を削減するうえで、さらなる改善の余地がある。
具体的には、機械学習に基づく画像解析技術を応用したシステムでは、かかるシステムを運用する中で、画像の分類精度を高めていく場合が多い。画像の分類精度を高めるためには、再学習用の画像を用意する必要がある。再学習用の画像として、かかるシステムより誤って認識された画像が収集され利用される。システム管理者は、システムによる画像の分類結果の全てについて目視確認による評価を行い、再学習画像として採用する画像を選別する。
ところで、たとえば製品の生産ラインなどに導入されるシステムでは、システムにより分類される製品の画像数も膨大となる。このため、再学習画像の収集には、過大な労力と時間が要求される。
実施形態の一態様は、上記に鑑みてなされたものであって、機械学習用の画像を収集する手間を大幅に削減できる画像分類方法、画像分類装置および画像分類プログラムを提供することを目的とする。
実施形態の一態様に係る画像分類方法は、第1学習工程と、第2学習工程と、第1分類工程と、第2分類工程とを含む。第1学習工程は、複数の分類クラスのいずれに対応するかを示す情報が付与された複数の学習用画像を用いた機械学習を実行することにより、検査対象画像を複数の分類クラスのいずれかに分類する第1識別器を生成する。第2学習工程は、複数の分類クラスのそれぞれに分類された複数の学習用画像を用いて分類クラスごとに個別の機械学習を実行することによって、分類クラスのそれぞれに分類される学習用画像が有する特徴量を獲得する第2識別器を分類クラスごとにそれぞれ生成する。第1分類工程は、第1識別器を用いて、検査対象画像を複数の分類クラスのいずれかに分類する。第2分類工程は、第2識別器に検査対象画像を入力して得られる出力値に基づいて、検査対象画像を分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類する。
実施形態の一態様によれば、機械学習用の画像を収集する手間を大幅に削減できる。
図1は、比較例に係る画像分類方法の概要説明図である。 図2は、実施形態に係る画像分類方法の概要説明図(その1)である。 図3は、実施形態に係る画像分類方法の概要説明図(その2)である。 図4は、実施形態に係る画像分類方法の概要説明図(その3)である。 図5は、実施形態に係る第2識別部による分類の概念を示す図である。 図6は、実施形態に係る画像分類装置のブロック図である。 図7は、実施形態に係る第1学習部による学習の概要を示す図である。 図8は、実施形態に係る第2学習部による学習の概要を示す図である。 図9は、実施形態に係る画像分類装置が実行する処理手順を示すフローチャートである。 図10は、実施形態に係る画像分類装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。 図11は、その他の実施形態に係る第2学習部による学習の概要を示す図である。
以下、添付図面を参照して、本願の開示する画像分類方法、画像分類装置および画像分類プログラムの実施形態を詳細に説明する。なお、以下に示す実施形態によりこの発明が限定されるものではない。また、以下の説明において、実質的に同一の機能構成を有する複数の構成を必要に応じて区別する。なお、実質的に同一の機能構成を有する複数の構成要素の各々を特に区別する必要がない場合、例えば、分類クラス20のように、同一符号のみを付して、特に区別することなく説明する。
まず、図1を用いて、比較例に係る画像分類方法の概要を説明する。図1は、比較例に係る画像分類方法の概要説明図である。
図1に示すように、比較例に係る画像分類方法では、識別部144EXが、識別器133EXを用いて、複数の検査対象画像10EXを複数の分類クラス20EX〜20EX(画像を仕分けするカテゴリ)のいずれかに分類することを概要とする。
識別器133EXは、検査対象画像10EXに対応する学習用画像を学習用データセットとし、公知の学習アルゴリズムを用いた機械学習により生成されるモデルである。識別器133EXは、検査対象画像10EXを識別器133EXに入力することにより、識別器133EXが出力する出力値に基づいて、検査対象画像10EXを複数の分類クラス20EX〜20EXのいずれかに分類する。
例えば、画像分類方法を用いたシステムのシステム管理者は、比較例に係る画像分類方法による検査対象画像10EXの分類結果を目視確認することにより、分類結果が誤っている検査対象画像10EXを再学習用の画像として収集する。そして、収集した再学習用の画像を学習用データセットとして、識別器133EXに再学習させることにより、識別器133EXの分類精度の向上が図られる。
ところで、システム管理者は、システム管理者が再学習用の画像を収集する際、識別部144EXによる分類結果を全て確認する必要があるので、過大な労力および膨大な時間を要する。例えば、生産ラインにおける製品の検査において、事実上、再学習用の画像を収集不可能な状況となり得る。一例をあげれば、時間あたり、およそ50万個の製品を生産する生産ラインにおける検査であれば、1日あたり7時間の稼働で30日間に撮像される検査対象画像10EXの枚数は、およそ1億枚となり、膨大な数である。
このような点を鑑み、実施形態に係る画像分類方法では、以下に説明するように、機械学習用の画像を収集する手間を大幅に削減する方法を提案する。図2から図4は、実施形態に係る画像分類方法の概要説明図(その1)、(その2)及び(その3)である。
図2に示すように、実施形態に係る画像分類方法では、第1識別部144が、複数の検査対象画像10を取得し、第1識別器133を用いて、検査対象画像10を複数の分類クラス20のいずれかに分類する(ステップS1)。
そして、実施形態に係る画像分類方法では、第2識別部145が、第2識別器134に検査対象画像10を入力して得られる出力値に基づいて、検査対象画像10を分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類する(ステップS2)。
以下、実施形態に係る画像分類方法を、例えば、製品として歯車を製造する生産ラインに適用する場合を例に挙げて説明を行う。
上記ステップS1において、第1識別部144は、図3に示すように、検査対象画像10を第1識別器133に入力して得られる出力値に基づいて、検査対象画像10を複数の分類クラス20〜20のいずれかに分類する。すなわち、ステップS1によって、製品である歯車の画像を撮像した検査対象画像10が、分類クラス20〜20のいずれかに分類(クラス分類)される。
第1識別器133は、異常がない歯車の画像(不良品ではない歯車の画像)、及び異常がある歯車の画像(不良品である歯車の画像)を複数含む学習用画像を学習用データセットとした機械学習を実行することにより生成される。第1識別器133を生成する機械学習の学習アルゴリズムとして、例えば、「CNN(Convolutional Neural Network)」などを採用できる。例えば、第1識別器133の機械学習に用いる学習用データセットには、分類クラス20のいずれに対応するかを示す情報(例えば、クラスIDなどのタグ)が学習用画像のそれぞれに予めタグ付けされている。第1識別器133は、入力された検査対象画像10が、いずれの分類クラス20に対応する画像であるかを示す出力値を出力できる。
分類クラス20は、例えば、検査対象画像10に撮像される歯車に異常がない場合(不良品ではない場合)に、検査対象画像10が分類されるクラスであり、クラスID:「01」がタグ付けされている。また、分類クラス20〜20(nは4以上の整数)は、検査対象画像10に撮像される歯車に異常がある(不良品である場合)に、検査対象画像10が分類されるクラスである。分類クラス20は、例えば、検査対象画像10に撮像される歯車の歯が欠けている場合に、検査対象画像10が分類されるクラスであり、クラスID:「02」がタグ付けされている。また、分類クラス20は、例えば、検査対象画像10に撮像される歯車にひび割れがある場合に、検査対象画像10が分類されるクラスであり、クラスID:「03」がタグ付けされている。また、分類クラス20は、例えば、検査対象画像10に撮像される歯車に傷がある場合に、検査対象画像10が分類されるクラスであり、クラスID:「nn」がタグ付けされている。
また、上記ステップS2では、図4に示すように、第2識別器134に検査対象画像10を入力して得られる出力値に基づいて、検査対象画像10を分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類する。ここで、分類ミスとは、検査対象画像10が、対応する分類クラス20に正しく分類されないことを意味している。
第2識別器134〜134は、第1識別器133によって分類クラス20〜20のそれぞれに分類された学習用画像を学習用データセットとして、分類クラス20〜20ごとに個別の機械学習を実行することにより生成される。第2識別器134を生成する機械学習の学習アルゴリズムとして、VAE(Variational Auto Encoder)を用いることができる。第2識別器134〜134は、分類クラス20〜20のそれぞれに分類された学習用画像が有する特徴量を獲得するモデルである。すなわち、第2識別器134〜134は、それぞれに対応する分類クラス20〜20に分類されてくる学習用画像が共通して備える特徴量を獲得できる。
第2識別部145は、第2識別器134に検査対象画像10を入力することにより得られる出力値に基づいて、検査対象画像10を分類ミスの可能性が高い画像、又は分類ミスの可能性が低い画像のいずれかに分類する。図5は、実施形態に係る第2識別部による分類の概念を示す図である。
図5に示すように、第2識別部145は、第2識別器134に検査対象画像10を入力することにより出力値として得られる検査対象画像10に対応する特徴量の確率分布134PDに基づいて、検査対象画像10を分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類する。具体的には、第2識別部145は、確率分布134PDの密度が薄い範囲PS1に含まれる各特徴量に対応する検査対象画像10を分類ミスの可能性が高い画像、すなわち分類クラス20に正しく分類されない可能性の高い画像に分類する。一方、第2識別部145は、確率分布134PDの密度が濃い範囲PS2に含まれる各特徴量に対応する検査対象画像10を分類ミスの可能性が低い画像、すなわち分類クラス20に正しく分類されない可能性の低い画像に分類する。
すなわち、ステップS2では、ステップS1で分類クラス20〜20のいずれかに分類された検査対象画像10が、分類ミスの可能性が高い画像、又は分類ミスの可能性が低い画像にさらに細かく分類される。
このように、実施形態に係る画像分類方法は、分類クラス20〜20のいずれかに分類された検査対象画像10を、分類ミスの可能性が高い画像、又は分類ミスの可能性が低い画像にさらに細かく分類する。このため、システム管理者は、例えば、分類ミスの可能性が高い画像として分類された画像についてのみ目視確認を行い、分類結果の評価を行って、再学習画像として採用する画像を収集できる。このようにして、実施形態に係る画像分類方法は、機械学習用の画像を収集する手間を大幅に削減できる。
以下、上記画像分類方法を適用した画像分類装置100の構成について、具体的に説明する。
図6は、実施形態に係る画像分類装置100のブロック図である。なお、図6では、実施形態に係る画像分類装置100の特徴を説明するために必要な構成要素を機能ブロックで表しており、一般的なその他の構成要素についての記載を省略している。
図2に示す画像分類装置100の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。例えば、各機能ブロックの分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することが可能である。
また、図6を用いた説明では、これまでに既に述べた構成要素については、説明を簡略化するか、省略する場合がある。
図6に示すように、画像分類装置100は、入力部110と、出力部120と、記憶部130と、制御部140とを備える。
入力部110は、操作部111を備える。操作部111は、キーボードやマウス、タッチパネルといった入力装置で実装され、各種入力を受け付ける。
出力部120は、表示部121を備える。表示部121は、液晶ディスプレイや有機EL(Electro Luminescence)ディスプレイなどを備えた表示装置により実装され、各種情報を表示する。
記憶部130は、画像分類装置100の各種処理の実現に必要となるプログラム及びデータを記憶する。記憶部130は、ハードディスクドライブや不揮発性メモリ、レジスタといった記憶装置により実装される。図6に示すように、記憶部130は、第1学習用データセット131と、第2学習用データセット132と、第1識別器133と、第2識別器134とを含む。
第1学習用データセット131は、第1識別器133を生成する機械学習に用いる複数の学習用画像で構成される。
第2学習用データセット132は、第2識別器134を生成する機械学習に用いる複数の学習用画像で構成される。
第1識別器133は、後述する第1学習部142により生成される。第2識別器134は、後述する第2学習部143により生成される。
制御部140は、画像分類装置100の各部を制御する。制御部140は、CPU(Central Processing Unit)などのプロセッサを備え、画像分類装置100内の各種メモリを記憶領域として利用し、処理手順などを規定したプログラム及び所要データを用いて、種々の処理を実行する。図6に示すように、制御部140は、取得部141と、第1学習部142と、第2学習部143と、第1識別部144と、第2識別部145〜145とを備え、かかる各部により画像分類装置100の各種処理を実行する。
取得部141は、学習用画像を取得する。学習用画像は、例えば、画像分類装置100のシステム管理者が操作部111を操作することにより、画像分類装置100に取り込まれる。取得部141は、第1識別器133の生成に用いる学習用画像を取得すると、第1学習用データセット131に格納する。取得部141は、第2識別器134の生成に用いる学習用画像を取得すると、第2学習用データセット132に格納する。
第1学習部142は、第1学習用データセット131を取得し、これを用いた機械学習を実行して、第1識別器133を生成する。第1学習部142は、機械学習の学習アルゴリズムとして、「CNN」を用いることができる。図7は、実施形態に係る第1学習部による学習の概要を示す図である。
図7に示す第1学習用データセット131には、分類クラス20のいずれに対応するかを示すタグ131L(例えばクラスIDなどのタグ)が複数の学習用画像のそれぞれに予めタグ付けされている。また、図7に示すモデル生成器200は、「CNN」による学習アルゴリズムに従って機械学習を実行可能に設計されている。
第1学習部142によって第1学習用データセット131がモデル生成器200に入力されると、モデル生成器200は、第1学習用データセット131を用いて、「CNN」による学習アルゴリズムに従った機械学習を実行し、第1識別器133を生成する。第1学習部142は、モデル生成器200により生成された第1識別器133を記憶部130に格納する。
第2学習部143は、第2学習用データセット132を取得し、これを用いた機械学習を実行して、第2識別器134を生成する。第2学習部143は、機械学習の学習アルゴリズムとして、「VAE」を用いることができる。図8は、実施形態に係る第2学習部による学習の概要を示す図である。
図8に示す第2学習用データセット132に格納されるクラス別学習用画像は、複数の分類クラス20のいずれかに予め仕分けされている。なお、それぞれの分類クラス20に仕分けされたクラス別学習用画像には、クラスを示す情報(例えばクラスIDなどのタグ)はタグ付けされていない。また、図8に示すモデル生成器200は、「VAE」に従って機械学習を実行可能に設計されている。「VAE」は、いわゆる教師データなしで機械学習を実行できる。このため、第2学習用データセット132を準備する際に、分類クラス20に対応する情報(例えばクラスIDなどのタグ)をタグ付けする手間が削減される。
第2学習部143は、第2学習用データセット132に含まれる学習用画像を分類クラス20ごとに個別にモデル生成器200に入力する。モデル生成器200は、分類クラス20ごとに仕分けされた複数の学習用画像が入力されると、かかる複数の学習用画像を用いて、「VAE」による学習アルゴリズムに従った機械学習を実行し、第2識別器134を生成する。第2学習部143は、モデル生成器200により生成された第2識別器134を記憶部130に格納する。同様にして、第2学習部143は、モデル生成器200により生成された第2識別器134〜第2識別器134を記憶部130にそれぞれ格納する。
第1識別部144は、上記図3に示すように、入力された検査対象画像10を第1識別器133に入力して得られる出力値に基づいて、検査対象画像10を複数の分類クラス20〜20のいずれかに分類する。第1識別器133は、検査対象画像10が入力されると、入力された検査対象画像10が、いずれの分類クラス20に対応する画像であるかを示す値を出力できる。第1識別部144は、かかる値に基づいて、入力された検査対象画像10を、いずれかの分類クラス20に分類する。
第2識別部145は、上記図4及び図5に示すように、第2識別器134に検査対象画像10を入力することにより得られる確率分布134PDに基づいて、検査対象画像10を分類ミスの可能性が高い画像、又は分類ミスの可能性が低い画像のいずれかに分類する。第2識別部145は、確率分布134PDの密度が薄い範囲PS1に含まれる各特徴量に対応する検査対象画像10を分類ミスの可能性が高い画像、すなわち分類クラス20に正しく分類されない可能性の高い画像に分類する。一方、第2識別部145は、確率分布134PDの密度が濃い範囲PS2に含まれる各特徴量に対応する検査対象画像10を分類ミスの可能性が低い画像、すなわち分類クラス20に正しく分類されない可能性の低い画像に分類する。第2識別器134は、入力した検査対象画像10の特徴量を次元圧縮した潜在変数に変換し、変換した潜在変数の確率分布を出力できる。第2識別器134により出力される確率分布において、共通した特徴量を有する検査対象画像10は局所的に固まって表現される。第1識別部144によって分類クラス20に分類される検査対象画像10は、おおよそ共通した特徴を備えていることが想定される。そこで、第2識別部145は、例えば、第2識別器134から出力される確率分布の密度が薄い範囲に含まれる各特徴量に対応する検査対象画像10を、分類クラス20に合致しない特徴を備えた分類ミスの可能性が高い画像として分類する。
次に、図9を用いて、画像分類装置100が実行する処理手順の一例を説明する。図9は、実施形態に係る画像分類装置100が実行する処理手順を示すフローチャートである。図9に示す処理手順は、制御部140の各部により実行される。
図9に示すように、第1学習部142は、第1学習工程を実行する(ステップS101)。第1学習工程は、上述のとおり、第1学習用データセット131を取得し、これを用いた機械学習を実行して、第1識別器133を生成する工程である。
続いて、第2学習部143は、第2学習工程を実行する(ステップS102)。第2学習工程は、上述のとおり、第2学習用データセット132を取得し、これを用いた機械学習を実行して、第2識別器134を生成する工程である。
続いて、第1識別部144は、第1分類工程を実行する(ステップS103)。第1分類工程は、上述のとおり、入力された検査対象画像10を第1識別器133に入力して得られる出力値に基づいて、検査対象画像10を複数の分類クラス20〜20のいずれかに分類する工程である。
続いて、第2識別部145は、第2分類工程を実行し(ステップS104)、図9に示す処理を終了する。第2分類工程は、上述のとおり、第2識別器134に検査対象画像10を入力することにより得られる確率分布134PDに基づいて、検査対象画像10を分類ミスの可能性が高い画像、又は分類ミスの可能性が低い画像のいずれかに分類する工程である。
第1学習工程(ステップS101)及び第2学習工程(ステップS102)は、所定の学習期間に該当する場合に実行されてもよい。所定の学習期間は、画像分類装置100の運用初回や、運用前に予め第1識別器133および第2識別器134を作成しておく場合の所定期間である場合に相当する。所定の学習期間に該当しない場合、図9に示す処理手順は、第1分類工程(ステップS103)から実行できる。
なお、上述してきた画像分類装置100は、たとえば図10に示すような構成のコンピュータ300によって実現される。図10は、画像分類装置100の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ300は、CPU(Central Processing Unit)301、RAM(Random Access Memory)302、ROM(Read Only Memory)303、HDD(Hard Disk Drive)304、通信インタフェース(I/F)305、入出力インタフェース(I/F)306、およびメディアインタフェース(I/F)307を備える。
CPU301は、ROM303またはHDD304に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM303は、コンピュータ300の起動時にCPU301によって実行されるブートプログラムや、コンピュータ300のハードウェアに依存するプログラム等を格納する。
HDD304は、CPU301によって実行されるプログラムおよび当該プログラムによって使用されるデータ等を格納する。通信インタフェース305は、通信ネットワークを介して他の機器からデータを受信してCPU301へ送り、CPU301が生成したデータを、通信ネットワークを介して他の機器へ送信する。
CPU301は、入出力インタフェース306を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU301は、入出力インタフェース306を介して、入力装置からデータを取得する。また、CPU301は、生成したデータを、入出力インタフェース306を介して出力装置へ出力する。
メディアインタフェース307は、記録媒体308に格納されたプログラムまたはデータを読み取り、RAM302を介してCPU301に提供する。CPU301は、当該プログラムを、メディアインタフェース307を介して記録媒体308からRAM302上にロードし、ロードしたプログラムを実行する。記録媒体308は、たとえばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
たとえば、コンピュータ300が実施形態に係る画像分類装置100として機能する場合、コンピュータ300のCPU301は、RAM302上にロードされたプログラムを実行することにより、制御部140が有する各部の機能を実現する。また、HDD304には、記憶部130内のデータが記憶される。コンピュータ300のCPU301は、これらのプログラムを、記録媒体308から読み取って実行するが、他の例として、他の装置から、通信ネットワークを介してこれらのプログラムを取得してもよい。
上述してきたように、実施形態に係る画像分類方法は、第1学習工程と、第2学習工程と、第1分類工程と、第2分類工程とを含む。
第1学習工程は、複数の分類クラス20のいずれに対応するかを示す情報が付与された複数の学習用画像を用いた機械学習を実行することにより、検査対象画像10を複数の分類クラス20のいずれかに分類する第1識別器133を生成する。第2学習工程は、複数の分類クラス20のそれぞれに分類された複数の学習用画像を用いて分類クラス20ごとに個別の機械学習を実行することによって、分類クラス20のそれぞれに分類される学習用画像が有する特徴量を獲得する第2識別器134を分類クラス20ごとにそれぞれ生成する。
第1分類工程は、第1識別器133を用いて、検査対象画像10を複数の分類クラス20のいずれかに分類する。第2分類工程は、第2識別器134に検査対象画像10を入力して得られる出力値に基づいて、検査対象画像10を分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類する。
このように、実施形態に係る画像分類方法は、第1分類工程によって分類クラス20のいずれかに分類された検査対象画像10を、分類ミスの可能性が高い画像、又は分類ミスの可能性が低い画像にさらに細かく分類する。このため、システム管理者は、例えば、分類ミスの可能性が高い画像として分類された画像についてのみ目視確認を行い、分類結果の評価を行って、再学習画像として採用する画像を収集できる。このようにして、実施形態に係る画像分類方法は、機械学習用の画像を収集する手間を大幅に削減できる。
〔その他の実施形態〕
上述した実施形態では、分類クラス20のそれぞれに対応する第2識別器134を生成する例を説明したが、全ての分類クラス20に共通の第2識別器134を1つ生成してもよい。図11は、その他の実施形態に係る第2学習部による学習の概要を示す図である。
図11に示す第2学習用データセット132には、複数の分類クラス20のいずれかに予め仕分けされているクラス別学習用画像に、それぞれの分類クラス20を示す情報132Lが付与されている。分類クラス20を示す情報132Lとして、クラスIDなどのタグを用いることができる。また、第1識別器133が生成済みである場合、第1識別器133により分類された学習用画像を、そのまま第2学習用データセット132として用いることにより、第2学習用データセット132の学習用画像にタグ付けする手間を削減できる。
そして、第2学習部143は、予めクラスを示す情報がラベリングされた学習用画像で構成される第2学習用データセット132をモデル生成器200に入力する。モデル生成器200は、分類クラス20に仕分けされた複数の学習用画像が入力されると、かかる複数の学習用画像を用いて、CVAE(Conditional Variational Auto Encoder)による学習アルゴリズムに従った機械学習を実行し、全ての分類クラス20に共通の第2識別器134Mを生成する。「CVAE」は、「VAE」に対して、正解ラベル(例えばクラスを示す情報)を付与して学習するアルゴリズムである。第2識別器134Mは、第1識別部144により分類クラス20ごとに分類された各検査対象画像10を一度に入力し、それぞれの分類クラス20ごとの出力値を一度に出力できる。
このように、全ての分類クラス20に共通の第2識別器134Mを1つ生成することにより、分類クラス20のそれぞれに対応する第2識別器134を生成する手間を削減できる。なお、全ての分類クラス20に共通の第2識別器134Mを1つ生成する例には特に限定される必要はなく、いくつかの分類クラス20に共通の第2識別器134をそれぞれ生成してもよい。
また、上述した実施形態では、第1識別器133を生成するための機械学習のアルゴリズムとしてディープラーニングの一種である「CNN」を用いるものとしたが、アルゴリズムを限定するものではない。SVM(Support Vector Machine)のようなパターン識別器を用いたサポートベクタ回帰等の回帰分析手法により機械学習を実行し、第1識別器133を生成してもよい。また、パターン識別器は、SVMに限らず、アダブースト(AdaBoost)、ランダムフォレストなどの公知のアルゴリズムの中から任意のアルゴリズムを用いてもよい。
また、上述した実施形態では、第2学習部143は、第2識別器134を生成するための機械学習のアルゴリズムとして「VAE」の代わりに、GAN(Generative Adversarial Network:敵対的生成ネットワーク)などを用いてもよい。
さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲およびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。
100 画像分類装置
110 入力部
120 出力部
130 記憶部
131 第1学習用データセット
132 第2学習用データセット
133 第1識別器
134 第2識別器
140 制御部
141 取得部
142 第1学習部
143 第2学習部
144 第1識別部
145 第2識別部

Claims (5)

  1. 複数の分類クラスのいずれに対応するかを示す情報が付与された複数の学習用画像を用いた機械学習を実行することにより、検査対象画像を前記複数の分類クラスのいずれかに分類する第1識別器を生成する第1学習工程と、
    複数の分類クラスのそれぞれに分類された複数の学習用画像を用いて前記分類クラスごとに個別の機械学習を実行することによって、前記分類クラスのそれぞれに分類される前記学習用画像が有する特徴量を獲得する第2識別器を前記分類クラスごとにそれぞれ生成する第2学習工程と、
    前記第1識別器を用いて、前記検査対象画像を前記複数の分類クラスのいずれかに分類する第1分類工程と、
    前記第2識別器に前記検査対象画像を入力して得られる出力値に基づいて、前記検査対象画像を分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類する第2分類工程と
    を含むことを特徴とする画像分類方法。
  2. 前記第2分類工程は、
    前記出力値として得られる前記検査対象画像に対応する特徴量の確率分布に基づいて、前記検査対象画像を前記分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類することを特徴とする
    請求項1に記載の画像分類方法。
  3. 前記第2学習工程は、
    前記分類クラスを示す情報が付与された複数の学習用画像を用いた機械学習を実行することにより、前記複数の分類クラスに共通の第2識別器を生成する
    ことを特徴とする請求項2に記載の画像分類方法。
  4. 複数の分類クラスのいずれに対応するかを示す情報が付与された複数の学習用画像を用いた機械学習を実行することにより、検査対象画像を前記複数の分類クラスのいずれかに分類する第1識別器を生成する第1学習部と、
    複数の分類クラスのそれぞれに分類された複数の学習用画像を用いて前記分類クラスごとに個別の機械学習を実行することによって、前記分類クラスのそれぞれに分類される前記学習用画像が有する特徴量を獲得する第2識別器を前記分類クラスごとにそれぞれ生成する第2学習部と、
    前記第1識別器を用いて、前記検査対象画像を前記複数の分類クラスのいずれかに分類する第1識別部と、
    前記第2識別器に前記検査対象画像を入力して得られる出力値に基づいて、前記検査対象画像を分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類する第2識別部と
    を備えることを特徴とする画像分類装置。
  5. コンピュータに備えられたプロセッサが、
    複数の分類クラスのいずれに対応するかを示す情報が付与された複数の学習用画像を用いた機械学習を実行することにより、検査対象画像を前記複数の分類クラスのいずれかに分類する第1識別器を生成する第1学習手順と、
    複数の分類クラスのそれぞれに分類された複数の学習用画像を用いて前記分類クラスごとに個別の機械学習を実行することによって、前記分類クラスのそれぞれに分類される前記学習用画像が有する特徴量を獲得する第2識別器を前記分類クラスごとにそれぞれ生成する第2学習手順と、
    前記第1識別器を用いて、前記検査対象画像を前記複数の分類クラスのいずれかに分類する第1分類手順と、
    前記第2識別器に前記検査対象画像を入力して得られる出力値に基づいて、前記検査対象画像を分類ミスの可能性が高い画像又は分類ミスの可能性が低い画像のいずれかに分類する第2分類手順と
    を実行することを特徴とする画像分類プログラム。
JP2019152058A 2019-08-22 2019-08-22 画像分類方法、画像分類装置および画像分類プログラム Pending JP2021033564A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019152058A JP2021033564A (ja) 2019-08-22 2019-08-22 画像分類方法、画像分類装置および画像分類プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019152058A JP2021033564A (ja) 2019-08-22 2019-08-22 画像分類方法、画像分類装置および画像分類プログラム

Publications (1)

Publication Number Publication Date
JP2021033564A true JP2021033564A (ja) 2021-03-01

Family

ID=74676547

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019152058A Pending JP2021033564A (ja) 2019-08-22 2019-08-22 画像分類方法、画像分類装置および画像分類プログラム

Country Status (1)

Country Link
JP (1) JP2021033564A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022190636A1 (ja) * 2021-03-12 2022-09-15 オムロン株式会社 支援装置および方法
WO2022254858A1 (ja) * 2021-06-03 2022-12-08 コニカミノルタ株式会社 検査装置、検査方法、および検査プログラム
WO2023095416A1 (ja) * 2021-11-25 2023-06-01 株式会社ジャパンディスプレイ 表示装置の検査方法及び情報処理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022190636A1 (ja) * 2021-03-12 2022-09-15 オムロン株式会社 支援装置および方法
TWI823261B (zh) * 2021-03-12 2023-11-21 日商歐姆龍股份有限公司 支援裝置以及支援方法
WO2022254858A1 (ja) * 2021-06-03 2022-12-08 コニカミノルタ株式会社 検査装置、検査方法、および検査プログラム
WO2023095416A1 (ja) * 2021-11-25 2023-06-01 株式会社ジャパンディスプレイ 表示装置の検査方法及び情報処理装置

Similar Documents

Publication Publication Date Title
US20210034980A1 (en) Real-time visualization of machine learning models
JP2021033564A (ja) 画像分類方法、画像分類装置および画像分類プログラム
Alawieh et al. Wafer map defect patterns classification using deep selective learning
CN112598017A (zh) 用于对产品进行分类的系统和方法
JP6113024B2 (ja) 分類器取得方法、欠陥分類方法、欠陥分類装置およびプログラム
JP2015087903A (ja) 情報処理装置及び情報処理方法
US20200202508A1 (en) Image-based maintenance prediction and detection of operating errors
JP2007327937A (ja) 検査装置、検査方法、検査プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体
JP2023518568A (ja) 画像分類のための適応学習
JP7106391B2 (ja) 画像判定方法、画像判定装置および画像判定プログラム
US11334774B2 (en) Image labeling apparatus, method, and non-transitory computer readable storage medium thereof
CN111507362B (zh) 神经网络的训练方法、基于神经网络的分类方法及其装置
JP2020198092A (ja) 教師なし異常検出及び高次元センサデータの多数決投票による原因説明のための方法及びシステム
JP2017102865A (ja) 情報処理装置、情報処理方法及びプログラム
JP2022512292A (ja) 半導体試料の欠陥の分類
CN114631115A (zh) 使用深度学习的新产品的质量检查方法及系统
JP2014137284A (ja) 教師データ作成支援装置、教師データ作成装置、画像分類装置、教師データ作成支援方法、教師データ作成方法および画像分類方法
JP7422548B2 (ja) ラベルノイズ検出プログラム、ラベルノイズ検出方法及びラベルノイズ検出装置
CN114254146A (zh) 图像数据的分类方法、装置和系统
JP2017107313A (ja) 教師データ作成支援方法、画像分類方法、教師データ作成支援装置および画像分類装置
de Giorgio et al. Systematic review of class imbalance problems in manufacturing
US11151710B1 (en) Automatic selection of algorithmic modules for examination of a specimen
Liu et al. Knowledge transfer in board-level functional fault identification using domain adaptation
Kumar et al. Fault detection on the 3-D printed objective surface by using the SVM algorithm
US20230297886A1 (en) Cluster targeting for use in machine learning