WO2023084900A1

WO2023084900A1 - 学習方法、学習装置、学習プログラム、及び画像処理装置

Info

Publication number: WO2023084900A1
Application number: PCT/JP2022/034032
Authority: WO
Inventors: 遼池田
Original assignee: 富士フイルム株式会社
Priority date: 2021-11-10
Filing date: 2022-09-12
Publication date: 2023-05-19
Also published as: EP4432218A1; US20240273704A1; JPWO2023084900A1; CN118284904A

Abstract

本発明の一態様は、学習方法、学習装置、学習プログラム、及び画像処理装置を提供する。本発明の一態様に係る学習方法は、プロセッサを備える学習装置により実行される学習方法であって、プロセッサは、パッチ画像と、パッチ画像の単位領域に対するクラスラベルの正解データと、のペアからなる学習データを取得するデータ取得工程と、学習モデル及び学習データを用いてパッチ画像のセグメンテーションを行い、学習モデルが第２の単位領域を正しく検出したか否かをパッチ画像ごとに判定する判定工程と、判定の結果に基づいて、学習における第１の重みを設定する重み付け工程と、重み付けした結果に基づいて学習モデルを更新する更新工程と、を実行する。

Description

学習方法、学習装置、学習プログラム、及び画像処理装置

　本発明は、画像の学習を行う学習方法、学習装置、及び学習プログラム、並びに当該学習により構築された学習済みモデルを用いる画像処理装置に関する。

　画像の学習を行う技術に関し、例えば、特許文献１，２には、クロスエントロピー損失に基づく学習を行うことが記載されている。

特開２０２０－０６１０６６号公報特開２０２０－０９１５４３号公報

　本発明の一つの態様は、検出率が良好な学習モデルを得られる学習方法、学習装置、及び学習プログラム、並びに学習済みモデルにより良好な精度で被写体のきず及び／または欠陥を検出することができる画像処理装置を提供する。

　上述した目的を達成するため、本発明の第１の態様に係る学習方法は、プロセッサを備える学習装置により実行される学習方法であって、プロセッサは、パッチ画像と、パッチ画像の単位領域に対するクラスラベルの正解データと、のペアからなる学習データを取得するデータ取得工程と、学習モデル及び学習データを用いてパッチ画像のセグメンテーションを行い、学習モデルが第２の単位領域を正しく検出したか否かをパッチ画像ごとに判定する判定工程と、判定の結果に基づいて第１の重みを設定する重み付け工程と、重み付けした結果に基づいて学習モデルを更新する更新工程と、を実行する。

　第２の態様に係る学習方法は第１の態様において、プロセッサは、重み付け工程において、個々のパッチ画像についての損失である第１の損失に対して、パッチ画像単位で第１の重みを設定する。

　第３の態様に係る学習方法は第１または第２の態様において、プロセッサは、重み付け工程において、第２の単位領域が正しく検出されていないと判定した場合は、第２の単位領域が正しく検出されていると判定した場合よりも大きな重みを第１の重みとして設定する。

　第４の態様に係る学習方法は第１から第３の態様のいずれか１つにおいて、学習モデルは、判定工程において、特定のクラスに属する第２の単位領域を検出する。

　第５の態様に係る学習方法は第４の態様において、プロセッサは、判定工程において、学習モデルが特定のクラスに属する第２の単位領域を誤って検出した第１の場合、及び学習モデルが特定のクラスに属する第２の単位領域を検出できなかった第２の場合は、第２の単位領域が正しく検出されていないと判定する。

　第６の態様に係る学習方法は第５の態様において、プロセッサは、重み付け工程において、第２の場合は第１の場合よりも大きな重みを設定する。

　第７の態様に係る学習方法は第５または第６の態様において、プロセッサは、判定工程において、検出の結果が第１の場合ではなく第２の場合でもない第３の場合は、検出の結果が正しいと判定する。

　第８の態様に係る学習方法は第４から第７の態様のいずれか１つにおいて、プロセッサは、判定工程において、被写体のきず及び欠陥について判定を行う。

　第９の態様に係る学習方法は第４から第８の態様のいずれか１つにおいて、学習モデルは、検出の確からしさを出力し、プロセッサは、判定工程において、確からしさが閾値以上であるか否かに基づいて、第２の単位領域が特定のクラスに属すると判定する。

　第１０の態様に係る学習方法は第９の態様において、プロセッサは、学習の過程で閾値を変化させる。

　第１１の態様に係る学習方法は第１から第１０の態様のいずれか１つにおいて、プロセッサは、重み付け工程において、パッチ画像のクロスエントロピー損失に対して重み付けを行う。

　第１２の態様に係る学習方法は第１から第１１の態様のいずれか１つにおいて、プロセッサは、パッチ画像で構成されるバッチに対する損失関数を導出する損失関数導出工程をさらに実行し、更新工程では損失関数を用いて学習モデルを更新する。

　第１３の態様に係る学習方法は第１２の態様において、プロセッサは、損失関数導出工程において、重み付けを行った結果をパッチ画像で構成されるバッチ全体で平均した第１の損失関数を損失関数として導出する。

　第１４の態様に係る学習方法は第１３の態様において、プロセッサは、損失関数導出工程において、第１の損失関数と、バッチに対する損失関数であって第１の損失関数とは異なる損失関数である第２の損失関数と、を組み合わせた関数を損失関数として用いる。

　第１５の態様に係る学習方法は第１から第１４の態様のいずれか１つにおいて、プロセッサは、更新工程において、学習モデルのパラメータを更新して損失関数を最小化する。

　第１６の態様に係る学習方法は第１から第１５の態様のいずれか１つにおいて、プロセッサは、データ取得工程において、画像を入力し、入力した画像を分割した画像をパッチ画像として取得する。

　第１７の態様に係る学習方法は第１から第１６の態様のいずれか１つにおいて、プロセッサは、データ取得工程において、検出しようとする被写体のきず及び／または欠陥のサイズに応じたサイズのパッチ画像を取得する。

　第１８の態様に係る学習方法は第１から第１７の態様のいずれか１つにおいて、学習モデルは、セグメンテーションを行うニューラルネットワークを備える。

　上述した目的を達成するため、第１９の態様に係る学習装置は、プロセッサを備える学習装置であって、プロセッサは、パッチ画像と、パッチ画像の単位領域に対するクラスラベルの正解データと、のペアからなる学習データを取得するデータ取得処理と、学習モデル及び学習データを用いてパッチ画像のセグメンテーションを行い、学習モデルが第２の単位領域を正しく検出したか否かをパッチ画像ごとに判定する判定処理と、判定の結果に基づいて第１の重みを設定する重み付け工程と、重み付けした結果に基づいて学習モデルを更新する更新処理と、を実行する。第１９の態様に係る学習装置は、第２～第１８の態様と同様の処理を実行する構成を備えていてもよい。

　上述した目的を達成するため、本発明の第２０の態様に係る学習プログラムは、プロセッサを備える学習装置に学習方法を実行させる学習プログラムであって、学習方法において、プロセッサは、パッチ画像と、パッチ画像の単位領域に対するクラスラベルの正解データと、のペアからなる学習データを取得するデータ取得工程と、学習モデル及び学習データを用いてパッチ画像のセグメンテーションを行い、学習モデルが第２の単位領域を正しく検出したか否かをパッチ画像ごとに判定する判定工程と、判定の結果に基づいて第１の重みを設定する重み付け工程と、重み付けした結果に基づいて学習モデルを更新する更新工程と、を実行させる。第２０の態様に係る学習プログラムは、第２～第１８の態様と同様の処理を実行する構成を備えていてもよい。また、これら態様の学習プログラムのコンピュータ読み取り可能なコードを記録した非一時的記録媒体も、本発明の範囲に含まれる。

　上述した目的を達成するため、本発明の第２１の態様に係る画像処理装置は、第１から第１８の態様のいずれか１つに係る学習方法で学習した学習済みモデルを備え、入力した画像から、学習済みモデルを用いて被写体のきず及び／または欠陥を検出する。

図１は、学習装置の概略構成を示す図である。図２は、処理部の概略構成を示す図である。図３は、畳み込みニューラルネットワークによる処理の様子を示す図である。図４は、畳み込みニューラルネットワークによる処理の様子を示す他の図である。図５は、学習方法の処理の概要を示すフローチャートである。図６は、学習方法の処理の詳細を示すフローチャートである。図７は、重み付けによる学習への影響を示す図である。図８は、パッチ画像取得の処理を示すフローチャートである。図９は、重み付け処理のバリエーションを示すフローチャートである。図１０は、巨大な欠陥の一部が未検出となる様子を示す図である。図１１は、微小な欠陥の全体が未検出となる様子を示す図である。

［セグメンテーションの学習における検出率］
　従来の手法によるセグメンテーション（クラス分類）の一例として、被写体の欠陥を検出する場合について説明する。

　機械学習におけるセグメンテーション（semantic segmentation）では、一般にクロスエントロピー損失（cross-entropy loss）が用いられる。クラス分類を行う対象である画像の１ピクセル（画素）ごとに、正解ラベル（p＝０or１）と、学習モデルの予測値（０≦q≦１）の差分に由来するペナルティ（＝損失）を与え、損失によって学習モデルを更新する。たとえば欠陥検出タスクの場合、p＝１が「欠陥」、p＝０が「非欠陥」と対応づけることができる。なお、以下の説明において、クロスエントロピー損失を「ＣＥ損失」と記載する場合がある。

　セグメンテーションタスクとして分類するべき同一クラスの中に、微小な検出対象と巨大な検出対象が同時に存在する場合がある。即ち、欠陥検出の場合、微小な欠陥と巨大な欠陥が併存する場合がある。しかし、一般的なＣＥ損失では、各ピクセルに対して予測を行い、それらが等価に扱われるため、巨大な欠陥は学習頻度が高い一方で、微小な欠陥ほど、学習されにくくなってしまう。

　ＣＥ損失は、｛欠陥，非欠陥｝の２値分類を画素ごとに行う場合の正解ラベルをp∈｛０，１｝、欠陥確率を表す出力値をq∈［０，１］とするとき、下記の式（１）、（２）で表される。

　式（１）は、各画素で定義される。ＣＥ損失はモデルの重みを更新する単位であるバッチ数がＢであるときの、各入力パッチ画像Ｉｉ（１≦ｉ≦Ｂ）を構成する画素の座標（ｘ，ｙ）に依存するが、添え字を略記している。式（２）は、これらに対する平均（のべ画素数Ｎ：＝Ｂ×Ｈ×Ｗ、Ｈ，Ｗは入力パッチ画像のサイズ）をとることを意味しており、画像中の画素が等価に学習される。

　例えば、図１０に示すように（i）巨大欠陥９００（同図の（ａ）部分参照）のうちの数画素分が未検出の箇所（同図の（ｂ）部分における領域９０２）と、図１１に示すような（ii）数画素からなる微小欠陥９１０（同図の（ａ）部分参照）の全体が未検出の箇所（同図の（ｂ）部分における領域９１２）があり，未検出である画素数が（i）の領域９０２と（ii）の領域９１２で同等であるとすれば、損失関数への寄与も同程度となる。しかし、検出率の評価観点でとらえると、（i）のように検出には成功している欠陥（巨大欠陥９００）に対してより詳細な形状を再現することよりも、（ii）のように全く検出できていない欠陥（微小欠陥９１０）を検出することの方が優先されることが好ましい。

　このように、大小の検出対象が混在するタスクであって、微小であっても見落としを防ぎ、個数ベースの検出率を向上させることが重要である場合に、上述のような従来の損失関数でそれらを考慮することはできないため、より直接的に、検出率を向上させるための損失を設定することが好ましい。

　本願発明者は、斯かる事情の下で鋭意検討を進め、検出率が良好な学習モデルを得られる学習方法、学習装置、及び学習プログラム、並びに被写体のきず及び／または欠陥の検出率が良好な画像処理装置の着想を得た。以下、斯かる着想に基づく本発明の実施形態を説明する。説明においては、必要に応じて添付図面が参照される。なお、添付図面において、説明の便宜上一部の構成要素の記載を省略する場合がある。

　［学習装置の構成］
　図１は本発明の一実施形態に係る学習装置（画像処理装置）の概略構成を示す図である。図１に示すように、第１の実施形態に係る学習装置１０（学習装置、画像処理装置）は、処理部１００（プロセッサ、コンピュータ）と、記憶部２００と、表示部３００と、操作部４００と、を備え、これらの構成要素が互いに接続されて必要な情報が送受信される。これらの構成要素については各種の設置形態を採用することができ、各構成要素が１箇所（１筐体内、１室内等）に設置されていてもよいし、離れた場所に設置されネットワークを介して接続されていてもよい。また、学習装置１０は、インターネット等のネットワークＮＷを介して外部サーバ５００及び／または外部データベース５１０に接続し、必要に応じて処理に用いるサンプルや学習データを取得することができ、また処理結果等を外部サーバ５００及び／または外部データベース５１０に格納することができる。

　［処理部の構成］
　図２に示すように、処理部１００は、プロセッサ１０２（プロセッサ、コンピュータ）、ＲＯＭ１３０（ＲＯＭ：Read Only Memory）、ＲＡＭ１５０（ＲＡＭ：Random Access Memory）を備える。プロセッサ１０２は処理部１００の各部が行う処理の統括制御を行うもので、データ取得部１０４、検出器１０６、判定部１０８、重み付け部１１０、更新部１１２、表示制御部１１４、記録制御部１１６、及び通信制御部１１８の機能を有する。データ取得部１０４はネットワークＮＷを介して、あるいは記憶部２００等の記録媒体から入力を行うことができ、表示制御部１１４、記録制御部１１６は、それぞれモニタ３１０への表示、及び記憶部２００への出力を行うことができる。これらの処理は、必要に応じ通信制御部１１８を介して行われる。

　［検出器の構成］
　検出器１０６（プロセッサ）は学習モデルを備え、この学習モデルは、セグメンテーションを行うニューラルネットワークを備える。ニューラルネットワークとしては、例えばＣＮＮ（Convolutional Neural Network）、ＲＮＮ（Recurrent Neural Network）、ＳＶＭ（Support Vector Machine）を用いることができる。後述するように、本発明の一態様である学習方法により、学習モデルのパラメータが更新されていく。なお、学習終了後の検出器１０６（学習済みモデル）は、被写体の画像からきず及び／または欠陥を検出するのに用いることができる。即ち、学習終了後の学習装置１０は本発明の一態様に係る画像処理装置として動作する（後述）。

　［ＣＮＮの層構成の例］
　検出器１０６においてＣＮＮ（学習モデルの一例）を用いる場合の層構成の例について説明する。図３は学習モデル２２４の層構成の例を示す図である。図３の（ａ）部分に示す例では、学習モデル２２４は入力層２５０と、中間層２５２と、出力層２５４とを含む。入力層２５０はデータ取得部１０４が取得した画像（パッチ画像）を入力して特徴量を出力する。中間層２５２は畳み込み層２５６及びプーリング層２５８を含み、入力層２５０が出力する特徴量を入力して他の特徴量を算出する。これらの層は複数の「ノード」が「エッジ」で結ばれた構造となっており、複数の重みパラメータを保持している。重みパラメータの値は、学習が進むにつれて変化していく。学習モデル２２４は、図３の（ｂ）部分に示す例のように全結合層２６０を含んでいてもよい。学習モデル２２４の層構成は畳み込み層２５６とプーリング層２５８とが１つずつ繰り返される場合に限らず、いずれかの層（例えば、畳み込み層２５６）が複数連続して含まれていてもよい。また、全結合層２６０が複数連続して含まれていてもよい。

　［中間層における処理］
　中間層２５２は、畳み込み演算及びプーリング処理によって特徴量を算出する。畳み込み層２５６で行われる畳み込み演算はフィルタを使用した畳み込み演算により特徴マップを取得する処理であり、画像からのエッジ抽出等の特徴抽出の役割を担う。このフィルタを用いた畳み込み演算により、１つのフィルタに対して１チャンネル（１枚）の「特徴マップ」が生成される。「特徴マップ」のサイズは、畳み込みによりダウンスケーリングされ、各層で畳み込みが行われるにつれて小さくなって行く。プーリング層２５８で行われるプーリング処理は畳み込み演算により出力された特徴マップを縮小（または拡大）して新たな特徴マップとする処理であり、抽出された特徴が、平行移動などによる影響を受けないようにロバスト性を与える役割を担う。中間層２５２は、これらの処理を行う１または複数の層により構成することができる。

　図４は、図３に示す学習モデル２２４における畳み込み演算の様子を示す図である。中間層２５２の最初（１番目）の畳み込み層では、複数の画像により構成される画像セット（学習時は学習用画像セット、検出等の認識時は認識用画像セット）とフィルタＦ_１との畳み込み演算が行われる。画像セットは、縦がＨ、横がＷの画像サイズを有するＮ枚（Ｎチャンネル）の画像により構成することができる。可視光画像を入力する場合、画像セットを構成する画像はＲ（赤色），Ｇ（緑色），Ｂ（青色）の３チャンネルの画像である。この画像セットと畳み込み演算されるフィルタＦ_１は、画像セットがＮチャンネル（Ｎ枚）であるため、例えばサイズ５（５×５）のフィルタの場合、フィルタサイズは５×５×Ｎのフィルタになる。このフィルタＦ_１を用いた畳み込み演算により、１つのフィルタＦ_１に対して１チャンネル(１枚)の「特徴マップ」が生成される。２番目の畳み込み層で使用されるフィルタＦ_２は、例えばサイズ３（３×３）のフィルタの場合、フィルタサイズは３×３×Ｍになる。

　１番目の畳み込み層と同様に、２番目からｎ番目の畳み込み層ではフィルタＦ_２～Ｆ_ｎを用いた畳み込み演算が行われる。ｎ番目の畳み込み層における「特徴マップ」のサイズが、２番目の畳み込み層における「特徴マップ」のサイズよりも小さくなっているのは、前段までの畳み込み層またはプーリング層によりダウンスケーリングされているからである。

　中間層２５２の層のうち、入力側に近い畳み込み層では低次の特徴抽出（エッジの抽出等）が行われ、出力側に近づくにつれて高次の特徴抽出（対象物の形状、構造等に関する特徴の抽出）が行われる。なお、注目領域（本実施形態では、きず及び／または欠陥）の計測を目的としてセグメンテーションを行う場合は後半部分の畳み込み層でアップスケーリングされ、最後の畳み込み層では、入力した画像セットと同じサイズの「特徴マップ」が得られる。一方、注目領域の検出を行う場合は位置情報を出力すればよいのでアップスケーリングは必須ではない。

　なお、中間層２５２は畳み込み層２５６及びプーリング層２５８の他にバッチノーマライゼーションを行う層を含んでいてもよい。バッチノーマライゼーション処理は学習を行う際のミニバッチを単位としてデータの分布を正規化する処理であり、学習を速く進行させる、初期値への依存性を下げる、過学習を抑制する等の役割を担う。

　［出力層における処理］
　出力層２５４は、中間層２５２から出力された特徴量に基づき、入力された画像（パッチ画像等）に映っている注目領域の位置検出を行ってその結果を出力する層である。セグメンテーション（クラス分類）を行う場合、出力層２５４は、中間層２５２から得られる「特徴マップ」により、画像に写っている注目領域の位置を画素レベルで把握する。すなわち、画像の画素ごとに注目領域に属するか否か（特定のクラスに属するか否か）を検出し、その検出結果を出力することができる。一方、物体検出を行う場合は画素レベルでの判断は必要なく、出力層２５４が対象物の位置情報を出力する。なお、「特定のクラス」は例えば「欠陥」や「きず」である。出力層２５４は、欠陥やきずを細かく分類して出力してもよい（気泡、異物混入、孔、ひびわれ、剥離等）。

　なお、出力層２５４（学習モデル２２４）は、検出結果（セグメンテーションの結果、クラス分類の結果）を単位領域について出力することができる。また、出力層２５４は、検出結果の確からしさ（確率、信頼度）を出力することができる。「単位領域」は１画素で構成されていてもよいし、複数画素で構成されていてもよい。

　出力層２５４は注目領域の鑑別（分類）を実行して鑑別結果を出力するものでもよい。例えば、出力層２５４は画像を「正常」、「きず」、「欠陥」の３つのカテゴリに分類し、鑑別結果として「正常」、「きず」、及び「欠陥」に対応する３つのスコア（３つのスコアの合計は１００％、あるいは１）として出力してもよいし、３つのスコアから明確に分類できる場合には分類結果を出力してもよい。なお、分類は２クラスでもよいし、多クラスでもよい。

　鑑別結果を出力する場合、中間層２５２あるいは出力層２５４が最後の１層または複数の層として全結合層を含んでいてもよいし（図３の（ｂ）部分を参照）、含んでいなくてもよい。

　出力層２５４は注目領域の計測結果を出力するものでもよい。計測を行う場合は、対象となる注目領域の計測値を学習モデル２２４から直接出力することができる。また、対象となる注目領域を例えば上述のようにセグメンテーションしてから、その結果を基にプロセッサ１０２等で計測することもできる。計測値を直接出力させる場合、画像に対し計測値そのものを学習させるので、計測値の回帰問題となる。

　上述した構成の学習モデル２２４を用いる場合、学習の過程において、出力層２５４が出力する結果と画像セットに対する認識の正解とを比較して損失関数（誤差関数）を計算し、損失関数が小さくなるように（最小化されるように）、中間層２５２における重みパラメータを出力側の層から入力側の層に向けて更新していく処理（誤差逆伝播）を行うことが好ましい。本実施態様における損失関数の導出、及び損失関数に基づく学習モデルの更新については、詳細を後述する。

　［ニューラルネットワーク以外の手法による認識］
　学習モデル２２４は、ニューラルネットワーク以外の手法により検出を行ってもよい。例えば、取得した画像の特徴量に基づいて注目領域を検出することができる。この場合、学習モデル２２４は検出対象画像を例えば複数の矩形領域に分割し、分割した各矩形領域を局所領域として設定し、検出対象画像の局所領域ごとに局所領域内の画素の特徴量（例えば色相）を算出し、各局所領域の中から特定の色相を有する局所領域を注目領域として決定する。同様に、学習モデル２２４は特徴量に基づく分類や計測を行ってもよい。

　［処理部及びプロセッサの機能の実現］
　上述した処理部１００及びプロセッサ１０２の各部（検出器１０６を含む）の機能は、各種のプロセッサ（processor）及び記録媒体を用いて実現することができる。各種のプロセッサには、例えばソフトウェア（プログラム）を実行して各種の機能を実現する汎用的なプロセッサであるＣＰＵ（Central Processing Unit）が含まれる。また、上述した各種のプロセッサには、画像処理に特化したプロセッサであるＧＰＵ（Graphics Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）などの製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Programmable Logic Device：ＰＬＤ）も含まれる。画像の学習や認識を行う場合は、ＧＰＵを用いた構成が効果的である。さらに、ＡＳＩＣ（Application Specific Integrated Circuit）などの、特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路も、上述した各種のプロセッサに含まれる。

　各部の機能は１つのプロセッサにより実現されてもよいし、同種または異種の複数のプロセッサ（例えば、複数のＦＰＧＡ、あるいはＣＰＵとＦＰＧＡの組み合わせ、またはＣＰＵとＧＰＵの組み合わせ）で実現されてもよい。また、複数の機能を１つのプロセッサで実現してもよい。複数の機能を１つのプロセッサで構成する例としては、第１に、コンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組合せで１つのプロセッサを構成し、このプロセッサが複数の機能として実現する形態がある。第２に、システムオンチップ（System On Chip：ＳｏＣ）などに代表されるように、システム全体の機能を１つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態がある。このように、各種の機能は、ハードウェア的な構造として、上述した各種のプロセッサを１つ以上用いて構成される。さらに、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子などの回路素子を組み合わせた電気回路（circuitry）である。これらの電気回路は、論理和、論理積、論理否定、排他的論理和、及びこれらを組み合わせた論理演算を用いて上述した機能を実現する電気回路であってもよい。

　上述したプロセッサあるいは電気回路がソフトウェア（プログラム）を実行する際は、実行するソフトウェアのコンピュータ（例えば、処理部１００を構成する各種のプロセッサや電気回路、及び／またはそれらの組み合わせ）で読み取り可能なコードをＲＯＭ１３０等の非一時的記録媒体に記憶しておき、コンピュータがそのソフトウェアを参照する。非一時的記録媒体に記憶しておくソフトウェアは、本発明に係るデータ処理方法を実行するためのプログラム（データ処理プログラム）及び実行に際して用いられるデータ（第１，第２のＤＮＡプロファイルデータ、後述するがん種ラベル等の学習データ、機械学習で用いられる重みパラメータ等）を含む。ＲＯＭ１３０ではなく各種の光磁気記録装置、半導体メモリ等の非一時的記録媒体にコードを記録してもよい。ソフトウェアを用いた処理の際には例えばＲＡＭ１５０が一時的記憶領域として用いられ、また例えば不図示のＥＥＰＲＯＭ（Electronically Erasable and Programmable Read Only Memory）やフラッシュメモリ等の非一時的記録媒体に記憶されたデータを参照することもできる。「非一時的記録媒体」として記憶部２００を用いてもよい。なお、上述の「非一時的記録媒体」は、搬送波信号や伝播信号そのもののような非有体の記録媒体を含まない。

　上述した構成の処理部１００を用いた処理の詳細は後述する。

　［記憶部の構成］
　記憶部２００はハードディスク、半導体メモリ等の各種記憶デバイス及びその制御部により構成され、被写体の画像（入力画像、パッチ画像）、学習データ、学習モデルが用いる重みパラメータ、学習方法の実行条件及びその結果、画像処理方法の実行条件及びその結果等を記憶することができる。

　［表示部の構成］
　表示部３００は例えば液晶ディスプレイ等のディスプレイにより構成されるモニタ３１０（表示装置）を備え、被写体の画像や、学習方法、学習プログラム、画像処理方法の実行結果等を表示することができる。モニタ３１０をタッチパネル型のディスプレイにより構成し、ユーザの指示入力を受け付けてもよい。

　［操作部の構成］
　操作部４００は操作デバイスの一例としてのキーボード４１０及びマウス４２０を備え、ユーザは、操作部４００を介して本発明に係る学習方法、学習プログラム、及び画像処理方法の実行、結果表示等に関する操作を行うことができる。操作部４００は、その他の操作デバイスを備えていてもよい。

　［学習方法の処理］
　本実施態様に係る学習方法（学習プログラム）の処理について説明する。図５は、学習方法の処理の概要を示すフローチャートである。なお、以下の説明は本発明における処理の一例であり、必要に応じて処理の順序を入れ替えてもよい。

　［処理の概要］
（学習データの取得）
　処理が始まると、データ取得部１０４（プロセッサ）は、パッチ画像と、パッチ画像の単位領域に対するクラスラベルの正解データと、のペアからなる学習データを取得する（ステップＳ１００：データ取得工程、データ取得処理）。データ取得部１０４は、記憶部２００から学習データを取得してもよいし、外部データベース５１０から取得してもよい。また、データ取得部１０４は、学習データを一括して取得してもよいし、複数回に分けて取得してもよい。

　（パッチ画像のセグメンテーション）
　検出器１０６（プロセッサ）は、上述した学習モデル２２４及び学習データを用いて、取得したパッチ画像のセグメンテーションを行い、単位領域が各クラスに属する確からしさを出力する（ステップＳ１１０：判定工程、判定処理）。「クラス」の設定は、例えば「きず」、「欠陥」、「正常」（「きず」「欠陥」以外）である。ここで、「きず」を被写体の不連続部分と定義することができ、また「欠陥」を規格や仕様書等で規定された規準を超え検査結果が不合格となるきず（例えば、大きさや程度が規準を超えるきず）と定義することができるが、本発明では、きずと欠陥を区別せず両方とも「欠陥」として扱ってもよい。また、きず及び欠陥を複数の種類（例えば異物、気泡、孔、ひび割れ、剥離等）や程度（数、大きさ、密度等）に分け、種類及び／または程度が異なるきず及び欠陥を異なるクラスとして扱ってもよい。なお、どのようなクラスに分類するかに応じて、検出器１０６（学習モデル２２４）の層構成（全結合層の有無や、出力の数等）をあらかじめ設定しておくこと、及び分類するクラスの種類、数、程度等に合わせた正解データを用意しておくことが好ましい。

　なお、本発明において「単位領域」は、一画素、または複数の画素により構成される領域である。

　以下、画素ごとに「欠陥」と「正常」の２クラスに分類する場合、即ちきずと欠陥を区別せず、単位領域が一画素で構成される場合について説明する。また、検出器１０６は各画素が欠陥クラスに属する確からしさｑ（ｑ∈［０，１］）を出力するものとする。

　（特定のクラスを検出したか否かの判定）
　判定部１０８（プロセッサ）は、パッチ画像ごとに（第２の単位領域ごとに）、各画素についての確からしさｑ及び正解データｐに基づいて、学習モデル２２４が特定のクラス（欠陥クラス）に属する第２の単位領域を正しく検出したか否かを、パッチ画像ごとに判定する（ステップＳ１２０：判定工程、判定処理）。

　（重み付け及び更新）
　重み付け部１１０（プロセッサ）は、上述した判定の結果に基づいて、パッチ画像単位で損失（損失関数）に重みを設定する（ステップＳ１３０：重み付け工程、重み付け処理）し、更新部１１２（プロセッサ）は、重み付けした結果に基づいて、検出器１０６の学習モデルを更新する（ステップＳ１４０：更新工程、更新処理）。更新部１１２（プロセッサ）は、終了条件を満たすまで（ステップＳ１５０でＹＥＳになるまで）、プロセッサ１０２の各部にステップＳ１００～Ｓ１４０の処理を繰り返させる。終了条件は、例えば全ての学習データの学習を終了した、決められた回数の繰り返しが終了した、損失が収束した、等である。

　［処理の詳細］
　上述した学習方法の処理の詳細を、図６のフローチャートを参照して説明する。

　［クラスの判定］
　判定部１０８（プロセッサ）は、検出器１０６（学習モデル）が出力した確からしさｑ（各画素が欠陥クラスに属する確からしさ）を閾値θと比較する（ステップＳ１２２：判定工程、判定処理）。判定部１０８は、確からしさが閾値以上である場合（ｑ≧θ）に、「判断対象の画素は欠陥クラス（特定のクラス）に属する」と判定することができる。

　［損失に対する重み付け及び損失関数の導出］
　重み付け部１１０（プロセッサ）は、個々のパッチ画像についての損失であるＣＥ損失を第１の損失として、以下のように、パッチ画像単位で重み付けを行う。

　重み付け部１１０は、各画素の確からしさｑと正解データｐに基づいて、上述の式（１）によりＣＥ損失を算出する（ステップＳ１３１：重み付け工程、重み付け処理）。また、重み付け部１１０は、確からしさｑを正解データｐと比較し（ステップＳ１３２：重み付け工程、重み付け処理）、誤検出または未検出の場合（ステップＳ１３３でＹＥＳ；以下の式（４）を参照）、即ち比較の結果が特定の結果である場合は、ＣＥ損失に対する第１の重みとしてパッチ画像単位でα＝１を設定し（ステップＳ１３４）、誤検出または未検出以外の場合（ステップＳ１３３でＮＯ；以下の式（４）を参照）、即ち比較の結果が特定の結果でない場合は、第１の重みとしてパッチ画像単位でα＝０を設定する。このように、重み付け部１１０は、比較の結果が特定の結果である場合は、比較の結果が特定の結果でない場合より大きな重みを第１の重みとして設定する。

　重み付け部１１０（プロセッサ）は、重み付けを行った結果をパッチ画像で構成されるバッチ全体で平均して、第１の損失関数（以下の式（３）を参照；損失関数）を導出する（ステップＳ１３８：損失関数導出工程、損失関数導出処理）。

　上述の重み付け及び損失関数の導出は、以下の式（３）、（４）により表すことができる。なお、式（３）において、Ｂはバッチを構成するパッチ画像の数であり、Ｎはバッチののべ画素数（＝Ｂ×Ｈ×Ｗ、Ｈ，Ｗは入力パッチ画像のサイズ）である。

　式（４）におけるθ∈（０，１）は事前に定めた欠陥確率の閾値を表しており、プロセッサ１０２は、確からしさｑが閾値θ以上であると、その画素は欠陥であると判定することができる。このとき、実際には欠陥でない領域を誤検出した場合（第１の場合）、あるいは欠陥であるにも関わらず未検出となった場合（第２の場合）は式（３）においてα(Ii)=１となり、当該パッチに損失が加えられる。逆に、学習が進み、欠陥の一部でも検出に成功した画素が生じると、α(Ii)＝０（第３の場合）となるから、学習の優先度は相対的に減少する。

　式（４）における重み付けを詳細に説明すると、「（パッチとしての）誤検出」は「パッチ内の全ての画素で正解ラベルｐ＝０、かつ、パッチ内のいずれか１画素で学習モデルの出力値（確からしさ）ｑが閾値θ以上（ｑ≧θ）である場合」と定義され、「（パッチとしての）未検出」は「パッチの中に正解ラベルｐ＝１である画素が１つでも存在し、かつ、パッチ内の全ての画素で学習モデルの出力値（確からしさ）ｑが閾値未満（ｑ＜θ）である場合」と定義される。「（パッチとしての）誤検出」または「（パッチとしての）未検出」であればα＝１であり、それ以外の場合は全てα＝０となる。なお、式（４）ではパッチ内の画素１つ１つに対して「未検出」「誤検出」を判定しているわけではなく、パッチ全体（第２の単位領域）に対して、上記の基準に基づき１つの判定結果が定まる。

　［重み付けによる学習への影響］
　上述した重み付けによる学習への影響について説明する。例えば、図７の（ａ）部分（パッチ画像における、欠陥の正解範囲を示す図）に示すように、パッチ画像９２０において巨大な欠陥９２２が存在する場合（欠陥９２２の内側の画素ではｐ＝１，外側の画素ではｐ＝０）を考える。またこの場合、検出器１０６による検出結果が、同図の（ｂ）部分に示すように、パッチ画像９２０Ａにおいて正解よりも狭い領域を欠陥９２２Ａとして検出したものとする（欠陥９２２Ａの内側の画素ではｐ＝１，外側の画素ではｐ＝０）。

　この場合、上述した重み付けによれば、α＝０（正しく検出したという判定）である。これは、「巨大な欠陥を、少なくともその一部だけでも検出すれば、未検出のペナルティ（α＝１と重み付けすること）が解消される」と解釈することができ、逆にいえば「巨大な欠陥の領域『全体』を検出する必要はない」ということである。

　図７に示す例の場合、従来の手法によれば、画素レベルで捉えると検出できていない面積が大きいため、その検出できていない面積に応じて巨大な欠陥９２２をさらに学習しようとする（重み付けされる）。これに対し本発明の手法によれば、このような巨大な欠陥９２２の学習が早い段階で終了する（重みがゼロになる）。これに対し微小な欠陥の場合、そもそも例えば数画素程度で構成されていて、「欠陥の一部でも検出すればよい」という規準は条件を緩めたことにはならない。

　この結果、本発明の手法によれば、巨大な欠陥だけにとって「検出した」の規準が緩くなり、微小な欠陥が相対的に学習されやすくなる。

　以上から、本実施形態によれば、微小欠陥であっても未検出の領域が重点的に学習されやすくなり、検出率を向上させるという観点で有利にはたらく。

　［損失関数の組合せ］
　学習モデルの更新において、重み付け部１１０（プロセッサ）は、上述した第１の損失関数（Ｌweighted）を単独で損失関数として用いてもよいし、Ｌweightedと、バッチに対する損失関数であってＬweightedとは異なる損失関数である第２の損失関数と、を組み合わせた関数を損失関数として用いてもよい。例えば、以下の式（５）のように、通常のＣＥ損失を第２の損失関数（Ｌ_ＣＥ）とし、第１の損失関数と第２の損失関数とを任意の係数（λ＞０）で足し合わせた関数を損失関数としてもよい（ステップＳ１３９：損失関数導出工程、損失関数導出処理）。

　なお、損失関数のさらなるバリエーションについて、「損失関数のバリエーション」の項で後述する。

　プロセッサ１０２は、どのような損失関数を用いるか、あるいはどのような重みを用いるかを、操作部４００を介したユーザの操作に応じて決定してもよいし、ユーザの操作によらずに自動的に決定してもよい。

　［学習モデルの更新］
　更新部１１２（プロセッサ）は、学習モデル２２４を更新するタイミングである場合は（ステップＳ１４２でＹＥＳ）、導出した損失関数を用いて、学習モデル２２４のパラメータを更新する（ステップＳ１４４：更新工程、更新処理）。例えば、更新部１１２は、学習モデルのパラメータを更新して損失関数を最小化する。なお、ステップＳ１４２における更新のタイミングはパッチ画像ごとでもよいし、ステップごと（バッチごと）でもよいし、複数ステップごとでもよい。

　［実施例］
　４px以下の微小欠陥と、10000px以上の巨大欠陥が併存するデータセットに対して、以下の条件でセグメンテーションの学習を行い、ＣＥ損失を損失関数として用いた条件（従来の手法）で、ＦＭＬＤ（Foreign Material Less Dense：低密度異物欠陥）及びＦＭＭＤ（Foreign Material More Dense：高密度異物欠陥）の検出確率がそれぞれ74.5%、74.1%であったが、上述した実施形態の重み付きＣＥ損失を用いた条件（本発明の手法）では、合計２００Epoch後の学習結果において、ＦＭＬＤ，ＦＭＭＤの検出確率がそれぞれ89.7％、88.1％に向上した。ここで、「検出確率」とは、正解ラベルが付いている連続領域を「１個」として数えたときの、存在する全欠陥個数に対する、検出に成功した個数である。

　＜詳細な条件＞
（ａ）上述した重み付けを、Epochごとの損失関数の導出に適用した。
（ｂ）重み付けの条件は式（４）を適用し、式（５）の重みパラメータ（係数）λ=０．１を設定した。
（ｃ）判定の閾値は、θ＝０．５で固定した。

　［第１の実施形態の効果］
　以上説明したように、第１の実施形態に係る学習方法、学習装置、及び学習プログラムによれば、検出率が良好な学習モデルを得ることができる。

　［学習方法における処理のバリエーション］
　［画像のバリエーション］
　本発明において、放射線画像、可視光画像、近赤外光画像等を学習（あるいは学習完了後の画像処理）に用いることができ、画像を取得する周波数帯域は特に限定されない。

　［画像の分割によるパッチ画像の取得］
　上述したステップＳ１００で取得するパッチ画像が、検出器１０６（学習モデル２２４）に入力する画像のサイズに合ったサイズの画像ではない場合がある。具体的には、被写体を撮影した画像（例えば、数千画素×数千画素程度）がパッチ画像（例えば、数十画素×数十画素～数百画素×数百画素程度）よりもサイズが大きい場合がある。このような場合、データ取得部１０４（プロセッサ）は、入力した画像を検出器１０６に入力する画像のサイズに合わせて分割した画像を、パッチ画像として取得することができる（データ取得工程、データ取得処理）。これによりＣＰＵ，ＧＰＵ等のプロセッサやＲＡＭ等のメモリに対する負荷を軽減することができる。

　また、データ取得部１０４は、パッチ画像を取得する際に、入力画像の分割（パッチ画像への切り分け）に代えて、または分割に加えて、画像のリサイズを行ってもよい（データ取得工程、データ取得処理）。例えば、データ取得部１０４は、長方形の画像全体を正方形にして入力することができる。

　さらにまた、データ取得部１０４（プロセッサ）は、検出しようとする対象のサイズ（検出サイズ）に応じたサイズのパッチ画像を取得してもよい。例えば、図８のフローチャートに示すように、データ取得部１０４が画像及び正解データを入力し（ステップＳ１０２）、検出しようとする対象（例えば、被写体のきず及び／または欠陥）のサイズを設定する（ステップＳ１０４）。データ取得部１０４は、操作部４００を介したユーザの操作に応じて、あるいは決められた条件に従って自動的に（ユーザの操作を介さずに）対象のサイズを設定することができる。

　データ取得部１０４は、設定したサイズに応じて、入力した画像をパッチ画像に分割する（ステップＳ１０６）。上述したリサイズを行ってもよい。以降の処理は、図５，６のフローチャートについて上述したのと同様である。

　［判定の閾値］
　プロセッサ１０２（プロセッサ）は、学習の過程で閾値θを変化させてもよい。例えば、「学習の初期はきずや欠陥を精度よく検出できないので閾値（検出のハードル、基準）を低くしておき、学習が進行し精度よく検出できるようになるにつれて、閾値を高くする」との考え方に基づき、学習の初期は閾値を低くしておき、その後高くすることができる。

　［重み付けのバリエーション］
　上述した第１の実施形態では、パッチ画像に対する重みとして、誤検出または未検出の場合（第１の場合、第２の場合）はα＝１、それ以外の場合（第３の場合）はα＝０を設定しているが、本発明において、パッチ画像に対する重み付けはこのような態様に限定されない。上述の態様の他にも、例えば、未検出の場合（第２の場合）の重みを誤検出の場合（第１の場合）の重みよりも大きくすることで、微小欠陥の検出率を向上させてもよい。図９はそのような場合の重み付け処理を示すフローチャートである。同図に示すように、重み付け部１１０（プロセッサ）は、未検出の場合（ステップＳ１３３ＡでＹＥＳ）は重みとしてα＝２を設定し（ステップＳ１３４Ａ）、誤検出の場合（ステップＳ１３６でＹＥＳ）はα＝１を設定し（ステップＳ１３７Ａ）、それ以外の場合（ステップＳ１３６でＮＯ）はα＝０を設定することができる。

　［損失関数のバリエーション］
　上述した第１の態様では、ＣＥ損失に基づくＬ_ＣＥ、Ｌ_weighted、あるいはこれらの組合せを損失関数とする場合について説明したが、本発明では、これらと異なる損失関数を用いることもできる。例えば、重み付け部１１０（プロセッサ）は、平均二乗和誤差、Dice loss、IoU loss（Jaccard loss）、Tversky loss、Focal loss、これらの組合せ、さらにこれらとＬ_ＣＥ及び／またはＬ_weightedとの組合せを損失関数として用いることができる。複数の損失関数を組み合わせる場合、以下の式（６）のように、個々の損失関数を任意の個数、任意の係数で組み合わせて総損失関数Ｌ_total（損失関数）とすることができる（損失関数導出工程、損失関数導出処理）。なお、Ｌ_weightedの係数は０より大きいことが好ましい。

　なお、式（６）において、Ｋは組み合わせる損失関数の数で１以上の整数、λiは個々の損失関数に対する係数（任意の実数）、Ｌiは個々の損失関数であり上述したＬ_ＣＥ、Ｌ_weighted、平均二乗和誤差、Dice loss、IoU loss（Jaccard loss）、Tversky loss、Focal loss等である。

　［画像処理装置としての動作］
　上述した学習の完了後、検出器１０６の学習モデル２２４は学習済みモデルとなる。即ち、学習完了後の学習装置１０は画像処理装置として動作しうる。この画像処理装置によれば、本発明に係る学習方法で学習した学習済みモデルを用いて、被写体のきず及び／または欠陥を良好な検出率で検出することができる。

　以上で本発明の実施形態及びそのバリエーションについて説明してきたが、本発明は上述した態様に限定されず、本発明の精神を逸脱しない範囲で種々の変形が可能である。

１０　　　学習装置
１００　　処理部
１０２　　プロセッサ
１０４　　データ取得部
１０６　　検出器
１０８　　判定部
１１０　　重み付け部
１１２　　更新部
１１４　　表示制御部
１１６　　記録制御部
１１８　　通信制御部
１３０　　ＲＯＭ
１５０　　ＲＡＭ
２００　　記憶部
２２４　　学習モデル
２５０　　入力層
２５２　　中間層
２５４　　出力層
２５６　　畳み込み層
２５８　　プーリング層
２６０　　全結合層
３００　　表示部
３１０　　モニタ
４００　　操作部
４１０　　キーボード
４２０　　マウス
５００　　外部サーバ
５１０　　外部データベース
９００　　巨大欠陥
９０２　　領域
９１０　　微小欠陥
９１２　　領域
Ｆ１　　　フィルタ
Ｆ２　　　フィルタ
ＮＷ　ネットワーク
Ｓ１００～Ｓ１５０　学習方法の各ステップ

Claims

　プロセッサを備える学習装置により実行される学習方法であって、前記プロセッサは、
　パッチ画像と、前記パッチ画像の単位領域に対するクラスラベルの正解データと、のペアからなる学習データを取得するデータ取得工程と、
　学習モデル及び前記学習データを用いて前記パッチ画像のセグメンテーションを行い、前記学習モデルが第２の単位領域を正しく検出したか否かを前記パッチ画像ごとに判定する判定工程と、
　前記判定の結果に基づいて第１の重みを設定する重み付け工程と、
　前記重み付けした結果に基づいて前記学習モデルを更新する更新工程と、
　を実行する学習方法。
　前記プロセッサは、前記重み付け工程において、個々の前記パッチ画像についての損失である第１の損失に対して、前記パッチ画像単位で第１の重みを設定する請求項１に記載の学習方法。
　前記プロセッサは、前記重み付け工程において、
　前記第２の単位領域が正しく検出されていないと判定した場合は、前記第２の単位領域が正しく検出されていると判定した場合よりも大きな重みを前記第１の重みとして設定する請求項１または２に記載の学習方法。
　前記学習モデルは、前記判定工程において、特定のクラスに属する前記第２の単位領域を検出する請求項１から３のいずれか１項に記載の学習方法。
　前記プロセッサは、前記判定工程において、
　前記学習モデルが前記特定のクラスに属する前記第２の単位領域を誤って検出した第１の場合、及び前記学習モデルが前記特定のクラスに属する前記第２の単位領域を検出できなかった第２の場合は、前記第２の単位領域が正しく検出されていないと判定する請求項４に記載の学習方法。
　前記プロセッサは、前記重み付け工程において、
　前記第２の場合は前記第１の場合よりも大きな重みを設定する請求項５に記載の学習方法。
　前記プロセッサは、前記判定工程において、
　前記検出の結果が前記第１の場合ではなく前記第２の場合でもない第３の場合は、前記検出の結果が正しいと判定する請求項５または６に記載の学習方法。
　前記プロセッサは、前記判定工程において、
　被写体のきず及び欠陥について前記判定を行う請求項４から７のいずれか１項に記載の学習方法。
　前記学習モデルは、前記検出の確からしさを出力し、
　前記プロセッサは、前記判定工程において、
　前記確からしさが閾値以上であるか否かに基づいて、前記第２の単位領域が前記特定のクラスに属すると判定する請求項４から８のいずれか１項に記載の学習方法。
　前記プロセッサは、学習の過程で前記閾値を変化させる請求項９に記載の学習方法。
　前記プロセッサは、前記重み付け工程において、前記パッチ画像のクロスエントロピー損失に対して前記重み付けを行う請求項１から１０のいずれか１項に記載の学習方法。
　前記プロセッサは、
　前記パッチ画像で構成されるバッチに対する損失関数を導出する損失関数導出工程をさらに実行し、
　前記更新工程では前記損失関数を用いて前記学習モデルを更新する請求項１から１１のいずれか１項に記載の学習方法。
　前記プロセッサは、前記損失関数導出工程において、前記重み付けを行った結果を前記パッチ画像で構成されるバッチ全体で平均した第１の損失関数を前記損失関数として導出する請求項１２に記載の学習方法。
　前記プロセッサは、前記損失関数導出工程において、
　前記第１の損失関数と、前記バッチに対する損失関数であって前記第１の損失関数とは異なる損失関数である第２の損失関数と、を組み合わせた関数を前記損失関数として用いる請求項１３に記載の学習方法。
　前記プロセッサは、前記更新工程において、前記学習モデルのパラメータを更新して損失関数を最小化する請求項１から１４のいずれか１項に記載の学習方法。
　前記プロセッサは、前記データ取得工程において、
　画像を入力し、前記入力した画像を分割した画像を前記パッチ画像として取得する請求項１から１５のいずれか１項に記載の学習方法。
　前記プロセッサは、前記データ取得工程において、検出しようとする被写体のきず及び／または欠陥のサイズに応じたサイズの前記パッチ画像を取得する請求項１から１６のいずれか１項に記載の学習方法。
　前記学習モデルは、前記セグメンテーションを行うニューラルネットワークを備える請求項１から１７のいずれか１項に記載の学習方法。
　プロセッサを備える学習装置であって、前記プロセッサは、
　パッチ画像と、前記パッチ画像の単位領域に対するクラスラベルの正解データと、のペアからなる学習データを取得するデータ取得処理と、
　学習モデル及び前記学習データを用いて前記パッチ画像のセグメンテーションを行い、前記学習モデルが第２の単位領域を正しく検出したか否かを前記パッチ画像ごとに判定する判定処理と、
　前記判定の結果に基づいて第１の重みを設定する重み付け工程と、
　前記重み付けした結果に基づいて前記学習モデルを更新する更新処理と、
　を実行する学習装置。
　プロセッサを備える学習装置に学習方法を実行させる学習プログラムであって、前記学習方法において、前記プロセッサは、
　パッチ画像と、前記パッチ画像の単位領域に対するクラスラベルの正解データと、のペアからなる学習データを取得するデータ取得工程と、
　学習モデル及び前記学習データを用いて前記パッチ画像のセグメンテーションを行い、前記学習モデルが第２の単位領域を正しく検出したか否かを前記パッチ画像ごとに判定する判定工程と、
　前記判定の結果に基づいて第１の重みを設定する重み付け工程と、
　前記重み付けした結果に基づいて前記学習モデルを更新する更新工程と、
　を実行させる学習プログラム。
　非一時的かつコンピュータ読取可能な記録媒体であって、請求項２０に記載のプログラムが記録された記録媒体。
　請求項１から１８のいずれか１項に記載の学習方法で学習した学習済みモデルを備え、
　入力した画像から、前記学習済みモデルを用いて被写体のきず及び／または欠陥を検出する画像処理装置。