JP7366325B1 - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP7366325B1
JP7366325B1 JP2023547256A JP2023547256A JP7366325B1 JP 7366325 B1 JP7366325 B1 JP 7366325B1 JP 2023547256 A JP2023547256 A JP 2023547256A JP 2023547256 A JP2023547256 A JP 2023547256A JP 7366325 B1 JP7366325 B1 JP 7366325B1
Authority
JP
Japan
Prior art keywords
image
unit
generation unit
abnormality
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023547256A
Other languages
English (en)
Inventor
恵一 白須賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Application granted granted Critical
Publication of JP7366325B1 publication Critical patent/JP7366325B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

情報処理装置(100)は、検査対象品を含む画像(10)を取得する取得部(120)と、画像(10)に基づいて、特徴マップを生成する特徴マップ生成部(130)と、特徴マップに基づいて、正常空間からの逸脱度を、異常度として検出し、異常度に基づいて、異常箇所抽出画像を生成する検出生成部(160)と、特徴マップに基づいて、検査対象品又は検査対象品の検査対象部位を示す領域である注目領域を含むヒートマップであるアテンションマップを生成するアテンションマップ生成部(170)と、アテンションマップが示す注目領域に対応する異常箇所抽出画像の画像領域に、重みを付けられた重み付き異常箇所抽出画像を生成する重み付け生成部(180)と、重み付き異常箇所抽出画像のうち、重み付けされた画像領域を判定対象領域として、検査対象品が異常であるか否かを判定する判定部(190)と、を有する。

Description

本開示は、情報処理装置に関する。
製品の外観検査が、学習済モデルを用いて行われる場合がある。例えば、当該学習済モデルは、正常品を含む画像を再構成画像として出力するモデルである。当該学習済モデルは、検査対象品を含む画像と、再構成画像との差分画像を用いて、異常を判定する。また、当該学習済モデルは、異常箇所を可視化した情報を出力する。
また、外観検査に関する技術が提案されている(特許文献1を参照)。特許文献1の検査装置は、第1推定モデルを使用して、対象画像から注目領域を抽出し、注目領域の抽出結果を使用して、第2推定モデルの演算処理を実行し、かつ第2推定モデルの演算結果に基づいて、対象製品に欠陥があるか否かを判定する。
特開2022-3495号公報 特開2021-022368号公報
ところで、検査対象品を含む画像と学習済モデルとを用いて、検査が行われる場合がある。ここで、検査対象品を含む画像の背景の特徴が、学習データとして用いられた画像の背景の特徴と異なることがある。また、検査対象品を含む画像の検査対象部位以外の領域の特徴が、学習データとして用いられた画像の特徴と異なることがある。このように、学習データと異なる特徴を有する画像が入力された場合、検査対象品又は検査対象部位以外の領域が注目領域とされ、正常品の検査対象品が異常品であると判定される場合がある。このように、誤判定が起こることは、問題である。
本開示の目的は、誤判定を抑制することである。
本開示の一態様に係る情報処理装置が提供される。情報処理装置は、検査対象品を含む画像を取得する取得部と、前記画像に基づいて、特徴マップを生成する特徴マップ生成部と、前記特徴マップに基づいて、正常品の特徴量によって表現される空間である正常空間からの逸脱度を、異常度として検出し、前記異常度に基づいて、異常箇所抽出画像を生成する検出生成部と、前記特徴マップに基づいて、前記検査対象品又は前記検査対象品の検査対象部位を示す領域である注目領域を含むヒートマップであるアテンションマップを生成するアテンションマップ生成部と、前記アテンションマップが示す前記注目領域に対応する前記異常箇所抽出画像の画像領域に、重みを付けられた重み付き異常箇所抽出画像を生成する重み付け生成部と、前記重み付き異常箇所抽出画像のうち、重み付けされた画像領域を判定対象領域として、前記検査対象品が異常であるか否かを判定する判定部と、を有する。
本開示によれば、誤判定を抑制できる。
実施の形態1の情報処理装置が有するハードウェアを示す図である。 実施の形態1の情報処理装置の機能を示すブロック図である。 実施の形態1の畳み込み層の選択方法の例を示すフローチャートである。 実施の形態1の学習時における処理のイメージ図である。 実施の形態1の各主成分軸に対する寄与度のイメージ図である。 実施の形態1のインクリメント番号の割り当てのイメージ図である。 実施の形態1の各層の寄与度のイメージ図である。 実施の形態1の正常品の分布図である。 実施の形態1のアテンションマップ生成部と分類予測部との機能を示すブロック図である。 実施の形態1の判定部の機能を示すブロック図である。 実施の形態1の学習処理の例を示すフローチャートである。 (A)~(C)は、実施の形態1の教師データの例を示す図(その1)である。 (A)~(C)は、実施の形態1の教師データの例を示す図(その2)である。 実施の形態2の情報処理装置の機能を示すブロック図である。 実施の形態2のリサイズ結合部の機能を示すブロック図である。 実施の形態3の情報処理装置の機能を示すブロック図である。 実施の形態3の判定部の機能を示すブロック図である。 実施の形態4の情報処理装置の機能を示すブロック図である。 実施の形態4の検出生成部の機能を説明するための図である。 実施の形態4の教師データの例を示す図である。 実施の形態4の学習処理の例を示すフローチャートである。 実施の形態5の情報処理装置の機能を示すブロック図である。 実施の形態5の学習処理の例を示すフローチャートである。
以下、図面を参照しながら実施の形態を説明する。以下の実施の形態は、例にすぎず、本開示の範囲内で種々の変更が可能である。
実施の形態1.
図1は、実施の形態1の情報処理装置が有するハードウェアを示す図である。情報処理装置100は、プロセッサ101、揮発性記憶装置102、及び不揮発性記憶装置103を有する。
プロセッサ101は、情報処理装置100全体を制御する。例えば、プロセッサ101は、CPU(Central Processing Unit)、FPGA(Field Programmable Gate Array)などである。プロセッサ101は、マルチプロセッサでもよい。また、情報処理装置100は、処理回路を有してもよい。
揮発性記憶装置102は、情報処理装置100の主記憶装置である。例えば、揮発性記憶装置102は、RAM(Random Access Memory)である。不揮発性記憶装置103は、情報処理装置100の補助記憶装置である。例えば、不揮発性記憶装置103は、HDD(Hard Disk Drive)、又はSSD(Solid State Drive)である。
次に、情報処理装置100の機能を説明する。
図2は、実施の形態1の情報処理装置の機能を示すブロック図である。情報処理装置100は、記憶部110、取得部120、特徴マップ生成部130、リサイズ部140、結合部150、検出生成部160、アテンションマップ生成部170、重み付け生成部180、判定部190、及び表示制御部200を有する。情報処理装置100は、分類予測部210を有してもよい。また、リサイズ部140は、第1のリサイズ部とも言う。結合部150は、第1の結合部とも言う。
記憶部110は、揮発性記憶装置102又は不揮発性記憶装置103に確保した記憶領域として実現してもよい。
取得部120、特徴マップ生成部130、リサイズ部140、結合部150、検出生成部160、アテンションマップ生成部170、重み付け生成部180、判定部190、及び表示制御部200の一部又は全部は、処理回路によって実現してもよい。また、取得部120、特徴マップ生成部130、リサイズ部140、結合部150、検出生成部160、アテンションマップ生成部170、重み付け生成部180、判定部190、及び表示制御部200の一部又は全部は、プロセッサ101が実行するプログラムのモジュールとして実現してもよい。
記憶部110は、様々な情報を記憶する。
取得部120は、画像10を取得する。例えば、取得部120は、カメラから画像10を取得する。また、例えば、取得部120は、記憶部110から画像10を取得する。
画像10は、検査対象品を含む。画像10の縦ピクセル数は、h0である。画像10の横ピクセル数は、w0である。画像10のチャンネル数は、ch0である。そのため、画像10は、“h0×w0×ch0”と表現してもよい。
特徴マップ生成部130は、画像10に基づいて、特徴マップを生成する。特徴マップ生成部130を詳細に説明する。特徴マップ生成部130は、複数の畳み込み層を構成するニューラルネットワークである。例えば、特徴マップ生成部130は、ResNet(Residual Network)、EfficientNet、CNN(Convolutional Neural Network)などである。特徴マップ生成部130では、各畳み込み層から特徴マップ130outが、出力される。図1は、特徴マップ130out1,130out2,130out3が、3つの畳み込み層から出力されることを示している。しかし、出力される特徴マップの数は、1つでもよい。特徴マップ生成部130では、選択された畳み込み層から特徴マップが、出力されてもよい。特徴マップ生成部130では、全ての畳み込み層から特徴マップが、出力されてもよい。
上記したように、選択された畳み込み層から特徴マップが、出力されてもよい。ここで、畳み込み層の選択方法を説明する。
図3は、実施の形態1の畳み込み層の選択方法の例を示すフローチャートである。また、図3の処理は、学習時におけるフローチャートである。
(ステップS11)正常品を含む複数の画像のそれぞれを用いて、全ての畳み込み層から特徴マップが、出力される。これにより、複数の特徴マップが、得られる。
(ステップS12)各特徴マップにおける各チャンネルの画像について、画像内ピクセル値の平均値が、算出される。
(ステップS13)算出された平均値を用いて、主成分分析が、行われる。
ここで、ステップS11~13までの処理のイメージ図を示す。
図4は、実施の形態1の学習時における処理のイメージ図である。
ここで、第1層からN層までの全層の特徴マップのうち、第i層の特徴マップを“hi×wi×chi”と表現する。“hi”は、縦ピクセル数を示す。“wi”は、横ピクセル数を示す。“chi”は、チャンネル数を示す。第i層の平均値の数は、“chi”個となる。そして、全層の全チャンネルの平均値の数は、(ch1+ch2+・・・+chN)個となる。すなわち、1つの画像当たりの平均値の数は、(ch1+ch2+・・・+chN)個となる。そのため、全画像の平均値の数は、“(ch1+ch2+・・・+chN)×全画像数”個となる。
“(ch1+ch2+・・・+chN)×全画像数”個のデータを用いて、主成分分析が、行われる。
(ステップS14)特徴マップが出力される対象の畳み込み層が、選択される。詳細に、処理を説明する。主成分分析により、各主成分軸に変換する各チャンネルの変換係数が、得られる。変換係数は、各主成分軸に対する寄与度を表す。言い換えれば、寄与度は、主成分に寄与する度合いである。各主成分軸に対する寄与度のイメージ図を示す。
図5は、実施の形態1の各主成分軸に対する寄与度のイメージ図である。
主成分軸毎に、寄与度(すなわち、変換係数の絶対値)の小さい順にインクリメント番号が、割り当てられる。インクリメント番号の割り当てのイメージ図を示す。
図6は、実施の形態1のインクリメント番号の割り当てのイメージ図である。第1~i主成分では、インクリメント番号が所属する畳み込み層毎に、合計値が算出される。そして、合計値が、チャンネル数で除算される。これにより、畳み込み層の寄与度平均値が、得られる。
図7は、実施の形態1の各層の寄与度のイメージ図である。
寄与度平均値に基づいて、寄与度の高い畳み込み層が、特徴マップが出力される対象に選択される。
そして、例えば、特徴マップが出力される対象の畳み込み層を示す情報が、予め記憶部110に格納される。特徴マップ生成部130では、当該情報に基づいて、対象の畳み込み層から特徴マップが、出力される。
このように、特徴マップ生成部130は、複数の畳み込み層のうち、予め定められた複数の畳み込み層から、画像10に基づく複数の特徴マップを出力する。予め定められた複数の畳み込み層(すなわち、当該情報が示す対象の複数の畳み込み層)のそれぞれは、多くの特徴量を示す特徴マップを出力する層である。
以下の説明では、3つの特徴マップが出力されるものとする。3つの特徴マップは、特徴マップ130out1,130out2,130out3である。
ここで、入力層に近い畳み込み層から出力される特徴マップは、次の性質を有する。解像度が、高い。特徴の種類を示すチャンネル数が少ないため、画像のエッジ、テクスチャなどのようなプリミティブな特徴が、高解像度で得られる。一方、入力層から遠い畳み込み層から出力される特徴マップは、次の性質を有する。解像度が、低い。当該特徴マップは、チャンネル数が多いため、画像全体を俯瞰した高いレベルの多彩な特徴量を有している。当該特徴マップは、画像内の物体を特定できるような情報を有している。
図2に戻って、リサイズ部140を説明する。
リサイズ部140は、3つの特徴マップのそれぞれの画像サイズが異なるため、3つの特徴マップのサイズを同じサイズにリサイズする。具体例には、リサイズ部140は、h4×w4のサイズに、3つの特徴マップをリサイズする。或いは、いずれかの特徴マップのサイズにリサイズする場合、リサイズ部140は、2つの特徴マップをリサイズしてもよい。
結合部150は、リサイズされた複数の特徴マップをチャンネル方向に結合する。これにより、結合することにより得られた特徴マップ150outが、出力される。また、特徴マップ150outのチャンネル数は、ch4(ch4=ch1、ch2、及びch3)となる。
検出生成部160は、特徴マップ150outに基づいて、異常度を検出する。詳細には、検出生成部160は、特徴マップ150outの各微小領域の異常度を検出する。ここで、出力される特徴マップの数が1つである場合、情報処理装置100は、リサイズ部140及び結合部150を有さない。情報処理装置100がリサイズ部140及び結合部150を有さない場合、検出生成部160は、特徴マップ130outに基づいて、異常度を検出する。詳細には、検出生成部160は、特徴マップ130outの各微小領域の異常度を検出する。
検出生成部160は、異常度に基づいて、異常箇所抽出画像160outを生成する。異常箇所抽出画像160outは、特徴マップと同一サイズである。異常箇所抽出画像160outは、ヒートマップの画像である。例えば、異常箇所抽出画像160outのうち、異常度が低い領域は、青色である。異常箇所抽出画像160outのうち、異常度が高い領域は、赤色である。
検出生成部160を詳細に説明する。検出生成部160は、正常品の画像を用いて、正常品の特徴空間の分布を学習している。検出生成部160は、特徴マップ150outに基づいて、正常空間からの逸脱度を、異常度として検出する。なお、正常空間は、正常品の特徴量によって表現される空間である。検出処理は、特徴マップ150outの微小ブロック単位で行われる。微小ブロック単位は、1ピクセル単位でもよいし、複数のピクセル単位でもよい。検出処理を詳細に説明する。まず、特徴量で示される正常品の分布図を示す。
図8は、実施の形態1の正常品の分布図である。図8は、各正常品の特徴量を2次元で示している。正常品の分布をガウス分布と想定したとき、平均と分散を用いて、正常品の特徴空間が、マハラノビス距離で把握することができる。
検出生成部160は、特徴マップ150outの特徴量に基づいて、マハラノビス距離を算出する。検出生成部160は、算出されたマハラノビス距離に基づいて、正常品としての逸脱度を、異常度として検出する。例えば、正常品の特徴量を2次元で表した点が、点Aである場合、マハラノビス距離は、小さい。そのため、小さい値の異常度が、検出される。例えば、異常品の特徴量を2次元で表した点が、点Bである場合、マハラノビス距離は、大きい。そのため、大きい値の異常度が、検出される。検出生成部160は、特徴マップ150outの微小ブロック単位で異常度を検出する。検出生成部160は、異常度に基づいて、異常箇所抽出画像160outを生成する。異常箇所抽出画像160outは、h4×w4×1のサイズである。
また、検出生成部160は、オートエンコーダで正常品を含む画像から自己画像を再構成するように学習していてもよい。検出生成部160は、検査時に、再構成画像と、画像10との差を、微小ブロックごとに算出してもよい。検出生成部160は、当該差を、微小ブロックの異常度とする。そして、検出生成部160は、異常度に基づいて、異常箇所抽出画像160outを生成する。
アテンションマップ生成部170は、リサイズされた複数の特徴マップのうちのいずれか1つの特徴マップに基づいて、アテンションマップ170outを生成する。例えば、図2は、特徴マップ生成部130の最も深い層から出力された特徴マップ130out3がリサイズ部140でリサイズされることにより得られた特徴マップが、アテンションマップ生成部170に入力されることを示している。なお、情報処理装置100がリサイズ部140及び結合部150を有さない場合、アテンションマップ生成部170は、特徴マップ130outに基づいて、アテンションマップ170outを生成する。アテンションマップ170outは、h4×w4×1のサイズである。アテンションマップ170outは、注目領域を含むヒートマップである。なお、注目領域は、検査対象品又は検査対象品の検査対象部位若しくは傷などの異常箇所を示す領域である。
アテンションマップ生成部170を、図を用いて、詳細に説明する。
図9は、実施の形態1のアテンションマップ生成部と分類予測部との機能を示すブロック図である。
アテンションマップ生成部170は、特許文献2に記載されているような、複数の層を有するニューラルネットワークである。アテンションマップ生成部170に入力されるデータは、図9ではw×h×chのサイズである。w、h、chの値は、接続される前段の値と同一である。図2に示す構成では、wがw4、hがh4、cがch4になる。
アテンションマップ生成部170は、1つ以上の畳み込み層又は1つ以上の残差ブロックを有するConv部171、及びch×1×1×2のConv部172を有する。なお、ch×1×1×2は、ch個のチャンネルそれぞれについて、1×1の畳み込みカーネルを用いた畳み込み処理を2つ有するという意味である。そのため、Conv部172は、w×h×2を出力する。
また、アテンションマップ生成部170は、2×1×1×1のConv部173、及びSigmoid部174を有する。
リサイズ部140から出力された特徴マップのうちいずれかの特徴マップが、Conv部171、Conv部172、Conv部173、及びSigmoid部174を経由することで、アテンションマップ170outが、生成される。
なお、w×h×2が、Conv部172から分類予測部210に、出力される。当該出力の処理は、アテンションマップ生成部170の学習時に行われる。
重み付け生成部180は、アテンションマップ170outが示す注目領域に対応する異常箇所抽出画像160outの画像領域に、重みを付けられた重み付き異常箇所抽出画像180outを生成する。言い換えれば、重み付け生成部180は、アテンションマップ170outが示す注目領域に対応する異常箇所抽出画像160outの画像領域に、重みを付けることにより得られる重み付き異常箇所抽出画像180outを生成する。
判定部190は、重み付き異常箇所抽出画像180outのうち、重み付けされた画像領域を判定対象領域として、検査対象品が異常であるか否かを判定する。例えば、判定部190は、重み付き異常箇所抽出画像180outの最大の画素値と予め設定された閾値とを比較する。判定部190は、最大の画素値が当該閾値を超える場合、検査対象品が異常であると判定する。また、判定部190は、検査対象部位が異常と判定した場合、検査対象品が異常であると判定する。
また、異常判定処理では、注目領域が重みにより強調されているので、異常判定の精度が、向上する。
ここで、判定部190は、次のような機能を有してもよい。
図10は、実施の形態1の判定部の機能を示すブロック図である。判定部190は、全結合層191とsoftmax192とを有する。
全結合層191は、ニューラルネットワークで構成される。全結合層191の学習時では、学習パラメータとして、h4×w4×2の重みと2つのバイアスが、用いられる。当該重みと2つのバイアスは、最終的に学習により、決定される。また、学習時における教師データとして、正常品を含む画像、異常品を含む画像、及び正解分類ラベルが、用いられる。
全結合層191には、重み付き異常箇所抽出画像180out(h4×w4×1)が入力される。全結合層191は、正常又は異常に関する情報をsoftmax192に出力する。softmax192は、正常又は異常に関する情報に基づいて、正常又は異常の確率を算出し、当該確率に基づいて、検査対象品が異常であるか否かを判定する。
表示制御部200は、重み付き異常箇所抽出画像180outをヒートマップとして、重み付き異常箇所抽出画像180outを画像10に重畳し、重畳により得られた画像を表示するための制御を実行する。例えば、表示制御部200は、当該画像と、当該画像の表示指示を情報処理装置100のディスプレイに送信する。これにより、当該ディスプレイは、当該画像を表示する。なお、当該画像では、異常度が高い微小ブロックの画素が、赤色で表示される。また、異常度が低い微小ブロックの画素が、青色で表示される。これにより、異常箇所が、可視化される。
ここで、検出生成部160、アテンションマップ生成部170、及び判定部190の学習について説明する。
図11は、実施の形態1の学習処理の例を示すフローチャートである。
(ステップS21)検出生成部160の学習が、行われる。検出生成部160の学習を詳細に説明する。
特徴マップ生成部130は、正常品を含む画像に基づいて、特徴マップ130outを出力する。ここで、学習時における特徴マップ生成部130は、ResNet、EfficientNetなどの複数の畳み込み層を有するニューラルネットワークである。学習時における特徴マップ生成部130は、事前に一般画像で十分に学習された学習済みモデルである。学習時における特徴マップ生成部130は、検査対象品を含む画像で学習していなくてもよい。
リサイズ部140は、特徴マップ130outをリサイズする。
結合部150は、リサイズされた特徴マップをチャンネル方向に結合する。これにより、特徴マップ150outが、得られる。
特徴マップ150outに基づいてマハラノビス距離が算出され、マハラノビス距離に基づいて異常度が検出されるように、学習が、行われる。これにより、検出生成部160は、異常度を検出することができる。
(ステップS22)アテンションマップ生成部170及び判定部190の学習が、行われる。ここで、ステップS22の詳細な処理は、図9を参照しながら説明する。
まず、学習済の特徴マップ生成部130と検出生成部160とが、用いられる。
リサイズされた複数の特徴マップのうちのいずれか1つの特徴マップが、アテンションマップ生成部170に入力される。入力された特徴マップが、Conv部171、Conv部172を経由する。w×h×2が、Conv部172から分類予測部210に、出力される。
分類予測部210は、Conv部211、GAP層212、及びsoftmax部213を有する。
なお、Conv部211は、複数の畳込み層で構成される。例えば、Conv部211は、特徴マップ生成部130で特徴マップを出力した層以降の層から最終層までの構造である。
教師データとして、正常品を含む画像、及び異常品を含む画像が、用いられる。これらの画像の例を示す。
図12(A)~(C)は、実施の形態1の教師データの例を示す図(その1)である。図12(A)は、正常品を含む画像である。図12(B)は、検査対象品の一部が欠損していることを示している。図12(C)は、検査対象品の一部に傷が存在していることを示している。そのため、図12(B),(C)は、異常品を含む画像である。教師データには、正常品又は異常品の分類ラベルが付される。
分類予測部210は、教師データを用いて、検査対象品が正常品であるか異常品であるか、分類予測を行う。
分類予測と並行して、アテンションマップ170outを用いて、重み付き異常箇所抽出画像180outが生成される。そして、判定部190は、重み付き異常箇所抽出画像180outに基づいて、検査対象品が異常であるか否かを判定する。
2か所の学習誤差が、それぞれ異常分類損失2、異常分類損失1と定義された場合、損失関数は、式(1)のように表現される。
損失関数=異常分類損失1+異常分類損失2 …(1)
そして、アテンションマップ生成部170のConv部171、Conv部172、Conv部173、及び判定部190の全結合層191が、誤差逆伝搬法により、学習される。
また、教師データには、次のような画像が含まれてもよい。
図13(A)~(C)は、実施の形態1の教師データの例を示す図(その2)である。図13(A)は、検査対象品の検査対象箇所が存在する画像である。図13(B)は、検査対象箇所の側面部分が無い画像である。当該画像は、加工により得ることができる。図13(C)は、検査対象品が存在しない画像である。そのため、図13(B),(C)は、検査対象箇所が存在しない画像である。また、教師データには、分類ラベルが付される。
アテンションマップ生成部170及び判定部190が、このような教師データを用いて、学習されてもよい。
1つの学習データ(すなわち、画像)に対して、検査対象箇所有り又は無しの分類ラベルと、正常品又は異常品の分類ラベルとの2種類の分類ラベルが、用いられる。2種類の分類ラベルが、用いられる場合、損失関数は、式(2)のように表現される。
損失関数=異常分類損失1+検査対象箇所有無分類損失 …(2)
そして、アテンションマップ生成部170のConv部171、Conv部172、Conv部173、及び判定部190の全結合層191が、誤差逆伝搬法により、学習される。
このように、検出生成部160、アテンションマップ生成部170、判定部190は、学習される。
実施の形態1によれば、情報処理装置100は、アテンションマップ170outが示す注目領域に対応する異常箇所抽出画像160outの画像領域に、重みを付けることで、検査対象領域又は検査対象部位を強調する。重み付け後の検査対象品以外の領域又は検査対象部位以外の領域の画素値は、検査対象領域の画素値に対して相対的に小さい。そのため、検査対象品以外の領域又は検査対象部位以外の領域がマスクされる効果が得られる。そのため、情報処理装置100は、検査対象品を判定する際、学習時にはなかった背景パターンなどの影響を受けずに、判定を行う。つまり、情報処理装置100は、重み付けされた画像領域に対して、判定を行う。そのため、情報処理装置100は、誤判定を抑制できる。そして、情報処理装置100は、高精度な判定を行うことができる。
また、アテンションマップ生成部170は、複数の畳み込み層のうち、最も深い層から出力された特徴マップがリサイズされた特徴マップに基づいて、アテンションマップを生成してもよい。最も深い層から出力された特徴マップは、広い領域の特徴を示す特徴マップである。当該特徴マップに基づいて生成された当該アテンションマップが用いられることにより、検査対象品以外の領域又は検査対象部位以外の領域がマスクされる効果が高くなる。
アテンションマップ生成部170が学習されるとき、欠損、傷などを含む画像が、学習データとして用いられる。そのため、アテンションマップ170outでは、欠損、傷などの異常箇所が、注目領域とされる。そして、情報処理装置100は、注目領域に対応する画像領域に重みを付ける。これにより、異常箇所が、強調される。そのため、情報処理装置100は、容易に、異常箇所を含む検査対象品を異常品と判定できる。
特徴マップ生成部130は、予め決められた層から、特徴マップを出力する。出力される特徴マップは、効果がある特徴マップである。よって、情報処理装置100は、効果がある特徴マップ130outを得ることができる。
表示制御部200は、重み付き異常箇所抽出画像180outを画像10に重畳することにより得られる画像を生成する。当該画像は、可視化された画像である。表示制御部200は、情報処理装置100のディスプレイに当該画像を表示する。これにより、ユーザは、異常箇所を容易に認識できる。
実施の形態2.
次に、実施の形態2を説明する。実施の形態2では、実施の形態1と相違する事項を主に説明する。そして、実施の形態2では、実施の形態1と共通する事項の説明を省略する。
図14は、実施の形態2の情報処理装置の機能を示すブロック図である。図14では、画像10、記憶部110、及び取得部120が、省略されている。
情報処理装置100は、アテンションマップ生成部170a,170b,170c、及びリサイズ結合部220を有する。
アテンションマップ生成部170aは、特徴マップ130out1に基づいて、アテンションマップを生成する。ここで、特徴マップ130out1は、入力層に近い畳み込み層から出力された特徴マップである。そのため、当該アテンションマップは、局所的な特徴を高解像度で表現したアテンションマップである。当該アテンションマップを用いることで、微小な傷、欠損箇所などが、注目領域とされる。当該アテンションマップは、h1×w1×1で表される。
アテンションマップ生成部170bは、特徴マップ130out2に基づいて、アテンションマップを生成する。当該アテンションマップは、h2×w2×1で表される。
アテンションマップ生成部170cは、特徴マップ130out3に基づいて、アテンションマップを生成する。ここで、特徴マップ130out3は、入力層から遠い畳み込み層から出力される特徴マップである。特徴マップ130out3は、画像全体を俯瞰した高いレベルの多彩な特徴量を有している。そのため、当該アテンションマップを用いることで、検査対象品又は検査対象領域のような大きな領域が、注目領域とされる。当該アテンションマップは、h3×w3×1で表される。
このように、3つのアテンションマップが、生成される。3つのアテンションマップのそれぞれは、注目領域を含むヒートマップである。
上記では、アテンションマップ生成部の数が3つである場合を説明した。アテンションマップ生成部の数は、1つでもよい。そして、1つのアテンションマップ生成部(例えば、アテンションマップ生成部170)は、3つの特徴マップに基づいて、3つのアテンションマップを生成してもよい。
次に、リサイズ結合部220の機能を説明する。
図15は、実施の形態2のリサイズ結合部の機能を示すブロック図である。リサイズ結合部220は、リサイズ部221と結合部222とを有する。リサイズ部221は、第2のリサイズ部とも言う。結合部222は、第2の結合部とも言う。
リサイズ部221は、3つのアテンションマップのそれぞれのサイズが異なるため、3つのアテンションマップを同じサイズにリサイズする。リサイズされたアテンションマップは、h4×w4×1で表される。
結合部222は、リサイズされた3つのアテンションマップを結合する。結合部222を詳細に説明する。結合部222は、Conv部222a,222b,222c、及び結合部222dを有する。
Conv部222a,222b,222cは、1×1の畳み込み処理を行う。なお、畳み込み処理の際のストライドを1とすることで、入力されるアテンションマップと同じサイズのアテンションマップが、出力される。
結合部222dは、3つのアテンションマップを結合する。詳細には、結合部222dは、各アテンションマップの画素値を画素単位で足し合わせ、アテンションマップ内における画素の最大値が255になるように正規化を行う。これにより、結合することにより得られたアテンションマップである結合アテンションマップ220outが、出力される。
重み付け生成部180は、結合アテンションマップ220outが示す注目領域に対応する異常箇所抽出画像160outの画像領域に、重みを付けられた重み付き異常箇所抽出画像180outを生成する。
実施の形態2における判定部190と表示制御部200との処理は、実施の形態1と同じなので、説明を省略する。
ここで、学習時では、アテンションマップ生成部170a,170b,170cのそれぞれに対応する分類予測部が、存在する。各分類予測部は、実施の形態1と同様に、学習する。損失関数を用いる点、及び判定部190と合わせて同時に学習する点も実施の形態1と同じである。また、入力層に近い畳み込み層から出力された特徴マップを用いるアテンションマップ生成部の学習は、局所的特徴を高解像度で捉えやすいので、正常品、異常品の分類用教師データを用いて、行われてもよい。一方、入力層から遠い畳み込み層から出力された特徴マップを用いるアテンションマップ生成部の学習は、画像全体を俯瞰して注目領域を捉えやすいので、検査対象箇所の有無を示す教師データを用いて、行われてもよい。このように学習を行うことで、微小傷などの細かく弱い異常特徴を有する異常箇所、及び検査対象箇所領域、又は検査対象品領域のような大きな領域を注目領域とする結合アテンションマップ220outが、生成可能になる。
また、入力層に近い畳み込み層から出力された特徴マップを用いるアテンションマップ生成部の学習は、検査対象箇所の有無を示す教師データを用いて、行われてもよい。このように学習を行うことで、検査対象領域又は検査対象品を高解像度で注目領域とする結合アテンションマップ220outが、生成可能になる。
実施の形態2によれば、情報処理装置100は、微小傷などの細かく弱い異常特徴を有する異常箇所、及び検査対象箇所領域、又は検査対象品領域のような大きな領域を注目領域とする結合アテンションマップ220outを生成する。このように、情報処理装置100は、異なる性質が融合された結合アテンションマップ220outを生成する。そのため、情報処理装置100は、様々な観点から検査対象品を判定できる。なお、どのアテンションマップをどのくらいの割合で融合させるかは、学習フェーズで調整される。
また、情報処理装置100は、検査対象領域又は検査対象品を高解像度で注目領域とする結合アテンションマップ220outすることもできる。
実施の形態3.
次に、実施の形態3を説明する。実施の形態3では、実施の形態2と相違する事項を主に説明する。そして、実施の形態3では、実施の形態2と共通する事項の説明を省略する。
図16は、実施の形態3の情報処理装置の機能を示すブロック図である。図16では、画像10、記憶部110、及び取得部120が、省略されている。
情報処理装置100は、重み付け生成部180a,180b,180c、及びリサイズ部230を有する。
リサイズ部230は、リサイズ部221と同じ機能を有する。リサイズ部230は、3つのアテンションマップのそれぞれのサイズが異なるため、3つのアテンションマップを同じサイズにリサイズする。リサイズされたアテンションマップは、h4xw4×1で表される。ここで、リサイズ部230は、第2のリサイズ部とも言う。
重み付け生成部180aは、アテンションマップ生成部170aにより生成され、かつリサイズされたアテンションマップが示す注目領域に対応する異常箇所抽出画像160outの画像領域に、重みを付けられた重み付き異常箇所抽出画像180out1を生成する。
重み付け生成部180bは、アテンションマップ生成部170bにより生成され、かつリサイズされたアテンションマップが示す注目領域に対応する異常箇所抽出画像160outの画像領域に、重みを付けられた重み付き異常箇所抽出画像180out2を生成する。
重み付け生成部180cは、アテンションマップ生成部170cにより生成され、かつリサイズされたアテンションマップが示す注目領域に対応する異常箇所抽出画像160outの画像領域に、重みを付けられた重み付き異常箇所抽出画像180out3を生成する。
上記では、3つの重み付け生成部が、3つの重み付き異常箇所抽出画像を生成する場合を説明した。1つの重み付け生成部が、3つの重み付き異常箇所抽出画像を生成してもよい。例えば、1つの重み付け生成部(例えば、重み付け生成部180)は、リサイズされたアテンションマップ毎に、リサイズされたアテンションマップが示す注目領域に対応する異常箇所抽出画像の画像領域に、重みを付けられた重み付き異常箇所抽出画像を生成する。
判定部190は、重み付き異常箇所抽出画像180out1のうち、重み付けされた画像領域を判定対象領域として、検査対象品が異常であるか否かを判定する。
判定部190は、重み付き異常箇所抽出画像180out2のうち、重み付けされた画像領域を判定対象領域として、検査対象品が異常であるか否かを判定する。
判定部190は、重み付き異常箇所抽出画像180out3のうち、重み付けされた画像領域を判定対象領域として、検査対象品が異常であるか否かを判定する。
ここで、判定部190は、次のような機能を有してもよい。
図17は、実施の形態3の判定部の機能を示すブロック図である。判定部190は、ReLU部193、Max pool部194、fc2部195、及びsoftmax部196を有する。
ReLU部193に対する入力サイズは、w4×h4×Nである。Nは、重み付き異常箇所抽出画像の数である。図16の例の場合、Nは、3である。
Max pool部194では、重み付き異常箇所抽出画像のそれぞれの最大画素値が、画像の代表として出力される。出力される情報は、1×1×N個の情報と表現される。
出力された情報が、fc2部195、及びsoftmax部196を経由することで、正常クラス及び異常クラスの確率値が、出力される。確率値が高い方の分類クラスが、判定結果として出力される。
表示制御部200は、重み付き異常箇所抽出画像180out1を画像10に重畳することにより得られる画像を生成する。表示制御部200は、情報処理装置100のディスプレイに当該画像を表示する。
表示制御部200は、重み付き異常箇所抽出画像180out2を画像10に重畳することにより得られる画像を生成する。表示制御部200は、情報処理装置100のディスプレイに当該画像を表示する。
表示制御部200は、重み付き異常箇所抽出画像180out3を画像10に重畳することにより得られる画像を生成する。表示制御部200は、情報処理装置100のディスプレイに当該画像を表示する。
表示制御部200は、重み付き異常箇所抽出画像180out1,180out2,180out3を画像10に重畳することにより得られる画像を生成してもよい。なお、重み付き異常箇所抽出画像のそれぞれの重畳比率は、ユーザによって設定されてもよい。
アテンションマップ生成部170、及び判定部190の学習方法は、実施の形態2に記載された内容と同様に行われる。
実施の形態3によれば、情報処理装置100は、アテンションマップ生成部170a~170cのそれぞれにより生成され、かつリサイズされたアテンションマップに基づいた判定を行うことができる。
実施の形態4.
次に、実施の形態4を説明する。実施の形態4では、実施の形態1と相違する事項を主に説明する。そして、実施の形態4では、実施の形態1と共通する事項の説明を省略する。
図18は、実施の形態4の情報処理装置の機能を示すブロック図である。情報処理装置100は、検出生成部240及びマスク処理部250を有する。
実施の形態4の情報処理装置100は、アテンションマップ生成部170及び重み付け生成部180を有していない。
検出生成部240及びマスク処理部250を詳細に説明する。
図19は、実施の形態4の検出生成部の機能を説明するための図である。検出生成部240は、検出部241及びマスク情報生成部242を有する。
検出部241は、画像10に基づいて、検査対象品又は検査対象品の検索対象部位を検出する。例えば、検出部241は、Yolov2、Yolov3、又はYolov4を用いて、検査対象品又は当該検索対象部位を検出する。検出部241は、次のような教師データを用いて、学習されてもよい。
図20は、実施の形態4の教師データの例を示す図である。図20は、教師データである画像20を示している。画像20は、検査対象品を含む画像である。検索対象部位には、矩形バウンディングボックス(BBOX)が、ラベリングされる。検出部241は、画像20を用いて学習を行った場合、検索対象部位を検出できる。
マスク情報生成部242は、画像10のうち、検査対象品以外の領域又は検索対象部位以外の領域をマスクさせるための情報であるマスク情報を生成する。具体的には、マスク情報は、検査対象品の領域又は検索対象部位の領域に対する重みが“1”であることを示す。また、マスク情報は、検査対象品以外の領域又は検索対象部位以外の領域に対する重みが“0”であることを示す。
マスク処理部250は、マスク情報に基づいて、画像10のうち、検査対象品以外の領域又は検索対象部位以外の領域をマスクする。詳細には、マスク処理部250は、検査対象品の領域又は検索対象部位の領域の画素値に重み“1”を乗算する。マスク処理部250は、検査対象品以外の領域又は検索対象部位の領域以外の画素値に重み“0”を乗算する。これにより、検査対象品以外の領域又は検索対象部位以外の領域が、マスクされる。
図18に戻って、処理を説明する。
特徴マップ生成部130は、マスクされた画像10に基づいて、特徴マップを生成する。これにより、特徴マップ130outが、出力される。
リサイズ部140は、複数の特徴マップのサイズを同じサイズにリサイズする。リサイズされた特徴マップのサイズは、h4×w4のサイズである。
結合部150は、リサイズされた複数の特徴マップをチャンネル方向に結合する。これにより、結合することにより得られた特徴マップ150outが、出力される。また、特徴マップ150outのチャンネル数は、ch4(ch4=ch1、ch2、及びch3)となる。
検出生成部160は、特徴マップ150outに基づいて、異常度を検出する。検出生成部160は、異常度に基づいて、異常箇所抽出画像160outを生成する。
判定部190は、異常箇所抽出画像160outに基づいて、検査対象品が異常であるか否かを判定する。例えば、判定部190は、異常箇所抽出画像160outの最大の画素値と予め設定された閾値とを比較する。判定部190は、最大の画素値が当該閾値を超える場合、検査対象品が異常であると判定する。また、判定部190は、図10に示す機能を用いて、検査対象品が異常であるか否かを判定してもよい。
表示制御部200は、異常箇所抽出画像160outを画素値に応じた色に変える。これにより、異常箇所抽出画像160outは、ヒートマップのようになる。表示制御部200は、異常箇所抽出画像160outを画像10に重畳し、重畳により得られた画像を表示するための制御を実行する。
なお、出力される特徴マップの数が1つである場合、情報処理装置100は、リサイズ部140及び結合部150を有さない。情報処理装置100がリサイズ部140及び結合部150を有さない場合、検出生成部160は、特徴マップ130outに基づいて、異常度を検出する。
ここで、検出生成部160、検出部241、及び判定部190の学習について説明する。また、判定部190が図10に示す機能を有する場合、学習が、行われる。
図21は、実施の形態4の学習処理の例を示すフローチャートである。
(ステップS31)検出生成部160の学習が、行われる。
(ステップS32)検出部241の学習が、行われる。
(ステップS33)判定部190の学習が、行われる。判定部190の学習では、学習済の検出生成部160と検出部241と用いて、判定部190の学習が、行われる。
また、ステップS31は、ステップS32の後に実行されてもよい。
実施の形態4によれば、情報処理装置100は、検査対象品以外の領域又は検索対象部位以外の領域がマスクされている異常箇所抽出画像160outを用いて、判定を行う。そのため、情報処理装置100は、誤判定を抑制できる。そして、情報処理装置100は、高精度な判定を行うことができる。
また、検出部241の学習は、比較的短時間で終わらせることができる。特徴マップ生成部130、検出生成部160、及び判定部190は、比較的小さいメモリで、少ない処理負荷で実施する。そのため、情報処理装置100は、安価なハードウェアで実現できる。
実施の形態5.
次に、実施の形態5を説明する。実施の形態5では、実施の形態1と相違する事項を主に説明する。そして、実施の形態5では、実施の形態1と共通する事項の説明を省略する。
図22は、実施の形態5の情報処理装置の機能を示すブロック図である。情報処理装置100は、検出部260及び画像生成部270を有する。なお、実施の形態5の情報処理装置100は、アテンションマップ生成部170及び重み付け生成部180を有していない。
検出部260は、画像10に基づいて、検査対象品又は検査対象品の検索対象部位を検出する。例えば、検出部260は、Yolov2、Yolov3、又はYolov4を用いて、検査対象品又は当該検索対象部位を検出する。検出部260は、検出部241と同じように、学習されてもよい。
画像生成部270は、検出された検査対象品を示す情報又は検索対象部位を示す情報と、画像10とに基づいて、画像10の中から、検査対象品以外の領域又は検索対象部位以外の領域を除外することにより得られた画像である検査対象画像を生成する。これにより、検査対象品又は検索対象部位のみが存在する画像が、生成される。
特徴マップ生成部130は、検査対象画像に基づいて、特徴マップを生成する。これにより、特徴マップ130outが、出力される。
リサイズ部140は、複数の特徴マップのサイズを同じサイズにリサイズする。リサイズされた特徴マップのサイズは、h4×w4のサイズである。
結合部150は、リサイズされた複数の特徴マップをチャンネル方向に結合する。これにより、結合することにより得られた特徴マップ150outが、出力される。また、特徴マップ150outのチャンネル数は、ch4(ch4=ch1、ch2、及びch3)となる。
検出生成部160は、特徴マップ150outに基づいて、異常度を検出する。検出生成部160は、異常度に基づいて、異常箇所抽出画像160outを生成する。
判定部190は、異常箇所抽出画像160outに基づいて、検査対象品が異常であるか否かを判定する。例えば、判定部190は、異常箇所抽出画像160outの最大の画素値と予め設定された閾値とを比較する。判定部190は、最大の画素値が当該閾値を超える場合、検査対象品が異常であると判定する。また、判定部190は、図10に示す機能を用いて、検査対象品が異常であるか否かを判定してもよい。
表示制御部200は、異常箇所抽出画像160outを画素値に応じた色に変える。これにより、異常箇所抽出画像160outは、ヒートマップのようになる。表示制御部200は、異常箇所抽出画像160outを画像10に重畳し、重畳により得られた画像を表示するための制御を実行する。
なお、出力される特徴マップの数が1つである場合、情報処理装置100は、リサイズ部140及び結合部150を有さない。情報処理装置100がリサイズ部140及び結合部150を有さない場合、検出生成部160は、特徴マップ130outに基づいて、異常度を検出する。
ここで、検出生成部160、検出部260、及び判定部190の学習について説明する。また、判定部190が図10に示す機能を有する場合、学習が、行われる。
図23は、実施の形態5の学習処理の例を示すフローチャートである。
(ステップS41)検出生成部160の学習が、行われる。
(ステップS42)検出部260の学習が、行われる。
(ステップS43)判定部190の学習が、行われる。判定部190の学習では、学習済の検出生成部160と検出部260と用いて、判定部190の学習が、行われる。
また、ステップS41は、ステップS42の後に実行されてもよい。
実施の形態5によれば、情報処理装置100は、検査対象品以外の領域又は検索対象部位以外の領域が除去されている異常箇所抽出画像160outを用いて、判定を行う。そのため、情報処理装置100は、誤判定を抑制できる。そして、情報処理装置100は、高精度な判定を行うことができる。
また、検査対象画像には、検査対象品又は検索対象部位のみが存在する。そのため、情報処理装置100は、検査対象画像の画像サイズを小さくしてもよい。画像サイズが小さくされた場合、特徴マップ生成部130の処理よりも後に行われる処理の負荷が、軽減される。
また、検出部260の学習は、比較的短時間で終わらせることができる。特徴マップ生成部130、検出生成部160、及び判定部190は、比較的小さいメモリで、少ない処理負荷で実施する。そのため、情報処理装置100は、安価なハードウェアで実現できる。
以上に説明した各実施の形態における特徴は、互いに適宜組み合わせることができる。
10 画像、 20 画像、 100 情報処理装置、 101 プロセッサ、 102 揮発性記憶装置、 103 不揮発性記憶装置、 110 記憶部、 120 取得部、 130 特徴マップ生成部、 130out,130out1,130out2,130out3 特徴マップ、 140 リサイズ部、 150 結合部、 150out 特徴マップ、 160 検出生成部、 160out 異常箇所抽出画像、 170,170a,170b,170c アテンションマップ生成部、 170out アテンションマップ、 171 Conv部、 172 Conv部、 173 Conv部、 174 Sigmoid部、 180,180a,180b,180c 重み付け生成部、 180out,180out1,180out2,180out3 重み付き異常箇所抽出画像、 190 判定部、 191 全結合層、 192 softmax、 193 ReLU部、 194 Max pool部、 195 fc2部、 196 softmax部、 200 表示制御部、 210 分類予測部、 211 Conv部、 212 GAP層、 213 softmax部、 220 リサイズ結合部、 220out 結合アテンションマップ、 221 リサイズ部、 222 結合部、 222a,222b,222c Conv部、 222d 結合部、 230 リサイズ部、 240 検出生成部、 241 検出部、 242 マスク情報生成部、 250 マスク処理部、 260 検出部、 270 画像生成部。

Claims (11)

  1. 検査対象品を含む画像を取得する取得部と、
    前記画像に基づいて、特徴マップを生成する特徴マップ生成部と、
    前記特徴マップに基づいて、正常品の特徴量によって表現される空間である正常空間からの逸脱度を、異常度として検出し、前記異常度に基づいて、異常箇所抽出画像を生成する検出生成部と、
    前記特徴マップに基づいて、前記検査対象品又は前記検査対象品の検査対象部位を示す領域である注目領域を含むヒートマップであるアテンションマップを生成するアテンションマップ生成部と、
    前記アテンションマップが示す前記注目領域に対応する前記異常箇所抽出画像の画像領域に、重みを付けられた重み付き異常箇所抽出画像を生成する重み付け生成部と、
    前記重み付き異常箇所抽出画像のうち、重み付けされた画像領域を判定対象領域として、前記検査対象品が異常であるか否かを判定する判定部と、
    を有する情報処理装置。
  2. 第1のリサイズ部と、
    第1の結合部と、
    をさらに有し、
    前記特徴マップ生成部は、複数の畳み込み層を構成し、前記複数の畳み込み層のうち、予め定められた複数の畳み込み層から、前記画像に基づく複数の特徴マップを出力し、
    前記第1のリサイズ部は、前記複数の特徴マップのサイズを同じサイズにリサイズし、
    前記第1の結合部は、リサイズされた前記複数の特徴マップをチャンネル方向に結合し、
    前記検出生成部は、結合することにより得られた特徴マップに基づいて、前記異常度を検出し、
    前記予め定められた複数の畳み込み層のそれぞれは、多くの特徴量を示す特徴マップを出力する層である、
    請求項1に記載の情報処理装置。
  3. 前記アテンションマップ生成部は、リサイズされた前記複数の特徴マップのうちのいずれか1つの特徴マップに基づいて、前記アテンションマップを生成する、
    請求項2に記載の情報処理装置。
  4. 前記アテンションマップ生成部は、前記複数の畳み込み層のうち、最も深い層から出力された特徴マップがリサイズされた特徴マップに基づいて、前記アテンションマップを生成する、
    請求項2または3に記載の情報処理装置。
  5. 第1のリサイズ部と、
    第1の結合部と、
    第2のリサイズ部と、
    第2の結合部と、
    をさらに有し、
    前記特徴マップ生成部は、複数の畳み込み層を構成し、前記複数の畳み込み層のうち、予め定められた複数の畳み込み層から、前記画像に基づく複数の特徴マップを出力し、
    前記第1のリサイズ部は、前記複数の特徴マップのサイズを同じサイズにリサイズし、
    前記第1の結合部は、リサイズされた前記複数の特徴マップをチャンネル方向に結合し、
    前記検出生成部は、結合することにより得られた特徴マップに基づいて、前記異常度を検出し、
    前記アテンションマップ生成部は、前記複数の特徴マップに基づいて、複数のアテンションマップを生成し、
    前記第2のリサイズ部は、前記複数のアテンションマップのサイズを同じサイズにリサイズし、
    前記第2の結合部は、リサイズされた前記複数のアテンションマップを結合し、
    前記重み付け生成部は、結合することにより得られたアテンションマップである結合アテンションマップが示す前記注目領域に対応する前記異常箇所抽出画像の画像領域に、重みを付けられた重み付き異常箇所抽出画像を生成し、
    前記複数のアテンションマップのそれぞれは、前記注目領域を含むヒートマップである、
    請求項1に記載の情報処理装置。
  6. 第1のリサイズ部と、
    第1の結合部と、
    第2のリサイズ部と、
    をさらに有し、
    前記特徴マップ生成部は、複数の畳み込み層を構成し、前記複数の畳み込み層のうち、予め定められた複数の畳み込み層から、前記画像に基づく複数の特徴マップを出力し、
    前記第1のリサイズ部は、前記複数の特徴マップのサイズを同じサイズにリサイズし、
    前記第1の結合部は、リサイズされた前記複数の特徴マップをチャンネル方向に結合し、
    前記検出生成部は、結合することにより得られた特徴マップに基づいて、前記異常度を検出し、
    前記アテンションマップ生成部は、前記複数の特徴マップに基づいて、複数のアテンションマップを生成し、
    前記第2のリサイズ部は、前記複数のアテンションマップのサイズを同じサイズにリサイズし、
    前記重み付け生成部は、リサイズされた前記アテンションマップ毎に、リサイズされた前記アテンションマップが示す前記注目領域に対応する前記異常箇所抽出画像の画像領域に、重みを付けられた重み付き異常箇所抽出画像を生成し、
    前記判定部は、生成された前記重み付き異常箇所抽出画像毎に、前記重み付き異常箇所抽出画像のうち、重み付けされた画像領域を判定対象領域として、前記検査対象品が異常であるか否かを判定し、
    前記複数のアテンションマップのそれぞれは、前記注目領域を含むヒートマップである、
    請求項1に記載の情報処理装置。
  7. 前記重み付き異常箇所抽出画像をヒートマップとして、前記重み付き異常箇所抽出画像を前記画像に重畳し、重畳により得られた画像を表示するための制御を実行する表示制御部をさらに有する、
    請求項1又は2に記載の情報処理装置。
  8. 検査対象品を含む画像を取得する取得部と、
    前記画像に基づいて、前記検査対象品又は前記検査対象品の検索対象部位を検出する検出部と、
    前記画像のうち、前記検査対象品以外の領域又は前記検索対象部位以外の領域をマスクさせるための情報であるマスク情報を生成するマスク情報生成部と、
    前記マスク情報に基づいて、前記画像のうち、前記検査対象品以外の領域又は前記検索対象部位以外の領域をマスクするマスク処理部と、
    マスクされた前記画像に基づいて、特徴マップを生成する特徴マップ生成部と、
    前記特徴マップに基づいて、正常品の特徴量によって表現される空間である正常空間からの逸脱度を、異常度として検出し、前記異常度に基づいて、異常箇所抽出画像を生成する検出生成部と、
    前記異常箇所抽出画像に基づいて、前記検査対象品が異常であるか否かを判定する判定部と、
    を有する情報処理装置。
  9. 検査対象品を含む画像を取得する取得部と、
    前記画像に基づいて、前記検査対象品又は前記検査対象品の検索対象部位を検出する検出部と、
    検出された前記検査対象品を示す情報又は前記検索対象部位を示す情報と、前記画像とに基づいて、前記画像の中から、前記検査対象品以外の領域又は前記検索対象部位以外の領域を除外することにより得られた画像である検査対象画像を生成する画像生成部と、
    前記検査対象画像に基づいて、特徴マップを生成する特徴マップ生成部と、
    前記特徴マップに基づいて、正常品の特徴量によって表現される空間である正常空間からの逸脱度を、異常度として検出し、前記異常度に基づいて、異常箇所抽出画像を生成する検出生成部と、
    前記異常箇所抽出画像に基づいて、前記検査対象品が異常であるか否かを判定する判定部と、
    を有する情報処理装置。
  10. リサイズ部と、
    結合部と、
    をさらに有し、
    前記特徴マップ生成部は、複数の畳み込み層を構成し、前記複数の畳み込み層のうち、予め定められた複数の畳み込み層から、マスクされた前記画像又は前記検査対象画像に基づく複数の特徴マップを出力し、
    前記リサイズ部は、前記複数の特徴マップのサイズを同じサイズにリサイズし、
    前記結合部は、リサイズされた前記複数の特徴マップをチャンネル方向に結合し、
    前記検出生成部は、結合することにより得られた特徴マップに基づいて、前記異常度を検出し、
    前記予め定められた複数の畳み込み層のそれぞれは、多くの特徴量を示す特徴マップを出力する層である、
    請求項8又は9に記載の情報処理装置。
  11. 前記異常箇所抽出画像の画素値に応じた色に前記異常箇所抽出画像を変えることにより得られた前記異常箇所抽出画像をヒートマップとして、前記異常箇所抽出画像を前記画像に重畳し、重畳により得られた画像を表示するための制御を実行する表示制御部をさらに有する、
    請求項8又は9に記載の情報処理装置。
JP2023547256A 2022-12-14 2023-04-28 情報処理装置 Active JP7366325B1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2022046023 2022-12-14
JPPCT/JP2022/046023 2022-12-14
JP2023016861 2023-04-28

Publications (1)

Publication Number Publication Date
JP7366325B1 true JP7366325B1 (ja) 2023-10-20

Family

ID=88372791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023547256A Active JP7366325B1 (ja) 2022-12-14 2023-04-28 情報処理装置

Country Status (1)

Country Link
JP (1) JP7366325B1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021225097A1 (ja) 2020-05-02 2021-11-11 Arithmer株式会社 画像検査装置、画像検査方法及びプログラム
WO2022185432A1 (ja) 2021-03-03 2022-09-09 Heroz株式会社 画像認識学習システム、画像認識学習方法、画像認識学習プログラム、画像認識機械学習器、および画像認識システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021225097A1 (ja) 2020-05-02 2021-11-11 Arithmer株式会社 画像検査装置、画像検査方法及びプログラム
WO2022185432A1 (ja) 2021-03-03 2022-09-09 Heroz株式会社 画像認識学習システム、画像認識学習方法、画像認識学習プログラム、画像認識機械学習器、および画像認識システム

Similar Documents

Publication Publication Date Title
US10860879B2 (en) Deep convolutional neural networks for crack detection from image data
US11714397B2 (en) System and method for generating machine learning model with trace data
CN111339858B (zh) 一种基于神经网络的油气管道标志物识别方法
US11010838B2 (en) System and method for optimizing damage detection results
JP2018534694A (ja) 物体検出のためのサブカテゴリ認識機能付き畳み込みニューラルネットワーク
US20120027288A1 (en) Methods, Systems and Apparatus for Defect Detection
US20210350521A1 (en) Method for computer-implemented determination of blade-defects of a wind turbine
KR20210150970A (ko) 약한 라벨링을 사용한 반도체 시편들에서의 결함들의 검출
JP4982213B2 (ja) 欠陥検査装置及び欠陥検査方法
Dong et al. Defect classification and detection using a multitask deep one-class CNN
JP2020119154A (ja) 情報処理装置、情報処理方法、及びプログラム
Avola et al. Real-time deep learning method for automated detection and localization of structural defects in manufactured products
US11663815B2 (en) System and method for inspection of heat recovery steam generator
JP7366325B1 (ja) 情報処理装置
JP2023145412A (ja) 欠陥検出方法及びシステム
Guo et al. Rail Surface Defect Detection Using A Transformer-Based Network
Stefenon et al. Hypertuned-YOLO for interpretable distribution power grid fault location based on EigenCAM
KR20220143119A (ko) 인지 시스템용 훈련 데이터 후보의 자동 식별
CN113591645A (zh) 一种基于区域卷积神经网络的电力设备红外图像识别方法
Yasuno et al. One-class steel detector using patch GAN discriminator for visualising anomalous feature map
Zhou et al. CABF-YOLO: a precise and efficient deep learning method for defect detection on strip steel surface
Dini et al. Visual Anomaly Detection and Localization with a Patch-Wise Transformer and Convolutional Model
KR102542505B1 (ko) 학습데이터 생성 방법, 장치, 프로그램 및 이를 이용한 이물질 검출 방법
Yang et al. Deep feature inpainting for unsupervised visual anomaly detection
WO2022172468A1 (ja) 画像検査装置、画像検査方法及び学習済みモデル生成装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230803

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230803

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230803

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230912

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231010

R150 Certificate of patent or registration of utility model

Ref document number: 7366325

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150