WO2022259661A1

WO2022259661A1 - 学習装置、学習プログラム、異常検出装置、および異常検出プログラム

Info

Publication number: WO2022259661A1
Application number: PCT/JP2022/010216
Authority: WO
Inventors: 貴一奥野; 智也岡▲崎▼
Original assignee: コニカミノルタ株式会社
Priority date: 2021-06-09
Filing date: 2022-03-09
Publication date: 2022-12-15
Also published as: JPWO2022259661A1

Abstract

【課題】正常画像のバリエーションが正規分布以外の分布に基づく場合であっても、正常画像の復元精度が低下することを防止できる、学習装置、学習プログラム、異常検出装置、および異常検出プログラムを提供する。【解決手段】学習装置は、データ取得部２１０、エンコーダー部２２１、ノイズ付加部２３０、デコーダー部２２３、および学習部２４０を有する。データ取得部２１０は、検査対象の正常データからなる訓練データを取得する。エンコーダー部２２１は、訓練データの特徴量を抽出する。ノイズ付加部２３０は、特徴量にノイズを付加する。デコーダー部２２３は、ノイズが付加された特徴量から訓練データを復元する。学習部２４０は、訓練データと、デコーダー部２２３によって復元された復元データとに基づいて、エンコーダー部２２１およびデコーダー部２２３のパラメーターを更新する。

Description

学習装置、学習プログラム、異常検出装置、および異常検出プログラム

　本発明は、学習装置、学習プログラム、異常検出装置、および異常検出プログラムに関する。

　近年、ニューラルネットワークに検査対象の画像の特徴量を学習させて学習済みモデルを生成し、この学習済みモデルを使用して検査対象の検査を行う、機械学習による検査方法が提案されている。

　例えば、このような検査方法として、標準的な学習を行った異常検出器と、現場環境で学習させた異常検出器とを用意し、両者の検出結果に基づいて、検査対象の異常を判定する異常検出システムが知られている。しかし、検査対象が正常である場合に比べて、検査対象に異常が含まれている頻度は低いことが多いので、検査対象に異常が含まれている画像データを十分に準備することは難しい。そこで、正常な検査対象の画像（以下、「正常画像」ともいう）を訓練データとして学習することで得られた学習済みモデルに、検査対象の画像を入力し、入出力のデータを比較することで検査対象の異常を検出する技術が提案されている。

　これに関連して、下記特許文献１には、学習対象の正常画像のバリエーションが正規分布に基づいて生成された前提で損失関数を設計し、同時確率モデルを学習する技術が開示されている。

特開２０２０－１１９６０５号公報

　しかし、この技術では、同時確率モデルにおいて特徴量の分布を学習する際に、既定分布と推測分布のカルバック・ライブラ・ダイバージェンス（ＫＬＤ：Ｋｕｌｌｂａｃｋ-Ｌｅｉｂｌｅｒ　Ｄｉｖｅｒｇｅｎｃｅ）を最大化するように損失を設計する必要があり、正規分布以外の分布の損失設計が困難である。そのため、正常画像のバリエーションが正規分布以外の分布に基づく場合、正常画像の復元精度が低下する可能性がある。

　本発明は、このような問題を解決するためになされたものであり、画像のバリエーションが正規分布以外の分布に基づく場合であっても、画像の復元精度が低下することを防止できる、学習装置、学習プログラム、異常検出装置、および異常検出プログラムを提供することを目的とする。

　本発明の上記課題は、以下の手段によって解決される。

　（１）検査対象の正常データからなる訓練データを取得するデータ取得部と、前記データ取得部によって取得された訓練データの特徴量を抽出するエンコーダー部と、前記エンコーダー部によって抽出された特徴量にノイズを付加するノイズ付加部と、前記ノイズ付加部によってノイズが付加された前記特徴量から前記訓練データを復元するデコーダー部と、前記訓練データと、前記デコーダー部によって復元された復元データとに基づいて、前記エンコーダー部および前記デコーダー部のパラメーターを更新する学習部と、を有する、学習装置。

　（２）前記学習部は、前記訓練データを前記エンコーダー部に入力した場合に、前記デコーダー部による復元データが正常データとなるように、前記エンコーダー部および前記デコーダー部のパラメーターを更新することにより、前記エンコーダー部および前記デコーダー部を学習する、上記（１）に記載の学習装置。

　（３）前記ノイズ付加部は、所定の確率分布に従うノイズを付加する、上記（１）または（２）に記載の学習装置。

　（４）前記確率分布は、二項分布である、上記（３）に記載の学習装置。

　（５）前記正常データは、正常画像である、上記（１）～（４）のいずれか１つに記載の学習装置。

　（６）検査対象の正常データからなる訓練データを取得する取得ステップと、エンコーダー部によって前記訓練データの特徴量を抽出する抽出ステップと、前記抽出ステップにおいて抽出された特徴量にノイズを付加する付加ステップと、前記付加ステップにおいてノイズが付加された前記特徴量から、デコーダー部によって前記訓練データを復元する復元ステップと、前記訓練データと、前記復元ステップにおいて復元された復元データとに基づいて、前記エンコーダー部および前記デコーダー部のパラメーターを更新する更新ステップと、を含む処理をコンピューターに実行させるための学習プログラム。

　（７）検査対象のデータを取得するデータ取得部と、上記（１）～（５）のいずれか１つに記載の学習装置においてパラメーターが更新されたエンコーダー部およびデコーダー部と、前記エンコーダー部に入力される前記検査対象のデータと、前記デコーダー部によって復元される復元データとに基づいて、前記検査対象のデータの異常スコアを算出するスコア算出部と、前記スコア算出部によって算出された異常スコアに基づいて、前記検査対象の異常を判定する異常判定部と、を有する、異常検出装置。

　（８）前記スコア算出部は、前記検査対象のデータと、前記復元データとの差分を異常スコアとして算出する、上記（７）に記載の異常検出装置。

　（９）検査対象のデータを取得する取得ステップと、上記（１）～（５）のいずれか１つに記載の学習装置においてパラメーターが更新されたエンコーダー部により、前記検査対象のデータの特徴量を抽出する抽出ステップと、前記学習装置によって学習されたデコーダー部により、前記特徴量から前記検査対象のデータの復元する復元ステップと、前記検査対象のデータと、前記デコーダー部によって復元された復元データとに基づいて、前記検査対象のデータの異常スコアを算出する算出ステップと、前記算出ステップにおいて算出された異常スコアに基づいて、前記検査対象の異常を判定する判定ステップと、を含む処理をコンピューターに実行させるための異常検出プログラム。

　本発明によれば、エンコーダー部によって正常画像から抽出された特徴量にノイズを付加することにより、正常画像のバリエーションを増加させる。したがって、正常画像のバリエーションが正規分布以外の分布に基づく場合であっても、正常画像の復元精度が低下することを防止できる。

一実施形態に係る学習装置のハードウェア構成を例示する概略ブロック図である。図１に示す学習装置の制御部の主要な機能を例示する機能ブロック図である。図２に示す画像処理部の生成モデルの構造を説明するための模式図である。図１に示す学習装置の学習方法の処理手順を例示するフローチャートである。部品の製造および検査工程を例示する模式図である。図５に示す製造および検査工程について、ノイズ作成関数のコードの一例を示すリストである。人体の検査工程を例示する模式図である。図７に示す検査工程について、ノイズ作成関数のコードの一例を示すリストである。異常検出装置の制御部の主要な機能を例示する機能ブロック図である異常検出装置の異常検出方法の処理手順を例示するフローチャートである。

　以下、図面を参照して、本発明の実施形態に係る学習装置、学習プログラム、異常検出装置、および異常検出プログラムについて説明する。なお、図面において、同一の要素には同一の符号を付し、重複する説明を省略する。
　（学習装置）

　図１は一実施形態に係る学習装置のハードウェア構成を例示する概略ブロック図であり、図２は図１に示す学習装置の制御部の主要な機能を例示する機能ブロック図である。また、図３は、図２に示す画像処理部の生成モデルの構造を説明するための模式図である。

　学習装置１００は、検査対象の正常画像（例えば、工業製品の良品の画像）からなる訓練データを取得し、訓練データを使用して、ニューラルネットワークによって構成される生成モデルを学習する。後述する異常検出装置２００は、学習装置１００によって学習された学習済みモデルを使用して、検査対象の検査を行う。検査対象は、特に限定されるものではないが、例えば、工業製品に使用される部品等が挙げられる。検査には、折れ、曲げ、欠け、傷、および汚れ等の異常の検出が含まれる。

　図１に示すように、学習装置１００は、制御部１１０、通信部１２０、および操作表示部１３０を有する。これらの構成要素は、バス１０１を介して互いに接続される。学習装置１００は、例えば、パーソナルコンピューター、サーバー等のコンピューターでありうる。

　制御部１１０は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１１１、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１１２、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１１３、および補助記憶部１１４を有する。

　ＣＰＵ１１１は、ＲＡＭ１１２に展開されたＯＳ（Ｏｐｅｒａｔｉｎｇ　Ｓｙｓｔｅｍ）、学習プログラム等のプログラムを実行し、学習装置１００の動作制御を行う。学習プログラムは、ＲＯＭ１１３または補助記憶部１１４に予め保存されている。また、ＲＡＭ１１２は、ＣＰＵ１１１の処理によって一時的に生じたデータ等を格納する。ＲＯＭ１１３は、ＣＰＵ１１１によって実行されるプログラムや、プログラムの実行に使用されるデータ、パラメーター等を記憶する。補助記憶部１１４は、例えばＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等を有する。

　通信部１２０は、ネットワークを介して、外部の装置と通信するためのインターフェース回路（例えばＬＡＮカード等）である。

　操作表示部１３０は、入力部および出力部を有する。入力部は、例えば、キーボード、マウス等を備え、キーボード、マウス等による文字入力、各種設定等の各種指示（入力）をユーザーが行うために利用される。また、出力部は、ディスプレイを備え、訓練データ、復元画像、検査対象の検査結果等を表示する。また、出力部は、スピーカーを有し、検査結果を音声でユーザーに通知することもできる。

　また、図示を省略しているが、検査対象は、例えば、カメラ等の撮像装置によって撮影される。撮像装置は、撮影された正常な検査対象の画像データを学習装置１００に送信する。学習装置１００は、画像データを訓練データとして取得する。あるいは、撮像装置によって予め撮影された検査対象の正常画像は、学習装置１００の外部にある記憶装置に保存される。学習装置１００は、記憶装置に保存されている所定枚数の検査対象の正常画像を訓練データとして順次取得する。記憶装置には、複数（例えば、数十～数万枚）の正常画像からなる訓練データが保存されていることが望ましい。

　撮像装置は、例えば、検査対象が工業製品の部品である場合、検査工程に設置され、検査対象を包含する撮影範囲を撮影し、検査対象が含まれる画像のデータを出力する。撮像装置は、例えば、所定ピクセル（例えば、１２８ピクセル×１２８ピクセル）の検査対象の白黒画像またはカラー画像のデータを出力する。

　図２に示すように、制御部１１０は、ＣＰＵ１１１が学習プログラムを実行することにより、画像取得部２１０、画像処理部２２０、ノイズ付加部２３０、および学習部２４０として機能する。

　画像取得部２１０は、データ取得部として機能し、通信部１２０と協働することにより、訓練データを取得する。画像取得部２１０は、例えば、学習装置１００の外部の撮像装置または記憶装置から検査対象の訓練データを取得する。画像取得部２１０は、画像処理部２２０に訓練データを送信する。

　画像処理部２２０は、例えば、エンコーダー・デコーダー構造を有する生成モデルとして機能するニューラルネットワークを有する。ニューラルネットワークは、正常画像から特徴量を抽出し、抽出された特徴量に基づいて、正常画像の復元画像を生成する。

　より具体的には、図３に示すように、エンコーダー・デコーダー構造は、入力層、１層以上の中間層（隠れ層）、および出力層を有する。入力層および出力層におけるニューロン（演算ユニット（図中「〇」で示す））の個数（例えば、Ｍ個）は等しく、特定の中間層（同図では「接続層」と記載されている層）のニューロンの個数（例えば、Ｌ個）は入力層および出力層のニューロンの個数よりも少ない（すなわち、Ｍ＞Ｌ）。これにより、正常画像の特徴を表すためのニューロンの個数、すなわち次元数が削減される。入力層から接続層まではエンコーダー２２１であり、接続層から出力層まではデコーダー２２３である。正常画像の特徴は、接続層において、特徴量２２２として取り出すことができる。特徴量２２２は、例えば、ベクトルで表されうる。

　ノイズ付加部２３０は、エンコーダー２２１によって抽出された正常画像の特徴量２２２に対してノイズを付加する。本実施形態では、ノイズ付加部２３０は、任意の分布に従うノイズを作成するノイズ作成関数を有する。ノイズ作成関数は、例えば、所定の確率分布（例えば、二項分布）に従うノイズを、特徴量２２２のベクトルに付加する。ノイズが付加された各々のベクトルの分布は、ノイズの分布に応じて広がる。これにより、正常画像のバリエーションが増加する。二項分布に従うノイズが特徴量２２２に付加された場合、正常画像のバリエーションは、二項分布に従う。一方、特徴量２２２に正規分布に従うノイズが付加された場合、正常画像のバリエーションは、正規分布に従う。なお、確率分布は、二項分布、正規分布に限定されず、これら以外であってよい。

　このように、正常画像の特徴量２２２に対してノイズを付加することにより、ノイズの分布に応じて、正常画像に対応する特徴量２２２を増加させることができる。したがって、機械学習における正常画像のバリエーションを有効に増加させることができる。その結果、後述するように検査対象の属性や撮影条件の違いによる正常画像のばらつきにも対応でき、画像復元のロバスト性が向上する。なお、ノイズ作成関数の具体例については後述する。

　学習部２４０は、訓練データを使用して、画像処理部２２０のニューラルネットワークを学習する。学習部２４０は、訓練データをエンコーダー２２１（エンコーダー部）に入力した場合に、デコーダー２２３（デコーダー部）による復元画像（復元データ）が正常画像（正常データ）となるようにエンコーダー２２１およびデコーダー２２３を学習する。

　より具体的には、学習部２４０は、復元画像、および正常画像から誤差関数を算出し、誤差関数が小さくなるように、誤差逆伝播法（バックプロパゲーション）により、ニューラルネットワークの重みパラメーター等を更新する。そして、各々の正常画像について、ニューラルネットワークの各パラメーターの更新が行われることにより、学習が進められる。

　本実施形態では、ノイズ付加部２３０のノイズ作成関数により、任意の分布に従うノイズを特徴量に付加し、学習部２４０は、上述した特許文献１のように特徴量の分布を学習するのではなく、特徴量のみを学習するように構成されている。したがって、ノイズ作成関数は、誤差逆伝搬に関与しない。
　（学習方法）

　図４は、図１に示す学習装置の学習方法の処理手順を例示するフローチャートである。図４のフローチャートに示す処理は、ＣＰＵ１１１が学習プログラムを実行することにより実現される。図５は、部品の製造および検査工程を例示する模式図である。

　まず、訓練データを取得する（ステップＳ１０１）。画像取得部２１０は、例えば、学習装置１００の外部の記憶装置から、正常画像からなる訓練データを取得する。

　次に、訓練データの特徴量を抽出する（ステップＳ１０２）。エンコーダー２２１は、画像取得部２１０によって取得された訓練データの特徴量を抽出する。

　次に、特徴量にノイズを付加する（ステップＳ１０３）。ノイズ付加部２３０は、エンコーダー２２１によって抽出された、正常画像の特徴量に、ノイズ作成関数によって生成されたノイズを付加する。ノイズは、例えば、所定の確率分布を有しており、ノイズが付加されることにより、正常画像の特徴量は確率分布に応じて広がる。これにより、正常画像のバリエーションを増加させることができる。

　例えば、図５に示すように、ある部品の製造および検査工程が、工程１、工程２、および外観検査工程を含む場合について説明する。例えば、工程１は、金属材料をドリル等の加工器具や、フライス等の加工機械を用いて加工する工程である。工程１については、Ａさん、およびＢさんが、切削作業を日替わり（勤務シフト）で行うことになっている。また、工程２は、工程１において加工された加工済みの部材を、砥石等の研磨工具を用いて研磨する工程である。工程２については、作業者は、特定の一人の作業者（例えば、Ｃさん）であるが、２種類の研磨工具を使用する可能性がある。

　工程１においては、作業者がＡさんか、あるいはＢさんかによって切削の仕上がりに微妙な違いが生じ、外観が異なる可能性があるが、いずれも良品（正常画像）が得られるものとする。また、工程２においては、使用される研磨工具がＣか、あるいはＤかによって、研磨の仕上がりに微妙な違いが生じ、外観が異なる可能性があるが、いずれも良品（正常画像）が得られるものとする。このように、外観検査前の各工程の実施条件の違いが外乱となって正常画像のバリエーションが生じる。この例の場合、正常画像は、２×２＝４パターンのバリエーションがあり、バリエーションの分布は、勤務シフトの状況や、研磨工具の使用頻度に応じて二項分布に従うと考えられる。

　図６は、図５に示す製造および検査工程について、ノイズ作成関数のコードの一例を示すリストである。リストの１～２行目において、各々ｒａｎｄｏｍ関数により発生させた０～１の範囲の乱数が、「作業者がＡさんである確率」の分布範囲を超え、かつ「研磨工具がＣである確率」の分布範囲を超えている場合、特徴量（ｆｅａｔｕｒｅ）の現在の値にノイズＰ（ｎｏｉｓｅ＿ｐ）を加算する（リストの３行目）。一方、リストの４～５行目において、「研磨工具がＤである確率」を満たす場合、特徴量の現在の値にノイズＱ（ｎｏｉｓｅ＿ｑ）を加算する。このように、正常画像のバリエーションが二項分布に従う場合であっても、ノイズ作成関数により二項分布に従うノイズを付加することにより、画像の復元精度が低下することを防止できる。

　一方、正常画像のバリエーションが正規分布や他の確率分布に従う場合は、ノイズ作成関数により正規分布や他の確率分布に従うノイズを付加する。これにより、画像の復元精度が低下することを防止できる。また、例えば、部品の製造ラインの環境に変更が生じた場合、現場の責任者の判断により、付加するノイズを適宜変更することもできる。

　次に、特徴量から訓練データを復元する（ステップＳ１０４）。デコーダー２２３は、ノイズ付加部２３０によってノイズが付加された特徴量から訓練データを復元する。

　次に、エンコーダー２２１およびデコーダー２２３のパラメーターを更新する（ステップＳ１０５）。学習部２４０は、デコーダー２２３による復元画像が正常画像となるように、エンコーダー２２１およびデコーダー２２３のパラメーターを更新することにより、エンコーダー２２１およびデコーダー２２３を学習する。

　このように、図４に示すフローチャートの処理では、画像取得部２１０は、検査対象の正常画像からなる訓練データを取得し、エンコーダー２２１は訓練データの特徴量を抽出する。ノイズ付加部２３０は、エンコーダー２２１によって抽出された、正常画像の特徴量に任意のノイズを付加し、デコーダー２２３は、ノイズが付加された特徴量から訓練データを復元する。学習部２４０は、訓練データと復元データとに基づいて、エンコーダー２２１およびデコーダー２２３のパラメーターを更新する。
　（ノイズ作成関数の他の例）

　以上では、部品の外観を撮影した正常画像の特徴量に対してノイズを付加することにより、バリエーションを増加させる場合を例示して説明したが、部品の正常画像に限らず、例えば、人体に関する正常画像の特徴量に対してノイズを付加してバリエーションを増加させることもできる。人体に関する正常画像は、人体の全てまたは一部の正常画像でありうる。

　図７は、人体の検査工程を例示する模式図である。通常、人体の撮影には種々の外乱が伴う。例えば、患者を撮影対象とする撮影において、外乱１、および外乱２が生じる場合を想定する。外乱１は、例えば、男女、年齢等の撮影対象者の属性に起因する。すなわち、撮影対象者が男性か、あるいは女性かによって、人体に関する正常画像は異なりうる。また、撮影対象者の年齢によっても正常画像は異なりうる。

　また、外乱２は、撮影担当者、撮影装置メーカー等の撮影条件に起因する。すなわち、撮影担当者（Ｄさん、Ｆさん）によって撮影方法や撮影技術に差があるため、正常画像に対して、許容される範囲内のばらつきが生じうる。また、撮影装置のメーカー（Ｇ社、Ｈ社）によって装置構成が異なるため、正常画像に対して、許容される範囲内のばらつきが生じうる。

　このように、外観検査前に生じる外乱により正常画像のばらつき（すなわち、バリエーション）が生じる。例えば、外乱１として撮影対象者の属性のうち男女のみが変化し、外乱２として撮影条件のうち撮影担当者のみが変化する場合、正常画像は、２×２＝４パターンのバリエーションが生じる。また、バリエーションの分布は、男女の割合や、撮影担当者の担当状況に応じて二項分布に従うと考えられる。

　図８は、図７に示す検査工程について、ノイズ作成関数のコードの一例を示すリストである。リストの１～２行目において、各々ｒａｎｄｏｍ関数により発生させた０～１の範囲の乱数が、「対象者が男性である確率」の分布範囲を超え、かつ「撮影装置メーカーがＧ社である確率」の分布範囲を超えている場合、特徴量（ｆｅａｔｕｒｅ）の現在の値にノイズＲ（ｎｏｉｓｅ＿ｒ）を加算する（リストの３行目）。一方、リストの４～５行目において、「撮影装置メーカーがＨ社である確率」を満たす場合、特徴量の現在の値にノイズＳ（ｎｏｉｓｅ＿ｓ）を加算する。

　このように、本実施形態の学習装置１００によれば、エンコーダー２２１によって正常画像から抽出された特徴量に任意のノイズを付加することにより、正常画像のバリエーションを増加させる。したがって、正常画像のバリエーションが正規分布以外の分布に基づく場合であっても、正常画像の復元精度が低下することを防止できる。
　（異常検出装置）

　本実施形態に係る異常検出装置のハードウェア構成は、図１に示す学習装置１００のハードウェア構成（例えば、パーソナルコンピューター、サーバー等のコンピューター）と同じでありうる。説明の重複を避けるため、異常検出装置のハードウェア構成については、詳細な説明を省略する。

　図９は、異常検出装置の制御部３００の主要な機能を例示する機能ブロック図である。制御部３００は、画像取得部３１０、画像処理部３２０、スコア算出部３３０、および異常判定部３４０を有する。

　画像取得部３１０は、入力画像を取得する。入力画像は、検査対象である正常／異常が未知の画像であり、異常を含む検査対象の画像（以下、「異常画像」という）、または正常画像でありうる。画像取得部３１０は、取得した入力画像を画像処理部３２０に送信する。

　画像処理部３２０は、例えば、エンコーダー・デコーダー構造を有する生成モデルとして機能するニューラルネットワークを有する。本実施形態のニューラルネットワークは、エンコーダー３２１、およびデコーダー３２３を有し、図１、図２に示す学習装置１００により、訓練データを用いて予め学習されている。ニューラルネットワークは、特徴抽出により入力画像が有する本質的な要素のみを抜き出し、抽出された特徴量を用いて復元することにより、入力画像における不要な要素が除外された復元画像を生成して出力する。すなわち、ニューラルネットワークは、異常画像を訓練データとして用いずに学習するため、正常画像に対して、対応する特徴量が生成可能なように構成されており、異常画像に対しては、対応する特徴量を生成できず、再現性を有しない。

　図９に示す例では、入力画像は、検査対象としての部品Ｍ１の画像を含んでいる。部品Ｍ１には、製造工程の途中で異常（傷Ｓ１，Ｓ２）が発生している場合を想定している。なお、Ｔ１は、正常な部品Ｍ１が元々備えるテクスチャーである。復元画像は、入力画像の部品Ｍ１の画像から本質的な要素のみが残され、不要な要素が除去された画像となっている。テクスチャーＴ１は、部品Ｍ１が元々備えているものなので復元される一方で、傷Ｓ１，Ｓ２は、異常であるので復元されていない。

　より具体的には、エンコーダー３２１は、入力画像から特徴量を抽出する。すなわち、エンコーダー３２１は、入力画像を圧縮し、入力画像が元々有している特徴量の次元よりも低い次元の特徴量３２２を生成する。デコーダー３２３は、特徴量３２２に基づいて入力画像を復元する。エンコーダー３２１は、デコーダー３２３が入力画像の本質を再現できる程度に入力画像の特徴を圧縮することが好ましい。すなわち、特徴量３２２は、入力画像の本質を再現できる必要最小限の次元であることが好ましい。また、入力画像が有する特徴が多過ぎたり、入力画像の特徴の圧縮が不十分であったりした場合、入力画像を復元する際に、検査対象の異常が入力画像に含まれている場合に、この異常についても再現される可能性がある。一方で、入力画像が有する特徴が少な過ぎたり、入力画像の特徴が過度に圧縮されたりした場合、入力画像を復元する際に、正常な入力画像の再現度が低下する可能性があり、復元画像の画素レベルが検出可能なレベルに達しない場合がありうる。

　スコア算出部３３０は、エンコーダー３２１に入力される入力画像（検査対象のデータ）と、デコーダー３２３によって復元された入力画像の復元画像（復元データ）とに基づいて、入力画像の異常スコアを算出する。より具体的には、スコア算出部３３０は、入力画像と、復元画像との差分を異常スコアとして算出する。

　異常判定部３４０は、スコア算出部３３０によって算出された異常スコアに基づいて、検査対象の異常を判定する。異常判定部３４０は、例えば、異常スコアと所定の閾値とを比較し、比較結果に基づいて、検査対象の異常を判定する。
　（異常検出方法）

　図１０は、異常検出装置の異常検出方法の処理手順を例示するフローチャートである。同図に示すフローチャートの処理は、ＣＰＵ１１１が異常検出プログラムを実行することにより実現される。

　まず、入力画像を取得する（ステップＳ２０１）。画像取得部３１０は、例えば、異常検出装置の外部の撮像装置が撮影した、検査対象が写っている画像を入力画像として取得する。入力画像は、検査対象の異常画像、または正常画像でありうる。

　次に、入力画像の特徴量を抽出する（ステップＳ２０２）。エンコーダー３２１は、入力画像の特徴量を抽出する。エンコーダー３２１は、学習装置１００により、訓練データを用いて予め学習されている。

　次に、入力画像を復元する（ステップＳ２０３）。デコーダー３２３は、エンコーダー３２１によって抽出された特徴量から入力画像を復元する。デコーダー３２３は、学習装置１００により、訓練データを用いて予め学習されている。

　次に、検査対象のデータの異常スコアを算出する（ステップＳ２０４）。スコア算出部３３０は、入力画像と、デコーダー３２３によって復元された、入力画像の復元画像との差分を異常スコアとして算出する。

　次に、検査対象の異常を判定する（ステップＳ２０５）。異常判定部３４０は、スコア算出部３３０によって算出された異常スコアに基づいて、検査対象の異常を判定する。より具体的には、異常判定部３４０は、異常スコアが所定の閾値よりも高い場合、検査対象が異常であると判定し、閾値よりも低い場合、検査対象が正常であると判定する。異常判定部３４０は、例えば、入力画像についての異常スコアマップの最大値が所定の閾値よりも高い場合、検査対象が異常であると判定し、閾値よりも低い場合、検査対象が正常であると判定する。異常スコアマップは、入力画像の各画素に対応する異常スコアをマップ化したものである。あるいは、異常スコアマップの平均値が所定の閾値よりも高い場合、検査対象が異常であると判定し、閾値よりも低い場合、検査対象が正常であると判定するように構成してもよい。判定結果は、検査対象の検査結果として操作表示部１３０に送信され、ディスプレイに検査結果が表示される。
　（変形例）

　以上では、パーソナルコンピューター、サーバー上で学習、および推論（異常検出）の処理を行う場合について例示したが、クラウド上やエッジで学習、および推論の処理を行うように構成することもできる。

　（ａ）クラウド上において学習、および推論の処理を行う場合

　クラウド上においてニューラルネットワーク（生成モデル）を学習できるように、学習に関するアルゴリズム（学習プログラム）を保存し、実行する。ユーザーは、製造現場（製造ラインや工場）から離れた場所（例えば、本社）から、学習に関する設定・変更（例えば、ノイズ設定）や、各種アルゴリズムに関する設定・変更、学習の指示等を行うことができる。

　また、複数の現場（例えば、製造ラインＡ～Ｃ）における検査対象の異常検出を行う場合、クラウドにより、学習済み生成モデルを共有できる。また、クラウド上において、現場（例えば、製造ライン、工場、病院等）の検査対象（例えば、部品、人体等）に応じて、適した学習済み生成モデルを選択できる。

　また、推論に関するアルゴリズム（異常検出プログラム等）をクラウドに実装し、現場から第５世代移動通信システム（以下、「５Ｇ」という）を使用して、入力画像が取得される度にクラウドに送信する。これにより、クラウドにおいて学習および推論の処理を一元的に管理しつつ、リアルタイムで推論を進めることができる。

　さらに、学習、および推論の処理を高度化、高精度化できる。例えば、複数のデバイス（撮像装置）により検査対象を撮像し、画像群をクラウドに送信し、画像の組み合わせによって、アルゴリズムの組み合わせを変更する等、クラウドで統合処理し、推論した結果を現場にフィードバックできる。

　（ｂ）エッジ（現場におけるネットワーク端末）において学習、および推論の処理を行う場合

　エッジから、５Ｇを使用して、検査対象の画像をクラウドに送信する。クラウドは、検査対象の画像に応じて、生成モデルを選択し、選択した生成モデルをエッジに送信する。エッジにおいて、生成モデルの学習を行い、学習済み生成モデルを使用して推論の処理を行う。これにより、生成モデルの中央管理、都度切り替え、エッジ処理によるクラウドの処理負荷の低減、リアルタイム推論を同時に達成できる。

　また、エッジ側で特徴量抽出まで行い、特徴量を５Ｇでクラウドに送信し、クラウドにおいて推論を行う等、役割分担することもできる。これにより、処理負荷が分散され、全体としてのスループットが向上する。

　さらに、エッジにおいて、学習、および推論の処理を行った結果をクラウドに送信し、クラウド上において後処理（例えば、テンプレートマッチング、後工程選定）を行い、最終判定結果を算出し、算出結果をエッジに送信することもできる。これにより、クラウド上における後処理の設定変更等を一元的に管理できる。

　上述した学習装置、学習プログラム、異常検出装置、および異常検出プログラムは、上述の実施形態の特徴を説明するにあたって主要構成を説明したのであって、上述の構成に限られず、特許請求の範囲内において、種々改変することができる。また、一般的な異常検出装置等が備える構成を排除するものではない。

　例えば、上述したフローチャートは、一部のステップを省略してもよく、他のステップが追加されてもよい。また各ステップの一部は同時に実行されてもよく、一つのステップが複数のステップに分割されて実行されてもよい。

　また、上述の例では、検査対象として部品、および人体の正常画像を用いて生成モデルを学習する場合について例示したが、本発明はこのような場合に限定されず、図版、図形、色彩等を検査対象とすることもできる。また、訓練データとして画像データを用いる場合について例示したが、本発明はこのような場合に限定されず、テキストデータ、音声データ等を用いることもできる。

　また、上述した学習装置および異常検出装置における各種処理を行う手段および方法は、専用のハードウェア回路、またはプログラムされたコンピューターのいずれによっても実現することが可能である。上記プログラムは、例えば、ＵＳＢメモリやＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）－ＲＯＭ等のコンピューター読み取り可能な記録媒体によって提供されてもよいし、インターネット等のネットワークを介してオンラインで提供されてもよい。この場合、コンピューター読み取り可能な記録媒体に記録されたプログラムは、通常、ハードディスク等の記憶部に転送され記憶される。また、上記プログラムは、単独のアプリケーションソフトとして提供されてもよいし、一機能としてその学習装置および異常検出装置のソフトウエアに組み込まれてもよい。
　本出願は、２０２１年６月９日に出願された日本国特許出願番号２０２１－０９６３３７号に基づいており、その開示内容は、参照により全体として組み入れられている。

１００　学習装置、
１１０　制御部、
１１１　ＣＰＵ、
１１２　ＲＡＭ、
１１３　ＲＯＭ、
１１４　補助記憶部、
１２０　通信部、
１３０　操作表示部、
２１０　画像取得部、
２２０　画像処理部、
２２１　エンコーダー、
２２２　特徴量、
２２３　デコーダー、
２３０　ノイズ付加部、
２４０　学習部、
３００　制御部、
３１０　画像取得部、
３２０　画像処理部、
３２１　エンコーダー、
３２２　特徴量、
３２３　デコーダー、
３３０　スコア算出部、
３４０　異常判定部。

Claims

　検査対象の正常データからなる訓練データを取得するデータ取得部と、
　前記データ取得部によって取得された訓練データの特徴量を抽出するエンコーダー部と、
　前記エンコーダー部によって抽出された特徴量にノイズを付加するノイズ付加部と、
　前記ノイズ付加部によってノイズが付加された前記特徴量から前記訓練データを復元するデコーダー部と、
　前記訓練データと、前記デコーダー部によって復元された復元データとに基づいて、前記エンコーダー部および前記デコーダー部のパラメーターを更新する学習部と、を有する、学習装置。
　前記学習部は、前記訓練データを前記エンコーダー部に入力した場合に、前記デコーダー部による復元データが正常データとなるように、前記エンコーダー部および前記デコーダー部のパラメーターを更新することにより、前記エンコーダー部および前記デコーダー部を学習する、請求項１に記載の学習装置。
　前記ノイズ付加部は、所定の確率分布に従うノイズを付加する、請求項１または２に記載の学習装置。
　前記確率分布は、二項分布である、請求項３に記載の学習装置。
　前記正常データは、正常画像である、請求項１～４のいずれか１項に記載の学習装置。
　検査対象の正常データからなる訓練データを取得する取得ステップと、
　エンコーダー部によって前記訓練データの特徴量を抽出する抽出ステップと、
　前記抽出ステップにおいて抽出された特徴量にノイズを付加する付加ステップと、
　前記付加ステップにおいてノイズが付加された前記特徴量から、デコーダー部によって前記訓練データを復元する復元ステップと、
　前記訓練データと、前記復元ステップにおいて復元された復元データとに基づいて、前記エンコーダー部および前記デコーダー部のパラメーターを更新する更新ステップと、
　を含む処理をコンピューターに実行させるための学習プログラム。
　検査対象のデータを取得するデータ取得部と、
　請求項１～５のいずれか１項に記載の学習装置においてパラメーターが更新されたエンコーダー部およびデコーダー部と、
　前記エンコーダー部に入力される前記検査対象のデータと、前記デコーダー部によって復元される復元データとに基づいて、前記検査対象のデータの異常スコアを算出するスコア算出部と、
　前記スコア算出部によって算出された異常スコアに基づいて、前記検査対象の異常を判定する異常判定部と、を有する、異常検出装置。
　前記スコア算出部は、前記検査対象のデータと、前記復元データとの差分を異常スコアとして算出する、請求項７に記載の異常検出装置。
　検査対象のデータを取得する取得ステップと、
　請求項１～５のいずれか１項に記載の学習装置においてパラメーターが更新されたエンコーダー部により、前記検査対象のデータの特徴量を抽出する抽出ステップと、
　前記学習装置においてパラメーターが更新されたデコーダー部により、前記特徴量から前記検査対象のデータの復元する復元ステップと、
　前記検査対象のデータと、前記デコーダー部によって復元された復元データとに基づいて、前記検査対象のデータの異常スコアを算出する算出ステップと、
　前記算出ステップにおいて算出された異常スコアに基づいて、前記検査対象の異常を判定する判定ステップと、を含む処理をコンピューターに実行させるための異常検出プログラム。