JP7268367B2 - 学習装置、学習方法および学習プログラム - Google Patents

学習装置、学習方法および学習プログラム Download PDF

Info

Publication number
JP7268367B2
JP7268367B2 JP2019014035A JP2019014035A JP7268367B2 JP 7268367 B2 JP7268367 B2 JP 7268367B2 JP 2019014035 A JP2019014035 A JP 2019014035A JP 2019014035 A JP2019014035 A JP 2019014035A JP 7268367 B2 JP7268367 B2 JP 7268367B2
Authority
JP
Japan
Prior art keywords
learning
generator
discriminator
state
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019014035A
Other languages
English (en)
Other versions
JP2020123096A (ja
Inventor
孝 河東
和樹 岩本
健人 上村
優 安富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019014035A priority Critical patent/JP7268367B2/ja
Priority to EP20152622.5A priority patent/EP3690743A1/en
Priority to CN202010071123.XA priority patent/CN111507934B/zh
Priority to US16/774,100 priority patent/US11250297B2/en
Publication of JP2020123096A publication Critical patent/JP2020123096A/ja
Application granted granted Critical
Publication of JP7268367B2 publication Critical patent/JP7268367B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Image Analysis (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、学習装置、学習方法および学習プログラムに関する。
近年、医療画像分析の分野等で、画像データを用いて、病変等の異常を検出することが行われている。特に、医療等の分野では、訓練データに用いる異常状態の画像データの入手が困難なことが多いことから、正常状態の画像データのみを利用した機械学習が求められるとともに、大量かつ精密な大容量のデータを扱うことから、検出速度の高速化も求められている。
このような状況下で、機械学習を使用した異常検知に手法として、正常データの分布を推定して、その分布から外れたデータを異常データと検知する敵対的生成ネットワーク(GAN:Generative Adversarial Networks)が知られている。図17は、GANを説明する図である。図17に示すように、GANは、生成器と識別器とを有し、生成器を学習するネットワークと識別器を学習するネットワークとが互いに成長していく教師なし学習の学習モデルである。
GANでは、生成器がノイズなどの入力データから本物データに近い偽物データを生成するように学習し、識別器が生成器により生成されたデータが本物データか偽物データかを識別できるように学習する。このGANを用いた異常検出としては、学習済みの生成器が与えられたサンプルを生成する能力が存在するか否かを判定して、能力が無ければ異常データとみなす手法や、学習済みの識別器が偽物データと判定したデータを異常データとみなす手法が利用されている。
Schlegl,Thomas,et al."Unsupervised anomaly detection with generative adversarial networks to guide marker discovery.",International Conference on Information Processing in Medical Imaging.Springer,Cham,2017. M.Sabokrou,et al."Adversarially Learned One-Class Classifier for Novelty Detection",Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.2018.
しかしながら、上記技術では、識別器の異常検知の能力が低下する場合がある。具体的には、識別器を使用する場合、識別器の特性が学習終了時の生成器が誤って生成する正常データ以外のデータに依存するので、検出漏れが大きくなる場合がある。例えば、識別器は、正常データと生成器の出力の違いを見分ける能力があると期待できるが、その一方で、生成器の出力に含まれず、正常データにも含まれないものは、学習できないので、特定の出力を期待できない。なお、生成器を用いる手法は、検出コストが高いので、高速性が求められる異常検知には不向きである。
一つの側面では、識別器の異常検知の能力低下を抑制することができる学習装置、学習方法および学習プログラムを提供することを目的とする。
第1の案では、学習装置は、画像データを生成する生成器と、前記画像データの真偽を識別する識別器とを有する。学習装置は、前記生成器が前記識別器の識別誤差を最大化するように学習を実行するとともに、前記識別器が識別誤差を最小化するように学習を実行する学習部を有する。学習装置は、前記学習の実行途中において、予め設定された条件で、学習途中の前記生成器の状態を保存する保存部を有する。学習装置は、保存された前記学習途中の識別器の状態を用いて、前記識別器の再学習を実行する再学習部を有する。
一実施形態によれば、識別器の異常検知の能力低下を抑制することができる。
図1は、実施例1にかかる異常検出装置を説明する図である。 図2は、学習前を説明する図である。 図3は、学習開始後を説明する図である。 図4は、学習の進行中を説明する図である。 図5は、学習後の識別器を説明する図である。 図6は、実施例1にかかる異常検出装置の機能構成を示す機能ブロック図である。 図7は、検出結果の一例を説明する図である。 図8は、実施例1にかかる学習処理の流れを示すフローチャートである。 図9は、実施例1にかかる検出処理の流れを示すフローチャートである。 図10は、一時保存と再学習を説明する図である。 図11は、効果を説明する図である。 図12は、実施例2にかかる学習処理を説明する図である。 図13は、実施例2にかかる学習処理の流れを示すフローチャートである。 図14は、実施例3にかかる学習処理を説明する図である。 図15は、実施例3にかかる学習処理の流れを示すフローチャートである。 図16は、ハードウェア構成例を説明する図である。 図17は、GANを説明する図である。
以下に、本願の開示する学習装置、学習方法および学習プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。
[異常検出装置10の説明]
図1は、実施例1にかかる異常検出装置10を説明する図である。図1に示すように、異常検出装置10は、学習フェーズにおいて、GANにより生成器と識別器とを学習し、予測フェーズにおいて、学習済みの識別器を用いて、予測対象の画像データに対して異常検知を実行する学習装置の一例である。
ところで、一般的なGANによる学習では、識別器の異常検知の能力が低下する場合がある。ここで、図2から図5を用いて、一般的なGANの問題点を説明する。ここでは、図2から図5では、一般的なGANによる学習に関し、学習開始前から学習終了後の各段階を例示して説明する。図2は、学習前を説明する図である。図3は、学習開始後を説明する図である。図4は、学習の進行中を説明する図である。図5は、学習後の識別器を説明する図である。
図2に示すように、学習前では、生成器は、正常データとは異なる分布のデータを生成し、識別器は、正常データに分布と生成器が生成したデータの分布との違いを学習する。すなわち、識別器は、正常データの分布と生成器が生成するデータの分布とを明確に区別して識別する。
続いて、図3に示すように、学習が開始されると、識別器に正常と識別されるデータが多く、異常と識別されるデータが少なくなるように、生成器の学習が進む。すなわち、生成器は、識別器が識別を間違えるようなデータの生成を学習するので、生成器が生成するデータの分布が、識別器が正常と判断できる範囲を含むように学習される。その一方で、識別器は、学習開始に伴って生成器が生成するデータの分布が変更されると、正常であると識別する識別結果の確率が変化していくが、正常データの分布と生成器が生成したデータの分布との違いを学習する。
続いて、図3の時点よりも学習が進むと、図4に示すように、生成器が生成するデータの分布は、図3において識別器が正常と識別できる範囲を含むように学習される。すなわち、生成器が生成するデータの分布が、識別器が正常と識別できる範囲により多く含まれるように更新される。一方で、識別器は、更新された生成器が生成データの分布と、正常データの分布とを識別するように学習する。
さらに学習が進むと、図5に示すように、生成器は、図4の状態から、識別器が正常と識別できる範囲のデータを模倣して識別器を間違わせるように学習するので、生成器が生成するデータの分布が、図4において識別器が識別できる範囲を含むように更新される。学習が完了すると、学習後の識別器は、生成器が生成したデータと正常データ(本物データ)とを識別できるように学習されている。
しかし、一般的なGANでは、識別器の特性が学習終了時の生成器が誤って生成する正常データ以外のデータに依存するので、検出漏れが大きくなる場合がある。つまり、学習後の識別器が異常と判断できる範囲に存在する異常データに対しては正しく異常を検出できるが、それ以外の範囲に存在する異常データを検出できない。言い換えると、一般的なGANでは、検出が期待される異常データの範囲まで識別器を学習できないことがある。
そこで、実施例1にかかる異常検出装置10は、医療における検出したい異常データが正常データの分布から大きく外れたところには出現しないことに着目する。そして、異常検出装置10は、学習の過程で、生成器の生成するデータの分布が一時的に正常データの分布を逸脱することがありうることから、一定の間隔で学習途中の生成器を保存し、保存された生成器すべてを用いて識別器を学習する。
具体的には、図1に示すように、異常検出装置10は、GANによる生成器と識別器とを学習する一方で、一定間隔で、学習途中の生成器に関する情報を取得する。そして、異常検出装置10は、GANによる識別器の学習が完了すると、学習済みの識別器に対して、途中に保存した各生成器を用いて再学習を実行する。再学習の完了後、異常検出装置10は、予測対象の画像データを再学習済みの識別器に入力して、異常検出を実行する。
[機能構成]
図6は、実施例1にかかる異常検出装置10の機能構成を示す機能ブロック図である。図6に示すように、異常検出装置10は、通信部11、記憶部12、制御部20を有する。
通信部11は、他の装置の間の通信を制御する処理部であり、例えば通信インタフェースなどである。例えば、通信部11は、管理者端末から各種処理の開始指示、正常データ、予測対象データなどを受信し、管理者端末に学習結果や予測結果などを送信する。
記憶部12は、各種データや制御部20が実行するプログラムなどを記憶する記憶装置の一例であり、例えばメモリやハードディスクなどである。この記憶部12は、正常データDB13、途中情報DB14、学習結果DB15などを記憶する。
正常データDB13は、正常な状態の内臓等が撮像された画像データを記憶するデータベースである。例えば、正常データDB13は、GANによる識別器の学習において使用される正常データを記憶する。
途中情報DB14は、GANによる生成器の学習過程における学習途中の生成器に関する情報を記憶するデータベースである。例えば、途中情報DB14は、学習途中の生成器を再現(構築)できる、学習途中の各種パラメータを記憶する。
学習結果DB15は、生成器および識別器の学習結果を記憶するデータベースである。例えば、学習結果DB15は、GANを用いた生成器および識別器の学習結果や、識別器の再学習結果として、学習が完了した学習済みの生成器や識別器を生成できる各種パラメータを記憶する。
制御部20は、異常検出装置10全体を司る処理部であり、例えばプロセッサなどである。この制御部20は、学習処理部30、再学習部40、検出部50を有し、識別精度のよい識別器を学習し、入力される予測対象の画像データに対して異常検知を実行する。
学習処理部30は、生成器学習部31、識別器学習部32、一時保存部33を有し、GANを用いた生成器および識別器の学習を実行する処理部である。
生成器学習部31は、GANの生成器の学習を実行する処理部である。具体的には、生成器学習部31は、一般的なGANと同様、識別器に正常と判定されるデータが多く、異常と判定されるデータが少なくなるように生成器を学習する。すなわち、生成器は、識別器の識別誤差を最大化するように学習する。
例えば、生成器学習部31は、乱数やランダムノイズなどであり、いわゆる種などと呼ばれる潜在変数を用いて、生成器により画像データを生成する。そして、生成器学習部31は、生成された画像データ(以下では、生成データと記載する場合がある)を識別器に入力し、識別器の識別結果を取得する。そして、生成器学習部31は、識別結果を用いて、生成データが識別器により正常データと識別されるように、生成器を学習する。
すなわち、生成器学習部31は、生成器が生成する生成データの分布が正常データの分布と一致するように、生成器を学習する。学習が完了すると、生成器学習部31は、学習済みの生成器に関する情報を学習結果DB15に格納する。
識別器学習部32は、GANの識別器の学習を実行する処理部である。具体的には、識別器学習部32は、一般的なGANと同様、正常データDB13に記憶される正常データと、生成器により生成される生成データとを区別できるように生成器を学習する。すなわち、識別器は、識別誤差を最小化するように学習する。
例えば、識別器学習部32は、生成器から生成データを取得して識別器に入力し、識別器の出力結果を取得する。そして、識別器学習部32は、出力結果に含まれる正常データである正常確率と、生成データである異常確率とのうち、異常確率が高くなり、正常確率が低くなるように、識別器を学習する。
すなわち、識別器学習部32は、生成器が生成する生成データの分布と正常データの分布との違いを識別器に学習させる。学習が完了すると、識別器学習部32は、学習済みの識別器に関する情報を学習結果DB15に格納する。
一時保存部33は、学習途中の生成器を保存する処理部である。例えば、一時保存部33は、生成器学習部31による生成器の学習過程において、一定時間ごと、または、一定学習回数ごとに、学習途中の生成器の状態を示す各種パラメータを、生成器から取得して途中情報DB14に格納する。
再学習部40は、GANにより学習された識別器の再学習を実行する処理部である。具体的には、再学習部40は、一時保存部33により保存された、学習途中の生成器すべてを用いて、識別器の再学習を実行する。
例えば、再学習部40は、学習処理部30による学習が完了すると、途中情報DB14からパラメータなどの情報を読み出して、学習途中である各生成器を生成する。同様に、再学習部40は、学習結果DB15から識別器のパラメータなどを読み出して、学習済みの識別器を生成する。
ここで、学習途中の識別器が4つ生成されたとする。すると、再学習部40は、1つ目の生成器を用いて生成データを生成して、学習済みの識別器に入力して、当該識別器を学習させる。続いて、再学習部40は、2つ目の生成器を用いて生成データを構築して、1つの識別器により学習された識別器に入力して、当該識別器を学習させる。このようにして、再学習部40は、学習途中の各生成器を順次用いて、識別器の再学習を実行する。そして、再学習部40は、再学習が完了すると、再学習済みの識別器に関する情報を学習結果DB15に格納する。
検出部50は、入力される画像データから異常検出を実行する処理部である。例えば、検出部50は、再学習部40による再学習が完了すると、再学習済みの識別器に関するパラメータなどを学習結果DB15から読み出して、識別器を構築する。そして、検出部50は、予測対象である画像データを受信すると、当該画像データを構築した識別器に入力し、出力結果を取得する。
ここで、検出部50は、出力結果に含まれる正常データである正常確率と、生成データである異常確率とのうち、正常確率の方が高い場合は入力された画像データを正常な画像データと識別し、異常確率の方が高い場合は入力された画像データを異常な画像データと識別する。そして、検出部50は、識別結果を管理者端末に送信したり、ディスプレイなどの表示部に表示したり、記憶部12に格納したりする。
図7は、検出結果の一例を説明する図である。図7に示すように、検出部50は、予測対象である入力画像を小領域に分割後、再学習部40により学習された識別器に入力して、識別結果を取得する。そして、検出部50は、識別器が異常と判定した領域をユーザに提示することができる。
[学習処理の流れ]
図8は、実施例1にかかる学習処理の流れを示すフローチャートである。図8に示すように、学習処理が指示されると、学習処理部30は、生成器と識別器を初期化する(S101)。
続いて、生成器学習部31は、生成器でデータ(生成データ)を生成し(S102)、識別器学習部32は、正常データと生成データとを区別できるように識別器を学習する(S103)。そして、生成器学習部31は、生成データが識別器に正常データと識別されるように、生成器を学習する(S104)。
その後、一時保存部33は、生成器が保存されていない時間や反復数(学習回数)が一定以上である場合(S105:Yes)、学習途中である生成器を保存する(S106)。なお、生成器が保存されていない時間や反復数が一定未満であれば(S105:No)、S106を実行することなく、S107が実行される。
その後、学習が終了するまで(S107:No)、S102以降が繰り返される。一方、学習が終了すると(S107:Yes)、再学習部40は、正常データと、保存された生成器で生成されたデータ(生成データ)とを識別できるように、識別器を再学習する(S108)。そして、再学習部40は、再学習が完了すると、識別器を保存する(S109)。
[検出処理の流れ]
図9は、実施例1にかかる検出処理の流れを示すフローチャートである。図9に示すように、検出処理が指示されると、検出部50は、保存された識別器を読み込む(S201)。続いて、検出部50は、対象データを識別器に入力して、対象データの異常を判定(識別)する(S202)。
ここで、検出部50は、正常と判定された場合(S203:Yes)、処理を終了し、正常と判定されなかった場合(S203:No)、対象データを異常データとして出力する(S204)。
[効果]
上述したように、異常検出装置10は、例えば医療における検出したい異常データが正常データの分布から大きく外れたところには出現しないことに着目し、学習途中の生成器を用いて識別器の再学習を実行する。この結果、異常検出装置10は、正常なデータの周辺に存在すると期待される異常データを網羅的に生成可能な生成器を用いて識別器を再学習することができるので、識別器の識別範囲を拡張することができる。
図10は、一時保存と再学習を説明する図である。学習途中の生成器を保存することは、生成器の学習途中の状態を保存することであり、正常データの分布と一致するように、学習している途中の生成器が生成する生成データの分布を保存することとなる。つまり、図10に示すように、学習初期から学習完了までに、生成器が生成する各生成データの分布の学習過程を保存しておくことができる。したがって、保存しておいたすべての生成器を用いて再学習することで、各生成器の生成データの各分布を学習することができるので、GANによる学習が完了した識別器が網羅できない範囲を学習することができる。
図11は、効果を説明する図である。図11に示すように、一般的なGANでは、識別器の特性が学習終了時の生成器が誤って生成する正常データ以外のデータに依存するので、異常検出が期待される範囲を網羅するように識別器の学習を行うことが難しく、検出漏れが多い。図11の例では、識別器は、生成器のデータ分布の範囲外にあるデータAについては、異常と検出できない。
これに対して、実施例1による識別器の学習では、途中保存される生成器により生成される生成データの分布を再学習することができるので、学習完了後の生成器の状態に依存せず、正常データの周辺をより多く網羅することができる。この結果、再学習後の識別器は、一般的なGANによる識別器では検出できなかったデータAについても異常データとして検出することができる。
ところで、実施例1では、学習途中の生成器を一定間隔で保存する例を説明したが、一定間隔ではなく、保存する間隔を制御することで、識別器の性能を向上させることができる。そこで、実施例2では、一定間隔ではなく、識別器の損失が一時的に閾値以上に上がった後、再び閾値未満に下がるタイミングで生成器を保存する例を説明する。
図12は、実施例2にかかる学習処理を説明する図である。図12では、GANによる学習において、識別器の損失の時間変化、すなわち識別器が識別に失敗する割合の時間変化を図示している。図12に示すように、GANによる生成器の学習が進むと、生成器が生成するデータの分布が、識別器がカバーしていない領域へ逸脱し始め(図12の(a))、識別器の損失が増加する(図12の(b))。その後、識別器の学習が進み、識別器が生成器の学習に追従するので、識別器の損失が低下していき(図12の(c))、逸脱が解消されていく(図12の(d))。
そこで、一時保存部33は、識別器の損失が増加していき、当該損失が低下し始めたときの生成器の状態を保存する。なお、一時保存部33は、このタイミングの生成器を複数保存したい場合、識別器の損失が低下し始めてから一定時間の間隔で生成器を保存することもできる。このようにすることで、生成器が生成するデータの分布と正常データの分布との差が大きい時点を保存することができるので、識別器が学習できる範囲を広くすることができる。この結果、識別器の性能を向上させることができる。
図13は、実施例2にかかる学習処理の流れを示すフローチャートである。図13に示すように、学習処理が指示されると、学習処理部30は、生成器と識別器を初期化する(S301)。
続いて、生成器学習部31は、生成器でデータ(生成データ)を生成し(S302)、識別器学習部32は、正常データと生成データとを区別できるように識別器を学習する(S303)。そして、生成器学習部31は、生成データが識別器に正常データと識別されるように、生成器を学習する(S304)。
その後、一時保存部33は、生成器が保存されていない時間や反復数が一定以上(S305:Yes)、かつ、識別器の損失が減少している場合(S306:Yes)、学習途中である生成器を保存する(S307)。なお、生成器が保存されていない時間や反復数が一定未満(S305:No)、または、識別器の損失が減少していない場合(S306:No)、S307を実行することなく、S308が実行される。
その後、学習が終了するまで(S308:No)、S302以降が繰り返される。一方、学習が終了すると(S308:Yes)、再学習部40は、正常データと、保存された生成器で生成されたデータ(生成データ)とを識別できるように、識別器を再学習する(S309)。そして、再学習部40は、再学習が完了すると、識別器を保存する(S310)。なお、検出処理は、実施例1と同様なので、詳細な説明を省略する。
ところで、実施例2では、生成器が異常データを生成し始めると、すぐに識別器が追従するので、生成器による生成データの分布の識別器がカバーしていない領域への逸脱の範囲が限定され、また、どの程度逸脱が進行しているかを見極めにくいことが考えられる。
そこで、実施例3では、学習速度の異なる識別器を2つ使用し、逸脱が進んだ状態の生成器を正確に保存することで、識別器の性能を向上させる。具体的には、生成器は、遅い識別器を用いて学習を行い、速い識別器を用いて逸脱の進行度を測る。実施例2では、速い識別器により生成データであると識別可能な生成データの割合を指標とする。また、逸脱が一定以上に進行した段階で、生成器を保存し、それ以上逸脱が起きないように、遅い識別器に速い生成器をコピーする。
図14は、実施例3にかかる学習処理を説明する図である。図14に示すように、図14では、学習速度の遅い識別器A(以下では、識別器Aや遅い識別器Aなどと記載する場合がある)と学習速度の速い識別器B(以下では、識別器Bや速い識別器Bなどと記載する場合がある)の2つを用いたGANによる学習において、各識別器の損失の時間変化を図示している。
図14に示すように、GANによる生成器の学習が進むと、生成器が生成するデータの分布が、速い識別器Bがカバーしていない領域へ逸脱し始め(図14の(a))、速い識別器Bの損失が増加する(図14の(b))。しかし、遅い識別器Aは、学習速度が遅いことから、速い識別器Bよりも損失の増加は少ない。
その後、両方の識別器の学習が進むが、特に速い識別器Bの学習が進んで、生成器の学習に追従するので、速い識別器Bの損失が低下し、遅い識別器Aは逸脱を許容できない(図14の(c))。すなわち、遅い識別器Aは、生成器の学習に追従することができず、識別の補正が進まない。
このとき、一時保存部33は、学習途中の生成器を保存する。つまり、一時保存部33は、速い識別器Bの逸脱が一定以上進行した段階で、遅い識別器Aを用いて学習する生成器を保存する。言い換えると、一時保存部33は、速い識別器Aの損失が増加した後に低下し始める一方で、遅い識別器Bの損失が増加しているときの生成器の状態を保存する。なお、損失が一定値以上か否かの閾値は、識別器Aと識別器Bとで共通の値を用いることができる。
そして、一時保存部33は、速い識別器の重みなどのパラメータを、遅い識別器Aにコピーして、2つの学習速度を用いた学習を再開する(図14の(d))。すなわち、2つの識別器のいずれも速い識別器の状態に変更し、その状態から、遅い学習と速い学習を行う。
このようにして、2つの識別器を用いた学習が完了すると、再学習部40は、一時的に保存された学習途中の生成器を用いて、識別器Bの再学習を実行する。
図15は、実施例3にかかる学習処理の流れを示すフローチャートである。図15に示すように、学習処理が指示されると、学習処理部30は、生成器、識別器A、識別器Bを初期化する(S401)。
続いて、生成器学習部31は、識別器Aの学習速度が識別器Bより小さくなるように設定する(S402)。例えば、生成器学習部31は、学習率を低くしたり、学習頻度を下げたりすることで、学習速度を遅くする。
そして、生成器学習部31は、生成器でデータ(生成データ)を生成し(S403)、識別器学習部32は、正常データと生成データとを区別できるように識別器Aと識別器Bを学習する(S404)。そして、生成器学習部31は、生成データが識別器Aに正常データと識別されるように、生成器を学習する(S405)。
その後、一時保存部33は、生成器が保存されていない時間や反復数が一定以上(S406:Yes)、かつ、識別器Bの損失が減少している場合(S407:Yes)、学習途中である生成器を保存する(S408)。続いて、一時保存部33は、識別器Bの重みなどのパラメータを識別器Aにコピーする(S409)。
なお、生成器が保存されていない時間や反復数が一定未満(S406:No)、または、識別器の損失が減少していない場合(S407:No)、S408とS409を実行することなく、S410が実行される。
その後、学習が終了するまで(S410:No)、S403以降が繰り返される。一方、学習が終了すると(S410:Yes)、再学習部40は、正常データと、保存された生成器で生成されたデータ(生成データ)とを識別できるように、識別器Bを再学習する(S411)。そして、再学習部40は、再学習が完了すると、識別器Bを保存する(S412)。なお、検出処理は、実施例1と同様なので、詳細な説明を省略する。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。
[学習]
例えば、学習処理を終了するタイミングは、所定数以上の学習データを用いた学習が完了した時点や識別器の損失が閾値未満となった時点など、任意に設定することができる。また、医療用の画像データに限らず、不正侵入や危険物持ち込みなどを判定する各種分野に適用することができる。
[再学習のタイミング]
上記実施例では、学習完了後に、識別器を再学習する例を説明したが、これに限定されるものではない。例えば、識別器は、通常のGANによる学習と、一時的に保存された学習途中の生成器を用いて学習とを並行して実行することもできる。つまり、保存した生成器がすでに生成可能な異常データを再び生成する生成器の保存を抑制するために、学習途中でも、識別器の学習に保存した生成器を用いる。このようにすることで、学習時間を短縮できるとともに、識別器の学習を補正しながら学習できるので、識別器の識別性能の向上を図ることもできる。
[システム]
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、学習処理部30と再学習部40と検出部50とを別々の装置で実現することもできる。
さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
[ハードウェア]
図16は、ハードウェア構成例を説明する図である。図16に示すように、異常検出装置10は、通信装置10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、図16に示した各部は、バス等で相互に接続される。
通信装置10aは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。HDD10bは、図6に示した機能を動作させるプログラムやDBを記憶する。
プロセッサ10dは、図6に示した各処理部と同様の処理を実行するプログラムをHDD10b等から読み出してメモリ10cに展開することで、図6等で説明した各機能を実行するプロセスを動作させる。すなわち、このプロセスは、異常検出装置10が有する各処理部と同様の機能を実行する。具体的には、プロセッサ10dは、学習処理部30と再学習部40と検出部50等と同様の機能を有するプログラムをHDD10b等から読み出す。そして、プロセッサ10dは、学習処理部30と再学習部40と検出部50等と同様の処理を実行するプロセスを実行する。
このように異常検出装置10は、プログラムを読み出して実行することで異常検出方法を実行する情報処理装置として動作する。また、異常検出装置10は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、異常検出装置10によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。
10 異常検出装置
11 通信部
12 記憶部
13 正常データDB
14 途中情報DB
15 学習結果DB
20 制御部
30 学習処理部
31 生成器学習部
32 識別器学習部
33 一時保存部
40 再学習部
50 検出部

Claims (8)

  1. 画像データを生成する生成器と、
    本物の画像データと生成された画像データとを識別する識別器と、
    学習過程において、前記生成器が前記識別器の識別誤差を最大化するように学習するとともに、前記生成器が生成するデータを用いて、前記識別器が前記識別誤差を最小化するように学習する学習処理を実行する学習部と、
    前記学習過程における第1の状態よりも前の状態である第2の状態の前記生成器が生成するデータを用いて、前記第1の状態の前記生成器が生成したデータで学習した前記識別器の再学習を実行する再学習部と
    を有することを特徴とする学習装置。
  2. 前記第2の状態は、前記第1の状態より前の状態であって、前記識別器の損失が閾値以上になった後、再び前記閾値未満となったときの状態であることを特徴とする請求項1に記載の学習装置。
  3. 前記識別器は、第1の識別器と、前記第1の識別器よりも学習速度が速い第2の識別器とを含み、
    前記学習処理は、前記生成器が前記第1の識別器の識別誤差を最大化するように学習するとともに前記生成器が生成するデータを用いて、前記第1の識別器が前記第1の識別器の前記識別誤差最小化するように学習するとともに前記第2の識別器が前記第2の識別器の識別誤差最小化するように学習する学習処理であって
    前記第2の状態は、前記第1の状態より前の状態であって、前記第2の識別器の損失が増加した後に低下し始めるとともに、前記第1の識別器の損失が閾値以上のときの状態であって、
    前記再学習部は、前記第2の状態の前記生成器が生成するデータを用いて、前記第1の状態の前記生成器が生成したデータで学習した前記第2の識別器の再学習を実行することを特徴とする請求項1に記載の学習装置。
  4. 前記再学習部は、前記学習部による前記学習処理が完了した後に、前記再学習を開始することを特徴とする請求項1に記載の学習装置。
  5. 前記再学習部は、前記学習部による前記学習処理が完了する前に、前記再学習を開始することを特徴とする請求項1に記載の学習装置。
  6. 前記再学習部によって再学習された再学習済みの前記識別器に、識別対象の画像データを複数領域に分割して入力して、前記再学習済みの前記識別器により異常が検出された場合に、前記再学習済みの前記識別器が異常と示す領域を提示する検出部をさらに有することを特徴とする請求項1に記載の学習装置。
  7. 学習過程において、画像データを生成する生成器が、本物の画像データと生成された画像データとを識別する識別器の識別誤差を最大化するように学習するとともに、前記生成器が生成するデータを用いて、前記識別器が前記識別誤差を最小化するように学習する学習処理を実行し、
    前記学習過程における第1の状態よりも前の状態である第2の状態の前記生成器が生成するデータを用いて、前記第1の状態の前記生成器が生成したデータで学習した前記識別器の再学習を実行する
    処理をコンピュータが実行することを特徴とする学習方法。
  8. 学習過程において、画像データを生成する生成器が、本物の画像データと生成された画像データとを識別する識別器の識別誤差を最大化するように学習するとともに、前記生成器が生成するデータを用いて、前記識別器が前記識別誤差を最小化するように学習する学習処理を実行し、
    前記学習過程における第1の状態よりも前の状態である第2の状態の前記生成器が生成するデータを用いて、前記第1の状態の前記生成器が生成したデータで学習した前記識別器の再学習を実行する
    処理をコンピュータに実行させることを特徴とする学習プログラム。
JP2019014035A 2019-01-30 2019-01-30 学習装置、学習方法および学習プログラム Active JP7268367B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2019014035A JP7268367B2 (ja) 2019-01-30 2019-01-30 学習装置、学習方法および学習プログラム
EP20152622.5A EP3690743A1 (en) 2019-01-30 2020-01-20 Training apparatus, training method, and training program
CN202010071123.XA CN111507934B (zh) 2019-01-30 2020-01-21 训练设备、训练方法和计算机可读记录介质
US16/774,100 US11250297B2 (en) 2019-01-30 2020-01-28 Training apparatus, training method, and non-transitory computer-readable recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019014035A JP7268367B2 (ja) 2019-01-30 2019-01-30 学習装置、学習方法および学習プログラム

Publications (2)

Publication Number Publication Date
JP2020123096A JP2020123096A (ja) 2020-08-13
JP7268367B2 true JP7268367B2 (ja) 2023-05-08

Family

ID=69185374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019014035A Active JP7268367B2 (ja) 2019-01-30 2019-01-30 学習装置、学習方法および学習プログラム

Country Status (4)

Country Link
US (1) US11250297B2 (ja)
EP (1) EP3690743A1 (ja)
JP (1) JP7268367B2 (ja)
CN (1) CN111507934B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111401138B (zh) * 2020-02-24 2023-11-07 上海理工大学 生成对抗神经网络训练过程的对抗优化方法
CN114698398A (zh) * 2020-10-30 2022-07-01 京东方科技集团股份有限公司 图像处理方法、图像处理装置、电子设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018192264A (ja) 2017-05-18 2018-12-06 キヤノンメディカルシステムズ株式会社 医用画像処理装置
WO2019169594A1 (en) 2018-03-08 2019-09-12 Intel Corporation Methods and apparatus to generate three-dimensional (3d) model for 3d scene reconstruction

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3385889A4 (en) * 2015-12-01 2019-07-10 Preferred Networks, Inc. ANOMALY DETECTION SYSTEM, ANOMALY DETECTION METHOD, ANOMALY DETECTION PROGRAM, AND APPRIS MODEL GENERATION METHOD
US10475174B2 (en) * 2017-04-06 2019-11-12 General Electric Company Visual anomaly detection system
US10937540B2 (en) * 2017-12-21 2021-03-02 International Business Machines Coporation Medical image classification based on a generative adversarial network trained discriminator
CN108769993A (zh) * 2018-05-15 2018-11-06 南京邮电大学 基于生成对抗网络的通信网络异常用户检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018192264A (ja) 2017-05-18 2018-12-06 キヤノンメディカルシステムズ株式会社 医用画像処理装置
WO2019169594A1 (en) 2018-03-08 2019-09-12 Intel Corporation Methods and apparatus to generate three-dimensional (3d) model for 3d scene reconstruction

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
坂本 俊之,Chainerで作る コンテンツ自動生成AIプログラミング入門,第1版,株式会社シーアンドアール研究所,2017年12月22日,第68ページ、第85-第95ページ,ISBN:978-4-86354-234-1
栗原 慧至,画像補完技術を用いた眼底画像の異常検出,電気学会研究会資料,日本,一般社団法人電気学会,2018年09月26日,pp.105-109

Also Published As

Publication number Publication date
EP3690743A1 (en) 2020-08-05
JP2020123096A (ja) 2020-08-13
CN111507934B (zh) 2024-04-26
US11250297B2 (en) 2022-02-15
CN111507934A (zh) 2020-08-07
US20200242412A1 (en) 2020-07-30

Similar Documents

Publication Publication Date Title
JP7268368B2 (ja) 学習装置、学習方法および学習プログラム
US11055632B2 (en) Method and device for improving the robustness against “adversarial examples”
CN111031071B (zh) 恶意流量的识别方法、装置、计算机设备及存储介质
JP7268367B2 (ja) 学習装置、学習方法および学習プログラム
CN111931179B (zh) 基于深度学习的云端恶意程序检测系统及方法
JPWO2019168167A1 (ja) 検証方法、検証装置、コンピュータプログラム、及び、検証システム
JP2021117968A (ja) 異常検出を扱うデバイス及び方法
US20220269996A1 (en) Information processing apparatus, information processing method, and storage medium
US11562294B2 (en) Apparatus and method for analyzing time-series data based on machine learning
JP2012058787A (ja) 情報処理装置、およびその処理方法
EP4053757A1 (en) Degradation suppression program, degradation suppression method, and information processing device
US11132790B2 (en) Wafer map identification method and computer-readable recording medium
JP2010231455A (ja) 信号識別方法および信号識別装置
US20240038278A1 (en) Method and device for timing alignment of audio signals
EP3499429A1 (en) Behavior inference model building apparatus and method
JP2019159835A (ja) 学習プログラム、学習方法および学習装置
CN112989312A (zh) 验证码的识别方法、装置、电子设备和存储介质
JP2008040684A (ja) 信号識別装置の学習方法
CN115931359A (zh) 一种涡轮泵轴承故障诊断方法及装置
JP4997524B2 (ja) 多変数決定木構築システム、多変数決定木構築方法および多変数決定木を構築するためのプログラム
CN113642017A (zh) 一种基于自适应特征分类的加密流量识别方法、存储器和处理器
CN114943077A (zh) 基于深度强化学习的恶意pdf文件对抗样本生成方法
CN110991659B (zh) 异常节点识别方法、装置、电子设备及存储介质
JP7206892B2 (ja) 画像検査装置、画像検査のための学習方法および画像検査プログラム
US11308404B2 (en) Synthesizing high-fidelity signals with spikes for prognostic-surveillance applications

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220817

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230404

R150 Certificate of patent or registration of utility model

Ref document number: 7268367

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150