JPWO2019180868A1 - 画像生成装置、画像生成方法および画像生成プログラム - Google Patents

画像生成装置、画像生成方法および画像生成プログラム Download PDF

Info

Publication number
JPWO2019180868A1
JPWO2019180868A1 JP2020507205A JP2020507205A JPWO2019180868A1 JP WO2019180868 A1 JPWO2019180868 A1 JP WO2019180868A1 JP 2020507205 A JP2020507205 A JP 2020507205A JP 2020507205 A JP2020507205 A JP 2020507205A JP WO2019180868 A1 JPWO2019180868 A1 JP WO2019180868A1
Authority
JP
Japan
Prior art keywords
image
result
generated
generator
identifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020507205A
Other languages
English (en)
Other versions
JP6988995B2 (ja
Inventor
恭太 比嘉
恭太 比嘉
あずさ 澤田
あずさ 澤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019180868A1 publication Critical patent/JPWO2019180868A1/ja
Application granted granted Critical
Publication of JP6988995B2 publication Critical patent/JP6988995B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N21/88Investigating the presence of flaws or contamination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Image Analysis (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)

Abstract

画像生成手段81は、生成器を用いて画像を生成する。識別手段82は、目標画像が有する特徴を対象とする画像が含むか否かを、識別器を用いて識別する。第一更新手段83は、生成器により生成された画像である生成画像を識別器を用いて識別した結果とその生成画像に対応付けられた正解ラベルとの乖離度を表す第一の誤差を最小化するように生成器を更新する。第二更新手段84は、生成画像、目標画像が有する特徴を含む第一実画像、および、目標画像が有する特徴を含まない第二実画像を識別器を用いて識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す第二の誤差を最小化するように識別器を更新する。

Description

本発明は、所望の特徴を含むような学習用画像を生成する画像生成装置、画像生成方法および画像生成プログラムに関する。
労働人口の減少が進む中、点検や検査などを実施する熟練の保守作業員による正常か異常かの判断を、画像認識技術で支援、または、自動化したいという要求が高まっている。画像認識では、現場で収集した大量の学習用画像を用いて認識精度を向上させる必要がある。しかし、一般に、異常な状態は発生頻度が低いため、十分な量の学習用画像を収集することが難しい。
そのため、少ないデータからモデルを学習する方法が各種提案されている。例えば、GAN(Generative Adversarial Network)は、訓練データを学習し、それらのデータと似たような新しいデータを生成するモデルである。また、正常データのみでモデルを学習し、入力と出力の類似度が低ければ異常と判定する方法(例えば、Stacked Autoencoder)も知られている。
また、特許文献1には、検査対象物の不良品に生じた欠陥を写した画像が少数しか得られない場合でも、検査対象物が良品か否かを識別する識別器を学習させることができる外観検査用識別器生成装置が記載されている。特許文献1に記載された装置は、検査対象物の表面に生じる欠陥の像を擬似的に表した複数の擬似欠陥画像について、擬似欠陥画像上の欠陥の像が検査対象物の良品または不良品の何れに対応するかを表す良否判定情報を取得する。そして、特許文献1に記載された装置は、複数の擬似欠陥画像と対応する良否判定情報から検査対象物の良品と不良品とを識別する境界を決定し、欠陥の像についての特徴量とその境界に従って決定されるその特徴量に対する検査対象物の良否判定結果を表す値との組である学習サンプルを複数生成する。
また、非特許文献1には、機械学習により画像を生成する方法(DCGAN:Deep Convolutional Generative Adversarial Network)が記載されている。非特許文献1に記載された方法は、既存のGANに畳み込みネットワークを適用することでランダムノイズから写真並みの画像を生成する。
特開2011−214903号公報
画像認識を行う対象の中には、特定の特徴が全体の領域に比べて十分小さい場合も存在する。例えば、送電線アーク痕(落雷跡)は、異常状態を表していると言えるが、送電線全体の範囲と比較すると、小さい範囲に存在する特徴である。すなわち、異常部分を含む画像のほとんどの領域は正常領域である。そのため、例えば、非特許文献1に記載された方法を用いて異常状態を表す画像を生成しようとしても、特定の特徴が全体の中で埋もれてしまう結果、画像認識の精度改善に寄与する画像を生成するのが難しいという問題がある。これは、特許文献1に記載された疑似欠陥画像を生成する場合にも、同様のことが言える。
そこで、本発明は、画像認識の精度を向上させる学習用画像を生成できる画像生成装置、画像生成方法および画像生成プログラムを提供することを目的とする。
本発明の画像生成装置は、生成器を用いて画像を生成する画像生成手段と、目標画像が有する特徴を対象とする画像が含むか否かを、識別器を用いて識別する識別手段と、生成器により生成された画像である生成画像を識別器を用いて識別した結果とその生成画像に対応付けられた正解ラベルとの乖離度を表す第一の誤差を最小化するように生成器を更新する第一更新手段と、生成画像、目標画像が有する特徴を含む第一実画像、および、目標画像が有する特徴を含まない第二実画像を識別器を用いて識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す第二の誤差を最小化するように識別器を更新する第二更新手段とを備えたことを特徴とする。
本発明の画像生成方法は、生成器を用いて画像を生成し、目標画像が有する特徴を対象とする画像が含むか否かを、識別器を用いて識別し、生成器により生成された画像である生成画像を識別器を用いて識別した結果とその生成画像に対応付けられた正解ラベルとの乖離度を表す第一の誤差を最小化するように生成器を更新し、生成画像、目標画像が有する特徴を含む第一実画像、および、目標画像が有する特徴を含まない第二実画像を識別器を用いて識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す第二の誤差を最小化するように識別器を更新することを特徴とする。
本発明の画像生成プログラムは、コンピュータに、生成器を用いて画像を生成する画像生成処理、目標画像が有する特徴を対象とする画像が含むか否かを、識別器を用いて識別する識別処理、生成器により生成された画像である生成画像を識別器を用いて識別した結果とその生成画像に対応付けられた正解ラベルとの乖離度を表す第一の誤差を最小化するように生成器を更新する第一更新処理、および、生成画像、目標画像が有する特徴を含む第一実画像、および、目標画像が有する特徴を含まない第二実画像を識別器を用いて識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す第二の誤差を最小化するように識別器を更新する第二更新処理を実行させることを特徴とする。
本発明によれば、画像認識の精度を向上させる学習用画像を生成できる。
本発明の画像生成装置の一実施形態の構成例を示すブロック図である。 学習用データを出力する動作の例を示す説明図である。 画像生成装置の動作例を示すフローチャートである。 第一実画像を学習データとして用いた場合の生成画像の例を示す説明図である。 第一実画像および第二実画像を学習データとして用いた場合の生成画像の例を示す説明図である。 本発明による画像生成装置の概要を示すブロック図である。
以下、本発明の実施形態を図面を参照して説明する。本発明の画像生成装置は、ユーザが学習用画像として利用したい画像(以下、目標画像と記す。)を生成する。言い換えると、目標画像は、ユーザが所望する何らかの特徴を有する画像であり、ユーザが生成したい画像と言える。例えば、上述する送電線の例では、送電線アーク痕(落雷跡)が特徴の一例である。
また、本発明の画像生成装置は、上述する特徴を含む学習用画像が少なく、かつ、その特徴を含まない画像が生成されやすい(その特徴が埋もれてしまう可能性が高い)状況で、学習用画像を生成する場合に好適に適用される。例えば、上述する送電線アーク痕(落雷跡)の例では、送電線全体の範囲と比較すると、送電線アーク痕(落雷跡)は、小さい範囲に存在する特徴である。そのため、一般的な方法で送電線アーク痕(落雷跡)を含むような異常画像を生成しようとしても、その特徴を含まない画像(すなわち、正常画像)が生成されやすい状況と言える。本発明の画像生成装置は、そのような特徴を含むような学習用画像を生成する。
図1は、本発明の画像生成装置の一実施形態の構成例を示すブロック図である。本実施形態の画像生成装置100は、記憶部10と、画像生成手段20と、識別手段30と、第一更新手段40と、第二更新手段50とを備えている。
記憶部10は、後述する識別手段30が識別する画像を記憶する。具体的には、記憶部10は、目標画像が有する特徴を含む画像11(以下、第一実画像と記す。)と、目標画像が有する特徴を含まない画像12(以下、第二実画像と記す。)を記憶する。すなわち、第一実画像は、目標画像と言うこともできる。第一実画像および第二実画像は、ユーザ等により予め記憶部10に記憶される。
画像生成手段20は、生成器を用いて画像を生成する。以下の説明では、画像生成手段20(生成器)が生成した画像のことを、生成画像と記すこともある。生成器は、画像を生成可能な任意のモデルにより実現され、その一例がニューラルネットワークである。生成器は、後述する第一更新手段40により、その内容(例えば、パラメータ等)が逐次更新される。以下、生成器がニューラルネットワークで実現される場合を例に説明する。
画像生成手段20は、例えば、与えられた乱数から画像を生成してもよく、基準とする画像から新たな画像を生成してもよい。なお、乱数や基準とする画像から新たな画像を生成する方法は広く知られているため、ここでは詳細な説明は省略する。画像生成手段20は、生成画像を識別手段30に入力する。
識別手段30は、対象とする画像が、上述する目標画像が有する特徴を含むか否かを識別する。本実施形態では、識別手段30は、識別器を用いて画像を識別する。識別器は、対象とする画像を2種類以上に分類可能な二項分類器や多項分類器などの任意のモデルにより実現され、その一例がニューラルネットワークである。識別器は、後述する第二更新手段50により、その内容(例えば、パラメータ等)が逐次更新される。以下、識別器がニューラルネットワークで実現される場合を例に説明する。
識別手段30が識別する対象の画像は、生成画像の他、記憶部10に記憶された第一実画像および第二実画像である。識別手段30は、対象の画像の識別結果とともに、対象の画像に応じた正解ラベルを出力する。
ここで、識別手段30は、生成器の更新に用いられる正解ラベルと、識別器の更新に用いられる正解ラベルとをそれぞれ出力する。以下、生成器の更新に用いられる正解ラベルを第一の出力セット、識別器の更新に用いられる正解ラベルを第二の出力セットと記す。
まず、第一の出力セットとして、識別対象が生成画像の場合、識別手段30は、生成画像を識別した結果と、目標画像であることを示す正解ラベルを出力する。
次に、第二の出力セットとして、識別対象が生成画像の場合、識別手段30は、生成画像を識別した結果と、目標画像でないことを示す正解ラベルを出力する。また、識別対象が第一実画像の場合、識別手段30は、第一実画像を識別した結果と、目標画像であることを示す正解ラベルを出力する。さらに、識別対象が第二実画像の場合、識別手段30は、第二実画像を識別した結果と、目標画像でないことを示す正解ラベルを出力する。
このような正解ラベルを出力する理由は以下の通りである。
まず、生成器は、識別器が生成画像を目標画像と識別するような画像を生成することが望まれる。そこで、生成器には、上述するような第一の出力セットのような学習用データが必要になる。一方、識別器は、第一実画像を目標画像と識別し、第二実画像を目標画像でないと識別することが望まれる。そこで、識別器には、第一実画像に目標画像であることを示す正解ラベルが設定され、第二実画像に目標画像でないことを示す正解ラベルが設定された学習用データが必要になる。
さらに、本実施形態では、生成器に目標画像が有する特徴を含む画像を生成させることが目標である。そこで、識別器には、生成画像に目標画像でないことを示す正解ラベルが対応付けられた学習用データを準備する。これにより、生成器に対して、第一実画像のような画像を生成するような学習データを提供できる。言い換えると、このような学習用データを準備することで、第二実画像のような画像を生成することを抑制できる。
以下の説明では、目標画像であると識別された結果を“1”と表わし、目標画像でないと識別された結果を“0”と表わす。また、目標画像でないことを示す正解ラベルを“0”と表わし、目標画像であることを示す正解ラベルを“1”と表わす。ただし、正解ラベルは、0または1の2値で表される場合に限定されず、例えば、目標画像らしさの度合いに応じて0から1の間の値で目標画像らしさを表していてもよい。
図2は、学習用データを出力する動作の例を示す説明図である。画像生成手段20は、ノイズ13aに基づいて生成器20aにより生成画像を生成する。識別手段30は、識別器30aを用いて、生成画像、第一実画像11a、および、第二実画像12aを識別する。識別手段30は、生成器20aの学習データD1(すなわち、第一の出力セット)として、生成画像の識別結果(1または0)と、正解ラベル“1”を対応付けた学習データを出力する。また、識別手段30は、識別器30aの学習データD2(すなわち、第二の出力セット)として、第一実画像の識別結果(1または0)と、正解ラベル“1”を対応付けた学習データ、第二実画像の識別結果(1または0)と、正解ラベル“0”を対応付けた学習データ及び生成画像の識別結果(1または0)と、正解ラベル“0”を対応付けた学習データを出力する。
第一更新手段40は、画像生成手段20が画像を生成する際に用いる生成器を更新する。具体的には、第一更新手段40は、識別器を用いて生成画像を識別した結果と、その生成画像に対応付けられた正解ラベルとの乖離度を表す誤差(以下、第一の誤差と記す。)を最小化するように生成器を更新する。
生成器の更新には、第一の出力セットが用いられる。すなわち、識別手段30は、生成器を更新するための学習データとして、生成画像を識別した結果と目標画像であることを示す正解ラベルとを出力する。そこで、第一更新手段40は、生成画像を識別した結果と目標画像であることを示す正解ラベルとの乖離度を表す第一の誤差を最小化するように生成器を更新する。
例えば、生成画像の識別結果が、目標画像であることを表す値“1”である場合、目標画像であることを示す正解ラベル“1”との乖離度は0になる。一方、生成画像の識別結果が、目標画像でないことを表す値“0”である場合、目標画像であることを示す正解ラベル“1”との乖離度は1になる。そこで、第一更新手段40は、乖離度(誤差)を最小化するように生成器を更新する。
生成器を更新する方法は、用いる生成器に応じて決定される。例えば、生成器がニューラルネットワークの場合、第一更新手段40は、識別手段30が出力した第一の出力セットを学習データとして、乖離度を最小化するようなパラメータを学習してもよい。
例えば、損失関数Eを以下に例示する式1のように定義した場合、第一更新手段40は、この損失関数Eを最小化するように生成器のパラメータを最適化してもよい。なお、下記に示す損失関数Eは例示であり、生成器のパラメータを最適化可能な任意の方法が用いられれば良い。
Figure 2019180868
式1において、Nはデータ数を表わし、Kは分類するクラスの数を表わす。また、式
1におけるtk´nは、n番目の入力データに対する正解ラベルのベクトルであり、以下に例示する式2のような形式で表される。式2に例示するベクトルは、k番目の要素のみ1を表す、いわゆる1−of−kベクトルである。
= (0,…,0,1,0,…,0) (式2)
また、式1におけるPk´(x)は、n番目の入力データがクラスk´に属する確率を示す。Pk´(x)は、以下に例示する式3で算出される。
Figure 2019180868
式3において、f(x)は、n番目の入力データxに対するクラスkの出力値であり、xがクラスkに属する確率である。
第二更新手段50は、識別手段30が画像を識別する際に用いる識別器を更新する。具体的には、第二更新手段50は、識別器を用いて生成画像、第一実画像、および、第二実画像を識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す誤差(以下、第二の誤差と記す。)を最小化するように識別器を更新する。
第二更新手段50が乖離度(誤差)を算出する方法は、第一更新手段40が乖離度(誤差)を算出する方法と同様である。また、識別器を更新する方法も、用いる識別器に応じて決定される。例えば、識別器がニューラルネットワークの場合、第二更新手段50は、識別手段30が出力した第二の出力セットを学習データとして、乖離度を最小化するようなパラメータを学習してもよい。
なお、第二更新手段50がパラメータを学習する方法は、第一更新手段40がパラメータを学習する方法と同様であってもよく、異なっていてもよい。例えば、第二更新手段50が第一更新手段40と同様の方法に基づいて識別器のパラメータを更新するとする。この場合、正解画像を用いた学習データに基づく損失をE、第一実画像を用いた学習データに基づく損失をE、第二実画像を用いた学習データに基づく損失をEとしたとき、第二更新手段50は、3つの損失の総和E=E+E+Eを最小化するように識別器のパラメータを最適化してもよい。
このようにして、第二更新手段50は、生成画像を識別した結果と目標画像でないことを示す正解ラベルとの乖離度、第一実画像を識別した結果と目標画像であることを示す正解ラベルとの乖離度、および、第二実画像を識別した結果と目標画像でないことを示す正解ラベルとの乖離度を含む第二の誤差を最小化するように識別器を更新する。
画像生成手段20と、識別手段30と、第一更新手段40と、第二更新手段50とは、プログラム(画像生成プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、画像生成装置100の記憶部10に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、画像生成手段20、識別手段30、第一更新手段40および第二更新手段50として動作してもよい。また、画像生成手段20と、識別手段30と、第一更新手段40と、第二更新手段50とは、それぞれが専用のハードウェアで実現されていてもよい。
次に、本実施形態の画像生成装置100の動作を説明する。図3は、本実施形態の画像生成装置100の動作例を示すフローチャートである。
画像生成手段20は、生成器を用いて画像を生成する(ステップS11)。そして、識別手段30は、生成画像が目的画像と言えるか否か識別する(ステップS12)。同様に、識別手段30は、第一実画像が目的画像と言えるか否かを識別し(ステップS13)、第二実画像が目的画像と言えるか否かを識別する(ステップS14)。なお、ステップS11およびステップS12の処理、ステップS13の処理、並びに、ステップS14の処理は、並列に行われてもよい。
第一更新手段40は、生成画像の識別結果から第一の誤差を計算する(ステップS15)。そして、第一更新手段40は、第一の誤差を最小化するように生成器を更新する(ステップS16)。
第二更新手段50は、生成画像の識別結果、第一実画像の識別結果、及び、第二実画像の識別結果から第二の誤差を計算する(ステップS17)。そして、第二更新手段50は、第二の誤差を最小化するように識別器を更新する(ステップS18)。なお、ステップS15およびステップS16の処理、並びに、ステップS17の処理およびステップS18の処理は、並列に行われてもよい。
以上のように、本実施形態では、画像生成手段20が、生成器を用いて画像を生成し、識別手段30が、目標画像が有する特徴を対象とする画像が含むか否かを、識別器を用いて識別する。そして、第一更新手段40が、識別器を用いて生成画像を識別した結果とその生成画像に対応付けられた正解ラベルとの乖離度を表す第一の誤差を最小化するように生成器を更新する。また、第二更新手段50が、識別器を用いて、生成画像、第一実画像、および、第二実画像を識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す第二の誤差を最小化するように識別器を更新する。
よって、画像認識の精度を向上させる学習用画像を生成できる。すなわち、本実施形態では、生成器が目標画像を生成できるように更新されるため、より多くの適切な目標画像を学習用画像として生成できる。
以下、具体的な実施例により本発明を説明するが、本発明の範囲は以下に説明する内容に限定されない。本実施例では、数字の「7」を目標画像として、第一実画像のみを用いた生成器の学習と、第一実画像および第二実画像を用いた識別器および生成器の学習とを行い、生成される画像を比較した。
図4は、第一実画像のみを用いて生成器を学習した結果生成された画像の例を示す説明図である。また、図5は、第一実画像および第二実画像を用いて生成器を学習した結果生成された画像の例を示す説明図である。
図4に示す例では、第一実画像として、数字の「7」を含む画像X1を準備した。この画像X1を用いて生成器を学習した結果、画像G1が生成されたが、生成された画像G1のうち、画像g1〜g4は、数字の「1」に似た画像が生成された。
一方、図5に示す例では、第一実画像として、数字の「7」を含む画像Xp1と、第二実画像として、数字の「1」を含む画像Xn1を準備した。この画像Xp1および画像Xn1を用いて生成器および識別器を学習した結果、画像G2が生成された。この実施例では、第二実画像に数字の「1」を含む画像を用いた結果、数字の「1」に似た画像の生成が抑制され、全体として数字の「7」を含む画像が生成された。
次に、本発明の概要を説明する。図6は、本発明による画像生成装置の概要を示すブロック図である。本発明による画像生成装置80(例えば、画像生成装置100)は、生成器を用いて画像を生成する画像生成手段81(例えば、画像生成手段20)と、目標画像が有する特徴を対象とする画像が含むか否かを、識別器を用いて識別する識別手段82(例えば、識別手段30)と、生成器により生成された画像である生成画像を識別器を用いて識別した結果とその生成画像に対応付けられた正解ラベルとの乖離度を表す第一の誤差を最小化するように生成器を更新する第一更新手段83(例えば、第一更新手段40)と、生成画像、目標画像が有する特徴を含む第一実画像、および、目標画像が有する特徴を含まない第二実画像を識別器を用いて識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す第二の誤差を最小化するように識別器を更新する第二更新手段84(例えば、第二更新手段50)とを備えている。
そのような構成により、目標画像を生成可能な生成器を学習できるため、画像認識の精度を向上させる学習用画像を生成できる。
また、第二更新手段84は、生成画像を識別した結果と目標画像でないことを示す正解ラベルとの乖離度、第一実画像を識別した結果と目標画像であることを示す正解ラベルとの乖離度、および、第二実画像を識別した結果と目標画像でないことを示す正解ラベルとの乖離度を含む第二の誤差を最小化するように識別器を更新してもよい。
また、第一更新手段83は、生成画像を識別した結果と目標画像であることを示す正解ラベルとの乖離度を表す第一の誤差を最小化するように生成器を更新してもよい。
また、識別手段82は、対象の画像を識別した結果とともに、その対象の画像に応じた正解ラベルを出力してもよい。そして、第一更新手段83は、生成画像を識別した結果と出力された正解ラベルとの第一の誤差を最小化するように生成器を更新し、第二更新手段84は、生成画像を識別した結果と正解ラベルとの乖離度、第一実画像を識別した結果と出力された正解ラベルとの乖離度、および、第二実画像を識別した結果と出力された正解ラベルとの乖離度を含む第二の誤差を最小化するように識別器を更新してもよい。
また、識別手段82は、対象の画像が生成画像の場合、その生成画像を識別した結果と目標画像でないことを示す正解ラベルとを出力し、対象の画像が第一実画像の場合、その第一実画像を識別した結果と目標画像であることを示す正解ラベルとを出力し、対象の画像が第二実画像の場合、その第二実画像を識別した結果と目標画像でないことを示す正解ラベルとを出力し、第二更新手段84は、生成画像を識別した結果と正解ラベルとの乖離度、第一実画像を識別した結果と正解ラベルとの乖離度、および、第二実画像を識別した結果と正解ラベルとの乖離度を含む第二の誤差を最小化するように識別器を更新してもよい。
また、識別手段82は、対象の画像が生成画像の場合、その生成画像を識別した結果と目標画像でないことを示す正解ラベルとを出力し、第一更新手段83は、生成画像を識別した結果と正解ラベルとの第一の誤差を最小化するように生成器を更新してもよい。
10 記憶部
11,11a 第一実画像
12,12a 第二実画像
13a ノイズ
20 画像生成手段
20a 生成器
30 識別手段
30a 識別器
40 第一更新手段
50 第二更新手段
100 画像生成装置
D1,D2 学習データ
X1,Xp1 第一実画像
Xn1 第二実画像
G1,G2 生成画像

Claims (8)

  1. 生成器を用いて画像を生成する画像生成手段と、
    目標画像が有する特徴を対象とする画像が含むか否かを、識別器を用いて識別する識別手段と、
    前記生成器により生成された画像である生成画像を前記識別器を用いて識別した結果と当該生成画像に対応付けられた正解ラベルとの乖離度を表す第一の誤差を最小化するように前記生成器を更新する第一更新手段と、
    前記生成画像、前記目標画像が有する特徴を含む第一実画像、および、前記目標画像が有する特徴を含まない第二実画像を前記識別器を用いて識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す第二の誤差を最小化するように前記識別器を更新する第二更新手段とを備えた
    ことを特徴とする画像生成装置。
  2. 第二更新手段は、生成画像を識別した結果と目標画像でないことを示す正解ラベルとの乖離度、第一実画像を識別した結果と目標画像であることを示す正解ラベルとの乖離度、および、第二実画像を識別した結果と目標画像でないことを示す正解ラベルとの乖離度を含む第二の誤差を最小化するように識別器を更新する
    請求項1記載の画像生成装置。
  3. 第一更新手段は、生成画像を識別した結果と目標画像であることを示す正解ラベルとの乖離度を表す第一の誤差を最小化するように生成器を更新する
    請求項1または請求項2記載の画像生成装置。
  4. 識別手段は、対象の画像を識別した結果とともに、当該対象の画像に応じた正解ラベルを出力し、
    第一更新手段は、生成画像を識別した前記結果と前記正解ラベルとの第一の誤差を最小化するように生成器を更新し、
    第二更新手段は、生成画像を識別した前記結果と前記正解ラベルとの乖離度、第一実画像を識別した前記結果と前記正解ラベルとの乖離度、および、第二実画像を識別した前記結果と前記正解ラベルとの乖離度を含む第二の誤差を最小化するように識別器を更新する
    請求項1から請求項3のうちのいずれか1項に記載の画像生成装置。
  5. 識別手段は、対象の画像が生成画像の場合、当該生成画像を識別した結果と目標画像でないことを示す正解ラベルとを出力し、対象の画像が第一実画像の場合、当該第一実画像を識別した結果と目標画像であることを示す正解ラベルとを出力し、対象の画像が第二実画像の場合、当該第二実画像を識別した結果と目標画像でないことを示す正解ラベルとを出力し、
    第二更新手段は、生成画像を識別した前記結果と前記正解ラベルとの乖離度、第一実画像を識別した前記結果と前記正解ラベルとの乖離度、および、第二実画像を識別した前記結果と前記正解ラベルとの乖離度を含む第二の誤差を最小化するように識別器を更新する
    請求項1から請求項4のうちのいずれか1項に記載の画像生成装置。
  6. 識別手段は、対象の画像が生成画像の場合、当該生成画像を識別した結果と目標画像でないことを示す正解ラベルとを出力し、
    第一更新手段は、生成画像を識別した前記結果と前記正解ラベルとの第一の誤差を最小化するように生成器を更新する
    請求項1から請求項5のうちのいずれか1項に記載の画像生成装置。
  7. 生成器を用いて画像を生成し、
    目標画像が有する特徴を対象とする画像が含むか否かを、識別器を用いて識別し、
    前記生成器により生成された画像である生成画像を前記識別器を用いて識別した結果と当該生成画像に対応付けられた正解ラベルとの乖離度を表す第一の誤差を最小化するように前記生成器を更新し、
    前記生成画像、前記目標画像が有する特徴を含む第一実画像、および、前記目標画像が有する特徴を含まない第二実画像を前記識別器を用いて識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す第二の誤差を最小化するように前記識別器を更新する
    ことを特徴とする画像生成方法。
  8. コンピュータに、
    生成器を用いて画像を生成する画像生成処理、
    目標画像が有する特徴を対象とする画像が含むか否かを、識別器を用いて識別する識別処理、
    前記生成器により生成された画像である生成画像を前記識別器を用いて識別した結果と当該生成画像に対応付けられた正解ラベルとの乖離度を表す第一の誤差を最小化するように前記生成器を更新する第一更新処理、および、
    前記生成画像、前記目標画像が有する特徴を含む第一実画像、および、前記目標画像が有する特徴を含まない第二実画像を前記識別器を用いて識別した結果と、各画像に対応付けられた正解ラベルとの乖離度を表す第二の誤差を最小化するように前記識別器を更新する第二更新処理
    を実行させるための画像生成プログラム。
JP2020507205A 2018-03-22 2018-03-22 画像生成装置、画像生成方法および画像生成プログラム Active JP6988995B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/011367 WO2019180868A1 (ja) 2018-03-22 2018-03-22 画像生成装置、画像生成方法および画像生成プログラム

Publications (2)

Publication Number Publication Date
JPWO2019180868A1 true JPWO2019180868A1 (ja) 2021-02-25
JP6988995B2 JP6988995B2 (ja) 2022-01-05

Family

ID=67986054

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020507205A Active JP6988995B2 (ja) 2018-03-22 2018-03-22 画像生成装置、画像生成方法および画像生成プログラム

Country Status (3)

Country Link
US (1) US11373285B2 (ja)
JP (1) JP6988995B2 (ja)
WO (1) WO2019180868A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126446B (zh) * 2019-11-29 2023-04-07 西安工程大学 一种机器人视觉工业产品缺陷图像数据增广方法
JP7392166B2 (ja) * 2020-08-26 2023-12-05 三菱重工業株式会社 画像生成装置、画像生成方法およびプログラム
JP7408515B2 (ja) * 2020-09-09 2024-01-05 株式会社東芝 学習装置、方法およびプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011214903A (ja) * 2010-03-31 2011-10-27 Denso It Laboratory Inc 外観検査装置、外観検査用識別器の生成装置及び外観検査用識別器生成方法ならびに外観検査用識別器生成用コンピュータプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10600185B2 (en) * 2017-03-08 2020-03-24 Siemens Healthcare Gmbh Automatic liver segmentation using adversarial image-to-image network
US20190147320A1 (en) * 2017-11-15 2019-05-16 Uber Technologies, Inc. "Matching Adversarial Networks"
US10592779B2 (en) * 2017-12-21 2020-03-17 International Business Machines Corporation Generative adversarial network medical image generation for training of a classifier
US10937540B2 (en) * 2017-12-21 2021-03-02 International Business Machines Coporation Medical image classification based on a generative adversarial network trained discriminator
US10540578B2 (en) * 2017-12-21 2020-01-21 International Business Machines Corporation Adapting a generative adversarial network to new data sources for image classification

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011214903A (ja) * 2010-03-31 2011-10-27 Denso It Laboratory Inc 外観検査装置、外観検査用識別器の生成装置及び外観検査用識別器生成方法ならびに外観検査用識別器生成用コンピュータプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RADFORD, ALEC ET AL.: "UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS", UNDER REVIEW AS A CONFERENCE PAPER AT ICLR 2016, JPN6021043655, 2016, pages 1 - 16, ISSN: 0004632736 *
伊藤 秀将 外2名: "画像認識精度を向上させるディープラーニング技術を用いた学習用画像の自動生成", 東芝レビュー VOL.72 NO.4, vol. 第72巻 第4号, JPN6021043653, 30 September 2017 (2017-09-30), JP, pages 18 - 21, ISSN: 0004632737 *
高橋 智洋: "Families of GANs", 電子情報通信学会技術研究報告 VOL.117 NO.238 PRMU2017−63−PRMU2017, vol. 第117巻 第238号, JPN6021043658, 5 October 2017 (2017-10-05), JP, pages 95 - 100, ISSN: 0004632735 *

Also Published As

Publication number Publication date
JP6988995B2 (ja) 2022-01-05
WO2019180868A1 (ja) 2019-09-26
US20210056675A1 (en) 2021-02-25
US11373285B2 (en) 2022-06-28

Similar Documents

Publication Publication Date Title
JP6708385B2 (ja) 識別器作成装置、識別器作成方法、およびプログラム
JP6277818B2 (ja) 機械学習装置、機械学習方法、及びプログラム
WO2020008919A1 (ja) 機械学習装置及び方法
JP2015087903A (ja) 情報処理装置及び情報処理方法
JP2020123330A (ja) ニューラルネットワーク学習に利用されるオートラベリングされたイメージのうちでラベル検収のためのサンプルイメージを取得する方法、及びそれを利用したサンプルイメージ取得装置
US12056210B2 (en) AI-based pre-training model determination system, and AI-based vision inspection management system using same for product production lines
WO2019187594A1 (ja) 学習装置、学習方法および学習プログラム
EP3598288A1 (en) System and method for generating photorealistic synthetic images based on semantic information
JP6988995B2 (ja) 画像生成装置、画像生成方法および画像生成プログラム
JP2018026122A5 (ja)
US10885593B2 (en) Hybrid classification system
JP2019067299A (ja) ラベル推定装置及びラベル推定プログラム
JPWO2020240808A1 (ja) 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム
WO2021245819A1 (ja) 学習装置、学習済みモデル生成方法、及び、記録媒体
WO2020054551A1 (ja) 情報処理装置、情報処理方法、プログラム
CN113780365B (zh) 样本生成方法和装置
WO2021095509A1 (ja) 推定システム、推定装置および推定方法
US20220405534A1 (en) Learning apparatus, information integration system, learning method, and recording medium
JP2005352997A (ja) 事例データベースの構築方法、判別装置の学習方法、データ判別支援装置、データ判別支援プログラム
CN114820618B (zh) 瑕疵检测模型的训练方法、装置、设备及存储介质
CN111727108B (zh) 用于控制机器人的方法、装置及系统以及存储介质
KR102018788B1 (ko) 이미지 분류 시스템 및 방법
US20200265270A1 (en) Mutual neighbors
US20230094940A1 (en) System and method for deep learning based continuous federated learning
US20220180495A1 (en) Abnormality detection apparatus, control method, and program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200901

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211115

R150 Certificate of patent or registration of utility model

Ref document number: 6988995

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150