WO2021084580A1

WO2021084580A1 - モデル生成システム、方法およびプログラム

Info

Publication number: WO2021084580A1
Application number: PCT/JP2019/042152
Authority: WO
Inventors: 亮高本
Original assignee: 日本電気株式会社
Priority date: 2019-10-28
Filing date: 2019-10-28
Publication date: 2021-05-06
Also published as: JPWO2021084580A1; US20240135143A1; JP7283566B2

Abstract

データ生成部６は、偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成する。識別部７は、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する。勾配情報算出部８は、１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、識別モデルが有する重み毎の更新量である勾配情報を算出する。選択部９は、偽データ毎に計算された重み毎の勾配情報に基づいて、第１の個数の偽データの中から保存データ記憶部４に記憶させるべき偽データを選択し、選択した偽データを保存データ記憶部４に記憶させる。

Description

モデル生成システム、方法およびプログラム

　本発明は、モデル生成システム、モデル生成方法およびモデル生成プログラムに関し、特に、敵対的生成ネットワークにおけるモデルを生成するモデル生成システム、モデル生成方法およびモデル生成プログラムに関する。

　敵対的生成ネットワークでは、与えられたデータが真データか偽データかを識別する識別器と、偽データを生成する生成器とを用いる。そして、敵対的生成ネットワークでは、生成器には、識別器を欺くような偽データを生成するように、生成器のモデルの学習を行わせ、識別器には、識別精度を向上させるように、識別器のモデルの学習を行わせる。

　識別器のモデルの学習には、生成器が新たに生成した偽データが用いられる。

　敵対的生成ネットワークは、例えば、特許文献１に記載されている。

　また、非特許文献１には、敵対的生成ネットワークにおいて、過去に生成した画像を保存することが記載されている。

特開２０１９－４６３９０号公報

Ashish Shrivastava、外５名、"Learning from Simulated and Unsupervised Images through Adversarial Training"、［２０１９年８月６日検索］、インターネット　<URL : https://arxiv.org/pdf/1612.07828.pdf>

　敵対的生成ネットワークには学習が不安定であるという問題がある。ここで、学習が不安定であるとは、必ずしも学習がうまくいくとは限らないことである。

　敵対的生成ネットワークにおいて、学習が不安定となる例として、以下に示す例が挙げられる。

　生成器は、ある程度、ランダムに偽データを生成する。そのため、生成器が、それまでと全く異なる偽データを生成し始める場合がある。そのような場合に、識別器が、その偽データを真データよりも真データらしいと識別したり、偽データらしさが非常に強い偽データであると識別したりすると、識別器に大きなペナルティが与えられる。その結果、その偽データに特化して識別精度が高くなるモデルが学習されてしまう。

　そこで、本発明は、敵対的生成ネットワークにおける各モデルを良好に生成することができる（換言すれば、安定的に生成することができる）モデル生成システム、モデル生成方法およびモデル生成プログラムを提供することを目的とする。

　本発明によるモデル生成システムは、保存しておくべき偽データを記憶する保存データ記憶部と、偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、識別モデルが有する重み毎の更新量である勾配情報を算出する勾配情報算出部と、偽データ毎に計算された重み毎の勾配情報に基づいて、第１の個数の偽データの中から保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを保存データ記憶部に記憶させる選択部とを備えることを特徴とする。

　本発明によるモデル生成システムは、保存しておくべき偽データを記憶する保存データ記憶部と、偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出する距離算出部と、偽データ毎に計算された距離に基づいて、第１の個数の偽データの中から保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを保存データ記憶部に記憶させる選択部とを備えることを特徴とする。

　本発明によるモデル生成方法は、コンピュータが、偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成し、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出し、１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、識別モデルが有する重み毎の更新量である勾配情報を算出し、偽データ毎に計算された重み毎の勾配情報に基づいて、第１の個数の偽データの中から、保存しておくべき偽データを記憶する保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを保存データ記憶部に記憶させることを特徴とする。

　本発明によるモデル生成方法は、コンピュータが、偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成し、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出し、１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、偽データ毎に計算された距離に基づいて、第１の個数の偽データの中から、保存しておくべき偽データを記憶する保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを保存データ記憶部に記憶させることを特徴とする。

　本発明によるモデル生成プログラムは、コンピュータを、保存しておくべき偽データを記憶する保存データ記憶部と、偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、識別モデルが有する重み毎の更新量である勾配情報を算出する勾配情報算出部と、偽データ毎に計算された重み毎の勾配情報に基づいて、第１の個数の偽データの中から保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを保存データ記憶部に記憶させる選択部とを備えるモデル生成システムとして機能させることを特徴とする。

　本発明によるモデル生成プログラムは、コンピュータを、保存しておくべき偽データを記憶する保存データ記憶部と、偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出する距離算出部と、偽データ毎に計算された距離に基づいて、第１の個数の偽データの中から保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを保存データ記憶部に記憶させる選択部とを備えるモデル生成システムとして機能させることを特徴とする。

　本発明によれば、敵対的生成ネットワークにおける各モデルを良好に生成することができる。

本発明の実施形態のモデル生成システムの例を示すブロック図である。ディープニューラルネットワークである生成モデルおよび識別モデルの例を示す模式図である。本発明の実施形態の処理経過の例を示すフローチャートである。本発明の実施形態の処理経過の例を示すフローチャートである。本発明の実施形態の処理経過の例を示すフローチャートである。本発明の実施形態の処理経過の例を示すフローチャートである。本発明の実施形態のモデル生成システムに係るコンピュータの構成例を示す概略ブロック図である。本発明のモデル生成システムの概要を示すブロック図である。本発明のモデル生成システムの概要の他の例を示すブロック図である。

　以下、本発明の実施形態を図面を参照して説明する。

　図１は、本発明の実施形態のモデル生成システムの例を示すブロック図である。本実施形態のモデル生成システム１は、真データ入力部２と、真データ記憶部３と、保存データ記憶部４と、シード入力部５と、データ生成部６と、識別部７と、勾配情報算出部８と、選択部９と、識別モデル更新部１０と、生成モデル更新部１１とを備える。

　以下の説明において、真データとは、予め真データとして定められたデータである。

　真データ入力部２は、外部から複数個の真データの入力を受け付け、その複数個の真データを真データ記憶部３に記憶させる。

　真データ記憶部３は、複数個の真データを記憶する記憶装置である。

　外部から入力され真データ記憶部３に記憶された複数個の真データは、固定的に定められ、モデル生成システム１の処理の経過中に入れ替えられることはない。ただし、モデル生成システム１が処理を最初からやり直す場合には、真データ記憶部３が記憶する複数個の真データが入れ替えられてもよい。

　保存データ記憶部４は、保存しておくべき偽データを記憶する記憶装置である。保存しておくべき偽データとは、データ生成部６によって生成された偽データのうち、選択部９によって選択された偽データである。保存データ記憶部４は、複数個の偽データを記憶する。保存データ記憶部４に真データが記憶されることはない。

　真データおよび偽データは、例えば、画像データであってもよい。この場合、真データ記憶部３は、真データとして定められた画像データを記憶する。また、データ生成部６は、偽データに該当する画像データを生成する。

　また、真データおよび偽データは、例えば、音声データであってもよい。この場合、真データ記憶部３は、真データとして定められた音声データを記憶する。また、データ生成部６は、偽データに該当する音声データを生成する。

　なお、画像データや音声データは、真データおよび偽データの例であり、真データおよび偽データは、他の形式のデータであってもよい。

　データ生成部６は、シードを用いて、生成モデルに基づいて、偽データを生成する。生成モデルは、偽データを生成するためのモデルである。データ生成部６は、生成モデルを有する。

　シード入力部５は、データ生成部６にシードを入力する。シードとは、偽データを生成する際に生成モデルへの入力となるデータである。シードは、例えば、乱数の配列で表される。

　識別部７は、真データであるか偽データであるかの識別対象となるデータが与えられ、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出する。識別部７は、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するための識別モデルに基づいて、出力値を導出する。識別部７は、与えられたデータを識別モデルへの入力として出力値を導出すればよい。識別部７は、識別モデルを有する。

　ここでは、与えられたデータの真データらしさが高いほど（与えられたデータが真データである可能性が高いほど）、出力値が１に近い値となり、与えられたデータの偽データらしさが高いほど（与えられたデータが偽データである可能性が高いほど）、出力値が０に近い値となる場合を例にする。この場合、出力値の取り得る範囲は０～１となる。ただし、出力値の取り得る範囲として、０～１ではなく、他の数値範囲が定められていてもよい。

　また、識別部７は、与えられたデータ（識別対象となるデータ）に対する出力値を導出するだけでなく、与えられたデータが真データか偽データであるかを識別する。識別部７は、与えられたデータを識別モデルへの入力として、与えられたデータが真データか偽データであるかを識別すればよい。

　本実施形態では、生成モデルが、偽データを生成するためのニューラルネットワークであり、識別モデルが、出力値を導出するためのニューラルネットワークである場合を例にして説明する。より具体的には、生成モデルが、偽データを生成するためのディープニューラルネットワークであり、識別モデルが、出力値を導出するためのディープニューラルネットワークである場合を例にして説明する。

　図２は、ディープニューラルネットワークである生成モデルおよび識別モデルの例を示す模式図である。以下、ディープニューラルネットワークを、ＤＮＮと記す。

　ＤＮＮは、複数の層を有し、各層には１つ以上のノードが含まれている（図２参照）。図２では、層を角丸四角形で表し、ノードを円で表している。

　ＤＮＮ内の個々のノードにはそれぞれ重みが定められる。すなわち、ＤＮＮは、ノード毎に重みを有する。

　生成モデルとなるＤＮＮにおける層やノードの構成と、識別モデルとなるＤＮＮにおける層やノードの構成とは、異なっていてよい。層やノードの構成とは、例えば、層の数や、層に含まれるノードの数等である。

　データ生成部６は、偽データを生成する際に、複数個の偽データを生成する。この偽データの個数を第１の個数と記し、第１の個数をｙ’個と表すこととする。第１の個数は、複数個である。

　データ生成部６が第１の個数（ｙ’個）の偽データを生成した場合、モデル生成システム１は、識別モデルおよび生成モデルを更新するための動作と、保存データ記憶部４に記憶させる偽データを第１の個数（ｙ’個）の偽データの中から選択する動作とを並行に行う。

　勾配情報算出部８は、真データに対する出力値と偽データに対する出力値の距離を算出する。真データに対する出力値は、識別部７が真データを識別モデルに適用して導出する出力値である。偽データに対する出力値は、識別部７が偽データを識別モデルに適用して導出する出力値である

　真データに対する出力値の数と、偽データに対する出力値の数がそれぞれ１つならば、勾配情報算出部８は、その２つの出力値の差の絶対値を、距離としてもよい。

　真データに対する出力値の数と、偽データに対する出力値の数がそれぞれ複数ならば、勾配情報算出部８は、真データに対する出力値の平均値と、偽データに対する出力値の平均値との差の絶対値を距離としてもよい。

　上記の距離の算出方法は例示であり、真データに対する出力値と偽データに対する出力値の距離の算出方法は、上記の例に限定されない。

　勾配情報算出部８は、距離を算出した後、その距離を所定量増大させるように識別モデルが有する重み毎に勾配情報を算出する。勾配情報は、ＤＮＮの重みを更新することによってＤＮＮを更新する場合における重み毎の更新量（変化量）である。勾配情報は、ＤＮＮ内の重み毎（換言すれば、ノード毎）に算出される。

　勾配情報算出部８は、距離を所定量増大させるように識別モデルが有する重み毎に勾配情報を算出する動作を、識別モデルおよび生成モデルを更新するための動作と、保存データ記憶部４に記憶させる偽データをｙ’個の偽データの中から選択する動作のそれぞれにおいて実行する。

　識別モデルおよび生成モデルを更新するための動作では、識別モデルが有する重み毎に勾配情報が算出された後に、識別モデル更新部１０が、識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、識別モデルを更新する。

　保存データ記憶部４に記憶させる偽データをｙ’個の偽データの中から選択する動作では、勾配情報算出部８は、１つの真データとｙ’個の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値の距離を算出し、距離を所定量増大させるように識別モデルが有する重み毎に勾配情報を算出する動作を実行する。この結果、ｙ’個の偽データ毎に、識別モデルが有する重み毎の勾配情報が得られる。選択部９は、ｙ’個の偽データ毎に算出された、識別モデルが有する重み毎の勾配情報に基づいて、ｙ’個（第１の個数）の偽データの中から保存データ記憶部４に記憶させる偽データを選択する。そして、選択部９は、選択した偽データを保存データ記憶部４に記憶させる。

　例えば、勾配情報算出部８が、ｙ’個の偽データ毎に、識別モデルが有する重み毎の勾配情報の絶対値の平均値を算出してもよい。そして、選択部９は、ｙ’個の偽データ毎に算出されたその平均値に基づいて、ｙ’個（第１の個数）の偽データの中から保存データ記憶部４に記憶させる偽データを選択してもよい。

　また、識別モデルおよび生成モデルを更新するための動作の過程においても、データ生成部６は、複数個の偽データを生成する。この偽データの個数を第２の個数と記し、第２の個数をｚ’個と表すこととする。第２の個数は、複数個である。この場合、勾配情報算出部８は、真データに対する出力値と偽データに対する出力値の距離を算出し、その距離を所定量減少させるように生成モデルが有する重み毎（換言すれば、ノード毎）に勾配情報を算出する。そして、生成モデル更新部１１が、生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、生成モデルを更新する。

　真データ入力部２は、例えば、モデル生成プログラムに従って動作するコンピュータのＣＰＵ（Central Processing Unit ）、および、入力デバイスによって実現される。例えば、ＣＰＵが、コンピュータのプログラム記憶装置等のプログラム記録媒体からモデル生成プログラムを読み込み、そのモデル生成プログラムに従って、入力デバイスを用いて、真データ入力部２として動作すればよい。この入力デバイスは、例えば、記録媒体に記録された複数の真データを読み込むデータ読み込み装置等であってもよい。また、シード入力部５、データ生成部６、識別部７、勾配情報算出部８、選択部９、識別モデル更新部１０および生成モデル更新部１１は、例えば、モデル生成プログラムに従って動作するＣＰＵによって実現される。例えば、ＣＰＵが上記のようにプログラム記録媒体からモデル生成プログラムを読み込み、そのモデル生成プログラムに従って、シード入力部５、データ生成部６、識別部７、勾配情報算出部８、選択部９、識別モデル更新部１０および生成モデル更新部１１として動作すればよい。真データ記憶部３および保存データ記憶部４は、例えば、コンピュータが備える記憶装置によって実現される。

　次に、本発明の実施形態の処理経過について説明する。図３から図６までは、本発明の実施形態の処理経過の例を示すフローチャートである。なお、データ生成部６が有する生成モデル（ＤＮＮ）の構成、および、識別部７が有する識別モデル（ＤＮＮ）の構成は、予め定められているとする。ＤＮＮの構成は、例えば、層の数や、個々の層に含まれているノードの数等である。

　また、保存データ記憶部４には、ある一定個数以上の偽データが既に記憶されているものとする。保存データ記憶部４に記憶されている偽データの数が上記の一定個数に達していない場合（すなわち、保存データ記憶部４に記憶されている偽データの数が十分でない場合）の動作については、後述する。

　まず、データ生成部６が、生成モデルが有する各重みの値を初期化する（ステップＳ１）。データ生成部６は、例えば、生成モデルの各重みの値をランダムに定めることによって、重みの値を初期化してもよい。あるいは、データ生成部６は、他の方法で、各重みの値を初期化してもよい。

　次に、識別部７が、識別モデルが有する各重みの値を初期化する（ステップＳ２）。識別部７は、例えば、識別モデルの各重みの値をランダムに定めることによって、重みの値を初期化してもよい。あるいは、識別部７は、他の方法で、各重みの値を初期化してもよい。

　次に、真データ入力部２が、外部から複数個の真データの入力を受け付け、その複数個の真データを真データ記憶部３に記憶させる（ステップＳ３）。ステップＳ３の後、真データ記憶部３が記憶する複数個の真データが入れ替えられることはない。

　次に、シード入力部５がデータ生成部６にシードを入力し、データ生成部６が、そのシードを生成モデルの入力として、第１の個数（ｙ’個）の偽データを生成する（ステップＳ４）。

　ステップＳ４の後、モデル生成システム１は、識別モデルおよび生成モデルを更新するための動作と、保存データ記憶部４に記憶させる偽データを第１の個数（ｙ’個）の偽データの中から選択する動作とを並行に行う。

　まず、保存データ記憶部４に記憶させる偽データを第１の個数（ｙ’個）の偽データの中から選択する動作を、図４を参照して説明する。識別モデルおよび生成モデルを更新するための動作については、図５および図６を用いて後述する。

　ステップＳ４の後、識別部７は、真データ入力部２に記憶されている複数個の真データの中から１つの真データを選択する。このとき、識別部７は、例えば、ランダムに１つの真データを選択してよい。そして、識別部７は、その１つの真データ、および、ステップＳ４で生成されたｙ’個の偽データそれぞれに対する出力値を、識別モデルに基づいて導出する（ステップＳ５、図４参照。）。

　次に、勾配情報算出部８が、選択された１つの真データと、ｙ’個の偽データそれぞれとの組合せ毎に、選択された真データに対する出力値と偽データに対する出力値との距離を算出する（ステップＳ６）。ステップＳ６において、勾配情報算出部８は、真データと偽データとの組合せ毎に、真データに対する出力値と偽データに対する出力値と差の絶対値を、距離として算出してもよい。ただし、ステップＳ６における距離の算出方法は、この例に限定されない。

　ステップＳ６の結果、ｙ’個の偽データそれぞれに関して、距離が得られることになる。

　ステップＳ６の次に、勾配情報算出部８は、ｙ’個の偽データ毎に、距離を所定量増大させるように、識別モデルが有する重み毎に勾配情報を算出する（ステップＳ７）。

　ステップＳ７での勾配情報の計算では、重みを変数とする距離関数を用いる。以下に示す式（１）は、距離関数の例である。

　式（１）において、ｙ_ｔｒｕｅは真データであり、ｙ_ｆａｋｅは偽データである。ｗは、重みである。Ｄ（ｙ_ｔｒｕｅ；ｗ）は、重みｗのもとでの真データに対する出力値であり、Ｄ（ｙ_ｆａｋｅ；ｗ）は、重みｗのもとでの偽データに対する出力値である。Ｎ_ｔｒｕｅは、距離の算出に用いた真データの数であり、Ｎ_ｆａｋｅは、距離の算出に用いた偽データの数である。１つの真データに対する出力値と１つの偽データに対する出力値との距離を算出する場合には、Ｎ_ｔｒｕｅ＝１，Ｎ_ｆａｋｅ＝１である。

　ある重みｗ^ｎに着目した場合、その重みの更新後の値をｗ^ｎ＋１とする。この場合、その重みの勾配情報（▽ｗと記す。）は、式（１）に例示する距離関数を用いて、式（２）のように表される。

　▽ｗ＝ｗ^ｎ＋１－ｗ^ｎ＝－η▽Ｅ（ｗ^ｎ）　　　・・・（２）

　ここで、ｄＥ（ｗ）／ｄｗ＝－ηであり、ηは固定値である。ηは、学習率（learning rate）と呼ばれる。

　勾配情報算出部８は、ステップＳ７において、式（２）を用いて、識別モデルが有する各重みの勾配情報を算出すればよい。

　このような勾配情報の計算は、誤差逆伝搬法による計算であるということができる。

　勾配情報算出部８は、後述のステップＳ１３で識別モデルの各重みの勾配情報を算出する場合や、後述のステップＳ１８で生成モデルの各重みの勾配情報を算出する場合にも、上記のような誤差逆伝搬法によって勾配情報を算出すればよい。

　ステップＳ７の結果、偽データ毎に、識別モデルの各重みそれぞれの勾配情報が得られる。ステップＳ７の次に、勾配情報算出部８が、ｙ’個の偽データ毎に、重み毎の勾配情報の絶対値の平均値を算出する(ステップＳ８）。勾配情報の絶対値の平均値は、式（３）の計算によって求めることができる。
　Σ｜▽ｗ｜／Ｎ　　　・・・（３）

　式（３）において、Ｎは、識別モデルが有する重みの個数である。

　次に、選択部９が、ｙ’個の偽データ毎に算出された勾配情報の絶対値の平均値に基づいて、ｙ’個の偽データの中から偽データを選択する（ステップＳ９）。ステップＳ９で選択される偽データの数は複数であってよい。

　ここでは、ステップＳ８で、勾配情報算出部８が、偽データ毎に勾配情報の絶対値の平均値を算出し、ステップＳ９で、選択部９が、勾配情報の絶対値の平均値に基づいて、偽データを選択する場合を例にして説明した。勾配情報の絶対値の平均値は、勾配情報の絶対値の大きさの指標の一例である。ステップＳ８では、勾配情報算出部８が、偽データ毎に、そのような指標を算出すればよく、ステップＳ９では、選択部９が、そのような指標に基づいて偽データを選択すればよい。勾配情報の絶対値の大きさの指標の他の例として、例えば、勾配情報の絶対値の総和等が挙げられる。

　ステップＳ９では、勾配情報の絶対値の大きさの指標が大きい偽データを選択すればよい。本実施形態では、例えば、選択部９は、ｙ’個の偽データの中から、勾配情報の絶対値の平均値が大きい順に、ｙ’個の１０％に相当する個数の偽データを選択してもよい。また、例えば、選択部９は、ｙ’個の偽データの中から、勾配情報の絶対値の平均値が大きい順に、保存データ記憶部４に記憶されている偽データの個数の１／９に相当する個数の偽データを選択してもよい。ただし、上記の“１０％”、“１／９”は例示であり、これらの割合に限定されるわけではない。

　次に、選択部９は、ステップＳ９で選択した偽データを保存データ記憶部４に記憶させる（ステップＳ１０）。

　モデル生成システム１は、ステップＳ４（図３参照）を実行する毎に、ステップＳ５～Ｓ１０（図４参照）を実行する。

　次に、識別モデルおよび生成モデルを更新するための動作については、図５および図６を参照して説明する。

　ステップＳ４（図３参照）の後、識別部７が、真データ記憶部３に記憶されている真データの部分集合に該当する複数個（ｘ個とする。）の真データ、保存データ記憶部４に記憶されている偽データの部分集合に該当する複数個（ｙ個とする。）の偽データ、および、ステップＳ４で生成されたｙ’個の偽データの部分集合に該当する複数個（ｙ’’個とする。）の偽データのそれぞれに対する出力値を、識別モデルに基づいて導出する（ステップＳ１１）。

　なお、ｘおよびｙ＋ｙ’’は近い値であることが好ましいが、必ずしも、ｘ＝ｙ＋ｙ’’である必要はない。

　次に、勾配情報算出部８が、ｘ個の真データに対する出力値と、ｙ＋ｙ’’個の偽データに対する出力値との距離を算出する（ステップＳ１２）。

　例えば、勾配情報算出部８が、ｘ個の真データに対する各出力値の平均値と、ｙ＋ｙ’’個の偽データに対する各出力値の平均値との差の絶対値を、距離として算出すればよい。ただし、ステップＳ１２における距離の算出方法は、上記の例に限定されない。

　次に、勾配情報算出部８が、ステップＳ１２で算出した距離を所定量増大させるように、識別モデルが有する重み毎に勾配情報を算出する（ステップＳ１３）。勾配情報算出部８は、例えば、誤差逆伝搬法によって勾配情報を算出すればよい。

　次に、識別モデル更新部１０が、識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、識別モデルを更新する（ステップＳ１４）。勾配情報は重みの更新量（変化量）であるので、識別モデル更新部１０は、重みに対して、その重みに応じた勾配情報を加算すればよい。

　次に、シード入力部５がデータ生成部６にシードを入力し、データ生成部６が、そのシードを生成モデルの入力として、第２の個数（ｚ’個）の偽データを生成する（ステップＳ１５）。

　次に、識別部７が、真データ記憶部３に記憶されている真データの部分集合に該当する複数個（ｘ’個とする。）の真データ、および、ステップＳ１５で生成されたｚ’個の偽データの部分集合に該当する複数個（ｚ’’個とする。）の偽データのそれぞれに対する出力値を、識別モデルに基づいて導出する（ステップＳ１６、図６参照）。

　なお、ｘ’およびｚ’’は近い値であることが好ましいが、必ずしも、ｘ’＝ｚ’’である必要はない。

　次に、勾配情報算出部８が、ｘ’個の真データに対する出力値と、ｚ’’個の偽データに対する出力値との距離を算出する（ステップＳ１７）。

　例えば、勾配情報算出部８が、ｘ’個の真データに対する各出力値の平均値と、ｚ’’個の偽データに対する各出力値の平均値との差の絶対値を、距離として算出すればよい。ただし、ステップＳ１７における距離の算出方法は、上記の例に限定されない。

　次に、勾配情報算出部８が、ステップＳ１７で算出した距離を所定量減少させるように、生成モデルが有する重み毎に勾配情報を算出する（ステップＳ１８）。勾配情報算出部８は、例えば、誤差逆伝搬法によって勾配情報を算出すればよい。

　ステップＳ４から後述のステップＳ２０までの動作は、繰り返し処理となっている。ステップＳ１８の後、例えば、データ生成部６は、このステップＳ４からの処理を繰り返すか否かを判定する（ステップＳ１９）。

　例えば、ステップＳ４およびステップＳ１１～Ｓ２０（図３、図５、図６を参照）の処理の繰り返し数が予め定められた閾値に達していなければ、ステップＳ４からの処理を繰り返すと判定し、その繰り返し数が閾値に達しているならば、ステップＳ４からの処理を繰り返さないと判定してもよい。ただし、ステップＳ１９の判定の基準は上記の例に限定されない。例えば、ステップＳ１２で算出された距離が閾値以上であるならば、ステップＳ４からの処理を繰り返すと判定し、その距離が閾値未満であるならば、ステップＳ４からの処理を繰り返さないと判定してもよい。

　また、本例では、データ生成部６がステップＳ１９の判定を行う場合を例にして説明したが、ステップＳ１９の判定は、データ生成部６以外の要素が行ってもよい。

　ステップＳ４からの処理を繰り返すと判定された場合（ステップＳ１９のＹｅｓ）、生成モデル更新部１１が、生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、生成モデルを更新する（ステップＳ２０）。勾配情報は重みの更新量（変化量）であるので、生成モデル更新部１１は、重みに対して、その重みに応じた勾配情報を加算すればよい。

　ステップＳ２０の後、ステップＳ４（図３参照）に移行する。シード入力部５およびデータ生成部６が再度ステップＳ４を実行した場合、モデル生成システム１は、モデル生成システム１は、識別モデルおよび生成モデルを更新するための動作（ステップＳ１１以降の動作）と、保存データ記憶部４に記憶させる偽データを第１の個数（ｙ’個）の偽データの中から選択する動作（ステップＳ５～Ｓ１０の動作）を並行に行う。

　ステップＳ４からの処理を繰り返さないと判定された場合（ステップＳ１９のＮｏ）、識別部７が識別モデルを提供し、データ生成部６が生成モデルを提供する（ステップＳ２１）。例えば、識別部７が識別モデルを外部の記憶装置（図示略）に記憶させ、データ生成部６も生成モデルを外部の記憶装置に記憶させる。この結果、モデル生成システム１の外部においても、識別モデルや生成モデルを利用可能となる。

　以上の説明では、保存データ記憶部４に、ある一定個数以上の偽データが既に記憶されている場合を説明した。次に、保存データ記憶部４に記憶されている偽データの数が上記の一定個数に達していない場合（すなわち、保存データ記憶部４に記憶されている偽データの数が十分でない場合）について説明する。なお、既に説明した動作については、詳細な説明を省略する。この場合、モデル生成システム１は、ステップＳ１～Ｓ４を実行する。そして、ステップＳ４の終了時に、保存データ記憶部４に記憶されている偽データの数が一定個数に達していないとする。この場合、保存データ記憶部４に記憶されている偽データの数が一定個数に達するまで、モデル生成システム１は、ステップＳ４～Ｓ１０の動作を繰り返す。ただし、このとき、モデル生成システム１は、ステップＳ４を実行しても、ステップＳ１１以降の処理は実行しない。ステップＳ４～Ｓ１０の動作を繰り返すことで、ステップＳ１０毎に、保存データ記憶部４に偽データが追加されていくので、保存データ記憶部４に記憶される偽データの数が増加し、一定個数に達することになる。

　保存データ記憶部４に記憶されている偽データの数が一定個数に達した後には、モデル生成システム１は、ステップＳ４の実行後に、ステップＳ１１以降の動作と、ステップＳ５～Ｓ１０の動作とを並行に行う。

　また、保存データ記憶部４に記憶できる偽データの個数の上限値が定められていてもよい。そして、保存データ記憶部４に記憶された偽データの個数が上限値に達している場合、選択部９は、選択した偽データを保存データ記憶部４に記憶させるときに（ステップＳ１０）、その選択した偽データと同数の偽データを、保存データ記憶部４から消去すればよい。そのような動作によって、保存データ記憶部４に記憶された偽データの個数が上限値に達した後、選択部９が、選択した偽データを保存データ記憶部４に記憶させるとしても、保存データ記憶部４に記憶される偽データの個数は、上限値に保たれる。選択部９は、保存データ記憶部４から消去する偽データをランダムに決定してもよい。あるいは、選択部９は、保存データ記憶部４から消去する偽データを、他の方法で決定してもよい。

　本実施形態によれば、ステップＳ４で生成されたｙ’個の偽データの全てが保存データ記憶部４に記憶されるのではなく、例えば、勾配情報算出部８が、偽データ毎に、勾配情報の絶対値の平均値を算出し、選択部９が、偽データ毎に算出された勾配情報の絶対値の平均値に基づいて、ｙ’個の偽データの中から偽データを選択し、選択した偽データを保存データ記憶部４に記憶させる。そして、保存データ記憶部４に記憶された偽データは、識別モデルの更新の際に用いられる。従って、識別モデルの識別精度が、極端に識別が容易なまたは困難な偽データに関してだけ特化して高くなってしまうような、好ましくない偽データが保存データ記憶部４に記憶されることが防止され、そのような好ましくない偽データが識別モデルの更新に用いられることが防止される。

　その結果、本実施形態によれば、識別モデルおよび生成モデルを良好に（換言すれば、安定的に）生成することができる。また、データ生成部６および識別部７は、敵対的生成ネットワークにおける生成器および識別器に相当すると言える。従って、本実施形態によれば、敵対的生成ネットワークにおける識別モデルおよび生成モデルを良好に（換言すれば、安定的に）生成することができる。

　さらに、本実施形態によれば、ステップＳ４およびステップＳ１１～Ｓ２０の処理（図３、図５、図６を参照）が繰り返し実行される。そして、この繰り返し処理には、識別モデルを更新する過程（ステップＳ１１～Ｓ１４）も含まれ、この識別モデルを更新する過程では、偽データとして、ステップＳ４で新たに生成された偽データだけでなく、保存データ記憶部４に記憶されている偽データも用いられる。具体的には、識別モデルを更新する過程（ステップＳ１１～Ｓ１４）では、偽データとして、保存データ記憶部４に記憶されている偽データの部分集合に該当する複数個（ｙ個）の偽データ、および、ステップＳ４で生成されたｙ’個の偽データの部分集合に該当する複数個（ｙ’’個）の偽データを用いる（図５に示すステップＳ１１を参照）。

　すなわち、識別モデルを更新する過程（ステップＳ１１～Ｓ１４）も繰り返し実行されるが、このとき、過去のステップＳ１１～Ｓ１４において用いられた偽データ（保存データ記憶部４に記憶されている偽データ）も、再度、用いられる。従って、例えば、データ生成部６が、識別モデルの識別精度が、直近のステップＳ４で生成された偽データに特化して高くなるようなことが防止される。

　よって、本実施形態によれば、識別モデルおよび生成モデルを良好に（換言すれば、安定的に）生成することができるという効果をより高めることができる。

　次に、本発明の実施形態の変形例を説明する。

　上記の実施形態では、ｙ’個（第１の個数）の偽データの中から、偽データを選択する場合に、勾配情報算出部８が、偽データ毎に、勾配情報の絶対値の大きさの指標（例えば、勾配情報の絶対値の平均値）を算出し、選択部９が、偽データ毎に算出されたその指標に基づいて、ｙ’個のデータの中から偽データを選択する場合を説明した。

　ステップＳ６において、選択された１つの真データと、ｙ’個の偽データそれぞれとの組合せ毎に（換言すれば、ｙ’個の偽データ毎に）算出される距離（選択された真データに対する出力値と偽データに対する出力値との距離）を、勾配情報の絶対値の大きさの指標として扱ってもよい。すなわち、勾配情報の絶対値の大きさの指標（例えば、勾配情報の絶対値の平均値）の代わりに、偽データ毎に算出された距離（選択された真データに対する出力値と偽データに対する出力値との距離）を用いてもよい。例えば、選択部９は、偽データ毎に算出された距離が大きい偽データを選択すればよい。選択部９は、例えば、ｙ’個の偽データの中から、距離が大きい順に、ｙ’個の１０％に相当する個数の偽データを選択してもよい。ただし、上記の１０％は例示であり、この割合に限定されるわけではない。

　本変形例においては、ステップＳ６を実行するときの勾配情報算出部８は、距離算出部と称することができる。そして、ステップＳ６の後、ステップＳ９に移行し、ステップＳ９において、選択部９は、偽データ毎に算出された距離に基づいて、偽データを選択すればよい。

　他の点は、上記の実施形態と同様である。

　図７は、本発明の実施形態のモデル生成システム１に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ１０００は、ＣＰＵ１００１と、主記憶装置１００２と、補助記憶装置１００３と、インタフェース１００４と、入力デバイス１００５とを備える。

　本発明の実施形態のモデル生成システム１は、コンピュータ１０００によって実現される。モデル生成システム１の動作は、プログラム（モデル生成プログラム）の形式で、補助記憶装置１００３に記憶されている。ＣＰＵ１００１は、プログラムを補助記憶装置１００３から読み出して主記憶装置１００２に展開し、そのプログラムに従って、上記の実施形態で説明した処理を実行する。この場合、真データ入力部２は、ＣＰＵ１００１および入力デバイス１００５によって実現される。シード入力部５、データ生成部６、識別部７、勾配情報算出部８、選択部９、識別モデル更新部１０および生成モデル更新部１１は、ＣＰＵ１００１によって実現される。真データ記憶部３および保存データ記憶部４は、例えば、補助記憶装置１００３によって実現されてもよく、あるいは、他の記憶装置によって実現されてもよい。

　補助記憶装置１００３は、一時的でない有形の媒体の例である。一時的でない有形の媒体の他の例として、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory ）、ＤＶＤ－ＲＯＭ（Digital Versatile Disk Read Only Memory ）、半導体メモリ等が挙げられる。また、プログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータ１０００がそのプログラムを主記憶装置１００２に展開し、そのプログラムに従って上記の実施形態で説明した処理を実行してもよい。

　また、各構成要素の一部または全部は、汎用または専用の回路（circuitry ）、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。

　各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

　次に、本発明の概要について説明する。図８は、本発明のモデル生成システムの概要を示すブロック図である。本発明のモデル生成システムは、保存データ記憶部４と、データ生成部６と、識別部７と、勾配情報算出部８と、選択部９とを備える。

　保存データ記憶部４は、保存しておくべき偽データを記憶する。

　データ生成部６は、偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数（例えば、ｙ’個）の偽データを生成する。

　識別部７は、与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する。

　勾配情報算出部８は、１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、識別モデルが有する重み毎の更新量である勾配情報を算出する。

　選択部９は、偽データ毎に計算された重み毎の勾配情報に基づいて、第１の個数の偽データの中から保存データ記憶部４に記憶させるべき偽データを選択し、選択した偽データを保存データ記憶部４に記憶させる。

　そのような構成により、敵対的生成ネットワークにおける識別モデルおよび生成モデルを良好に生成することができる。

　図９は、本発明のモデル生成システムの概要の他の例を示すブロック図である。本発明のモデル生成システムは、保存データ記憶部４と、データ生成部６と、識別部７と、距離算出部１８と、選択部９とを備えていてもよい。

　図９に示す保存データ記憶部４、データ生成部６および識別部７は、図８に示す保存データ記憶部４、データ生成部６および識別部７と同様であり、説明を省略する。

　距離算出部１８（例えば、前述の実施形態の変形例において、ステップＳ６を実行するときの勾配情報算出部８）は、１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出する。

　選択部９は、偽データ毎に計算された距離に基づいて、第１の個数の偽データの中から保存データ記憶部４に記憶させるべき偽データを選択し、選択した偽データを保存データ記憶部に記憶させる。

　そのような構成においても、敵対的生成ネットワークにおける識別モデルおよび生成モデルを良好に生成することができる。

　上記の本発明の実施形態は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。

（付記１）
　保存しておくべき偽データを記憶する保存データ記憶部と、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、前記識別モデルが有する重み毎の更新量である勾配情報を算出する勾配情報算出部と、
　偽データ毎に計算された重み毎の勾配情報に基づいて、前記第１の個数の偽データの中から前記保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる選択部とを備える
　ことを特徴とするモデル生成システム。

（付記２）
　識別モデルを更新する識別モデル更新部と、
　生成モデルを更新する生成モデル更新部とを備え、
　識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように前記識別モデルの重み毎の勾配情報を算出し、
　前記識別モデル更新部は、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　データ生成部は、
　第２の個数の偽データを生成し、
　前記識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように前記生成モデルの重み毎の勾配情報を算出し、
　前記生成モデル更新部は、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　付記１に記載のモデル生成システム。

（付記３）
　勾配情報算出部は、
　１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように識別モデルの重み毎の勾配情報を算出し、重み毎の勾配情報の絶対値の平均値を計算し、
　選択部は、
　偽データ毎に計算された前記平均値に基づいて、第１の個数の偽データの中から保存データ記憶部に記憶させるべき偽データを選択する
　付記１または付記２に記載のモデル生成システム。

（付記４）
　保存しておくべき偽データを記憶する保存データ記憶部と、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出する距離算出部と、
　偽データ毎に計算された前記距離に基づいて、前記第１の個数の偽データの中から前記保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる選択部とを備える
　ことを特徴とするモデル生成システム。

（付記５）
　識別モデルを更新する識別モデル更新部と、
　生成モデルを更新する生成モデル更新部とを備え、
　識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように前記識別モデルの重み毎の勾配情報を算出する勾配情報算出部を備え、
　前記識別モデル更新部は、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　データ生成部は、
　第２の個数の偽データを生成し、
　前記識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように前記生成モデルの重み毎の勾配情報を算出し、
　前記生成モデル更新部は、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　付記４に記載のモデル生成システム。

（付記６）
　選択部は、
　保存データ記憶部に記憶されている偽データの数が所定数に達しているならば、選択した偽データを前記保存データ記憶部に記憶させるときに、前記選択した偽データと同数の偽データを前記保存データ記憶部から消去する
　付記１から付記５のうちのいずれかに記載のモデル生成システム。

（付記７）
　識別モデルおよび生成モデルは、ディープニューラルネットワークである
　付記１から付記６のうちのいずれかに記載のモデル生成システム。

（付記８）
　真データおよび偽データは、画像データまたは音声データである
　付記１から付記７のうちのいずれかに記載のモデル生成システム。

（付記９）
　コンピュータが、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成し、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出し、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、前記識別モデルが有する重み毎の更新量である勾配情報を算出し、
　偽データ毎に計算された重み毎の勾配情報に基づいて、前記第１の個数の偽データの中から、保存しておくべき偽データを記憶する保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる
　ことを特徴とするモデル生成方法。

（付記１０）
　コンピュータが、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成し、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出し、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、
　偽データ毎に計算された前記距離に基づいて、前記第１の個数の偽データの中から、保存しておくべき偽データを記憶する保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる
　ことを特徴とするモデル生成方法。

（付記１１）
　コンピュータが、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように識別モデルの重み毎の勾配情報を算出し、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　第２の個数の偽データを生成し、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように生成モデルの重み毎の勾配情報を算出し、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　付記９または付記１０に記載のモデル生成方法。

（付記１２）
　コンピュータを、
　保存しておくべき偽データを記憶する保存データ記憶部と、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、前記識別モデルが有する重み毎の更新量である勾配情報を算出する勾配情報算出部と、
　偽データ毎に計算された重み毎の勾配情報に基づいて、前記第１の個数の偽データの中から前記保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる選択部とを備える
　モデル生成システムとして機能させるためのモデル生成プログラム。

（付記１３）
　コンピュータを、
　識別モデルを更新する識別モデル更新部と、
　生成モデルを更新する生成モデル更新部とを備え、
　識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように前記識別モデルの重み毎の勾配情報を算出し、
　前記識別モデル更新部は、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　データ生成部は、
　第２の個数の偽データを生成し、
　前記識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように前記生成モデルの重み毎の勾配情報を算出し、
　前記生成モデル更新部は、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　モデル生成システムとして機能させるための付記１２に記載のモデル生成プログラム。

（付記１４）
　コンピュータを、
　保存しておくべき偽データを記憶する保存データ記憶部と、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出する距離算出部と、
　偽データ毎に計算された前記距離に基づいて、前記第１の個数の偽データの中から前記保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる選択部とを備える
　モデル生成システムとして機能させるためのモデル生成プログラム。

（付記１５）
　コンピュータを、
　識別モデルを更新する識別モデル更新部と、
　生成モデルを更新する生成モデル更新部とを備え、
　識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように前記識別モデルの重み毎の勾配情報を算出する勾配情報算出部を備え、
　前記識別モデル更新部は、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　データ生成部は、
　第２の個数の偽データを生成し、
　前記識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように前記生成モデルの重み毎の勾配情報を算出し、
　前記生成モデル更新部は、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　モデル生成システムとして機能させるための付記１４に記載のモデル生成プログラム。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

産業上の利用の可能性

　本発明は、敵対的生成ネットワークにおけるモデルを生成するモデル生成システムに好適に適用される。

　１　モデル生成システム
　２　真データ入力部
　３　真データ記憶部
　４　保存データ記憶部
　５　シード入力部
　６　データ生成部
　７　識別部
　８　勾配情報算出部
　９　選択部
　１０　識別モデル更新部
　１１　生成モデル更新部

Claims

　保存しておくべき偽データを記憶する保存データ記憶部と、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、前記識別モデルが有する重み毎の更新量である勾配情報を算出する勾配情報算出部と、
　偽データ毎に計算された重み毎の勾配情報に基づいて、前記第１の個数の偽データの中から前記保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる選択部とを備える
　ことを特徴とするモデル生成システム。
　識別モデルを更新する識別モデル更新部と、
　生成モデルを更新する生成モデル更新部とを備え、
　識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように前記識別モデルの重み毎の勾配情報を算出し、
　前記識別モデル更新部は、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　データ生成部は、
　第２の個数の偽データを生成し、
　前記識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように前記生成モデルの重み毎の勾配情報を算出し、
　前記生成モデル更新部は、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　請求項１に記載のモデル生成システム。
　勾配情報算出部は、
　１つの真データと、第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように識別モデルの重み毎の勾配情報を算出し、重み毎の勾配情報の絶対値の平均値を計算し、
　選択部は、
　偽データ毎に計算された前記平均値に基づいて、第１の個数の偽データの中から保存データ記憶部に記憶させるべき偽データを選択する
　請求項１または請求項２に記載のモデル生成システム。
　保存しておくべき偽データを記憶する保存データ記憶部と、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出する距離算出部と、
　偽データ毎に計算された前記距離に基づいて、前記第１の個数の偽データの中から前記保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる選択部とを備える
　ことを特徴とするモデル生成システム。
　識別モデルを更新する識別モデル更新部と、
　生成モデルを更新する生成モデル更新部とを備え、
　識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように前記識別モデルの重み毎の勾配情報を算出する勾配情報算出部を備え、
　前記識別モデル更新部は、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　データ生成部は、
　第２の個数の偽データを生成し、
　前記識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように前記生成モデルの重み毎の勾配情報を算出し、
　前記生成モデル更新部は、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　請求項４に記載のモデル生成システム。
　選択部は、
　保存データ記憶部に記憶されている偽データの数が所定数に達しているならば、選択した偽データを前記保存データ記憶部に記憶させるときに、前記選択した偽データと同数の偽データを前記保存データ記憶部から消去する
　請求項１から請求項５のうちのいずれか１項に記載のモデル生成システム。
　識別モデルおよび生成モデルは、ディープニューラルネットワークである
　請求項１から請求項６のうちのいずれか１項に記載のモデル生成システム。
　真データおよび偽データは、画像データまたは音声データである
　請求項１から請求項７のうちのいずれか１項に記載のモデル生成システム。
　コンピュータが、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成し、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出し、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、前記識別モデルが有する重み毎の更新量である勾配情報を算出し、
　偽データ毎に計算された重み毎の勾配情報に基づいて、前記第１の個数の偽データの中から、保存しておくべき偽データを記憶する保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる
　ことを特徴とするモデル生成方法。
　コンピュータが、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成し、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出し、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、
　偽データ毎に計算された前記距離に基づいて、前記第１の個数の偽データの中から、保存しておくべき偽データを記憶する保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる
　ことを特徴とするモデル生成方法。
　コンピュータが、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように識別モデルの重み毎の勾配情報を算出し、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　第２の個数の偽データを生成し、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように生成モデルの重み毎の勾配情報を算出し、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　請求項９または請求項１０に記載のモデル生成方法。
　コンピュータを、
　保存しておくべき偽データを記憶する保存データ記憶部と、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように、前記識別モデルが有する重み毎の更新量である勾配情報を算出する勾配情報算出部と、
　偽データ毎に計算された重み毎の勾配情報に基づいて、前記第１の個数の偽データの中から前記保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる選択部とを備える
　モデル生成システムとして機能させるためのモデル生成プログラム。
　コンピュータを、
　識別モデルを更新する識別モデル更新部と、
　生成モデルを更新する生成モデル更新部とを備え、
　識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように前記識別モデルの重み毎の勾配情報を算出し、
　前記識別モデル更新部は、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　データ生成部は、
　第２の個数の偽データを生成し、
　前記識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように前記生成モデルの重み毎の勾配情報を算出し、
　前記生成モデル更新部は、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　モデル生成システムとして機能させるための請求項１２に記載のモデル生成プログラム。
　コンピュータを、
　保存しておくべき偽データを記憶する保存データ記憶部と、
　偽データを生成するためのニューラルネットワークである生成モデルに基づいて、第１の個数の偽データを生成するデータ生成部と、
　与えられたデータの真データらしさおよび偽データらしさを示す出力値を導出するためのニューラルネットワークである識別モデルに基づいて、与えられたデータに対する出力値を導出する識別部と、
　１つの真データと、前記第１の個数の偽データそれぞれとの組合せ毎に、真データに対する出力値と偽データに対する出力値との距離を算出する距離算出部と、
　偽データ毎に計算された前記距離に基づいて、前記第１の個数の偽データの中から前記保存データ記憶部に記憶させるべき偽データを選択し、選択した偽データを前記保存データ記憶部に記憶させる選択部とを備える
　モデル生成システムとして機能させるためのモデル生成プログラム。
　コンピュータを、
　識別モデルを更新する識別モデル更新部と、
　生成モデルを更新する生成モデル更新部とを備え、
　識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、保存データ記憶部に記憶されている偽データの部分集合に該当する複数個の偽データ、および、第１の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量増大させるように前記識別モデルの重み毎の勾配情報を算出する勾配情報算出部を備え、
　前記識別モデル更新部は、
　前記識別モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記識別モデルを更新し、
　データ生成部は、
　第２の個数の偽データを生成し、
　前記識別部は、
　予め用意されている複数個の真データの部分集合に該当する複数個の真データ、および、前記第２の個数の偽データの部分集合に該当する複数個の偽データのそれぞれに対して、出力値を導出し、
　前記勾配情報算出部は、
　前記識別部によって導出された、真データに対する出力値と偽データに対する出力値との距離を算出し、当該距離を所定量減少させるように前記生成モデルの重み毎の勾配情報を算出し、
　前記生成モデル更新部は、
　前記生成モデルの個々の重みを、個々の重みに応じた勾配情報に基づいて更新することによって、前記生成モデルを更新する
　モデル生成システムとして機能させるための請求項１４に記載のモデル生成プログラム。