WO2024057543A1

WO2024057543A1 - 画像データ生成装置、画像データ生成方法、および、画像データ生成プログラム

Info

Publication number: WO2024057543A1
Application number: PCT/JP2022/034806
Authority: WO
Inventors: 昇平榎本; モニカロスリアナブスト; 毅晴江田
Original assignee: 日本電信電話株式会社
Priority date: 2022-09-16
Filing date: 2022-09-16
Publication date: 2024-03-21

Abstract

画像データ生成装置（１０）は、分類装置（２０）による分類対象の画像データをBackbone　Networkに入力する。Backbone　Networkは、当該画像データに対し各Augmentationを実施する際のAugmentationごとの強度パラメータ、および、Augmentationを実施した画像データそれぞれを線形結合する際の重みを出力する。その後、画像データ生成装置（１０）は、当該画像データに、Backbone　Networkから出力されたAugmentationごとの強度パラメータを用いて各Augmentationを実施し、Augmentationを実施した画像データそれぞれを、Backbone　Networkから出力された重みを用いて線形結合する。その後、分類装置（２０）は、画像データ生成装置（１０）により出力された画像データに対し、分類処理を行う。

Description

画像データ生成装置、画像データ生成方法、および、画像データ生成プログラム

　本発明は、画像データ生成装置、画像データ生成方法、および、画像データ生成プログラムに関する。

　実世界では様々な要因でデータの分布シフトが発生する。分布シフトが発生したデータがDeep　Neural　Network（DNN）に入力されるとDNNの精度が大幅に劣化する傾向がある。したがって、分布シフト下でもDNNの精度を維持するためのロバスト性向上技術が求められている。

　ここでロバスト性を向上させるため、例えば、DNNへの入力画像についてDNNにとって認識しやすい画像に変換する技術が提案されている（例えば、Test-time　Augmentation、非特許文献１参照）。

　この技術は、予め12個のAugmentation候補を用意しておき、入力画像に各Augmentationを実施した場合の分類損失を予測する。そして、予測された分類損失が最も低いAugmentation（最適なAugmentation）を入力画像に対し実施し、Augmentationを実施した画像をDNNに入力する。

I.　Kim　et　al.　,"Learning　Loss　for　Test-Time　Augmentation",　In:　Advances　in　Neural　Information　Processing　Systems　(NeurIPS)　(2020)

　上記の技術は、入力画像に対して、12個のAugmentationの候補から最適なAugmentationを1つ選択し実施するものであるが、実際にはAugmentation候補は以下の理由で無限に存在する。

　理由１：多くAugmentationの強度パラメータは連続値である。
　例えば、Augmentationが画像の回転を行うものである場合、回転の角度は0°～360°の連続値である。

　理由２：2つ以上のAugmentationの組み合わせパターンは多数存在する。
　例えば、画像を回転するAugmentation、画像のコントラストを変更するAugmentation、画像のシャープネスを変更するAugmentationを連続で実施するということも考えられる。

　したがって、上記の技術で12個のAugmentationの候補から選択されたAugmentationを実施した画像をDNNが認識しても、その認識精度には限界があった。そこで本発明は、DNNの精度を向上させることを課題とする。

　前記した課題を解決するため、本発明は、Deep　Neural　Network（DNN）による分類対象の画像データの入力を受け付ける受付部と、前記画像データに各Augmentationを実施する際のAugmentationごとの強度パラメータ、および、前記Augmentationを実施した画像データそれぞれを線形結合する際の重みを出力するパラメータ出力部と、前記入力された画像データに、前記Augmentationごとの強度パラメータを用いてAugmentationを実施するAugmentation実施部と、前記Augmentationが実施された画像データそれぞれを、前記重みを用いて線形結合した画像データを生成する画像結合部と、生成した前記画像データを出力する出力処理部とを備えることを特徴とする。

　本発明によれば、DNNの精度を向上させることができる。

図１は、画像データ生成装置の動作例を説明するための図である。図２は、画像データ生成装置の構成例を示す図である。図３は、画像データ生成装置が用いるAugmentationの例を示す図である。図４は、画像データ生成装置が実行する処理手順の例を示すフローチャートである。図５は、画像データ生成装置が生成した画像データの評価結果を示す図である。図６は、画像データ生成装置が生成した画像データの評価結果を示す図である。図７は、画像データ生成装置に用いられる2つのアイディアの評価結果を示す図である。図８は、画像データ生成プログラムを実行するコンピュータを示す図である。

　以下、図面を参照しながら、本発明を実施するための形態（実施形態）について説明する。本発明は、本実施形態に限定されない。

［概要］
　まず、本実施形態の画像データ生成装置の概要を説明する。画像データ生成装置は、DNNが分類対象とする画像データに対し、DNNにおける分類精度をできるだけ向上させるようなAugmentationを実施する。ここで画像データ生成装置は、分類対象の画像データに対し、無限に存在するAugmentation候補から最適な（＝DNNにおける分類精度をできるだけ向上させるような）Augmentationを選択し、実施する。そのため、画像データ生成装置は、以下の（１）、（２）の処理を実行する。

（１）最適化アルゴリズムによりAugmentationの強度パラメータ（magnitude　paramerter）を推定する
　多くのAugmentationは微分可能なため、画像データ生成装置は局所最適な強度パラメータを勾配降下法等の最適化アルゴリズムにより推定することができる。

（２）Augmentationが実施された複数の画像をブレンドする
　例えば、各画像のブレンドの重みが[1,0,0]の場合、画像データ生成装置は、画像に対し1つ目のAugmentationを実施する。また、各画像のブレンドの重みが[0,0.5,0.5]の場合、画像データ生成装置は、画像に対し、2つ目のAugmentationを実施した画像と3つ目のAugmentationを実施した画像とをそれぞれ0.5の重みでブレンド（結合）する。

　次に、図１を用いて本実施形態の画像データ生成装置１０の動作例を説明する。例えば、画像データ生成装置１０は、分類対象の画像データをBackbone　Networkに入力する。このBackbone　Networkは、入力された画像データに対し、分類装置２０（DNNにより画像の分類を行う装置）における分類精度をできるだけ向上させるような、Augmentationごとの強度パラメータm、および、各Augmentationを実施した画像のブレンド重みwを出力するよう学習されたモデルである。

　Backbone　Networkは、入力された画像データに対しAugmentationを実施する際のAugmentationごとの強度パラメータm（m₁,…,m_k）および各Augmentationを実施した画像を結合する際の重み（ブレンド重み）w（w₁,…,w_k）を出力する。

　画像データ生成装置１０は、Backbone　Networkから出力されたAugmentationごとの強度パラメータm（m₁,…,m_k）を使用して、画像データに対し各Augmentationを実施する。次に、画像データ生成装置１０は、各Augmentationが実施された画像（Augmentation画像）を、Backbone　Networkから出力されたブレンド重みw（w₁,…,w_k）で結合（ブレンディング）した画像データを生成する。

　その後、分類装置２０は、画像データ生成装置１０により生成された画像データに対し分類処理を行い、その分類結果を出力する。

　このような画像データ生成装置１０によれば、分布シフト下でも画像データに対し、分類装置２０が分類しやすいAugmentationを実施することができる。その結果、分類装置２０による画像データの分類精度を向上させることができる。

［構成例］
　次に、図２を用いて、画像データ生成装置１０の構成例を説明する。画像データ生成装置１０は、例えば、入出力部１１、記憶部１２、および、制御部１３を備える。

　入出力部１１は、各種データの入出力を司るインタフェースである。例えば、入出力部１１は、処理対象の画像データの入力を受け付ける。また、入出力部１１は、例えば、制御部１３により、入力された画像データに対し各Augmentationが実施された画像データを出力する。

　記憶部１２は、制御部１３が各種処理を実行する際に参照されるデータ、プログラム等を記憶する。記憶部１２は、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。例えば、記憶部１２は、制御部１３が用いるBackbone　Networkのパラメータを記憶する。

　制御部１３は、画像データ生成装置１０全体の制御を司る。制御部１３の機能は、例えば、ＣＰＵ（Central　Processing　Unit）が、記憶部１２に記憶されるプログラムを実行することにより実現される。制御部１３は、例えば、学習部１３１、受付部１３２、パラメータ出力部１３３、Augmentation実施部１３４、画像結合部１３５、および、出力処理部１３６を備える。

　学習部１３１は、パラメータ出力部１３３が用いるBackbone　Networkの学習を行う。前記したとおり、Backbone　Networkは、入力された画像データに対し、各Augmentationを実施する際のAugmentationごとの強度パラメータm、および、各Augmentationを実施した画像を結合する際の重み（ブレンド重み）wを出力するモデルである。

　例えば、学習部１３１は、分布シフトされた画像データを含む画像データを学習データとして用いて、Backbone　Networkが、入力画像データに対し、分類装置２０における分類精度をできるだけ向上させるような、Augmentationごとの強度パラメータm（m₁,…,m_k）およびブレンド重みw（w₁,…,w_k）を出力するようBackbone　Networkの学習を行う。

　Backbone　Networkの学習に用いる損失関数は、例えば、分類装置２０が用いる分類モデルのソフトマックスエントロピーである。また、Backbone　Networkの学習に用いる学習データは、例えば、分布シフトの起きていないデータ（Clean　data）に人工的に分布シフトを発生させたデータを加えたデータである。人工的に分布シフトを起こしたデータは、例えば、corruptionデータ（文献１参照）を用いる。

　文献１：Hendrycks,　D.,　Dietterich,　T.:　BENCHMARKING　NEURAL　NETWORK　ROBUSTNESS　TO　COMMON　CORRUPTIONS　AND　PERTURBATIONS.　In:　International　Conference　on　Learning　Representations　(ICLR)　(2019)

　なお、学習部１３１は、例えば、AugMix（文献２参照）を用いてBackbone　Networkを学習してもよい。

　文献２：Hendrycks,　Dan,　et　al.:　AugMix:　A　Simple　DATA　PROCESSING　METHOD　TO　IMPROVE　ROBUSTNESS　AND　UNCERTAINTY,　International　Conference　on　Learning　Representations.　2019.

　なお、Backbone　Networkの学習は、画像データ生成装置１０内の学習部１３１が行ってもよいし、画像データ生成装置１０外の装置が行ってもよい。

　受付部１３２は、処理対象の画像データの入力を受け付ける。パラメータ出力部１３３は、受付部１３２で受け付けた画像データに対し、上記のBackbone　Networkを用いて、各Augmentationを実施する際のAugmentationごとの強度パラメータm（m₁,…,m_k）、および、各Augmentationを実施した画像のブレンド重みw（w₁,…,w_k）を出力する。なお、パラメータ出力部１３３は、強度パラメータを持たないAugmentationについては強度パラメータmを出力しない。

　Backbone　Networkは、例えば、DNNにより実現される。例えば、Backbone　Networkは、ImageNetを学習データとして学習したResNet18の出力層を2kクラス（k：Augmentationの数）の出力層に変更したモデルにより実現される。

　なお、画像データ生成装置１０が用いるAugmentationは、例えば、図３に示す14種類のAugmentationである。このAugmentationに用いられる関数はいずれも微分可能な関数である。また、図３に示す、f^actはAugmentationの活性化関数であり、MはAugmentationのレンジである。なお、図３に示すAugmentationのうち、LPFsおよびHPFsはフィルタサイズを最適化で求められないので、事前にフィルタサイズを0.05‐0.95(0.05刻み)の19個を用意したものである。さらに、URIEは、DNNによる画像変換手法である（以下の文献３参照）。

　文献３：Son,　T.,　Kang,　J.,　Kim,　N.,　Cho,　S.,　Kwak,　S.:　Urie:　Universal　Image　Enhancement　for　Visual　Recognition　in　the　Wild.　In:　European　Conference　on　Computer　Vision　(ECCV)　(2020)

　図２の説明に戻る。Augmentation実施部１３４は、入力された画像データに対し、パラメータ出力部１３３により出力されたAugmentationごとの強度パラメータm（m₁,…,m_k）を用いてAugmentationを実施する。

　例えば、Augmentation実施部１３４は、k番目のAugmentationの強度パラメータm_kを、k番目のAugmentationの活性化関数f_k ^actおよびレンジM（図３参照）を用いて変換する。なお、Augmentation実施部１３４は、強度パラメータを持たないAugmentationについては強度パラメータmの変換は行わない（式（１）参照）。

　次に、Augmentation実施部１３４は、変換後の強度パラメータm（m₁,…,m_k）を用いて、入力された画像データに対し各Augmentationを実施する（式（２）参照）。なお、式（２）におけるO_kは、k番目のAugmentation操作を示す。

　画像結合部１３５は、各Augmentationが実施された画像データを、パラメータ出力部１３３により出力されたブレンド重みw（w₁,…,w_k）で線形結合する。例えば、まず、画像結合部１３５は、ソフトマックス関数により、上記のブレンド重みw（w₁,…,w_k）の合計が１になるように変換する（式（３）参照）。

　そして、画像結合部１３５は、変換したブレンド重みw（w₁,…,w_k）を用いて、各Augmentationが実施された画像データを線形結合した画像データx^outを生成する（式（４）参照）。

　出力処理部１３６は、画像結合部１３５により線形結合された画像データを入出力部１１経由で出力する。その後、分類装置２０は、出力された画像データに対し分類処理を行う。

［処理手順の例］
　次に、図４を用いて画像データ生成装置１０が実行する処理手順の例を説明する。まず、画像データ生成装置１０の学習部１３１は、学習データを用いてBackbone　Networkの学習を行う（Ｓ１）。

　Ｓ１の後、受付部１３２は、分類対象の画像データの入力を受け付ける（Ｓ２）。そして、パラメータ出力部１３３は、入力された画像データに対しAugmentationを行う際の、Augmentationごとの強度パラメータ、重み（ブレンド重み）を出力する（Ｓ３）。

　次に、Augmentation実施部１３４は、Ｓ２で入力された画像データに対し、Ｓ３で出力されたAugmentationごとの強度パラメータを用いて各Augmentationを実施する（Ｓ４）。その後、画像結合部１３５は、Ｓ４で各Augmentationが実施された画像データを、Ｓ３で出力されたAugmentationごとの重みで線形結合した画像データを生成する（Ｓ５）。そして、出力処理部１３６は、Ｓ５で生成された画像データを出力する（Ｓ６）。

　画像データ生成装置１０が上記の処理を行うことで、分布シフト下でも分類装置２０が分類しやすい画像データを生成することができる。その結果、分類装置２０による画像データの分類精度を向上させることができる。

［実験結果］
　次に、画像データ生成装置１０により生成された画像データを、分類モデルで分類した際の分類精度の評価結果を説明する。

　まず、図５を用いてCUBデータセットでの評価結果を説明する。評価に用いた分類モデル（Classification　model）は、図５に示す６つの分類モデルである。なお、６つの分類モデルのうち、「w/AugMix」が付された分類モデルは、AugMix（文献２参照）によりロバスト性を向上させた分類モデルである。また、各分類モデルへ入力する画像データの生成に用いたモデル（Enhancement　model）は、URIE（文献３参照）、Loss　Predictor（非特許文献１参照）、AugNet（本実施形態）である。

　なお、図５に示すCleanの値は、分布シフトの起きていない画像データに対する分類精度を示す。また、Unseenの値は、人工的に分布シフトを起こした画像データに対する分類精度を示す。（）内の数値は、ベースライン（分類モデルのみで分類した場合の分類精度）との差分を示す。

　図５に示すように、AugNetは、Clean、Unseenともに概ね、URIE、Loss　Predictorよりも分類精度の高い画像データを生成できることが確認できた。特に、Unseenについては、AugNetは、URIE、Loss　Predictorより確実に分類精度の高い画像データを生成できることが確認できた。また、AugMixによりロバスト性を向上させた分類モデルに対しても、より分類精度の高い画像データを生成できることが確認できた。

　次に、図６を用いてImageNetデータセットでの評価結果を説明する。評価に用いた分類モデルは、図６に示すResNet50およびDeiTである。ここでは人工的に分布シフトを起こした画像データを対象に評価を行った。（）内の数値は、図５と同様に、ベースライン（分類モデルのみで分類した場合の分類精度）との差分を示す。各分類モデルへの入力画像データの生成に用いたモデル（Enhancement　model）は、図５と同様に、URIE、Loss　Predictor、AugNetである。

　図６に示すように、ImageNetデータセットの場合も、AugNetは、Unseenについて、URIE、Loss　Predictorよりも、分類モデルにおける分類精度の高い画像データを生成できることが確認できた。

　次に、本実施形態の画像データ生成装置１０における２つのアイディア（BlendingとOptimization）の効果を確認した（図７参照）。比較対象はLoss　Predictorである。Loss　Predictorは12個のAugmentation候補から最も損失が低いAugmentationを選択する。

　Blendingは、複数のAugmentation画像をブレンドすることである。ここでは、Loss　Predictorが用いる12個のAugmentationと同じAugmentationを用い、各Augmentationが実施された画像をブレンド重みwで線形結合した。

　Optimizationは、最適化アルゴリズムによりAugmentationの強度パラメータを推定することである。ここでは、Loss　Predictorが用いる12個のAugmentationと同じAugmentationについて、最適化アルゴリズムによりAugmentationそれぞれの強度パラメータを推定した。そして、推定した強度パラメータで画像データにAugmentationを実施した。

　なお、図７におけるUnseenの値はcorruptionデータセットで学習して評価した結果を示す。また、図７におけるStylizedの値とUnseen＋Seenの値はAugMixで学習して評価した結果を示す。なお、図７における（）内の数値は、Blending、Optimizationそれぞれについて、Loss　Predictorより生成された画像データの分類精度との差分を示している。

　図７に示すように、Blending、Optimizationは、Unseen、Stylized（スタイルを変更した画像データ）、Unseen+Seenいずれの場合も、Loss　Predictorよりも分類精度の高い画像データを生成できることが確認できた。このことから、画像データ生成装置１０が実行するBlendingおよびOptimizationのいずれも、分類モデルにおける分類精度の向上に貢献することが確認できた。

［システム構成等］
　また、図示した各部の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、ＣＰＵ及び当該ＣＰＵにて実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

　また、前記した実施形態において説明した処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

［プログラム］
　前記した画像データ生成装置１０は、パッケージソフトウェアやオンラインソフトウェアとしてプログラム（画像データ生成プログラム）を所望のコンピュータにインストールさせることによって実装できる。例えば、上記のプログラムを情報処理装置に実行させることにより、情報処理装置を画像データ生成装置１０として機能させることができる。ここで言う情報処理装置にはスマートフォン、携帯電話機やＰＨＳ（Personal　Handyphone　System）等の移動体通信端末、さらには、ＰＤＡ（Personal　Digital　Assistant）等の端末等がその範疇に含まれる。

　図８は、画像データ生成プログラムを実行するコンピュータの一例を示す図である。コンピュータ１０００は、例えば、メモリ１０１０、ＣＰＵ１０２０を有する。また、コンピュータ１０００は、ハードディスクドライブインタフェース１０３０、ディスクドライブインタフェース１０４０、シリアルポートインタフェース１０５０、ビデオアダプタ１０６０、ネットワークインタフェース１０７０を有する。これらの各部は、バス１０８０によって接続される。

　メモリ１０１０は、ＲＯＭ（Read　Only　Memory）１０１１及びＲＡＭ（Random　Access　Memory）１０１２を含む。ＲＯＭ１０１１は、例えば、ＢＩＯＳ（Basic　Input　Output　System）等のブートプログラムを記憶する。ハードディスクドライブインタフェース１０３０は、ハードディスクドライブ１０９０に接続される。ディスクドライブインタフェース１０４０は、ディスクドライブ１１００に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ１１００に挿入される。シリアルポートインタフェース１０５０は、例えばマウス１１１０、キーボード１１２０に接続される。ビデオアダプタ１０６０は、例えばディスプレイ１１３０に接続される。

　ハードディスクドライブ１０９０は、例えば、ＯＳ１０９１、アプリケーションプログラム１０９２、プログラムモジュール１０９３、プログラムデータ１０９４を記憶する。すなわち、上記の画像データ生成装置１０が実行する各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール１０９３として実装される。プログラムモジュール１０９３は、例えばハードディスクドライブ１０９０に記憶される。例えば、画像データ生成装置１０における機能構成と同様の処理を実行するためのプログラムモジュール１０９３が、ハードディスクドライブ１０９０に記憶される。なお、ハードディスクドライブ１０９０は、ＳＳＤ（Solid　State　Drive）により代替されてもよい。

　また、上述した実施形態の処理で用いられるデータは、プログラムデータ１０９４として、例えばメモリ１０１０やハードディスクドライブ１０９０に記憶される。そして、ＣＰＵ１０２０が、メモリ１０１０やハードディスクドライブ１０９０に記憶されたプログラムモジュール１０９３やプログラムデータ１０９４を必要に応じてＲＡＭ１０１２に読み出して実行する。

　なお、プログラムモジュール１０９３やプログラムデータ１０９４は、ハードディスクドライブ１０９０に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ１１００等を介してＣＰＵ１０２０によって読み出されてもよい。あるいは、プログラムモジュール１０９３及びプログラムデータ１０９４は、ネットワーク（ＬＡＮ（Local　Area　Network）、ＷＡＮ（Wide　Area　Network）等）を介して接続される他のコンピュータに記憶されてもよい。そして、プログラムモジュール１０９３及びプログラムデータ１０９４は、他のコンピュータから、ネットワークインタフェース１０７０を介してＣＰＵ１０２０によって読み出されてもよい。

　１０　画像データ生成装置
　１１　入出力部
　１２　記憶部
　１３　制御部
　２０　分類装置
　１３１　学習部
　１３２　受付部
　１３３　パラメータ出力部
　１３４　Augmentation実施部
　１３５　画像結合部
　１３６　出力処理部

Claims

　Deep　Neural　Network（DNN）による分類対象の画像データの入力を受け付ける受付部と、
　前記画像データに各Augmentationを実施する際のAugmentationごとの強度パラメータ、および、前記Augmentationを実施した画像データそれぞれを線形結合する際の重みを出力するパラメータ出力部と、
　前記入力された画像データに、前記Augmentationごとの強度パラメータを用いてAugmentationを実施するAugmentation実施部と、
　前記Augmentationが実施された画像データそれぞれを、前記重みを用いて線形結合した画像データを生成する画像結合部と、
　生成した前記画像データを出力する出力処理部と
　を備えることを特徴とする画像データ生成装置。
　分布シフトされた画像データを含む画像データを学習データとして用いて、前記DNNにおける分類精度をできるだけ向上させるような、前記Augmentationごとの強度パラメータ、および、前記Augmentationを実施した画像データそれぞれを線形結合する際の重みを出力するモデルを学習する学習部をさらに備え、
　前記パラメータ出力部は、
　学習された前記モデルを用いて、前記Augmentationごとの強度パラメータ、および、前記Augmentationを実施した画像データそれぞれを線形結合する際の重みを出力する
　ことを特徴とする請求項１に記載の画像データ生成装置。
　前記各Augmentationに用いられる関数は、微分可能な関数である
　ことを特徴とする請求項１に記載の画像データ生成装置。
　画像データ生成装置により実行される画像データ生成方法であって、
　Deep　Neural　Network（DNN）による分類対象の画像データの入力を受け付ける工程と、
　前記画像データの入力を受け付けると、前記画像データにAugmentationを実施する際のAugmentationごとの強度パラメータ、および、前記Augmentationを実施した画像データそれぞれを線形結合する際の重みを出力する工程と、
　前記入力された画像データに、前記Augmentationごとの強度パラメータを用いてAugmentationを実施する工程と、
　前記Augmentationが実施された画像データそれぞれを、前記重みを用いて線形結合した画像データを生成する工程と、
　生成した前記画像データを出力する工程と
　を含むことを特徴とする画像データ生成方法。
　Deep　Neural　Network（DNN）による分類対象の画像データの入力を受け付ける工程と、
　前記画像データの入力を受け付けると、前記画像データにAugmentationを実施する際のAugmentationごとの強度パラメータ、および、前記Augmentationを実施した画像データそれぞれを線形結合する際の重みを出力する工程と、
　前記入力された画像データに、前記Augmentationごとの強度パラメータを用いてAugmentationを実施する工程と、
　前記Augmentationが実施された画像データそれぞれを、前記重みを用いて線形結合した画像データを生成する工程と、
　生成した前記画像データを出力する工程と、
　をコンピュータに実行させるための画像データ生成プログラム。