JP2021157619A

JP2021157619A - 学習装置及び学習プログラム

Info

Publication number: JP2021157619A
Application number: JP2020058590A
Authority: JP
Inventors: 真太郎安達; Shintaro Adachi; 聡之山口; Satoyuki Yamaguchi; 邦和上野; Kunikazu Ueno; 洋劉; Hiroshi Ryu
Original assignee: Fujifilm Business Innovation Corp
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2021-10-07
Anticipated expiration: 2040-03-27
Also published as: US20210304031A1; CN113449843A

Abstract

【課題】過去の複数の案件で用いられた複数の学習済みデータセットのうち、新たな案件の学習データセットと類似する学習済みデータセットを選択的に用いて機械学習を行うことができる学習装置及び学習プログラムを提供する。【解決手段】学習装置１０は、ＣＰＵ１１を備える。ＣＰＵ１１は、過去の複数の案件の機械学習に用いられた複数の学習済みデータセットであって、各々が入力データ、正解データ、及び学習済みモデルを含む複数の学習済みデータセットの中から、新たな案件の機械学習に用いる入力データ及び正解データを含む学習データセットと類似する学習済みデータセットを選択し、選択した学習済みデータセットの入力データ及び正解データ、並びに、学習データセットの入力データ及び正解データを用いて、機械学習を行う。【選択図】図１

Description

本発明は、学習装置及び学習プログラムに関する。

例えば、特許文献１には、入力される画像データに対し、当該画像データの特徴に応じた内容の画像処理を行って出力する画像処理装置が記載されている。この画像処理装置は、画像処理の内容の異なる複数種類の画像処理手段を有する画像処理部と、画像処理部内にある画像処理手段のうち使用する画像処理手段又はその数を指定するための指定手段と、を有する。また、この画像処理装置は、画像データの特徴を表すデータが入力層に入力され、指定手段によって指定されている画像処理手段の中から１つの画像処理手段を選択する選択データを出力層から出力するニューラルネットワークと、入力層に入力されたデータに対応する適切な画像処理手段を選択する選択データを出力層から出力するようにニューラルネットワークを学習させるための学習手段と、を有する。

また、特許文献２には、ＤＮＮを容易に利用することができる提供装置が記載されている。この提供装置は、入力データに対する演算結果を出力するノードが接続された学習器であって入力データから所定の種別に対応する特徴を抽出する学習器を登録する登録部と、特徴の種別の指定を受け付ける受付部と、を備える。また、この提供装置は、登録部によって登録された学習器に基づいて、受付部によって受け付けられた特徴の種別に対応する特徴を抽出する学習器を選択し、当該選択された学習器に基づいて生成された新たな学習器を提供する提供部と、提供部が選択した学習器を提供した売主に支払う対価を算定する算定部と、を備える。

特開平１０−２８３４５８号公報特開２０１６−００４５４８号公報

ところで、新たな案件の学習データセットを用いて機械学習を行う場合に、過去の案件で機械学習した結果である学習済みデータセットを有効利用することで、新たな案件の学習モデルに対して、性能、品質等が担保される。

しかしながら、過去の複数の案件で用いられた複数の学習済みデータセットを全て流用すれば良いわけではなく、新たな案件の学習データセットと類似しないものは除外し、類似するものだけを選択的に流用するほうが望ましい。

本発明は、過去の複数の案件で用いられた複数の学習済みデータセットのうち、新たな案件の学習データセットと類似する学習済みデータセットを選択的に用いて機械学習を行うことができる学習装置及び学習プログラムを提供することを目的とする。

上記目的を達成するために、第１態様に係る学習装置は、プロセッサを備え、前記プロセッサが、過去の複数の案件の機械学習に用いられた複数の学習済みデータセットであって、各々が入力データ、正解データ、及び学習済みモデルを含む前記複数の学習済みデータセットの中から、新たな案件の機械学習に用いる入力データ及び正解データを含む学習データセットと類似する学習済みデータセットを選択し、前記選択した学習済みデータセットの入力データ及び正解データ、並びに、前記学習データセットの入力データ及び正解データを用いて、機械学習を行う。

また、第２態様に係る学習装置は、第１態様に係る学習装置において、前記プロセッサが、前記学習データセットの入力データを前記学習済みモデルの各々に入力し、前記学習済みモデルから得られる出力データと、前記学習データセットの正解データとの類似度を算出し、算出した類似度に基づいて、前記学習データセットと類似する学習済みデータセットを選択する。

また、第３態様に係る学習装置は、第２態様に係る学習装置において、前記類似度が、前記出力データの画素値と前記学習データセットの正解データの画素値との差、前記出力データの前記学習データセットの正解データに対する認識率、及び、前記出力データの前記学習データセットの正解データに対する編集距離の少なくとも１つで表される。

また、第４態様に係る学習装置は、第１態様に係る学習装置において、前記プロセッサが、前記複数の学習済みデータセットの各々について、前記学習データセットに対する類似度を算出し、算出した類似度に基づいて、前記学習データセットと類似する学習済みデータセットを選択する。

また、第５態様に係る学習装置は、第４態様に係る学習装置において、前記類似度が、前記学習済みデータセットの入力データと前記学習データセットの入力データとの類似度、及び、前記学習済みデータセットの正解データと前記学習データセットの正解データとの類似度の少なくとも一方で表される。

また、第６態様に係る学習装置は、第１態様に係る学習装置において、前記プロセッサが、前記複数の学習済みデータセットの各々に含まれる入力データ及び正解データを用いて機械学習を行うことにより学習モデルを生成し、生成した学習モデルに対して、前記学習データセットの入力データ及び正解データを入力し、前記生成した学習モデルから得られる出力結果に基づいて、前記学習データセットと類似する学習済みデータセットを選択する。

また、第７態様に係る学習装置は、第１態様〜第６態様のいずれか１の態様に係る学習装置において、前記プロセッサが、自装置の実装先情報に基づいて、前記複数の学習済みデータセットに対して、自装置で処理可能な学習済みデータセットの絞り込みを更に行う。

また、第８態様に係る学習装置は、第１態様〜第７態様のいずれか１の態様に係る学習装置において、前記プロセッサが、前記新たな案件の機械学習を行う場合に、前記選択した学習済みデータセットから得られる値を、前記機械学習の初期値として設定する。

また、第９態様に係る学習装置は、第１態様〜第８態様のいずれか１の態様に係る学習装置において、前記選択した学習済みデータセットが、入力データを変形して得られる変形入力データと、変形入力データの正解データである変形正解データとを更に含み、
前記プロセッサは、前記選択した学習済みデータセットの入力データ、正解データ、変形入力データ、及び変形正解データ、並びに、前記学習データセットの入力データ及び正解データを用いて、機械学習を行う。

更に、上記目的を達成するために、第１０様に係る学習プログラムは、過去の複数の案件の機械学習に用いられた複数の学習済みデータセットであって、各々が入力データ、正解データ、及び学習済みモデルを含む前記複数の学習済みデータセットの中から、新たな案件の機械学習に用いる入力データ及び正解データを含む学習データセットと類似する学習済みデータセットを選択し、前記選択した学習済みデータセットの入力データ及び正解データ、並びに、前記学習データセットの入力データ及び正解データを用いて、機械学習を行うことを、コンピュータに実行させる。

第１態様及び第１０態様によれば、過去の複数の案件で用いられた複数の学習済みデータセットのうち、新たな案件の学習データセットと類似する学習済みデータセットを選択的に用いて機械学習を行うことができる、という効果を有する。

第２態様によれば、学習済みデータセットの学習済みモデルを利用しない場合と比較して、新たな案件の学習データセットと学習済みデータセットとの類似度を効率的、かつ、精度良く算出することができる、という効果を有する。

第３態様によれば、データ間の画素値の差、認識率、及び編集距離を考慮しない場合と比較して、新たな案件の学習データセットと学習済みデータセットとの類似度を効率的、かつ、精度良く算出することができる、という効果を有する。

第４態様によれば、学習済みデータセットの各データを利用しない場合と比較して、新たな案件の学習データセットと学習済みデータセットとの類似度を精度良く算出することができる、という効果を有する。

第５態様によれば、入力データ間の類似度、及び、正解データ間の類似度を考慮しない場合と比較して、新たな案件の学習データセットと学習済みデータセットとの類似度を精度良く算出することができる、という効果を有する。

第６態様によれば、複数の学習済みデータセットを機械学習して得られる学習モデルを利用しない場合と比較して、新たな案件の学習データセットと類似する学習済みデータセットを精度良く選択することができる、という効果を有する。

第７態様によれば、自装置の実装先情報を考慮しない場合と比較して、学習済みデータセットの絞り込みを適切に行うことができる、という効果を有する。

第８態様によれば、機械学習の初期値として、選択した学習済みデータセットの値を考慮しない場合と比較して、機械学習を効率的に行うことができる、という効果を有する。

第９態様によれば、選択した学習済みデータセットの入力データ及び正解データの各々の変形データを追加しない場合と比較して、機械学習に用いるデータ数を増加させることができる、という効果を有する。

第１の実施形態に係る学習装置の電気的な構成の一例を示すブロック図である。第１の実施形態に係る学習装置の機能的な構成の一例を示すブロック図である。実施形態に係るニューラルネットワークの一例を示す概念図である。第１の実施形態に係る類似度算出方法の説明に供する図である。第１の実施形態に係る学習プログラムによる処理の流れの一例を示すフローチャートである。実施形態に係るデータ・オーグメンテーションの説明に供する図である。第２の実施形態に係る類似度算出方法の説明に供する図である。第２の実施形態に係る学習プログラムによる処理の流れの一例を示すフローチャートである。第３の実施形態に係る類似度算出方法の説明に供する図である。第３の実施形態に係る学習プログラムによる処理の流れの一例を示すフローチャートである。第４の実施形態に係る学習済み案件及び新規案件の一例を示す図である。

以下、図面を参照して、本発明を実施するための形態の一例について詳細に説明する。

[第１の実施形態]
図１は、第１の実施形態に係る学習装置１０の電気的な構成の一例を示すブロック図である。

図１に示すように、本実施形態に係る学習装置１０は、ＣＰＵ（Central Processing Unit）１１と、ＲＯＭ（Read Only Memory）１２と、ＲＡＭ（Random Access Memory）１３と、入出力インターフェース（Ｉ／Ｏ）１４と、記憶部１５と、表示部１６と、操作部１７と、通信部１８と、を備えている。なお、ＣＰＵに代えて、ＧＰＵ（Graphics Processing Unit）を備えていてもよい。

本実施形態に係る学習装置１０には、例えば、サーバコンピュータ、パーソナルコンピュータ（ＰＣ：Personal Computer）等の汎用的なコンピュータ装置が適用される。学習装置１０には、コピー機能、プリント機能、ファクシミリ機能、及びスキャナ機能等の複数の機能を備えた画像形成装置が適用されてもよい。

ＣＰＵ１１、ＲＯＭ１２、ＲＡＭ１３、及びＩ／Ｏ１４は、バスを介して各々接続されている。Ｉ／Ｏ１４には、記憶部１５と、表示部１６と、操作部１７と、通信部１８と、を含む各機能部が接続されている。これらの各機能部は、Ｉ／Ｏ１４を介して、ＣＰＵ１１と相互に通信可能とされる。

ＣＰＵ１１、ＲＯＭ１２、ＲＡＭ１３、及びＩ／Ｏ１４によって制御部が構成される。制御部は、学習装置１０の一部の動作を制御するサブ制御部として構成されてもよいし、学習装置１０の全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部の各ブロックの一部又は全部には、例えば、ＬＳＩ（Large Scale Integration）等の集積回路又はＩＣ（Integrated Circuit）チップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部の集積化には、ＬＳＩに限らず、専用回路又は汎用プロセッサを用いてもよい。

記憶部１５としては、例えば、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、フラッシュメモリ等が用いられる。記憶部１５には、本実施形態に係る学習プログラム１５Ａが記憶される。なお、この学習プログラム１５Ａは、ＲＯＭ１２に記憶されていてもよい。

学習プログラム１５Ａは、例えば、学習装置１０に予めインストールされていてもよい。学習プログラム１５Ａは、不揮発性の記憶媒体に記憶して、又はネットワークを介して配布して、学習装置１０に適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、ＣＤ-ＲＯＭ（Compact Disc Read Only Memory）、光磁気ディスク、ＨＤＤ、ＤＶＤ-ＲＯＭ（Digital Versatile Disc Read Only Memory）、フラッシュメモリ、メモリカード等が想定される。

表示部１６には、例えば、液晶ディスプレイ（ＬＣＤ:Liquid Crystal Display）、有機ＥＬ（Electro Luminescence）ディスプレイ等が用いられる。表示部１６は、タッチパネルを一体的に有していてもよい。操作部１７には、例えば、キーボードやマウス等の操作入力用のデバイスが設けられている。表示部１６及び操作部１７は、学習装置１０のユーザから各種の指示を受け付ける。表示部１６は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。

通信部１８は、インターネット、ＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）等のネットワークに接続されており、他の外部機器との間でネットワークを介して通信が可能とされる。

ところで、上述したように、新たな案件について機械学習を行って学習モデルを生成する際に、過去の複数の案件で用いられた複数の学習済みデータセットを全て流用すれば良いわけではなく、新たな案件の学習データセットと類似しないものは除外し、類似するものだけを選択的に流用するほうが望ましい。

このため、本実施形態に係る学習装置１０のＣＰＵ１１は、記憶部１５に記憶されている学習プログラム１５ＡをＲＡＭ１３に書き込んで実行することにより、図２に示す各部として機能する。なお、ＣＰＵ１１は、プロセッサの一例である。

図２は、第１の実施形態に係る学習装置１０の機能的な構成の一例を示すブロック図である。

図２に示すように、本実施形態に係る学習装置１０のＣＰＵ１１は、取得部１１Ａ、類似度算出部１１Ｂ、選択部１１Ｃ、学習データ決定部１１Ｄ、初期値決定部１１Ｅ、及び学習部１１Ｆとして機能する。

本実施形態に係る記憶部１５には、新たな案件（以下、「新規案件Ｘ」という。）の機械学習に用いる学習データセットＸが記憶されている。この学習データセットＸには、入力データ及び正解データが含まれる。この学習データセットＸは、更に、入力データと正解データとの差データを含んでいてもよい。これらの入力データ及び正解データは、例えば、画像データである。この画像データは、文字列等を含んでいてもよい。

また、記憶部１５には、過去の複数の案件（以下、「案件Ａ」、「案件Ｂ」、「案件Ｃ」、及び「案件Ｄ」という。）の機械学習に用いられた複数の学習済みデータセットＡ〜Ｄが記憶されている。なお、過去の複数の案件は、２件以上であればよく、４件に限定されるものではない。学習済みデータセットＡには、入力データ、正解データ、及び学習済みモデルが含まれる。この学習済みモデルは、入力データ及び正解データを用いて機械学習することで得られた案件Ａについての学習済みモデルである。学習済みデータセットＡは、更に、入力データと正解データとの差データを含んでいてもよい。これらの入力データ及び正解データは、例えば、画像データである。この画像データは、文字列等を含んでいてもよい。他の学習済みデータセットＢ、学習済みデータセットＣ、及び学習済みデータセットＤについても、学習済みデータセットＡと同様の構成とされる。なお、これらの学習データセットＸ及び学習済みデータセットＡ〜Ｄは、学習装置１０からアクセス可能な外部の記憶装置に記憶されていてもよい。

ここで、機械学習により生成される学習モデルには、一例として、ニューラルネットワーク（Neural Network：ＮＮ）、畳み込みニューラルネットワーク（Convolution Neural Network：ＣＮＮ）等が適用される。図３を参照して、本実施形態に係るニューラルネットワークの概要について説明する。

図３は、本実施形態に係るニューラルネットワークの一例を示す概念図である。

図３に示すニューラルネットワークは、入力層ｘ_ｉ、隠れ層（中間層とも称する）ｙ_ｊ、及び出力層ｚを有している。

図３に示すニューラルネットワークは、説明を簡単化するために、最も単純な３層構成としているが、隠れ層ｙ_ｊを２層以上とした多層構成としてもよい。また、出力層ｚのノード（ニューロンともいう。）を１つにしているが、複数のノードで構成してもよい。

ここで、ニューラルネットワークに対して、入力が与えられたときの出力の計算は、入力から順に以下の式（１）を用いて行われる。なお、ｆ（・）は活性化関数と呼ばれ、一例としてシグモイド関数等が用いられる。また、ｘ_ｉは入力層ｘ_ｉの入力、ｙ_ｊは隠れ層ｙ_ｊの出力、ｚは出力層ｚの出力、ｗ_ｉｊ、ｕ_ｊは重み係数である。これらの重み係数ｗ_ｉｊ、ｕ_ｊを変化させることで同じ入力に対して異なる出力が得られる。つまり、狙った出力が得られるように重み係数ｗ_ｉｊ、ｕ_ｊを更新させることで、各モデルの学習が行われる。

・・・（１）

本実施形態に係るＣＰＵ１１は、複数の学習済みデータセットＡ〜Ｄの中から、新規案件Ｘの機械学習に用いる学習データセットＸと類似する学習済みデータセットを選択する。そして、ＣＰＵ１１は、選択した学習済みデータセットの入力データ及び正解データ、並びに、学習データセットＸの入力データ及び正解データを用いて、機械学習を行う。

より具体的に、本実施形態に係る取得部１１Ａは、記憶部１５から、学習データセットＸと、複数の学習済みデータセットＡ〜Ｄと、を取得する。

本実施形態に係る類似度算出部１１Ｂは、取得部１１Ａにより取得された、学習データセットＸに対して、複数の学習済みデータセットＡ〜Ｄの各々との類似度を算出する。つまり、学習データセットＸと学習済みデータセットＡとの類似度、学習データセットＸと学習済みデータセットＢとの類似度、学習データセットＸと学習済みデータセットＣとの類似度、及び、学習データセットＸと学習済みデータセットＤとの類似度が算出される。類似度を表す指標には、一例として、平均二乗誤差等が用いられる。平均二乗誤差の値が小さいほど、類似している可能性が高いと判定される。なお、類似度の具体的な算出方法については後述する。

本実施形態に係る選択部１１Ｃは、類似度算出部１１Ｂにより算出された類似度に基づいて、複数の学習済みデータセットＡ〜Ｄの中から、学習データセットＸと類似する学習済みデータセットを選択する。例えば、複数の学習済みデータセットＡ〜Ｄの中で類似度が最も高い学習済みデータセットを選択するようにしてもよいし、あるいは、複数の学習済みデータセットＡ〜Ｄの中で類似度の高い順にＮ（＜４）個の学習済みデータセットを選択するようにしてもよい。

本実施形態に係る学習データ決定部１１Ｄは、新規案件Ｘの機械学習に用いる学習データを決定する。具体的には、選択部１１Ｃにより選択された学習済みデータセット、及び、新規案件Ｘの学習データセットＸを、学習データとして決定する。

本実施形態に係る初期値決定部１１Ｅは、新規案件Ｘの機械学習に用いる初期値を決定する。例えば、選択部１１Ｃにより選択された学習済みデータセットから得られる値を、機械学習の初期値として決定する。この際、ハイパーパラメータについても、選択部１１Ｃにより選択された学習済みデータセットから得られる値を適用してもよい。

本実施形態に係る学習部１１Ｆは、学習データ決定部１１Ｄにより決定された学習データ、及び、初期値決定部１１Ｅにより決定された初期値を用いて、新規案件Ｘについての機械学習を行い、学習モデルを生成する。

次に、図４を参照して、第１の実施形態に係る類似度算出方法について具体的に説明する。

図４は、第１の実施形態に係る類似度算出方法の説明に供する図である。

図４に示すように、学習データセットＸは、入力データＸ_ｉｎ及び正解データＸ_ｏｕｔを含む。また、学習済みデータセットＡは、入力データＡ_ｉｎ、正解データＡ_ｏｕｔ、及び学習済みモデルＡを含む。同様に、学習済みデータセットＢは、入力データＢ_ｉｎ、正解データＢ_ｏｕｔ、及び学習済みモデルＢを含む。学習済みデータセットＣは、入力データＣ_ｉｎ、正解データＣ_ｏｕｔ、及び学習済みモデルＣを含む。学習済みデータセットＤは、入力データＤ_ｉｎ、正解データＤ_ｏｕｔ、及び学習済みモデルＤを含む。

類似度算出部１１Ｂは、学習データセットＸの入力データＸ_ｉｎを、学習済みデータセットＡ〜Ｄの各学習済みモデルＡ〜Ｄに入力し、学習済みモデルＡ〜Ｄから得られる出力データＸ_ｏｕｔＡ〜Ｘ_ｏｕｔＤの各々と、学習データセットＸの正解データＸ_ｏｕｔとの類似度を算出する。そして、選択部１１Ｃは、類似度算出部１１Ｂにより算出された類似度に基づいて、学習データセットＸと類似する学習済みデータセットを選択する。例えば、各データが画像データである場合、類似度は、一例として、出力データの画素値と正解データの画素値との差、出力データの正解データに対する認識率、及び、出力データの正解データに対する編集距離の少なくとも１つで表される。

類似度は、例えば、出力データの画素値及び正解データの画素値に基づいて決定される。具体的に、出力データの画素値と正解データの画素値との差が小さいものを選択することは、画像自体の類似度が近いものを選択しているといえる。また、正解データに対する認識率が近いものを選択することは、後段で行われる認識処理における認識結果が近い画像を選択しているといえる。

例えば、画像間の画素値の差を用いる場合、画素値の差が小さいほど、画像間の類似度は高くなる。この場合、画像間の対応画素又は対応領域における画素値の差を求めればよい。対応領域の場合、領域内に含まれる複数の画素の画素値の平均値、最大値、及び最小値のいずれかの差を求めればよい。

また、画像間の認識率を用いる場合、認識率が高いほど、画像間の類似度は高くなる。認識率は、例えば、文字認識を行う文字認識エンジン又は画像認識を行う画像認識エンジンにより算出される。

また、編集距離は、レーベンシュタイン距離（Levenshtein distance）とも呼ばれ、２つの文字列がどの程度異なっているかを示す距離の一種である。具体的には、１文字の挿入、削除、置換によって、一方の文字列を他方の文字列に変形するのに必要な手順の最小回数として定義される。画像間の編集距離を用いる場合、編集距離の回数が少ないほど、画像間の類似度は高くなる。編集距離は、認識率と同様に、上記文字認識エンジンにより算出される。つまり、これらの認識率、編集距離を用いる場合、学習装置１０が文字認識エンジン、画像認識エンジンを備えているものとする。

なお、学習データセットＸの入力データＸ_ｉｎが複数ある場合には、複数の入力データＸ_ｉｎの全てについて、学習済みデータセットＡの出力データＸ_ｏｕｔＡと、正解データＸ_ｏｕｔとの類似度を算出する。このため、学習済みデータセットＡに対して複数の類似度が算出される。この場合、例えば、複数の類似度の平均値、最大値、及び最小値のいずれかを、学習済みデータセットＡとの類似度としてもよいし、あるいは、複数の類似度のうちで閾値を超えた類似度のカウント数を、学習済みデータセットＡとの類似度としてもよい。他の学習済みデータセットＢ〜Ｄについても同様に類似度が算出される。この場合、選択部１１Ｃは、類似度算出部１１Ｂにより算出された、複数の学習済みデータセットＡ〜Ｄの各々の類似度に基づいて、学習データセットＸと類似する学習済みデータセットを選択する。

次に、図５を参照して、第１の実施形態に係る学習装置１０の作用を説明する。

図５は、第１の実施形態に係る学習プログラム１５Ａによる処理の流れの一例を示すフローチャートである。

まず、学習装置１０に対して、新規案件Ｘの機械学習処理の実行が指示されると、ＣＰＵ１１により学習プログラム１５Ａが起動され、以下の各ステップを実行する。

図５のステップ１００では、ＣＰＵ１１が、記憶部１５から、学習データセットＸを取得する。

ステップ１０１では、ＣＰＵ１１が、記憶部１５に記憶されている、複数の学習済みデータセットＡ〜Ｄの中から、１つの学習済みデータセット（例えば、学習済みデータセットＡ）を取得する。

ステップ１０２では、ＣＰＵ１１が、一例として、上述の図４に示すように、学習データセットＸの入力データＸ_ｉｎを学習済みモデルＡに入力する。

ステップ１０３では、ＣＰＵ１１が、一例として、上述の図４に示すように、学習済みモデルＡから、出力データＸ_ｏｕｔＡを取得する。

ステップ１０４では、ＣＰＵ１１が、ステップ１０３で取得した出力データＸ_ｏｕｔＡと、学習データセットＸの正解データＸ_ｏｕｔとの類似度を算出する。類似度は、上述したように、例えば、出力データの画素値と正解データの画素値との差、出力データの正解データに対する認識率、及び、出力データの正解データに対する編集距離の少なくとも１つで表される。

ステップ１０５では、ＣＰＵ１１が、全ての学習済みデータセットについて類似度を算出したか否かを判定する。全ての学習済みデータセットについて類似度を算出したと判定した場合（肯定判定の場合）、ステップ１０６に移行し、全ての学習済みデータセットについて類似度を算出していないと判定した場合（否定判定の場合）、ステップ１０１に戻り処理を繰り返す。本実施形態の場合、学習済みデータセットＢ、学習済みデータセットＣ、及び学習済みデータセットＤの各々について、ステップ１０１〜ステップ１０４までの処理が繰り返し実行される。つまり、学習済みデータセットＢに対して、出力データＸ_ｏｕｔＢと、正解データＸ_ｏｕｔとの類似度が算出され、学習済みデータセットＣに対して、出力データＸ_ｏｕｔＣと、正解データＸ_ｏｕｔとの類似度が算出され、学習済みデータセットＤに対して、出力データＸ_ｏｕｔＤと、正解データＸ_ｏｕｔとの類似度が算出される。

なお、類似度を算出する際に、自装置の実装先情報に基づいて、複数の学習済みデータセットＡ〜Ｄに対して、自装置で処理可能な学習済みデータセットの絞り込みを行うようにしてもよい。実装先情報とは、学習装置１０が実装されている実装先に関する情報である。実装先が例えば画像形成装置である場合、画像形成装置の処理能力（ＣＰＵ又はＧＰＵのクロック周波数、メモリ容量等の性能）は比較的高くないことが多いため、大量のデータを有する学習済みデータセットを処理することは難しいと考えられる。このため、一定量以上のデータを有する学習済みデータセットは、類似度の算出対象から除外することが望ましい。また、実装先が例えば外部のクラウドサーバ又は内部のオンプレミスサーバである場合、クラウドサーバ又はオンプレミスサーバの処理能力（ＣＰＵ又はＧＰＵのクロック周波数、メモリ容量等の性能）に応じて、一定量以上のデータを有する学習済みデータセットを類似度の算出対象にするか否かを決定してもよい。

ステップ１０６では、ＣＰＵ１１が、ステップ１０５までの処理で類似度が算出された複数の学習済みデータセットＡ〜Ｄの中から、学習データセットＸと類似する学習済みデータセットを選択する。例えば、類似度として、類似度の平均値を用いる場合、平均値が最大となる学習済みデータセットを選択すればよい。あるいは、類似度として、閾値を超えた類似度のカウント数を用いる場合、カウント数が最大となる学習済みデータセットを選択すればよい。

ステップ１０７では、ＣＰＵ１１が、新規案件Ｘの機械学習に用いる学習データを決定する。具体的には、ステップ１０６で選択された学習済みデータセット、及び、新規案件Ｘの学習データセットＸが、学習データとして決定される。なお、学習データを決定する際に、データ・オーグメンテーション（Data Augmentation）と呼ばれるデータ数を増加させる処理を行うようにしてもよい。

図６は、本実施形態に係るデータ・オーグメンテーションの説明に供する図である。

図６に示すように、上記で選択した学習済みデータセットが例えば学習済みデータセットＡである場合について想定する。学習済みデータセットＡは、入力データＡ_ｉｎを変形して得られる変形入力データＡ_ｉｎｄｆと、変形入力データＡ_ｉｎｄｆの正解データである変形正解データＡ_{ｏｕｔｄｆ}とを更に含んでいる。ここでいう変形とは、一例として、反転、拡大、縮小等とされる。この場合、選択した学習済みデータセットＡの入力データＡ_ｉｎ、正解データＡ_ｏｕｔ、変形入力データＡ_ｉｎｄｆ、及び変形正解データＡ_{ｏｕｔｄｆ}、並びに、学習データセットＸの入力データＸ_ｉｎ及び正解データＸ_ｏｕｔを用いて、機械学習が行われる。

ステップ１０８では、ＣＰＵ１１が、新規案件Ｘの機械学習に用いる初期値を決定する。上述したように、例えば、ステップ１０６で選択した学習済みデータセットから得られる値を、機械学習の初期値として決定する。この際、ハイパーパラメータについても、ステップ１０６で選択した学習済みデータセットから得られる値を適用してもよい。

ステップ１０９では、ＣＰＵ１１が、ステップ１０７で決定した学習データ、及び、ステップ１０８で決定した初期値を用いて、新規案件Ｘについての機械学習を行い、学習モデルを生成する。

ステップ１１０では、ＣＰＵ１１が、ステップ１０９で生成した学習モデルを、学習結果として出力し、本学習プログラム１５Ａによる一連の処理を終了する。

このように本実施形態によれば、過去の複数の案件で用いられた複数の学習済みデータセットのうち、新規案件の学習データセットと類似する学習済みデータセットを選択的に用いて機械学習が行われる。このため、効率的、かつ、精度の高い機械学習が可能とされる。

また、類似度の算出が学習済みデータセットの学習済みモデルを用いて行われる。このため、新規案件の学習データセットと学習済みデータセットとの類似度が効率的、かつ、精度良く算出される。

[第２の実施形態]
上記第１の実施形態では、類似度の算出を学習済みデータセットの学習済みモデルを用いて行う形態について説明した。本実施形態では、類似度の算出を学習済みデータセットの各データを用いて行う形態について説明する。

なお、本実施形態では、上記第１の実施形態で説明した学習装置１０と同様の構成を有しているものとし、その繰り返しの説明は省略し、上述の図２を参照して、相違点のみを説明する。

図７は、第２の実施形態に係る類似度算出方法の説明に供する図である。

図７に示すように、学習データセットＸは、入力データＸ_ｉｎ及び正解データＸ_ｏｕｔを含む。また、学習済みデータセットＡは、入力データＡ_ｉｎ、正解データＡ_ｏｕｔ、及び学習済みモデルＡを含む。同様に、学習済みデータセットＢは、入力データＢ_ｉｎ、正解データＢ_ｏｕｔ、及び学習済みモデルＢを含む。学習済みデータセットＣは、入力データＣ_ｉｎ、正解データＣ_ｏｕｔ、及び学習済みモデルＣを含む。学習済みデータセットＤは、入力データＤ_ｉｎ、正解データＤ_ｏｕｔ、及び学習済みモデルＤを含む。

類似度算出部１１Ｂは、複数の学習済みデータセットＡ〜Ｄの各々について、学習データセットＸに対する類似度を算出する。そして、選択部１１Ｃは、類似度算出部１１Ｂにより算出された類似度に基づいて、学習データセットＸと類似する学習済みデータセットを選択する。例えば、各データが画像データである場合、類似度は、一例として、学習済みデータセットＡ〜Ｄの入力データＡ_ｉｎ〜Ｄ_ｉｎの各々と、学習データセットＸの入力データＸ_ｉｎとの類似度、及び、学習済みデータセットＡ〜Ｄの正解データＡ_ｏｕｔ〜Ｄ_ｏｕｔの各々と、学習データセットＸの正解データＸ_ｏｕｔとの類似度の少なくとも一方で表される。この場合、例えば、画像データの属性情報、認識対象物等から類似度を算出してもよい。属性情報とは、カラー／白黒、画像サイズ、特徴量、手書き文字量、活字文字量、及び、入力データと正解データとの差分の差等が含まれる。また、認識対象物には、ＱＲコード（登録商標）、活字文字、手書き文字、及びバーコード等が含まれる。

次に、図８を参照して、第２の実施形態に係る学習装置１０の作用を説明する。

図８は、第２の実施形態に係る学習プログラム１５Ａによる処理の流れの一例を示すフローチャートである。

図８のステップ１２０では、ＣＰＵ１１が、記憶部１５から、学習データセットＸを取得する。

ステップ１２１では、ＣＰＵ１１が、記憶部１５に記憶されている、複数の学習済みデータセットＡ〜Ｄの中から、１つの学習済みデータセット（例えば、学習済みデータセットＡ）を取得する。

ステップ１２２では、ＣＰＵ１１が、一例として、上述の図７に示すように、ステップ１２１で取得した入力データＡ_ｉｎと、学習データセットＸの入力データＸ_ｉｎとの類似度、及び、ステップ１２１で取得した正解データＡ_ｏｕｔと、学習データセットＸの正解データＸ_ｏｕｔとの類似度を算出する。なお、入力データ及び正解データの両方について類似度を算出する場合、各データの平均値を学習済みデータセットＡとの類似度としてもよいし、各データの合計値を学習済みデータセットＡとの類似度としてもよい。また、入力データの類似度だけでもよいし、正解データの類似度だけでもよい。

ステップ１２３では、ＣＰＵ１１が、全ての学習済みデータセットについて類似度を算出したか否かを判定する。全ての学習済みデータセットについて類似度を算出したと判定した場合（肯定判定の場合）、ステップ１２４に移行し、全ての学習済みデータセットについて類似度を算出していないと判定した場合（否定判定の場合）、ステップ１２１に戻り処理を繰り返す。本実施形態の場合、学習済みデータセットＢ、学習済みデータセットＣ、及び学習済みデータセットＤの各々について、ステップ１２１〜ステップ１２２までの処理が繰り返し実行される。つまり、学習済みデータセットＢに対して、入力データＢ_ｉｎと入力データＸ_ｉｎとの類似度、及び、正解データＢ_ｏｕｔと正解データＸ_ｏｕｔとの類似度が算出され、学習済みデータセットＣに対して、入力データＣ_ｉｎと入力データＸ_ｉｎとの類似度、及び、正解データＣ_ｏｕｔと正解データＸ_ｏｕｔとの類似度が算出され、学習済みデータセットＤに対して、入力データＤ_ｉｎと入力データＸ_ｉｎとの類似度、及び、正解データＤ_ｏｕｔと正解データＸ_ｏｕｔとの類似度が算出される。

ステップ１２４では、ＣＰＵ１１が、ステップ１２３までの処理で類似度が算出された複数の学習済みデータセットＡ〜Ｄの中から、学習データセットＸと類似する学習済みデータセットを選択する。例えば、類似度として、類似度の平均値を用いる場合、平均値が最大となる学習済みデータセットを選択すればよい。あるいは、類似度として、閾値を超えた類似度のカウント数を用いる場合、カウント数が最大となる学習済みデータセットを選択すればよい。

ステップ１２５では、ＣＰＵ１１が、新規案件Ｘの機械学習に用いる学習データを決定する。具体的には、ステップ１２４で選択された学習済みデータセット、及び、新規案件Ｘの学習データセットＸが、学習データとして決定される。なお、学習データを決定する際に、上述したデータ・オーグメンテーション（Data Augmentation）を行ってデータ数を増加させるようにしてもよい。

ステップ１２６では、ＣＰＵ１１が、新規案件Ｘの機械学習に用いる初期値を決定する。上述したように、例えば、ステップ１２４で選択した学習済みデータセットから得られる値を、機械学習の初期値として決定する。この際、ハイパーパラメータについても、ステップ１２４で選択した学習済みデータセットから得られる値を適用してもよい。

ステップ１２７では、ＣＰＵ１１が、ステップ１２５で決定した学習データ、及び、ステップ１２６で決定した初期値を用いて、新規案件Ｘについての機械学習を行い、学習モデルを生成する。

ステップ１２８では、ＣＰＵ１１が、ステップ１２７で生成した学習モデルを、学習結果として出力し、本学習プログラム１５Ａによる一連の処理を終了する。

このように本実施形態によれば、類似度の算出が学習済みデータセットの各データを用いて行われる。このため、新規案件の学習データセットと学習済みデータセットとの類似度が精度良く算出される。

[第３の実施形態]
本実施形態では、複数の学習済みデータセットを機械学習して得られる学習モデルを用いて、類似する学習済みデータセットを選択する形態について説明する。

図９は、第３の実施形態に係る類似度算出方法の説明に供する図である。

図９に示すように、学習データセットＸは、入力データＸ_ｉｎ及び正解データＸ_ｏｕｔを含む。また、学習済みデータセットＡは、入力データＡ_ｉｎ、正解データＡ_ｏｕｔ、及び学習済みモデルＡを含む。同様に、学習済みデータセットＢは、入力データＢ_ｉｎ、正解データＢ_ｏｕｔ、及び学習済みモデルＢを含む。学習済みデータセットＣは、入力データＣ_ｉｎ、正解データＣ_ｏｕｔ、及び学習済みモデルＣを含む。学習済みデータセットＤは、入力データＤ_ｉｎ、正解データＤ_ｏｕｔ、及び学習済みモデルＤを含む。

類似度算出部１１Ｂは、複数の学習済みデータセットＡ〜Ｄの各々に含まれる入力データＡ_ｉｎ〜Ｄ_ｉｎ及び正解データＡ_ｏｕｔ〜Ｄ_ｏｕｔを用いて機械学習を行うことにより学習モデルＸを生成する。そして、選択部１１Ｃは、類似度算出部１１Ｂにより生成された学習モデルＸに対して、学習データセットＸの入力データＸ_ｉｎ及び正解データＸ_ｏｕｔを入力し、生成した学習モデルＸから得られる出力結果（例えば、案件Ａ又は案件Ｂ又は案件Ｃ又は案件Ｄ）に基づいて、学習データセットＸと類似する学習済みデータセットを選択する。

次に、図１０を参照して、第３の実施形態に係る学習装置１０の作用を説明する。

図１０は、第３の実施形態に係る学習プログラム１５Ａによる処理の流れの一例を示すフローチャートである。

図１０のステップ１３０では、ＣＰＵ１１が、記憶部１５に記憶されている、複数の学習済みデータセットＡ〜Ｄの中から、１つの学習済みデータセット（例えば、学習済みデータセットＡ）を取得する。

ステップ１３１では、ＣＰＵ１１が、一例として、上述の図９に示すように、学習済みデータセットＡの入力データＡ_ｉｎ及び正解データＡ_ｏｕｔを用いて機械学習を行う。

ステップ１３２では、ＣＰＵ１１が、全ての学習済みデータセットについて機械学習を行ったか否かを判定する。全ての学習済みデータセットについて機械学習を行ったと判定した場合（肯定判定の場合）、ステップ１３３に移行し、全ての学習済みデータセットについて機械学習を行っていないと判定した場合（否定判定の場合）、ステップ１３０に戻り処理を繰り返す。本実施形態の場合、学習済みデータセットＢ、学習済みデータセットＣ、及び学習済みデータセットＤの各々について、ステップ１３０〜ステップ１３１までの処理が繰り返し実行される。つまり、学習済みデータセットＢの入力データＢ_ｉｎ及び正解データＢ_ｏｕｔを用いて機械学習が行われ、学習済みデータセットＣの入力データＣ_ｉｎ及び正解データＣ_ｏｕｔを用いて機械学習が行われ、学習済みデータセットＤの入力データＤ_ｉｎ及び正解データＤ_ｏｕｔを用いて機械学習が行われる。

ステップ１３３では、ＣＰＵ１１が、一例として、上述の図９に示すように、ステップ１３２での機械学習により学習モデルＸを生成する。この学習モデルＸは、案件Ａ〜Ｄを分類する分類モデルである。

ステップ１３４では、ＣＰＵ１１が、記憶部１５から、学習データセットＸを取得する。

ステップ１３５では、ＣＰＵ１１が、一例として、上述の図９に示すように、ステップ１３４で取得した学習データセットＸの入力データＸ_ｉｎ及び正解データＸ_ｏｕｔを、ステップ１３３で生成した学習モデルＸに入力する。

ステップ１３６では、ＣＰＵ１１が、一例として、上述の図９に示すように、学習モデルＸの出力結果（例えば、案件Ａ又は案件Ｂ又は案件Ｃ又は案件Ｄ）を取得する。

ステップ１３７では、ＣＰＵ１１が、ステップ１３６で取得した出力結果（例えば、案件Ａ又は案件Ｂ又は案件Ｃ又は案件Ｄ）から、類似する学習済みデータセットを選択する。

ステップ１３８では、ＣＰＵ１１が、新規案件Ｘの機械学習に用いる学習データを決定する。具体的には、ステップ１３７で選択された学習済みデータセット、及び、新規案件Ｘの学習データセットＸが、学習データとして決定される。なお、学習データを決定する際に、上述したデータ・オーグメンテーション（Data Augmentation）を行ってデータ数を増加させるようにしてもよい。

ステップ１３９では、ＣＰＵ１１が、新規案件Ｘの機械学習に用いる初期値を決定する。上述したように、例えば、ステップ１３７で選択した学習済みデータセットから得られる値を、機械学習の初期値として決定する。この際、ハイパーパラメータについても、ステップ１３７で選択した学習済みデータセットから得られる値を適用してもよい。

ステップ１４０では、ＣＰＵ１１が、ステップ１３８で決定した学習データ、及び、ステップ１３９で決定した初期値を用いて、新規案件Ｘについての機械学習を行い、学習モデルを生成する。

ステップ１４１では、ＣＰＵ１１が、ステップ１４０で生成した学習モデルを、学習結果として出力し、本学習プログラム１５Ａによる一連の処理を終了する。

このように本実施形態によれば、類似する学習済みデータセットの選択が複数の学習済みデータセットを機械学習して得られる学習モデルを用いて行われる。このため、新規案件の学習データセットと類似する学習済みデータセットが精度良く選択される。

[第４の実施形態]
本実施形態では、入力データが透かし（ウォーターマーク）有りの画像であり、正解データが透かし（ウォーターマーク）無しの画像である場合について説明する。

図１１は、第４の実施形態に係る学習済み案件及び新規案件の一例を示す図である。

図１１に示すように、複数の学習済み案件は、車検証案件、ＹＹ市手当申請書案件、ＹＨ大学アンケート案件、及びＸＸ社カタログ案件を含んでいる。車検証案件は、学習済みデータセットＡを有し、学習済みデータセットＡは、入力画像、正解画像、入力画像と正解画像との差データ、及び学習済みモデルを含んでいる。車検証の入力画像は、ウォーターマーク有りの画像であり、車検証の正解画像は、ウォーターマーク無しの画像である。また、ＹＹ市手当申請書案件は、学習済みデータセットＢを有し、学習済みデータセットＢは、入力画像、正解画像、入力画像と正解画像との差データ、及び学習済みモデルを含んでいる。また、ＹＨ大学アンケート案件は、学習済みデータセットＣを有し、学習済みデータセットＣは、入力画像、正解画像、入力画像と正解画像との差データ、及び学習済みモデルを含んでいる。また、ＸＸ社カタログ案件は、学習済みデータセットＤを有し、学習済みデータセットＤは、入力画像、正解画像、入力画像と正解画像との差データ、及び学習済みモデルを含んでいる。

一方、新規案件であるウォーターマーク案件は、学習データセットＸを有し、学習データセットＸは、入力画像、正解画像、及び入力画像と正解画像との差データを含んでいる。入力画像は、ウォーターマーク有りの画像であり、正解画像は、ウォーターマーク無しの画像である。

図１１の例では、複数の学習済みデータセットＡ〜Ｄの中から、車検証案件の学習済みデータセットＡが、学習データセットＸと類似する学習済みデータセットとして、選択される。つまり、ウォーターマークの有無を表す学習データセットＸと最も類似する学習済み案件は、同じく、ウォーターマークの有無を表す車検証の学習済みデータセットＡと判定される。この場合、例えば、学習済みデータセットＡの入力画像及び正解画像、並びに、学習データセットＸの入力画像及び正解画像を学習データとして、学習済みデータセットＡの学習済みモデルを用いて、新規案件用の機械学習を行う。あるいは、学習データセットＸの入力画像及び正解画像を学習データとして、学習済みデータセットＡの学習済みモデルを用いて、新規案件用の機械学習を行うようにしてもよい。

なお、上記各実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ（例えば、ＣＰＵ： Central Processing Unit、等）や、専用のプロセッサ（例えば、ＧＰＵ： Graphics Processing Unit、ＡＳＩＣ： Application Specific Integrated Circuit、ＦＰＧＡ： Field Programmable Gate Array、プログラマブル論理デバイス、等）を含むものである。

また、上記各実施形態におけるプロセッサの動作は、１つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は、上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。

以上、実施形態に係る学習装置を例示して説明した。実施形態は、学習装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、これらのプログラムを記憶したコンピュータが読み取り可能な非一時的記憶媒体の形態としてもよい。

その他、上記実施形態で説明した学習装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。

また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。

また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。

１０学習装置
１１ＣＰＵ
１１Ａ取得部
１１Ｂ類似度算出部
１１Ｃ選択部
１１Ｄ学習データ決定部
１１Ｅ初期値決定部
１１Ｆ学習部
１２ＲＯＭ
１３ＲＡＭ
１４Ｉ／Ｏ
１５記憶部
１５Ａ学習プログラム
１６表示部
１７操作部
１８通信部

Claims

プロセッサを備え、
前記プロセッサは、
過去の複数の案件の機械学習に用いられた複数の学習済みデータセットであって、各々が入力データ、正解データ、及び学習済みモデルを含む前記複数の学習済みデータセットの中から、新たな案件の機械学習に用いる入力データ及び正解データを含む学習データセットと類似する学習済みデータセットを選択し、
前記選択した学習済みデータセットの入力データ及び正解データ、並びに、前記学習データセットの入力データ及び正解データを用いて、機械学習を行う
学習装置。
前記プロセッサは、前記学習データセットの入力データを前記学習済みモデルの各々に入力し、前記学習済みモデルから得られる出力データと、前記学習データセットの正解データとの類似度を算出し、算出した類似度に基づいて、前記学習データセットと類似する学習済みデータセットを選択する
請求項１に記載の学習装置。
前記類似度は、前記出力データの画素値と前記学習データセットの正解データの画素値との差、前記出力データの前記学習データセットの正解データに対する認識率、及び、前記出力データの前記学習データセットの正解データに対する編集距離の少なくとも１つで表される
請求項２に記載の学習装置。
前記プロセッサは、前記複数の学習済みデータセットの各々について、前記学習データセットに対する類似度を算出し、算出した類似度に基づいて、前記学習データセットと類似する学習済みデータセットを選択する
請求項１に記載の学習装置。
前記類似度は、前記学習済みデータセットの入力データと前記学習データセットの入力データとの類似度、及び、前記学習済みデータセットの正解データと前記学習データセットの正解データとの類似度の少なくとも一方で表される
請求項４に記載の学習装置。
前記プロセッサは、前記複数の学習済みデータセットの各々に含まれる入力データ及び正解データを用いて機械学習を行うことにより学習モデルを生成し、生成した学習モデルに対して、前記学習データセットの入力データ及び正解データを入力し、前記生成した学習モデルから得られる出力結果に基づいて、前記学習データセットと類似する学習済みデータセットを選択する
請求項１に記載の学習装置。
前記プロセッサは、自装置の実装先情報に基づいて、前記複数の学習済みデータセットに対して、自装置で処理可能な学習済みデータセットの絞り込みを更に行う
請求項１〜請求項６のいずれか１項に記載の学習装置。
前記プロセッサは、前記新たな案件の機械学習を行う場合に、前記選択した学習済みデータセットから得られる値を、前記機械学習の初期値として設定する
請求項１〜請求項７のいずれか１項に記載の学習装置。
前記選択した学習済みデータセットは、入力データを変形して得られる変形入力データと、変形入力データの正解データである変形正解データとを更に含み、
前記プロセッサは、前記選択した学習済みデータセットの入力データ、正解データ、変形入力データ、及び変形正解データ、並びに、前記学習データセットの入力データ及び正解データを用いて、機械学習を行う
請求項１〜請求項８のいずれか１項に記載の学習装置。
過去の複数の案件の機械学習に用いられた複数の学習済みデータセットであって、各々が入力データ、正解データ、及び学習済みモデルを含む前記複数の学習済みデータセットの中から、新たな案件の機械学習に用いる入力データ及び正解データを含む学習データセットと類似する学習済みデータセットを選択し、
前記選択した学習済みデータセットの入力データ及び正解データ、並びに、前記学習データセットの入力データ及び正解データを用いて、機械学習を行うことを、
コンピュータに実行させるための学習プログラム。