JP6886112B2

JP6886112B2 - 学習プログラム、学習装置及び学習方法

Info

Publication number: JP6886112B2
Application number: JP2017193933A
Authority: JP
Inventors: 輝哉小林; 隆一高木
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2017-10-04
Filing date: 2017-10-04
Publication date: 2021-06-16
Anticipated expiration: 2037-10-04
Also published as: US20190102699A1; US11488056B2; JP2019067272A

Description

本発明は、学習プログラム、学習装置及び学習方法に関する。

近年、音声認識や画像認識等の分野において、ディープラーニング手法が活用されている。ディープラーニング手法は、多層構造のニューラルネットワーク（以下、単にニューラルネットワークとも呼ぶ）に学習データを学習させることをよって行われる機械学習の手法である。

具体的に、利用者に対してサービスを提供する事業者（以下、単に事業者とも呼ぶ）は、例えば、利用者からの問合せに対する回答を自動で行う業務システム（以下、情報処理システムとも呼ぶ）を構築する際に、上記のディープラーニング手法を用いたモデルの生成を行う。これにより、事象者は、従来の機械学習の手法を用いた場合と比べて、例えば、利用者に対する回答の正答率を高めることが可能になる（例えば、特許文献１乃至３）。

特開２０１５−１６２１１３号公報特表２００８−５０７０３８号公報特表２００５−５２７０３４号公報

上記のようなモデルは、例えば、用いられるディープラーニング手法に対応する各種パラメータの値に基づいて生成される。そのため、例えば、情報処理システムの構築時において、必要なパラメータの入力を行う。

ここで、上記のような情報処理システムが利用者に対して行う回答の正答率は、モデルの生成時において入力されたパラメータの値に影響する場合がある。そのため、事業者は、可能な限り、利用者に対する回答の正答率を高めることができるパラメータの値を決定する必要がある。そこで、事業者は、適切なパラメータの値を決定することが可能な関数（以下、獲得関数とも呼ぶ）を用いることにより、モデルの生成に要するパラメータの値を決定する。

しかしながら、上記のようにモデルの生成に要するパラメータの値を決定するためには、獲得関数が連続性を有していることが前提になる場合がある。そのため、獲得関数が不連続である場合、事業者は、適切なパラメータの値を効率良く特定することができない。

そこで、一つの側面では、モデルの生成に用いる適切なパラメータの値を効率的に特定することを可能とする学習プログラム、学習装置及び学習方法を提供することを目的とする。

実施の形態の一つの態様によれば、学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、特定した前記学習パラメータによる機械学習を実行する、処理を実行させる。

一つの側面によれば、モデルの生成に用いる適切なパラメータの値を効率的に特定することを可能とする。

図１は、情報処理システム１０の全体構成を示す図である。図２は、パラメータの値が特定される際の具体例を説明する図である。図３は、パラメータの値が特定される際の具体例を説明する図である。図４は、パラメータの値が特定される際の具体例を説明する図である。図５は、パラメータの値が特定される際の具体例を説明する図である。図６は、実績情報１３１の具体例を説明する図である。図７は、モデル群ｍｄｇを用いた情報処理システム１０の具体例を説明する図である。図８は、モデル群ｍｄｇを用いた情報処理システム１０の具体例を説明する図である。図９は、モデル群ｍｄｇを用いた情報処理システム１０の具体例を説明する図である。図１０は、情報処理装置１のハードウエア構成を説明する図である。図１１は、情報処理装置１の機能のブロック図及び情報格納領域１３０に記憶された情報のブロック図である。図１２は、第１の実施の形態における学習処理の概略について説明するフローチャートである。図１３は、第１の実施の形態における学習処理の概略を説明する図である。図１４は、第１の実施の形態における学習処理の概略を説明する図である。図１５は、第１の実施の形態における学習処理の概略を説明する図である。図１６は、第１の実施の形態における学習処理の詳細を説明するフローチャートである。図１７は、第１の実施の形態における学習処理の詳細を説明するフローチャートである。図１８は、第１の実施の形態における学習処理の詳細を説明するフローチャートである。図１９は、第１の実施の形態における学習処理の詳細を説明するフローチャートである。図２０は、第１の実施の形態における学習処理の詳細を説明するフローチャートである。図２１は、正答率情報１３１ａの具体例について説明する図である。図２２は、実績情報１３１の具体例を説明する図である。図２３は、第１の実施の形態における学習処理の詳細を説明する図である。

［情報処理システムの構成］
図１は、情報処理システム１０の全体構成を示す図である。図１に示す情報処理システム１０は、情報処理装置１と、記憶装置２と、操作端末３とを含む。図１に示す操作端末３は、操作端末３ａ、３ｂ及び３ｃが含まれている。

情報処理装置１は、図１に示すように、例えば、利用者が操作端末３を介して、情報処理システム１０において用いるモデルｍｄ（以下、試行パラメータとも呼ぶ）の生成を行う処理（以下、学習処理とも呼ぶ）を行う旨の指示を行った場合、回答の正答率を高めることが可能なパラメータの値を特定し、特定したパラメータの値を入力としてモデルｍｄの生成を行う。そして、情報処理装置１は、図１に示すように、生成したモデルｍｄを記憶装置２に記憶する。

具体的に、情報処理装置１は、複数のパラメータの値をそれぞれ入力してモデルｍｄを生成する。そして、情報処理装置１は、生成したモデルｍｄのうち、回答の正答率が最も高いモデルｍｄを、情報処理システム１０において用いるモデルｍｄとして決定する。以下、パラメータの値が特定される際の具体例について説明を行う。

［パラメータの値が特定される際の具体例］
図２から図５は、パラメータの値が特定される際の具体例を説明する図である。具体的に、図２から図５は、モデルｍｄの生成時間あたりの回答の正答率ｃ／ｔ（以下、時間あたりの回答の正答率ｃ／ｔとも呼ぶ）を示すグラフである。図２から図５に示すグラフにおける横軸は、パラメータｐ（以下、単にｐとも表記する）の値を示している。また、図２から図５に示すグラフにおける縦軸は、時間あたりの回答の正答率ｃ／ｔを示している。なお、以下、モデルの生成を行う際に値の入力が行われるパラメータｐがパラメータｐ１のみであるものとして説明を行う。また、パラメータｐ１には、「１」から「６」までの整数値のいずれかが設定されるものとして説明を行う。

初めに、情報処理装置１は、図２に示すように、例えば、パラメータｐ１として「１」を特定する（図２の（１））。そして、情報処理装置１は、図２に示すように、パラメータｐ１として「１」を入力することによってモデルｍｄ１の生成を行い、生成したモデルｍｄ１を用いた場合における回答の正答率ｃ１と、生成したモデルｍｄ１の生成時間ｔ１とを取得する（図２の（２））。その後、情報処理装置１は、図３に示すように、ガウス過程に基づいた獲得関数に対し、取得済の正答率ｃの全て（正答率ｃ１）と、取得済の生成時間ｔの全て（生成時間ｔ１）と、パラメータｐ１の値とを入力することにより、パラメータｐ１の値のそれぞれに対応する時間あたりの期待改善度ｅｉ／ｔ（時間あたりの回答の正答率ｃ／ｔが改善する期待度）を算出する（図３の（３））。

そして、情報処理装置１は、図３に示すように、例えば、算出した時間あたりの期待改善度ｅｉ／ｔ、及び、算出した時間あたりの期待改善度ｅｉ／ｔから推測された時間あたりの期待改善度ｅｉ／ｔの勾配（以下、単に勾配とも呼ぶ）を用いることにより、時間あたりの期待改善度ｅｉ／ｔの最大値を特定し、特定した最大値に対応するパラメータｐ１の値を特定する（図３の（４）、（５））。具体的に、情報処理装置１は、図３に示すように、例えば、パラメータｐ１の値が「２」である場合の時間あたりの期待改善度ｅｉ／ｔと、パラメータｐ１の値が「３」である場合の時間あたりの期待改善度ｅｉ／ｔと、これらの時間あたりの期待改善度ｅｉ／ｔから推測された勾配とから、時間あたりの期待改善度ｅｉ／ｔの最大値として「６」を特定する。すなわち、情報処理装置１は、この場合、次のモデルｍｄ２の生成を行う際に入力するパラメータｐ１の値として「６」を特定する。

さらに、情報処理装置１は、パラメータｐ１として「６」を入力することによりモデルｍｄ２の生成を行い、生成したモデルｍｄ２を用いた場合における回答の正答率ｃ２と、生成したモデルｍｄ２の生成時間ｔ２とを取得する（図３の（６））。その後、情報処理装置１は、図４に示すように、ガウス過程に基づいた獲得関数に対し、取得済の正答率ｃの全て（正答率ｃ１及び正答率ｃ２）と、取得済の生成時間ｔの全て（生成時間ｔ１及び生成時間ｔ２）と、パラメータｐ１の値とを入力することにより、パラメータｐ１の値のそれぞれに対応する時間あたりの期待改善度ｅｉ／ｔを算出する（図４の（７））。

そして、情報処理装置１は、図４に示すように、算出した時間あたりの期待改善度ｅｉ／ｔと勾配とを用いることにより、時間あたりの期待改善度ｅｉ／ｔの最大値を特定し、特定した最大値に対応するパラメータｐ１の値を特定する（図４の（８）、（９））。そして、情報処理装置１は、図４に示すように、例えば、次のモデルｍｄ３の生成を行う際に入力するパラメータｐ１の値として「３」を特定する。すなわち、情報処理装置１は、この場合、次のモデルｍｄ３の生成を行う際に入力するパラメータｐ１の値として「３」を特定する。

さらに、情報処理装置１は、パラメータｐ１として「３」を入力することによりモデルｍｄ３の生成を行い、生成したモデルｍｄ３を用いた場合における回答の正答率ｃ３と、生成したモデルｍｄ３の生成時間ｔ３とを取得する（図４の（１０））。その後、情報処理装置１は、図５に示すように、ガウス過程に基づいた獲得関数に対し、取得済の正答率ｃの全て（正答率ｃ１、正答率ｃ２及び正答率ｃ３）と、取得済の生成時間ｔの全て（生成時間ｔ１、生成時間ｔ２及び生成時間ｔ３）と、パラメータｐ１の値とを入力することにより、パラメータｐ１の値のそれぞれに対応する時間あたりの期待改善度ｅｉ／ｔを算出する（図５の（１１））。

そして、情報処理装置１は、図５に示すように、算出した時間あたりの期待改善度ｅｉ／ｔと勾配とを用いることにより、時間あたりの期待改善度ｅｉ／ｔの最大値を特定し、特定した最大値に対応するパラメータｐ１の値を特定する（図５の（１２）、（１３））。そして、情報処理装置１は、図５に示すように、例えば、次のモデルｍｄ４の生成を行う際に入力するパラメータｐ１の値として「４」を特定する。すなわち、情報処理装置１は、この場合、次のモデルｍｄ４の生成を行う際に入力するパラメータｐ１の値として「４」を特定する。

これにより、情報処理装置１は、生成済のモデルｍｄから取得される情報（正答率ｃ及び生成時間ｔ）と算出済の時間あたりの期待改善度ｅｉ／ｔとから、時間あたりの回答の正答率ｃ／ｔが高いモデルを生成することができる可能性が高いパラメータの値の特定を連続的に行うことが可能になる。そのため、情報処理装置１は、時間あたりの回答の正答率ｃ／ｔが高いモデルｍｄの生成を効率的に行うことが可能になる。

その後、情報処理装置１は、例えば、生成した各モデルｍｄに対応する正答率ｃ及び生成時間ｔを含む実績情報１３１を参照し、時間あたりの回答の正答率ｃ／ｔが最も高いモデルｍｄの特定を行う。そして、情報処理装置１は、特定したモデルｍｄを情報処理システム１０において用いるモデルｍｄとして決定する。以下、実績情報１３１の具体例について説明を行う。

［実績情報の具体例（１）］
図６は、実績情報１３１の具体例を説明する図である。

図６に示す実績情報１３１は、実績情報１３１に含まれる各項番を識別する「項番」と、各モデルｍｄを識別する「モデル名」と、パラメータｐを識別する「パラメータ名」と、「パラメータ名」に設定されたパラメータｐの値が設定される「値」とを項目として有している。また、図６に示す実績情報１３１は、「パラメータ名」に設定されたパラメータｐとして「値」に設定された値を入力して生成したモデルｍｄの生成時間ｔが設定される「生成時間」と、「パラメータ名」に設定されたパラメータｐとして「値」に設定された値を入力して生成したモデルｍｄを用いた場合における回答の正答率ｃ（例えば、時間あたりの回答の正答率ｃ／ｔ）が設定される「正答率」とを項目として有している。

具体的に、図６に示す実績情報１３１において、「項番」が「１」である情報には、「パラメータ」として「ｐ１」が設定され、「値」として「１」が設定され、「生成時間」として「１．５（ｈ）」が設定され、「正答率」として「６０（％）」が設定されている。図６に含まれる他の情報についての説明は省略する。

そして、情報処理装置１は、例えば、図６で説明した実績情報１３１を参照し、「正答率」に設定された情報のうち、「モデル名」が「ｍｄ４」である情報（「項番」が「４」である情報）の「正答率」に設定された情報である「８５（％）」が最も高い情報であると判定する。そのため、情報処理装置１は、この場合、例えば、モデルｍｄ４を用いて情報処理システム１０を構築することの決定を行う。

ここで、事業者は、複数のモデルｍｄ（以下、モデル群ｍｄｇとも呼ぶ）を用いて情報処理システム１０の構築を行う場合がある。以下、情報処理システム１０の構築に用いられるモデルｍｄが複数存在する場合の具体例について説明を行う。

［モデル群を用いた情報処理システムの具体例］
図７から図９は、モデル群ｍｄｇを用いた情報処理システム１０の具体例を説明する図である。図７及び図８に示すモデル群ｍｄｇには、モデルｍｄａと、モデルｍｄｂと、モデルｍｄｃとが含まれる。また、図９は、パラメータｐ１、ｐ２及びｐ３の値の組合せを便宜的に横軸に示した場合における時間あたりの回答の正答率ｃ／ｔのグラフである。

情報処理装置１は、図７に示すように、パラメータｐ１の値を入力とし、予め用意された学習データ１３２（以下、学習データ１３２ａとも呼ぶ）を学習することによってモデルｍｄａを生成する。そして、情報処理装置１は、第１のデータセット（図示しない）の入力に応じてモデルｍｄａが出力した学習データ１３２ｂを取得する。

続いて、情報処理装置１は、図７に示すように、パラメータｐ２の値を入力とし、学習データ１３２（以下、学習データ１３２ｂとも呼ぶ）を学習することによってモデルｍｄｂを生成する。そして、情報処理装置１は、第２のデータセット（図示しない）の入力に応じてモデルｍｄｂが出力した学習データ１３２ｃを取得する。

さらに、情報処理装置１は、図７に示すように、パラメータｐ３の値を入力とし、学習データ１３２（以下、学習データ１３２ｃとも呼ぶ）を学習することによってモデルｍｄｃを生成する。そして、情報処理装置１は、第３のデータセット（図示しない）の入力に応じてモデルｍｄｃが出力した出力データＤＴを取得する。

その後、情報処理装置１は、取得した出力データＤＴのうち、出力データＤＴの内容として期待していたデータ（以下、期待データとも呼ぶ）と一致しているデータの割合を、モデル群ｍｄｇの回答の正答率ｃとして取得する。そして、情報処理装置１は、図２から図５で説明した場合と同様に、時間あたりの期待改善度ｅｉ／ｔ等の算出を行い、次に用いるパラメータｐ１、ｐ２及びｐ３の値の特定を行う。

具体的に、図７に示す例において、パラメータｐ１、ｐ２及びｐ３の値がそれぞれ「２」、「４」及び「５」である場合、情報処理装置１は、パラメータｐ１の値として「２」を入力することによりモデルｍｄａを生成し、パラメータｐ２の値として「４」を入力することによりモデルｍｄｂを生成し、パラメータｐ３の値として「５」を入力することによりモデルｍｄｃの生成を行う。

そして、例えば、パラメータｐ１、ｐ２及びｐ３の値として次に特定された値がそれぞれ「２」、「７」及び「１」である場合、パラメータｐ１の値は、前回のパラメータｐ１の値と同じである。そのため、情報処理装置１は、この場合、図８に示すように、モデルｍｄａによって前回生成された学習データ１３２ｂを再利用することが可能になる。

また、例えば、パラメータｐ１、ｐ２及びｐ３の値として次に特定された値がそれぞれ「２」、「４」及び「９」である場合、パラメータｐ１及びｐ２の値は、前回のパラメータｐ１及びｐ２の値と同じである。そのため、情報処理装置１は、この場合、モデルｍｄｂによって前回生成された学習データ１３２ｃを再利用することが可能になる。

これにより、情報処理装置１は、モデルｍｄａやモデルｍｄｂの生成を省略することが可能になり、モデル群ｍｄｇ（モデルｍｄａ、モデルｍｄｂ及びモデルｍｄｃ）の生成時間ｔを短縮することが可能になる。

ここで、上記の場合、モデル群ｍｄｇの生成時間ｔは、学習データ１３２の再利用が行われる場合と、学習データ１３２の再利用が行われない場合とが混在することになるため不連続になる。そのため、事業者は、図９に示すように、獲得関数を用いることによる時間あたりの期待改善度ｅｉ／ｔの算出を適切に行うことができず、モデル群ｍｄｇの生成に要するパラメータｐの値の特定を適切に行うことができない場合がある。

そこで、本実施の形態における情報処理装置１は、パラメータｐ（以下、学習パラメータとも呼ぶ）の値の変化に対するモデル群ｍｄｇの生成時間ｔ（以下、パラメータｐによる学習時間とも呼ぶ）の変化が不連続となる不連続点が存在するか否かを判定する。その結果、不連続点が存在すると判定した場合、情報処理装置１は、その不連続点に基づき、パラメータｐの値の変化に対するモデル群ｍｄｇの生成時間ｔの変化が連続となるパラメータｐの値の範囲を特定する。

続いて、情報処理装置１は、特定したパラメータｐの値の範囲ごとに、その範囲に含まれるパラメータｐの値によるモデル群ｍｄｇの生成時間ｔあたりの、モデル群ｍｄｇを情報処理システム１０に用いた場合の期待改善度ｅｉ／ｔ（以下、成績の推定値とも呼ぶ）を算出する。そして、情報処理装置１は、算出した時間あたりの期待改善度ｅｉ／ｔのうち、その時間あたりの期待改善度ｅｉ／ｔの大きさに応じたいずれかが得られるパラメータｐの値を特定する。その後、情報処理装置１は、特定したパラメータｐの値によるモデル群ｍｄｇの生成を実行する。

すなわち、情報処理装置１は、パラメータｐの値の変化に対するモデル群ｍｄｇの生成時間ｔの不連続点が存在すると判定した場合、パラメータｐが取り得る値の範囲を、モデル群ｍｄｇの生成時間ｔの変化が連続となるパラメータｐの値の範囲ごとに区分けする。そして、情報処理装置１は、例えば、区分けしたパラメータｐの値の範囲ごとに、獲得関数を用いることによって時間あたりの期待改善度ｅｉ／ｔを算出し、算出した時間あたりの期待改善度ｅｉ／ｔのうちの最大値に対応するパラメータｐの値を、次に生成するモデル群ｍｄｇに入力するパラメータｐの値として決定する。

これにより、情報処理装置１は、パラメータｐの値に変化に対するモデル群ｍｄｇの生成時間ｔの不連続点が存在する場合であっても、獲得関数を用いることによる時間あたりの期待改善度ｅｉ／ｔの算出を適切に行うことが可能になる。そのため、情報処理装置１は、次のモデル群ｍｄｇの生成に用いる適切なパラメータｐの値を効率的に特定することを可能とする。

［情報処理装置のハードウエア構成］
次に、情報処理装置１のハードウエア構成について説明する。図１０は、情報処理装置１のハードウエア構成を説明する図である。

情報処理装置１は、図１０に示すように、プロセッサであるＣＰＵ１０１と、メインメモリ１０２（以下、単にメモリ１０２とも呼ぶ）と、外部インターフェース（Ｉ／Ｏユニット）１０３と、記憶媒体（ストレージ）１０４とを有する。各部は、バス１０５を介して互いに接続される。

記憶媒体１０４は、記憶媒体１０４内のプログラム格納領域（図示しない）に、学習処理を行うプログラム１１０を記憶する。

ＣＰＵ１０１は、図１０に示すように、記憶媒体１０４からメモリ１０２にロードされたプログラム１１０と協働することによって学習処理を行う。

記憶媒体１０４は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）やＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等であり、学習処理を行う際に用いられる情報を記憶する情報格納領域１３０（以下、記憶部１３０とも呼ぶ）を有する。

また、外部インターフェース１０３は、ネットワークを介して操作端末３と通信を行う。

［情報処理装置のソフトウエア構成］
次に、情報処理装置１のソフトウエア構成について説明する。図１１は、情報処理装置１の機能のブロック図及び情報格納領域１３０に記憶された情報のブロック図である。

ＣＰＵ１０１は、図１１に示すように、プログラム１１０と協働することにより、情報受付部１１１と、不連続点判定部１１２と、範囲特定部１１３と、推定値算出部１１４と、パラメータ特定部１１５と、機械学習実行部１１６と、実績測定部１１７と、情報送信部１１８として動作する。また、情報格納領域１３０には、図１１に示すように、実績情報１３１と、学習データ１３２とが記憶されている。なお、以下、情報処理装置１によって図７で説明したモデル群ｍｄｇの生成が行われるものとして説明を行う。

情報受付部１１１は、パラメータｐの値と、パラメータｐの値を入力することによるモデル群ｍｄｇの生成時間とをそれぞれが含む複数の実績情報１３１とを受け付ける。具体的に、情報受付部１１１は、後述する実績測定部１１７が、生成済のモデル群ｍｄｇを用いた場合における回答の正答率ｃと、そのモデル群ｍｄｇの生成時間ｔとの取得を行ったことに応じて、これらの情報を含む実績情報１３１の受け付けを行う。

不連続点判定部１１２は、パラメータｐの値が取り得る範囲に、パラメータｐの値の変化に対するモデル群ｍｄｇの生成時間ｔの変化が不連続となる不連続点が存在するか否かを判定する。具体的に、不連続点判定部１１２は、例えば、情報受付部１１１が受け付けた複数の実績情報１３１のそれぞれに含まれるパラメータｐの値と生成時間ｔとを参照することにより、不連続点が存在するか否かの判定を行う。また、不連続点判定部１１２は、情報処理装置１が生成するモデル群ｍｄｇに含まれる複数のモデルｍｄに、他のモデルｍｄによる学習結果を用いるモデルｍｄが存在するか否かを判定することにより、不連続点が存在するか否かの判定を行う。

範囲特定部１１３は、不連続点が存在すると不連続点判定部１１２が判定した場合、その不連続点に基づき、パラメータｐの値の変化に対する生成時間ｔの変化が連続となるパラメータｐの値の範囲を特定する。具体的に、範囲特定部１１３は、例えば、パラメータｐが取り得る値の範囲を、不連続点判定部１１２が存在すると判定した不連続点に対応するパラメータｐの値のそれぞれにおいて区分けすることにより、パラメータｐの値の変化に対する生成時間ｔの変化が連続となるパラメータｐの値の範囲の特定を行う。

推定値算出部１１４は、範囲特定部１１３が特定したパラメータｐの値の範囲ごとに、モデル群ｍｄｇを情報処理システム１０に用いた場合における時間あたりの期待改善度ｅｉ／ｔを算出する。具体的に、推定値算出部１１４は、例えば、範囲特定部１１３が特定したパラメータｐの値の範囲ごとに、モデル群ｍｄｇを情報処理システム１０に用いた場合における時間あたりの期待改善度ｅｉ／ｔの最大値の算出を行う。

パラメータ特定部１１５は、推定値算出部１１４が算出した時間あたりの期待改善度ｅｉ／ｔのうち、その時間あたりの期待改善度ｅｉ／ｔの大きさに応じたいずれかが得られるパラメータｐの値を特定する。具体的に、パラメータ特定部１１５は、例えば、推定値算出部１１４が算出した時間あたりの期待改善度ｅｉ／ｔのうち、所定の条件を満たす時間あたりの期待改善度ｅｉ／ｔが得られるパラメータｐの値の特定を行う。

なお、所定の条件を満たす時間あたりの期待改善度ｅｉ／ｔは、例えば、推定値算出部１１４が算出した時間あたりの期待改善度ｅｉ／ｔのうちの最大値であってよい。また、所定の条件を満たす時間あたりに期待改善度ｅｉ／ｔは、例えば、推定値算出部１１４が算出した時間あたりの期待改善度ｅｉ／ｔと、その時間あたりの期待改善度ｅｉ／ｔの勾配とから特定された時間あたりの期待改善度ｅｉ／ｔの最大値であってよい。

機械学習実行部１１６は、パラメータ特定部１１５が特定したパラメータｐの値によるモデル群ｍｄｇの生成を行う。

実績測定部１１７は、生成済のモデル群ｍｄｇを用いた場合における回答の正答率ｃと、そのモデル群ｍｄｇの生成時間ｔとを取得（測定）する。

情報送信部１１８は、例えば、機械学習実行部１１６が生成したモデル群ｍｄｇのうち、回答の正答率ｃが最も高いモデル群ｍｄｇを示す情報を操作端末３に送信する。

［第１の実施の形態の概略］
次に、第１の実施の形態の概略について説明する。図１２は、第１の実施の形態における学習処理の概略について説明するフローチャートである。また、図１３から図１５は、第１の実施の形態における学習処理の概略を説明する図である。図１３から図１５を参照しながら、図１２に示す第１の実施の形態における学習処理の概略について説明を行う。なお、図１３から図１５に示すグラフは、図９と同様に、パラメータｐ１、ｐ２及びｐ３の値の組合せを便宜的に横軸に示した場合における時間あたりの回答の正答率ｃ／ｔのグラフである。

情報処理装置１は、図１２に示すように、モデル生成タイミングまで待機する（Ｓ１のＮＯ）。具体的に、情報処理装置１は、例えば、事業者が操作端末３を介して、情報処理システム１０に用いられるモデル群ｍｄｇの生成を開始する旨の入力を行うまで待機する。

そして、モデル生成タイミングになった場合（Ｓ１のＹＥＳ）、情報処理装置１は、パラメータｐの値の変化に対するモデル群ｍｄｇの生成時間ｔの変化が不連続となる不連続点が存在するか否かを判定する（Ｓ２）。

その結果、不連続点が存在すると判定した場合（Ｓ３のＹＥＳ）、情報処理装置１は、図１３に示すように、Ｓ３の処理で存在した不連続点に基づき、パラメータｐの値の変化に対するモデル群ｍｄｇの生成時間ｔの変化が連続となるパラメータｐの値の範囲を特定する（Ｓ４）。

続いて、情報処理装置１は、図１４に示すように、Ｓ４の処理で特定した範囲ごとに、モデル群ｍｄｇを情報処理システム１０に用いた場合における時間あたりの期待改善度ｅｉ／ｔを算出する（Ｓ５）。具体的に、推定値算出部１１４は、範囲特定部１１３が特定したパラメータｐの値の範囲ごとに、モデル群ｍｄｇを情報処理システム１０に用いた場合における時間あたりの期待改善度ｅｉ／ｔの最大値の算出を行う。

そして、情報処理装置１は、図１５に示すように、Ｓ５の処理で算出した時間あたりの期待改善度ｅｉ／ｔのうち、時間あたりの期待改善度ｅｉ／ｔの大きさに応じて選択されたいずれかが得られるパラメータｐの値を特定する（Ｓ６）。

その後、情報処理装置１は、Ｓ６の処理で特定したパラメータｐの値によるモデル群ｍｄｇの生成を実行する（Ｓ７）。

一方、Ｓ３の処理において、不連続点が存在しないと判定した場合（Ｓ３のＮＯ）、情報処理装置１は、Ｓ４からＳ７の処理を行わない。具体的に、情報処理装置１は、この場合、Ｓ１の処理で受け付けた実績情報１３１に含まれるパラメータｐの値によるモデル群ｍｄｇの生成を実行する。

すなわち、情報処理装置１は、パラメータｐの値の変化に対するモデル群ｍｄｇの生成時間ｔの不連続点が存在すると判定した場合、パラメータｐが取り得る値の範囲を、モデル群ｍｄｇの生成時間ｔの変化が連続となるパラメータｐの値の範囲ごとに区分けする。そして、情報処理装置１は、例えば、区分けしたパラメータｐの値の範囲ごとに、時間あたりの期待改善度ｅｉ／ｔを算出し、算出した時間あたりの期待改善度ｅｉ／ｔのうちの最大値に対応するパラメータｐの値を、次に生成するモデル群ｍｄｇに入力するパラメータｐの値として決定する。

これにより、情報処理装置１は、パラメータｐの値の変化に対するモデル群ｍｄｇの生成時間ｔの不連続点が存在する場合であっても、次のモデル群ｍｄｇの生成に用いる適切なパラメータｐの値を効率的に特定することを可能とする。

なお、モデル群ｍｄｇは、例えば、検索パラメータを用いた検索処理（試行）を行うモデル群であってよい。また、モデル群ｍｄｇを情報処理システム１０に用いた場合における時間あたりの期待改善度ｅｉ／ｔは、例えば、モデル群ｍｄｇによる検索処理を行った場合における時間あたりの正答率ｃ（検索結果の評価）が改善する期待度であってよい。

［第１の実施の形態の詳細］
次に、第１の実施の形態の詳細について説明する。図１６から図２０は、第１の実施の形態における学習処理の詳細を説明するフローチャートである。また、図２１から図２３は、第１の実施の形態の詳細を説明する図である。図１６から図２０を参照しながら、図２１から図２３に示す第１の実施の形態の詳細について説明を行う。なお、図２３に示すグラフは、図９と同様に、パラメータｐ１、ｐ２及びｐ３の値の組合せを便宜的に横軸に示した場合における時間あたりの回答の正答率ｃ／ｔのグラフである。

情報処理装置１の情報受付部１１１は、図１６に示すように、モデル生成タイミングまで待機する（Ｓ１１のＮＯ）。

そして、モデル生成タイミングになった場合（Ｓ１１のＹＥＳ）、パラメータ特定部１１５は、最初のパラメータｐの値を決定する（Ｓ１２）。パラメータ特定部１１５は、この場合、例えば、最初のパラメータｐの値をランダムに決定するものであってよい。なお、モデル群ｍｄｇを生成する際に入力するパラメータｐが複数存在する場合、パラメータ特定部１１５は、Ｓ１２の処理において、複数のパラメータｐの値の組合せを決定する。

その後、情報処理装置１の機械学習実行部１１６は、Ｓ１２の処理で決定したパラメータｐ１の値、または、後述するＳ４２の処理で特定したパラメータｐの値による機械学習を実行してモデル群ｍｄｇを生成する（Ｓ１３）。

続いて、情報処理装置１の不連続点判定部１１２は、図１７に示すように、例えば、情報処理装置１が生成するモデル群ｍｄｇに含まれる複数のモデルｍｄに、他のモデルｍｄによる学習結果を用いるモデルｍｄが存在するか否かを判定する（Ｓ２１）。すなわち、不連続点判定部１１２は、モデル群ｍｄｇの生成時において、過去に生成された学習データ１３２を再利用することができる可能性があるか否かの判定を行う。

その結果、他のモデルｍｄによる学習結果を用いるモデルｍｄが存在すると判定した場合（Ｓ２２のＹＥＳ）、不連続点判定部１１２は、パラメータｐの値に変化に対するモデル群ｍｄｇの生成時間ｔに不連続点が存在すると判定する（Ｓ２３）。そして、範囲特定部１１３は、パラメータｐが取り得る値の範囲を、Ｓ２３の処理で存在すると判定した不連続点に対応するパラメータｐの値において区分けする（Ｓ２４）。

具体的に、情報処理装置１では、モデル群ｍｄｇに入力するパラメータｐ１、ｐ２及びｐ３の組合せによって、学習データ１３２ｂのみを再利用できる場合と、学習データ１３２ｂ及び学習データ１３２ｃを再利用できる場合と、学習データ１３２を再利用できない場合とが発生する。

そして、この場合、図２３に示すように、学習データ１３２を再利用できない場合における各パラメータｐの値の範囲Ａと、学習データ１３２ｂを再利用できる場合における各パラメータｐの値の範囲Ｂとの間の点が不連続点になる。また、図２３に示すように、学習データ１３２ｂを再利用できる場合における各パラメータｐの値の範囲Ｂと、学習データ１３２ｂ及び学習データ１３２ｃを再利用できる場合における各パラメータｐの値の範囲Ｃとの間の点が不連続点になる。また、図２３に示すように、学習データ１３２ｂ及び学習データ１３２ｃを再利用できる場合における各パラメータｐの値の範囲Ｃと、学習データ１３２ｂを再利用できる場合における各パラメータｐの値の範囲Ｄとの間の点が不連続点になる。さらに、図２３に示すように、学習データ１３２ｂを再利用できる場合における各パラメータｐの値の範囲Ｄと、学習データ１３２を再利用できない場合における各パラメータｐの値の範囲Ｅとの間の点が不連続点になる。

そのため、範囲特定部１１３は、Ｓ２４の処理において、例えば、パラメータｐの値の範囲を不連続点ごとに区分することにより、範囲Ａ、範囲Ｂ、範囲Ｃ、範囲Ｄ及び範囲Ｅを特定する。

なお、図２３に示す例では、範囲Ｃに対応する時間あたりの期待改善度ｅｉ／ｔが最も高くなり、範囲Ｂ及び範囲Ｄに対応する時間あたりの期待改善度ｅｉ／ｔが次に高くなり、範囲Ａ及び範囲Ｅに対応する時間あたりの期待改善度ｅｉ／ｔが最も低くなる。

続いて、パラメータ特定部１１５は、Ｓ２４の処理で特定したパラメータｐの値の範囲の１つ特定する（Ｓ２５）。すなわち、情報処理装置１は、以下の処理において、Ｓ２５の処理で特定したパラメータｐの値の範囲において、時間あたりの期待改善度ｅｉ／ｔが最大となるパラメータｐの値の特定を行う。

そして、情報処理装置１の実績測定部１１７は、図１８に示すように、Ｓ１３の処理で生成したモデル群ｍｄｇを情報処理システム１０に用いた場合における正答率ｃと、Ｓ１３の処理で生成したモデル群ｍｄｇの生成時間ｔとを取得する（Ｓ３１）。

具体的に、実績測定部１１７は、例えば、情報格納領域１３０に記憶された正答率情報１３１ａを参照することにより、Ｓ１３の処理で生成したモデル群ｍｄｇを用いた場合における正答率ｃの取得を行うものであってよい。また、実績測定部１１７は、Ｓ１３の処理で生成したモデル群ｍｄｇの生成が開始されてから完了するまでの時間を計測することによって、Ｓ１３の処理で生成したモデル群ｍｄｇの生成時間ｔの取得を行うものであってよい。以下、正答率情報１３１ａの具体例について説明を行う。

［正答率情報の具体例］
図２１は、正答率情報１３１ａの具体例について説明する図である。

図２１に示す正答率情報１３１ａは、正答率情報１３１ａに含まれる各情報を識別する「項番」と、事業者がモデル群ｍｄｇに対して入力した質問の内容が設定される「質問内容」と、「質問内容」に内容が設定された質問に対してモデル群ｍｄｇが出力した回答の内容が設定される「回答内容」とを項目として有する。また、図２１に示す正答率情報１３１ａは、「回答内容」に設定された内容が「質問内容」に設定された内容に対する回答として正しいものであったか否かを示す情報が設定される「正誤」を項目として有する。「正誤」には、例えば、回答として正しいことを示す「○」、または、回答として正しくないことを示す「×」が設定される。

なお、図２１に示す正答率情報１３１ａにおける「質問内容」に設定された情報は、例えば、図７で説明した第１のデータセットに含まれる情報に対応する。また、図２１に示す正答率情報１３１ａにおける「解答内容」に設定された情報は、例えば、図７で説明した出力データＤＴに含まれる情報に対応する。

具体的に、図２１に示す正答率情報１３１ａにおいて、「項番」が「１」である情報には、「質問内容」として「Ａ社の電話番号を教えて」が設定され、「回答内容」として「０３−ｘｘｘｘ−ｘｘｘｘです。」が設定され、「正誤」として「○」が設定されている。また、図２１に示す正答率情報１３１ａにおいて、「項番」が「３」である情報には、「質問内容」として「Ａ社製のパソコンの対応ＯＳは？」が設定され、「回答内容」として「Ｂ−ＯＳです。」が設定され、「正誤」として「○」が設定されている。

一方、図２１に示す正答率情報１３１ａにおいて、「項番」が「４」である情報には、「質問内容」として「Ａ社の郵便番号は？」が設定され、「回答内容」として「Ｂ−ＯＳです。」が設定され、「正誤」として「×」が設定されている。図２１に含まれる他の情報についての説明は省略する。

すなわち、図２１に示す正答率情報１３１ａにおける「正答」の欄には、「〇」、「〇」、「〇」、「×」及び「〇」が設定されている。そのため、実績測定部１１７は、Ｓ１４の処理において、例えば、モデル群ｍｄｇの正答率ｃとして８０（％）を取得する。

なお、実績測定部１１７は、例えば、Ｓ３１の処理において取得した正答率ｃと生成時間ｔとを含む実績情報１３１を情報格納領域１３０に記憶する。以下、Ｓ３１の処理において取得した正答率ｃと生成時間ｔとを含む実績情報１３１の具体例について説明を行う。

［実績情報の具体例（２）］
図２２は、実績情報１３１の具体例を説明する図である。

図２２に示す実績情報１３１において、「項番」が「１」である情報には、「モデル群名」として「ｍｄｇ１」が設定され、「パラメータ名」として「ｐ１、ｐ２、ｐ３」が設定され、「値」として「１、２、４」が設定されている。また、図２２に示す実績情報１３１において、「項番」が「１」である情報には、「生成時間」として「１４（ｈ）」が設定され、「正答率」として「５５（％）」が設定されている。図２２に示す他の情報についての説明は省略する。

図１８に戻り、パラメータ特定部１１５は、Ｓ３１の処理において今までに取得した回答の正答率ｃの全てと、Ｓ３１の処理において今までに取得したモデル群ｍｄｇの生成時間ｔの全てと、Ｓ２５の処理で特定した範囲に含まれるパラメータｐの値とを獲得関数に入力することにより、Ｓ２５の処理で特定した範囲に含まれるパラメータｐの値のそれぞれに対応する期待改善度ｅｉ／ｔを算出する（Ｓ３２）。

そして、情報処理装置１の推定値算出部１１４は、Ｓ３２の処理で算出した時間あたりの期待改善度ｅｉ／ｔと、Ｓ３２の処理で算出した時間あたりの期待改善度ｅｉ／ｔから推測された勾配とから時間あたりの期待改善度ｅｉ／ｔの最大値を特定する（Ｓ３３）。

その後、パラメータ特定部１１５は、Ｓ２５の処理においてパラメータｐの値の全範囲を特定したか否かの判定を行う（Ｓ３４）。

その結果、パラメータｐの値の全範囲を特定していないと判定した場合（Ｓ３４のＮＯ）、パラメータ特定部１１５は、Ｓ２５以降の処理を再度行う。

一方、パラメータｐの値の全範囲を特定したと判定した場合（Ｓ３４のＹＥＳ）、パラメータ特定部１１５は、学習処理の終了タイミングであるか否かの判定を行う（Ｓ３５）。具体的に、パラメータ特定部１１５は、例えば、現在時刻が予め定められた終了期限を超過した場合や、後述するＳ４２の処理においてパラメータｐの値の特定が行われた回数が予め定められた回数に達した場合に、学習処理の終了タイミングになったと判定する。

その結果、終了タイミングでないと判定した場合（Ｓ３５のＮＯ）、パラメータ特定部１１５は、図１９に示すように、Ｓ３３の処理で特定した時間あたりの期待改善度ｅｉ／ｔの最大値を特定する（Ｓ４１）。そして、パラメータ特定部１１５は、Ｓ４１の処理で特定した最大値に対応するパラメータｐの値を特定する（Ｓ４２）。その後、機械学習実行部１１６は、Ｓ１３以降の処理を再度行う。

すなわち、情報処理装置１は、パラメータｐの値に変化に対するモデル群ｍｄｇの生成時間ｔが不連続である場合、不連続点によって区分けされた範囲ごとに、期待改善度ｅｉ／ｔの最大値の特定を行う。そして、情報処理装置１は、不連続点によって区分けされた範囲ごとに特定された期待改善度ｅｉ／ｔの最大値のうちの最大値を、パラメータｐが取り得る値の全範囲における期待改善度ｅｉ／ｔの最大値として特定する。

これにより、情報処理装置１は、パラメータｐの値に変化に対するモデル群ｍｄｇの生成時間ｔの不連続点が存在する場合であっても、獲得関数を用いることによる時間あたりの期待改善度ｅｉ／ｔの算出を適切に行うことが可能になる。

一方、Ｓ３５の処理において、終了タイミングであると判定した場合（Ｓ３５のＹＥＳ）、情報処理装置１の情報送信部１１８は、Ｓ３１の処理において取得された回答の正答率ｃ（情報格納領域１３０に記憶された実績情報１３１に含まれる回答の正答率ｃ）のうち、最も高い回答の正答率ｃに対応するモデル群ｍｄｇを示す情報を操作端末３に送信する（Ｓ３６）。具体的に、情報送信部１１８は、例えば、図２２で説明した実績情報１３１を参照し、「正答率」に設定された情報が最大である情報（「項番」が「２」である情報）の「モデル群名」に設定された情報である「ｍｄｇ２」の送信を行う。

また、Ｓ２２の処理において、他のモデルｍｄによる学習結果を用いるモデルｍｄが存在しないと判定した場合（Ｓ２２のＮＯ）、パラメータ特定部１１５は、図２０に示すように、Ｓ３１の処理において今までに取得した回答の正答率ｃの全てと、Ｓ３１の処理において今までに取得したモデル群ｍｄｇの生成時間ｔの全てと、パラメータｐの値とを獲得関数に入力することにより、パラメータｐの値のそれぞれに対応する期待改善度ｅｉ／ｔを算出する（Ｓ５１）。

そして、推定値算出部１１４は、Ｓ５１の処理で算出した時間あたりの期待改善度ｅｉ／ｔと、Ｓ５１の処理で算出した時間あたりの期待改善度ｅｉ／ｔから推測された勾配とから時間あたりの期待改善度ｅｉ／ｔの最大値を特定する（Ｓ５２）。

その後、パラメータ特定部１１５は、Ｓ５２の処理で特定した最大値に対応するパラメータｐの値を特定する（Ｓ５３）。

これにより、情報処理装置１は、パラメータｐの値に変化に対するモデル群ｍｄｇの生成時間ｔの不連続点が存在しない場合についても同様に、獲得関数を用いることによる時間あたりの期待改善度ｅｉ／ｔの算出を適切に行うことが可能になる。

このように、本実施の形態における情報処理装置１は、パラメータｐの値と、パラメータｐの値を入力することによるモデル群ｍｄｇの生成時間ｔとをそれぞれが含む複数の実績情報１３１とを受け付ける。

そして、情報処理装置１は、受け付けた複数の実績情報１３１に基づき、パラメータｐの値の変化に対するモデル群ｍｄｇの生成時間ｔの変化が不連続となる不連続点が存在するか否かを判定する。その結果、不連続点が存在すると判定した場合、情報処理装置１は、その不連続点に基づき、パラメータｐの値の変化に対するモデル群ｍｄｇの生成時間ｔの変化が連続となるパラメータｐの値の範囲を特定する。

続いて、情報処理装置１は、特定したパラメータｐの値の範囲ごとに、その範囲に含まれるパラメータｐの値によるモデル群ｍｄｇの生成時間ｔあたりのモデル群ｍｄｇを用いた場合の正答率ｃの時間あたりの期待改善度ｅｉ／ｔを算出する。そして、情報処理装置１は、算出した推定値のうち、その推定値の大きさに応じて選択されたいずれかの推定値が得られるパラメータｐの値を特定する。その後、情報処理装置１は、特定したパラメータｐの値によるモデル群ｍｄｇの生成を実行する。

これにより、情報処理装置１は、パラメータｐの値に変化に対するモデル群ｍｄｇの生成時間ｔの不連続点が存在する場合であっても、次のモデル群ｍｄｇの生成に用いる適切なパラメータｐの値を効率的に特定することを可能とする。

以上の実施の形態をまとめると、以下の付記の通りである。

（付記１）
学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、
前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、
特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、
算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、
特定した前記学習パラメータによる機械学習を実行する、
処理を実行させることを特徴とする学習プログラム。

（付記２）
付記１において、さらに、
機械学習の学習パラメータと、前記学習パラメータによる機械学習の学習時間とをそれぞれが含む複数の実績情報を受け付ける、
処理を実行させ、
前記判定する処理では、受け付けた前記複数の実績情報のそれぞれに含まれる前記パラメータと前記学習時間とを参照し、前記不連続点が存在するか否かの判定を行う、
ことを特徴とする学習プログラム。

（付記３）
付記２において、
前記判定する処理では、前記複数の実績情報に含まれる前記学習パラメータによる機械学習に、前記学習パラメータによる過去の機械学習の結果を用いることが可能な機械学習が含まれている場合、前記不連続点が存在すると判定する、
ことを特徴とする学習プログラム。

（付記４）
付記３において、
前記結果は、前記学習パラメータによる過去の機械学習によって学習された試行パラメータから生成された学習データである、
ことを特徴とする学習プログラム。

（付記５）
付記１において、
前記学習パラメータの範囲を特定する処理では、前記学習パラメータの範囲を、前記不連続点のそれぞれにおいて区分けする、
ことを特徴とする学習プログラム。

（付記６）
付記１において、
前記学習パラメータを特定する処理では、前記推定値のうち、所定の条件を満たす推定値が得られる学習パラメータの特定を行う、
ことを特徴とする学習プログラム。

（付記７）
付記６において、
前記学習パラメータを特定する処理では、前記推定値のうち、最大の推定値が得られる学習パラメータの特定を行う、
ことを特徴とする学習プログラム。

（付記８）
付記１において、
前記試行は、検索パラメータを用いた検索処理であり、
前記成績は、前記検索処理の検索結果の評価である、
ことを特徴とする学習プログラム。

（付記９）
学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定する不連続点判定部と、
前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定する範囲特定部と、
特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出する推定値算出部と、
算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定するパラメータ特定部と、
特定した前記学習パラメータによる機械学習を実行する機械学習実行部と、を有する、
ことを特徴とする学習装置。

（付記１０）
付記９において、さらに、
機械学習の学習パラメータと、前記学習パラメータによる機械学習の学習時間とをそれぞれが含む複数の実績情報を受け付ける情報受付部を有し、
不連続点判定部は、受け付けた前記複数の実績情報のそれぞれに含まれる前記パラメータと前記学習時間とを参照し、前記不連続点が存在するか否かの判定を行う、
ことを特徴とする学習装置。

（付記１１）
学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、
前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、
特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、
算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、
特定した前記学習パラメータによる機械学習を実行する、
ことを特徴とする学習方法。

（付記１２）
付記１１において、さらに、
機械学習の学習パラメータと、前記学習パラメータによる機械学習の学習時間とをそれぞれが含む複数の実績情報を受け付け、
前記判定する工程では、受け付けた前記複数の実績情報のそれぞれに含まれる前記パラメータと前記学習時間とを参照し、前記不連続点が存在するか否かの判定を行う、
ことを特徴とする学習方法。

１：情報処理装置２：記憶装置
３：操作端末１０１：ＣＰＵ
１０２：メモリ１０３：Ｉ／Ｏユニット
１０４：記憶媒体１３０：情報格納領域

Claims

学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、
前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、
特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、
算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、
特定した前記学習パラメータによる機械学習を実行する、
処理を実行させることを特徴とする学習プログラム。
請求項１において、さらに、
機械学習の学習パラメータと、前記学習パラメータによる機械学習の学習時間とをそれぞれが含む複数の実績情報を受け付ける、
処理を実行させ、
前記判定する処理では、受け付けた前記複数の実績情報のそれぞれに含まれる前記パラメータと前記学習時間とを参照し、前記不連続点が存在するか否かの判定を行う、
ことを特徴とする学習プログラム。
請求項２において、
前記判定する処理では、前記複数の実績情報に含まれる前記学習パラメータによる機械学習に、前記学習パラメータによる過去の機械学習の結果を用いることが可能な機械学習が含まれている場合、前記不連続点が存在すると判定する、
ことを特徴とする学習プログラム。
請求項３において、
前記結果は、前記学習パラメータによる過去の機械学習によって学習された試行パラメータから生成された学習データである、
ことを特徴とする学習プログラム。
請求項１において、
前記学習パラメータの範囲を特定する処理では、前記学習パラメータの範囲を、前記不連続点のそれぞれにおいて区分けする、
ことを特徴とする学習プログラム。
請求項１において、
前記学習パラメータを特定する処理では、前記推定値のうち、所定の条件を満たす推定値が得られる学習パラメータの特定を行う、
ことを特徴とする学習プログラム。
請求項６において、
前記学習パラメータを特定する処理では、前記推定値のうち、最大の推定値が得られる学習パラメータの特定を行う、
ことを特徴とする学習プログラム。
請求項１において、
前記試行は、検索パラメータを用いた検索処理であり、
前記成績は、前記検索処理の検索結果の評価である、
ことを特徴とする学習プログラム。
学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定する不連続点判定部と、
前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定する範囲特定部と、
特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出する推定値算出部と、
算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定するパラメータ特定部と、
特定した前記学習パラメータによる機械学習を実行する機械学習実行部と、を有する、
ことを特徴とする学習装置。
学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、
前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、
特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、
算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、
特定した前記学習パラメータによる機械学習を実行する、
ことを特徴とする学習方法。