JP6886112B2 - 学習プログラム、学習装置及び学習方法 - Google Patents

学習プログラム、学習装置及び学習方法 Download PDF

Info

Publication number
JP6886112B2
JP6886112B2 JP2017193933A JP2017193933A JP6886112B2 JP 6886112 B2 JP6886112 B2 JP 6886112B2 JP 2017193933 A JP2017193933 A JP 2017193933A JP 2017193933 A JP2017193933 A JP 2017193933A JP 6886112 B2 JP6886112 B2 JP 6886112B2
Authority
JP
Japan
Prior art keywords
learning
parameter
parameters
value
discontinuity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017193933A
Other languages
English (en)
Other versions
JP2019067272A (ja
Inventor
輝哉 小林
輝哉 小林
隆一 高木
隆一 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017193933A priority Critical patent/JP6886112B2/ja
Priority to US16/133,833 priority patent/US11488056B2/en
Publication of JP2019067272A publication Critical patent/JP2019067272A/ja
Application granted granted Critical
Publication of JP6886112B2 publication Critical patent/JP6886112B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Description

本発明は、学習プログラム、学習装置及び学習方法に関する。
近年、音声認識や画像認識等の分野において、ディープラーニング手法が活用されている。ディープラーニング手法は、多層構造のニューラルネットワーク(以下、単にニューラルネットワークとも呼ぶ)に学習データを学習させることをよって行われる機械学習の手法である。
具体的に、利用者に対してサービスを提供する事業者(以下、単に事業者とも呼ぶ)は、例えば、利用者からの問合せに対する回答を自動で行う業務システム(以下、情報処理システムとも呼ぶ)を構築する際に、上記のディープラーニング手法を用いたモデルの生成を行う。これにより、事象者は、従来の機械学習の手法を用いた場合と比べて、例えば、利用者に対する回答の正答率を高めることが可能になる(例えば、特許文献1乃至3)。
特開2015−162113号公報 特表2008−507038号公報 特表2005−527034号公報
上記のようなモデルは、例えば、用いられるディープラーニング手法に対応する各種パラメータの値に基づいて生成される。そのため、例えば、情報処理システムの構築時において、必要なパラメータの入力を行う。
ここで、上記のような情報処理システムが利用者に対して行う回答の正答率は、モデルの生成時において入力されたパラメータの値に影響する場合がある。そのため、事業者は、可能な限り、利用者に対する回答の正答率を高めることができるパラメータの値を決定する必要がある。そこで、事業者は、適切なパラメータの値を決定することが可能な関数(以下、獲得関数とも呼ぶ)を用いることにより、モデルの生成に要するパラメータの値を決定する。
しかしながら、上記のようにモデルの生成に要するパラメータの値を決定するためには、獲得関数が連続性を有していることが前提になる場合がある。そのため、獲得関数が不連続である場合、事業者は、適切なパラメータの値を効率良く特定することができない。
そこで、一つの側面では、モデルの生成に用いる適切なパラメータの値を効率的に特定することを可能とする学習プログラム、学習装置及び学習方法を提供することを目的とする。
実施の形態の一つの態様によれば、学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、特定した前記学習パラメータによる機械学習を実行する、処理を実行させる。
一つの側面によれば、モデルの生成に用いる適切なパラメータの値を効率的に特定することを可能とする。
図1は、情報処理システム10の全体構成を示す図である。 図2は、パラメータの値が特定される際の具体例を説明する図である。 図3は、パラメータの値が特定される際の具体例を説明する図である。 図4は、パラメータの値が特定される際の具体例を説明する図である。 図5は、パラメータの値が特定される際の具体例を説明する図である。 図6は、実績情報131の具体例を説明する図である。 図7は、モデル群mdgを用いた情報処理システム10の具体例を説明する図である。 図8は、モデル群mdgを用いた情報処理システム10の具体例を説明する図である。 図9は、モデル群mdgを用いた情報処理システム10の具体例を説明する図である。 図10は、情報処理装置1のハードウエア構成を説明する図である。 図11は、情報処理装置1の機能のブロック図及び情報格納領域130に記憶された情報のブロック図である。 図12は、第1の実施の形態における学習処理の概略について説明するフローチャートである。 図13は、第1の実施の形態における学習処理の概略を説明する図である。 図14は、第1の実施の形態における学習処理の概略を説明する図である。 図15は、第1の実施の形態における学習処理の概略を説明する図である。 図16は、第1の実施の形態における学習処理の詳細を説明するフローチャートである。 図17は、第1の実施の形態における学習処理の詳細を説明するフローチャートである。 図18は、第1の実施の形態における学習処理の詳細を説明するフローチャートである。 図19は、第1の実施の形態における学習処理の詳細を説明するフローチャートである。 図20は、第1の実施の形態における学習処理の詳細を説明するフローチャートである。 図21は、正答率情報131aの具体例について説明する図である。 図22は、実績情報131の具体例を説明する図である。 図23は、第1の実施の形態における学習処理の詳細を説明する図である。
[情報処理システムの構成]
図1は、情報処理システム10の全体構成を示す図である。図1に示す情報処理システム10は、情報処理装置1と、記憶装置2と、操作端末3とを含む。図1に示す操作端末3は、操作端末3a、3b及び3cが含まれている。
情報処理装置1は、図1に示すように、例えば、利用者が操作端末3を介して、情報処理システム10において用いるモデルmd(以下、試行パラメータとも呼ぶ)の生成を行う処理(以下、学習処理とも呼ぶ)を行う旨の指示を行った場合、回答の正答率を高めることが可能なパラメータの値を特定し、特定したパラメータの値を入力としてモデルmdの生成を行う。そして、情報処理装置1は、図1に示すように、生成したモデルmdを記憶装置2に記憶する。
具体的に、情報処理装置1は、複数のパラメータの値をそれぞれ入力してモデルmdを生成する。そして、情報処理装置1は、生成したモデルmdのうち、回答の正答率が最も高いモデルmdを、情報処理システム10において用いるモデルmdとして決定する。以下、パラメータの値が特定される際の具体例について説明を行う。
[パラメータの値が特定される際の具体例]
図2から図5は、パラメータの値が特定される際の具体例を説明する図である。具体的に、図2から図5は、モデルmdの生成時間あたりの回答の正答率c/t(以下、時間あたりの回答の正答率c/tとも呼ぶ)を示すグラフである。図2から図5に示すグラフにおける横軸は、パラメータp(以下、単にpとも表記する)の値を示している。また、図2から図5に示すグラフにおける縦軸は、時間あたりの回答の正答率c/tを示している。なお、以下、モデルの生成を行う際に値の入力が行われるパラメータpがパラメータp1のみであるものとして説明を行う。また、パラメータp1には、「1」から「6」までの整数値のいずれかが設定されるものとして説明を行う。
初めに、情報処理装置1は、図2に示すように、例えば、パラメータp1として「1」を特定する(図2の(1))。そして、情報処理装置1は、図2に示すように、パラメータp1として「1」を入力することによってモデルmd1の生成を行い、生成したモデルmd1を用いた場合における回答の正答率c1と、生成したモデルmd1の生成時間t1とを取得する(図2の(2))。その後、情報処理装置1は、図3に示すように、ガウス過程に基づいた獲得関数に対し、取得済の正答率cの全て(正答率c1)と、取得済の生成時間tの全て(生成時間t1)と、パラメータp1の値とを入力することにより、パラメータp1の値のそれぞれに対応する時間あたりの期待改善度ei/t(時間あたりの回答の正答率c/tが改善する期待度)を算出する(図3の(3))。
そして、情報処理装置1は、図3に示すように、例えば、算出した時間あたりの期待改善度ei/t、及び、算出した時間あたりの期待改善度ei/tから推測された時間あたりの期待改善度ei/tの勾配(以下、単に勾配とも呼ぶ)を用いることにより、時間あたりの期待改善度ei/tの最大値を特定し、特定した最大値に対応するパラメータp1の値を特定する(図3の(4)、(5))。具体的に、情報処理装置1は、図3に示すように、例えば、パラメータp1の値が「2」である場合の時間あたりの期待改善度ei/tと、パラメータp1の値が「3」である場合の時間あたりの期待改善度ei/tと、これらの時間あたりの期待改善度ei/tから推測された勾配とから、時間あたりの期待改善度ei/tの最大値として「6」を特定する。すなわち、情報処理装置1は、この場合、次のモデルmd2の生成を行う際に入力するパラメータp1の値として「6」を特定する。
さらに、情報処理装置1は、パラメータp1として「6」を入力することによりモデルmd2の生成を行い、生成したモデルmd2を用いた場合における回答の正答率c2と、生成したモデルmd2の生成時間t2とを取得する(図3の(6))。その後、情報処理装置1は、図4に示すように、ガウス過程に基づいた獲得関数に対し、取得済の正答率cの全て(正答率c1及び正答率c2)と、取得済の生成時間tの全て(生成時間t1及び生成時間t2)と、パラメータp1の値とを入力することにより、パラメータp1の値のそれぞれに対応する時間あたりの期待改善度ei/tを算出する(図4の(7))。
そして、情報処理装置1は、図4に示すように、算出した時間あたりの期待改善度ei/tと勾配とを用いることにより、時間あたりの期待改善度ei/tの最大値を特定し、特定した最大値に対応するパラメータp1の値を特定する(図4の(8)、(9))。そして、情報処理装置1は、図4に示すように、例えば、次のモデルmd3の生成を行う際に入力するパラメータp1の値として「3」を特定する。すなわち、情報処理装置1は、この場合、次のモデルmd3の生成を行う際に入力するパラメータp1の値として「3」を特定する。
さらに、情報処理装置1は、パラメータp1として「3」を入力することによりモデルmd3の生成を行い、生成したモデルmd3を用いた場合における回答の正答率c3と、生成したモデルmd3の生成時間t3とを取得する(図4の(10))。その後、情報処理装置1は、図5に示すように、ガウス過程に基づいた獲得関数に対し、取得済の正答率cの全て(正答率c1、正答率c2及び正答率c3)と、取得済の生成時間tの全て(生成時間t1、生成時間t2及び生成時間t3)と、パラメータp1の値とを入力することにより、パラメータp1の値のそれぞれに対応する時間あたりの期待改善度ei/tを算出する(図5の(11))。
そして、情報処理装置1は、図5に示すように、算出した時間あたりの期待改善度ei/tと勾配とを用いることにより、時間あたりの期待改善度ei/tの最大値を特定し、特定した最大値に対応するパラメータp1の値を特定する(図5の(12)、(13))。そして、情報処理装置1は、図5に示すように、例えば、次のモデルmd4の生成を行う際に入力するパラメータp1の値として「4」を特定する。すなわち、情報処理装置1は、この場合、次のモデルmd4の生成を行う際に入力するパラメータp1の値として「4」を特定する。
これにより、情報処理装置1は、生成済のモデルmdから取得される情報(正答率c及び生成時間t)と算出済の時間あたりの期待改善度ei/tとから、時間あたりの回答の正答率c/tが高いモデルを生成することができる可能性が高いパラメータの値の特定を連続的に行うことが可能になる。そのため、情報処理装置1は、時間あたりの回答の正答率c/tが高いモデルmdの生成を効率的に行うことが可能になる。
その後、情報処理装置1は、例えば、生成した各モデルmdに対応する正答率c及び生成時間tを含む実績情報131を参照し、時間あたりの回答の正答率c/tが最も高いモデルmdの特定を行う。そして、情報処理装置1は、特定したモデルmdを情報処理システム10において用いるモデルmdとして決定する。以下、実績情報131の具体例について説明を行う。
[実績情報の具体例(1)]
図6は、実績情報131の具体例を説明する図である。
図6に示す実績情報131は、実績情報131に含まれる各項番を識別する「項番」と、各モデルmdを識別する「モデル名」と、パラメータpを識別する「パラメータ名」と、「パラメータ名」に設定されたパラメータpの値が設定される「値」とを項目として有している。また、図6に示す実績情報131は、「パラメータ名」に設定されたパラメータpとして「値」に設定された値を入力して生成したモデルmdの生成時間tが設定される「生成時間」と、「パラメータ名」に設定されたパラメータpとして「値」に設定された値を入力して生成したモデルmdを用いた場合における回答の正答率c(例えば、時間あたりの回答の正答率c/t)が設定される「正答率」とを項目として有している。
具体的に、図6に示す実績情報131において、「項番」が「1」である情報には、「パラメータ」として「p1」が設定され、「値」として「1」が設定され、「生成時間」として「1.5(h)」が設定され、「正答率」として「60(%)」が設定されている。図6に含まれる他の情報についての説明は省略する。
そして、情報処理装置1は、例えば、図6で説明した実績情報131を参照し、「正答率」に設定された情報のうち、「モデル名」が「md4」である情報(「項番」が「4」である情報)の「正答率」に設定された情報である「85(%)」が最も高い情報であると判定する。そのため、情報処理装置1は、この場合、例えば、モデルmd4を用いて情報処理システム10を構築することの決定を行う。
ここで、事業者は、複数のモデルmd(以下、モデル群mdgとも呼ぶ)を用いて情報処理システム10の構築を行う場合がある。以下、情報処理システム10の構築に用いられるモデルmdが複数存在する場合の具体例について説明を行う。
[モデル群を用いた情報処理システムの具体例]
図7から図9は、モデル群mdgを用いた情報処理システム10の具体例を説明する図である。図7及び図8に示すモデル群mdgには、モデルmdaと、モデルmdbと、モデルmdcとが含まれる。また、図9は、パラメータp1、p2及びp3の値の組合せを便宜的に横軸に示した場合における時間あたりの回答の正答率c/tのグラフである。
情報処理装置1は、図7に示すように、パラメータp1の値を入力とし、予め用意された学習データ132(以下、学習データ132aとも呼ぶ)を学習することによってモデルmdaを生成する。そして、情報処理装置1は、第1のデータセット(図示しない)の入力に応じてモデルmdaが出力した学習データ132bを取得する。
続いて、情報処理装置1は、図7に示すように、パラメータp2の値を入力とし、学習データ132(以下、学習データ132bとも呼ぶ)を学習することによってモデルmdbを生成する。そして、情報処理装置1は、第2のデータセット(図示しない)の入力に応じてモデルmdbが出力した学習データ132cを取得する。
さらに、情報処理装置1は、図7に示すように、パラメータp3の値を入力とし、学習データ132(以下、学習データ132cとも呼ぶ)を学習することによってモデルmdcを生成する。そして、情報処理装置1は、第3のデータセット(図示しない)の入力に応じてモデルmdcが出力した出力データDTを取得する。
その後、情報処理装置1は、取得した出力データDTのうち、出力データDTの内容として期待していたデータ(以下、期待データとも呼ぶ)と一致しているデータの割合を、モデル群mdgの回答の正答率cとして取得する。そして、情報処理装置1は、図2から図5で説明した場合と同様に、時間あたりの期待改善度ei/t等の算出を行い、次に用いるパラメータp1、p2及びp3の値の特定を行う。
具体的に、図7に示す例において、パラメータp1、p2及びp3の値がそれぞれ「2」、「4」及び「5」である場合、情報処理装置1は、パラメータp1の値として「2」を入力することによりモデルmdaを生成し、パラメータp2の値として「4」を入力することによりモデルmdbを生成し、パラメータp3の値として「5」を入力することによりモデルmdcの生成を行う。
そして、例えば、パラメータp1、p2及びp3の値として次に特定された値がそれぞれ「2」、「7」及び「1」である場合、パラメータp1の値は、前回のパラメータp1の値と同じである。そのため、情報処理装置1は、この場合、図8に示すように、モデルmdaによって前回生成された学習データ132bを再利用することが可能になる。
また、例えば、パラメータp1、p2及びp3の値として次に特定された値がそれぞれ「2」、「4」及び「9」である場合、パラメータp1及びp2の値は、前回のパラメータp1及びp2の値と同じである。そのため、情報処理装置1は、この場合、モデルmdbによって前回生成された学習データ132cを再利用することが可能になる。
これにより、情報処理装置1は、モデルmdaやモデルmdbの生成を省略することが可能になり、モデル群mdg(モデルmda、モデルmdb及びモデルmdc)の生成時間tを短縮することが可能になる。
ここで、上記の場合、モデル群mdgの生成時間tは、学習データ132の再利用が行われる場合と、学習データ132の再利用が行われない場合とが混在することになるため不連続になる。そのため、事業者は、図9に示すように、獲得関数を用いることによる時間あたりの期待改善度ei/tの算出を適切に行うことができず、モデル群mdgの生成に要するパラメータpの値の特定を適切に行うことができない場合がある。
そこで、本実施の形態における情報処理装置1は、パラメータp(以下、学習パラメータとも呼ぶ)の値の変化に対するモデル群mdgの生成時間t(以下、パラメータpによる学習時間とも呼ぶ)の変化が不連続となる不連続点が存在するか否かを判定する。その結果、不連続点が存在すると判定した場合、情報処理装置1は、その不連続点に基づき、パラメータpの値の変化に対するモデル群mdgの生成時間tの変化が連続となるパラメータpの値の範囲を特定する。
続いて、情報処理装置1は、特定したパラメータpの値の範囲ごとに、その範囲に含まれるパラメータpの値によるモデル群mdgの生成時間tあたりの、モデル群mdgを情報処理システム10に用いた場合の期待改善度ei/t(以下、成績の推定値とも呼ぶ)を算出する。そして、情報処理装置1は、算出した時間あたりの期待改善度ei/tのうち、その時間あたりの期待改善度ei/tの大きさに応じたいずれかが得られるパラメータpの値を特定する。その後、情報処理装置1は、特定したパラメータpの値によるモデル群mdgの生成を実行する。
すなわち、情報処理装置1は、パラメータpの値の変化に対するモデル群mdgの生成時間tの不連続点が存在すると判定した場合、パラメータpが取り得る値の範囲を、モデル群mdgの生成時間tの変化が連続となるパラメータpの値の範囲ごとに区分けする。そして、情報処理装置1は、例えば、区分けしたパラメータpの値の範囲ごとに、獲得関数を用いることによって時間あたりの期待改善度ei/tを算出し、算出した時間あたりの期待改善度ei/tのうちの最大値に対応するパラメータpの値を、次に生成するモデル群mdgに入力するパラメータpの値として決定する。
これにより、情報処理装置1は、パラメータpの値に変化に対するモデル群mdgの生成時間tの不連続点が存在する場合であっても、獲得関数を用いることによる時間あたりの期待改善度ei/tの算出を適切に行うことが可能になる。そのため、情報処理装置1は、次のモデル群mdgの生成に用いる適切なパラメータpの値を効率的に特定することを可能とする。
[情報処理装置のハードウエア構成]
次に、情報処理装置1のハードウエア構成について説明する。図10は、情報処理装置1のハードウエア構成を説明する図である。
情報処理装置1は、図10に示すように、プロセッサであるCPU101と、メインメモリ102(以下、単にメモリ102とも呼ぶ)と、外部インターフェース(I/Oユニット)103と、記憶媒体(ストレージ)104とを有する。各部は、バス105を介して互いに接続される。
記憶媒体104は、記憶媒体104内のプログラム格納領域(図示しない)に、学習処理を行うプログラム110を記憶する。
CPU101は、図10に示すように、記憶媒体104からメモリ102にロードされたプログラム110と協働することによって学習処理を行う。
記憶媒体104は、例えば、HDD(Hard Disk Drive)やSSD(Solid State Drive)等であり、学習処理を行う際に用いられる情報を記憶する情報格納領域130(以下、記憶部130とも呼ぶ)を有する。
また、外部インターフェース103は、ネットワークを介して操作端末3と通信を行う。
[情報処理装置のソフトウエア構成]
次に、情報処理装置1のソフトウエア構成について説明する。図11は、情報処理装置1の機能のブロック図及び情報格納領域130に記憶された情報のブロック図である。
CPU101は、図11に示すように、プログラム110と協働することにより、情報受付部111と、不連続点判定部112と、範囲特定部113と、推定値算出部114と、パラメータ特定部115と、機械学習実行部116と、実績測定部117と、情報送信部118として動作する。また、情報格納領域130には、図11に示すように、実績情報131と、学習データ132とが記憶されている。なお、以下、情報処理装置1によって図7で説明したモデル群mdgの生成が行われるものとして説明を行う。
情報受付部111は、パラメータpの値と、パラメータpの値を入力することによるモデル群mdgの生成時間とをそれぞれが含む複数の実績情報131とを受け付ける。具体的に、情報受付部111は、後述する実績測定部117が、生成済のモデル群mdgを用いた場合における回答の正答率cと、そのモデル群mdgの生成時間tとの取得を行ったことに応じて、これらの情報を含む実績情報131の受け付けを行う。
不連続点判定部112は、パラメータpの値が取り得る範囲に、パラメータpの値の変化に対するモデル群mdgの生成時間tの変化が不連続となる不連続点が存在するか否かを判定する。具体的に、不連続点判定部112は、例えば、情報受付部111が受け付けた複数の実績情報131のそれぞれに含まれるパラメータpの値と生成時間tとを参照することにより、不連続点が存在するか否かの判定を行う。また、不連続点判定部112は、情報処理装置1が生成するモデル群mdgに含まれる複数のモデルmdに、他のモデルmdによる学習結果を用いるモデルmdが存在するか否かを判定することにより、不連続点が存在するか否かの判定を行う。
範囲特定部113は、不連続点が存在すると不連続点判定部112が判定した場合、その不連続点に基づき、パラメータpの値の変化に対する生成時間tの変化が連続となるパラメータpの値の範囲を特定する。具体的に、範囲特定部113は、例えば、パラメータpが取り得る値の範囲を、不連続点判定部112が存在すると判定した不連続点に対応するパラメータpの値のそれぞれにおいて区分けすることにより、パラメータpの値の変化に対する生成時間tの変化が連続となるパラメータpの値の範囲の特定を行う。
推定値算出部114は、範囲特定部113が特定したパラメータpの値の範囲ごとに、モデル群mdgを情報処理システム10に用いた場合における時間あたりの期待改善度ei/tを算出する。具体的に、推定値算出部114は、例えば、範囲特定部113が特定したパラメータpの値の範囲ごとに、モデル群mdgを情報処理システム10に用いた場合における時間あたりの期待改善度ei/tの最大値の算出を行う。
パラメータ特定部115は、推定値算出部114が算出した時間あたりの期待改善度ei/tのうち、その時間あたりの期待改善度ei/tの大きさに応じたいずれかが得られるパラメータpの値を特定する。具体的に、パラメータ特定部115は、例えば、推定値算出部114が算出した時間あたりの期待改善度ei/tのうち、所定の条件を満たす時間あたりの期待改善度ei/tが得られるパラメータpの値の特定を行う。
なお、所定の条件を満たす時間あたりの期待改善度ei/tは、例えば、推定値算出部114が算出した時間あたりの期待改善度ei/tのうちの最大値であってよい。また、所定の条件を満たす時間あたりに期待改善度ei/tは、例えば、推定値算出部114が算出した時間あたりの期待改善度ei/tと、その時間あたりの期待改善度ei/tの勾配とから特定された時間あたりの期待改善度ei/tの最大値であってよい。
機械学習実行部116は、パラメータ特定部115が特定したパラメータpの値によるモデル群mdgの生成を行う。
実績測定部117は、生成済のモデル群mdgを用いた場合における回答の正答率cと、そのモデル群mdgの生成時間tとを取得(測定)する。
情報送信部118は、例えば、機械学習実行部116が生成したモデル群mdgのうち、回答の正答率cが最も高いモデル群mdgを示す情報を操作端末3に送信する。
[第1の実施の形態の概略]
次に、第1の実施の形態の概略について説明する。図12は、第1の実施の形態における学習処理の概略について説明するフローチャートである。また、図13から図15は、第1の実施の形態における学習処理の概略を説明する図である。図13から図15を参照しながら、図12に示す第1の実施の形態における学習処理の概略について説明を行う。なお、図13から図15に示すグラフは、図9と同様に、パラメータp1、p2及びp3の値の組合せを便宜的に横軸に示した場合における時間あたりの回答の正答率c/tのグラフである。
情報処理装置1は、図12に示すように、モデル生成タイミングまで待機する(S1のNO)。具体的に、情報処理装置1は、例えば、事業者が操作端末3を介して、情報処理システム10に用いられるモデル群mdgの生成を開始する旨の入力を行うまで待機する。
そして、モデル生成タイミングになった場合(S1のYES)、情報処理装置1は、パラメータpの値の変化に対するモデル群mdgの生成時間tの変化が不連続となる不連続点が存在するか否かを判定する(S2)。
その結果、不連続点が存在すると判定した場合(S3のYES)、情報処理装置1は、図13に示すように、S3の処理で存在した不連続点に基づき、パラメータpの値の変化に対するモデル群mdgの生成時間tの変化が連続となるパラメータpの値の範囲を特定する(S4)。
続いて、情報処理装置1は、図14に示すように、S4の処理で特定した範囲ごとに、モデル群mdgを情報処理システム10に用いた場合における時間あたりの期待改善度ei/tを算出する(S5)。具体的に、推定値算出部114は、範囲特定部113が特定したパラメータpの値の範囲ごとに、モデル群mdgを情報処理システム10に用いた場合における時間あたりの期待改善度ei/tの最大値の算出を行う。
そして、情報処理装置1は、図15に示すように、S5の処理で算出した時間あたりの期待改善度ei/tのうち、時間あたりの期待改善度ei/tの大きさに応じて選択されたいずれかが得られるパラメータpの値を特定する(S6)。
その後、情報処理装置1は、S6の処理で特定したパラメータpの値によるモデル群mdgの生成を実行する(S7)。
一方、S3の処理において、不連続点が存在しないと判定した場合(S3のNO)、情報処理装置1は、S4からS7の処理を行わない。具体的に、情報処理装置1は、この場合、S1の処理で受け付けた実績情報131に含まれるパラメータpの値によるモデル群mdgの生成を実行する。
すなわち、情報処理装置1は、パラメータpの値の変化に対するモデル群mdgの生成時間tの不連続点が存在すると判定した場合、パラメータpが取り得る値の範囲を、モデル群mdgの生成時間tの変化が連続となるパラメータpの値の範囲ごとに区分けする。そして、情報処理装置1は、例えば、区分けしたパラメータpの値の範囲ごとに、時間あたりの期待改善度ei/tを算出し、算出した時間あたりの期待改善度ei/tのうちの最大値に対応するパラメータpの値を、次に生成するモデル群mdgに入力するパラメータpの値として決定する。
これにより、情報処理装置1は、パラメータpの値の変化に対するモデル群mdgの生成時間tの不連続点が存在する場合であっても、次のモデル群mdgの生成に用いる適切なパラメータpの値を効率的に特定することを可能とする。
なお、モデル群mdgは、例えば、検索パラメータを用いた検索処理(試行)を行うモデル群であってよい。また、モデル群mdgを情報処理システム10に用いた場合における時間あたりの期待改善度ei/tは、例えば、モデル群mdgによる検索処理を行った場合における時間あたりの正答率c(検索結果の評価)が改善する期待度であってよい。
[第1の実施の形態の詳細]
次に、第1の実施の形態の詳細について説明する。図16から図20は、第1の実施の形態における学習処理の詳細を説明するフローチャートである。また、図21から図23は、第1の実施の形態の詳細を説明する図である。図16から図20を参照しながら、図21から図23に示す第1の実施の形態の詳細について説明を行う。なお、図23に示すグラフは、図9と同様に、パラメータp1、p2及びp3の値の組合せを便宜的に横軸に示した場合における時間あたりの回答の正答率c/tのグラフである。
情報処理装置1の情報受付部111は、図16に示すように、モデル生成タイミングまで待機する(S11のNO)。
そして、モデル生成タイミングになった場合(S11のYES)、パラメータ特定部115は、最初のパラメータpの値を決定する(S12)。パラメータ特定部115は、この場合、例えば、最初のパラメータpの値をランダムに決定するものであってよい。なお、モデル群mdgを生成する際に入力するパラメータpが複数存在する場合、パラメータ特定部115は、S12の処理において、複数のパラメータpの値の組合せを決定する。
その後、情報処理装置1の機械学習実行部116は、S12の処理で決定したパラメータp1の値、または、後述するS42の処理で特定したパラメータpの値による機械学習を実行してモデル群mdgを生成する(S13)。
続いて、情報処理装置1の不連続点判定部112は、図17に示すように、例えば、情報処理装置1が生成するモデル群mdgに含まれる複数のモデルmdに、他のモデルmdによる学習結果を用いるモデルmdが存在するか否かを判定する(S21)。すなわち、不連続点判定部112は、モデル群mdgの生成時において、過去に生成された学習データ132を再利用することができる可能性があるか否かの判定を行う。
その結果、他のモデルmdによる学習結果を用いるモデルmdが存在すると判定した場合(S22のYES)、不連続点判定部112は、パラメータpの値に変化に対するモデル群mdgの生成時間tに不連続点が存在すると判定する(S23)。そして、範囲特定部113は、パラメータpが取り得る値の範囲を、S23の処理で存在すると判定した不連続点に対応するパラメータpの値において区分けする(S24)。
具体的に、情報処理装置1では、モデル群mdgに入力するパラメータp1、p2及びp3の組合せによって、学習データ132bのみを再利用できる場合と、学習データ132b及び学習データ132cを再利用できる場合と、学習データ132を再利用できない場合とが発生する。
そして、この場合、図23に示すように、学習データ132を再利用できない場合における各パラメータpの値の範囲Aと、学習データ132bを再利用できる場合における各パラメータpの値の範囲Bとの間の点が不連続点になる。また、図23に示すように、学習データ132bを再利用できる場合における各パラメータpの値の範囲Bと、学習データ132b及び学習データ132cを再利用できる場合における各パラメータpの値の範囲Cとの間の点が不連続点になる。また、図23に示すように、学習データ132b及び学習データ132cを再利用できる場合における各パラメータpの値の範囲Cと、学習データ132bを再利用できる場合における各パラメータpの値の範囲Dとの間の点が不連続点になる。さらに、図23に示すように、学習データ132bを再利用できる場合における各パラメータpの値の範囲Dと、学習データ132を再利用できない場合における各パラメータpの値の範囲Eとの間の点が不連続点になる。
そのため、範囲特定部113は、S24の処理において、例えば、パラメータpの値の範囲を不連続点ごとに区分することにより、範囲A、範囲B、範囲C、範囲D及び範囲Eを特定する。
なお、図23に示す例では、範囲Cに対応する時間あたりの期待改善度ei/tが最も高くなり、範囲B及び範囲Dに対応する時間あたりの期待改善度ei/tが次に高くなり、範囲A及び範囲Eに対応する時間あたりの期待改善度ei/tが最も低くなる。
続いて、パラメータ特定部115は、S24の処理で特定したパラメータpの値の範囲の1つ特定する(S25)。すなわち、情報処理装置1は、以下の処理において、S25の処理で特定したパラメータpの値の範囲において、時間あたりの期待改善度ei/tが最大となるパラメータpの値の特定を行う。
そして、情報処理装置1の実績測定部117は、図18に示すように、S13の処理で生成したモデル群mdgを情報処理システム10に用いた場合における正答率cと、S13の処理で生成したモデル群mdgの生成時間tとを取得する(S31)。
具体的に、実績測定部117は、例えば、情報格納領域130に記憶された正答率情報131aを参照することにより、S13の処理で生成したモデル群mdgを用いた場合における正答率cの取得を行うものであってよい。また、実績測定部117は、S13の処理で生成したモデル群mdgの生成が開始されてから完了するまでの時間を計測することによって、S13の処理で生成したモデル群mdgの生成時間tの取得を行うものであってよい。以下、正答率情報131aの具体例について説明を行う。
[正答率情報の具体例]
図21は、正答率情報131aの具体例について説明する図である。
図21に示す正答率情報131aは、正答率情報131aに含まれる各情報を識別する「項番」と、事業者がモデル群mdgに対して入力した質問の内容が設定される「質問内容」と、「質問内容」に内容が設定された質問に対してモデル群mdgが出力した回答の内容が設定される「回答内容」とを項目として有する。また、図21に示す正答率情報131aは、「回答内容」に設定された内容が「質問内容」に設定された内容に対する回答として正しいものであったか否かを示す情報が設定される「正誤」を項目として有する。「正誤」には、例えば、回答として正しいことを示す「○」、または、回答として正しくないことを示す「×」が設定される。
なお、図21に示す正答率情報131aにおける「質問内容」に設定された情報は、例えば、図7で説明した第1のデータセットに含まれる情報に対応する。また、図21に示す正答率情報131aにおける「解答内容」に設定された情報は、例えば、図7で説明した出力データDTに含まれる情報に対応する。
具体的に、図21に示す正答率情報131aにおいて、「項番」が「1」である情報には、「質問内容」として「A社の電話番号を教えて」が設定され、「回答内容」として「03−xxxx−xxxxです。」が設定され、「正誤」として「○」が設定されている。また、図21に示す正答率情報131aにおいて、「項番」が「3」である情報には、「質問内容」として「A社製のパソコンの対応OSは?」が設定され、「回答内容」として「B−OSです。」が設定され、「正誤」として「○」が設定されている。
一方、図21に示す正答率情報131aにおいて、「項番」が「4」である情報には、「質問内容」として「A社の郵便番号は?」が設定され、「回答内容」として「B−OSです。」が設定され、「正誤」として「×」が設定されている。図21に含まれる他の情報についての説明は省略する。
すなわち、図21に示す正答率情報131aにおける「正答」の欄には、「〇」、「〇」、「〇」、「×」及び「〇」が設定されている。そのため、実績測定部117は、S14の処理において、例えば、モデル群mdgの正答率cとして80(%)を取得する。
なお、実績測定部117は、例えば、S31の処理において取得した正答率cと生成時間tとを含む実績情報131を情報格納領域130に記憶する。以下、S31の処理において取得した正答率cと生成時間tとを含む実績情報131の具体例について説明を行う。
[実績情報の具体例(2)]
図22は、実績情報131の具体例を説明する図である。
図22に示す実績情報131において、「項番」が「1」である情報には、「モデル群名」として「mdg1」が設定され、「パラメータ名」として「p1、p2、p3」が設定され、「値」として「1、2、4」が設定されている。また、図22に示す実績情報131において、「項番」が「1」である情報には、「生成時間」として「14(h)」が設定され、「正答率」として「55(%)」が設定されている。図22に示す他の情報についての説明は省略する。
図18に戻り、パラメータ特定部115は、S31の処理において今までに取得した回答の正答率cの全てと、S31の処理において今までに取得したモデル群mdgの生成時間tの全てと、S25の処理で特定した範囲に含まれるパラメータpの値とを獲得関数に入力することにより、S25の処理で特定した範囲に含まれるパラメータpの値のそれぞれに対応する期待改善度ei/tを算出する(S32)。
そして、情報処理装置1の推定値算出部114は、S32の処理で算出した時間あたりの期待改善度ei/tと、S32の処理で算出した時間あたりの期待改善度ei/tから推測された勾配とから時間あたりの期待改善度ei/tの最大値を特定する(S33)。
その後、パラメータ特定部115は、S25の処理においてパラメータpの値の全範囲を特定したか否かの判定を行う(S34)。
その結果、パラメータpの値の全範囲を特定していないと判定した場合(S34のNO)、パラメータ特定部115は、S25以降の処理を再度行う。
一方、パラメータpの値の全範囲を特定したと判定した場合(S34のYES)、パラメータ特定部115は、学習処理の終了タイミングであるか否かの判定を行う(S35)。具体的に、パラメータ特定部115は、例えば、現在時刻が予め定められた終了期限を超過した場合や、後述するS42の処理においてパラメータpの値の特定が行われた回数が予め定められた回数に達した場合に、学習処理の終了タイミングになったと判定する。
その結果、終了タイミングでないと判定した場合(S35のNO)、パラメータ特定部115は、図19に示すように、S33の処理で特定した時間あたりの期待改善度ei/tの最大値を特定する(S41)。そして、パラメータ特定部115は、S41の処理で特定した最大値に対応するパラメータpの値を特定する(S42)。その後、機械学習実行部116は、S13以降の処理を再度行う。
すなわち、情報処理装置1は、パラメータpの値に変化に対するモデル群mdgの生成時間tが不連続である場合、不連続点によって区分けされた範囲ごとに、期待改善度ei/tの最大値の特定を行う。そして、情報処理装置1は、不連続点によって区分けされた範囲ごとに特定された期待改善度ei/tの最大値のうちの最大値を、パラメータpが取り得る値の全範囲における期待改善度ei/tの最大値として特定する。
これにより、情報処理装置1は、パラメータpの値に変化に対するモデル群mdgの生成時間tの不連続点が存在する場合であっても、獲得関数を用いることによる時間あたりの期待改善度ei/tの算出を適切に行うことが可能になる。
一方、S35の処理において、終了タイミングであると判定した場合(S35のYES)、情報処理装置1の情報送信部118は、S31の処理において取得された回答の正答率c(情報格納領域130に記憶された実績情報131に含まれる回答の正答率c)のうち、最も高い回答の正答率cに対応するモデル群mdgを示す情報を操作端末3に送信する(S36)。具体的に、情報送信部118は、例えば、図22で説明した実績情報131を参照し、「正答率」に設定された情報が最大である情報(「項番」が「2」である情報)の「モデル群名」に設定された情報である「mdg2」の送信を行う。
また、S22の処理において、他のモデルmdによる学習結果を用いるモデルmdが存在しないと判定した場合(S22のNO)、パラメータ特定部115は、図20に示すように、S31の処理において今までに取得した回答の正答率cの全てと、S31の処理において今までに取得したモデル群mdgの生成時間tの全てと、パラメータpの値とを獲得関数に入力することにより、パラメータpの値のそれぞれに対応する期待改善度ei/tを算出する(S51)。
そして、推定値算出部114は、S51の処理で算出した時間あたりの期待改善度ei/tと、S51の処理で算出した時間あたりの期待改善度ei/tから推測された勾配とから時間あたりの期待改善度ei/tの最大値を特定する(S52)。
その後、パラメータ特定部115は、S52の処理で特定した最大値に対応するパラメータpの値を特定する(S53)。
これにより、情報処理装置1は、パラメータpの値に変化に対するモデル群mdgの生成時間tの不連続点が存在しない場合についても同様に、獲得関数を用いることによる時間あたりの期待改善度ei/tの算出を適切に行うことが可能になる。
このように、本実施の形態における情報処理装置1は、パラメータpの値と、パラメータpの値を入力することによるモデル群mdgの生成時間tとをそれぞれが含む複数の実績情報131とを受け付ける。
そして、情報処理装置1は、受け付けた複数の実績情報131に基づき、パラメータpの値の変化に対するモデル群mdgの生成時間tの変化が不連続となる不連続点が存在するか否かを判定する。その結果、不連続点が存在すると判定した場合、情報処理装置1は、その不連続点に基づき、パラメータpの値の変化に対するモデル群mdgの生成時間tの変化が連続となるパラメータpの値の範囲を特定する。
続いて、情報処理装置1は、特定したパラメータpの値の範囲ごとに、その範囲に含まれるパラメータpの値によるモデル群mdgの生成時間tあたりのモデル群mdgを用いた場合の正答率cの時間あたりの期待改善度ei/tを算出する。そして、情報処理装置1は、算出した推定値のうち、その推定値の大きさに応じて選択されたいずれかの推定値が得られるパラメータpの値を特定する。その後、情報処理装置1は、特定したパラメータpの値によるモデル群mdgの生成を実行する。
すなわち、情報処理装置1は、パラメータpの値の変化に対するモデル群mdgの生成時間tの不連続点が存在すると判定した場合、パラメータpが取り得る値の範囲を、モデル群mdgの生成時間tの変化が連続となるパラメータpの値の範囲ごとに区分けする。そして、情報処理装置1は、例えば、区分けしたパラメータpの値の範囲ごとに、獲得関数を用いることによって時間あたりの期待改善度ei/tを算出し、算出した時間あたりの期待改善度ei/tのうちの最大値に対応するパラメータpの値を、次に生成するモデル群mdgに入力するパラメータpの値として決定する。
これにより、情報処理装置1は、パラメータpの値に変化に対するモデル群mdgの生成時間tの不連続点が存在する場合であっても、次のモデル群mdgの生成に用いる適切なパラメータpの値を効率的に特定することを可能とする。
以上の実施の形態をまとめると、以下の付記の通りである。
(付記1)
学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、
前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、
特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、
算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、
特定した前記学習パラメータによる機械学習を実行する、
処理を実行させることを特徴とする学習プログラム。
(付記2)
付記1において、さらに、
機械学習の学習パラメータと、前記学習パラメータによる機械学習の学習時間とをそれぞれが含む複数の実績情報を受け付ける、
処理を実行させ、
前記判定する処理では、受け付けた前記複数の実績情報のそれぞれに含まれる前記パラメータと前記学習時間とを参照し、前記不連続点が存在するか否かの判定を行う、
ことを特徴とする学習プログラム。
(付記3)
付記2において、
前記判定する処理では、前記複数の実績情報に含まれる前記学習パラメータによる機械学習に、前記学習パラメータによる過去の機械学習の結果を用いることが可能な機械学習が含まれている場合、前記不連続点が存在すると判定する、
ことを特徴とする学習プログラム。
(付記4)
付記3において、
前記結果は、前記学習パラメータによる過去の機械学習によって学習された試行パラメータから生成された学習データである、
ことを特徴とする学習プログラム。
(付記5)
付記1において、
前記学習パラメータの範囲を特定する処理では、前記学習パラメータの範囲を、前記不連続点のそれぞれにおいて区分けする、
ことを特徴とする学習プログラム。
(付記6)
付記1において、
前記学習パラメータを特定する処理では、前記推定値のうち、所定の条件を満たす推定値が得られる学習パラメータの特定を行う、
ことを特徴とする学習プログラム。
(付記7)
付記6において、
前記学習パラメータを特定する処理では、前記推定値のうち、最大の推定値が得られる学習パラメータの特定を行う、
ことを特徴とする学習プログラム。
(付記8)
付記1において、
前記試行は、検索パラメータを用いた検索処理であり、
前記成績は、前記検索処理の検索結果の評価である、
ことを特徴とする学習プログラム。
(付記9)
学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定する不連続点判定部と、
前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定する範囲特定部と、
特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出する推定値算出部と、
算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定するパラメータ特定部と、
特定した前記学習パラメータによる機械学習を実行する機械学習実行部と、を有する、
ことを特徴とする学習装置。
(付記10)
付記9において、さらに、
機械学習の学習パラメータと、前記学習パラメータによる機械学習の学習時間とをそれぞれが含む複数の実績情報を受け付ける情報受付部を有し、
不連続点判定部は、受け付けた前記複数の実績情報のそれぞれに含まれる前記パラメータと前記学習時間とを参照し、前記不連続点が存在するか否かの判定を行う、
ことを特徴とする学習装置。
(付記11)
学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、
前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、
特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、
算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、
特定した前記学習パラメータによる機械学習を実行する、
ことを特徴とする学習方法。
(付記12)
付記11において、さらに、
機械学習の学習パラメータと、前記学習パラメータによる機械学習の学習時間とをそれぞれが含む複数の実績情報を受け付け、
前記判定する工程では、受け付けた前記複数の実績情報のそれぞれに含まれる前記パラメータと前記学習時間とを参照し、前記不連続点が存在するか否かの判定を行う、
ことを特徴とする学習方法。
1:情報処理装置 2:記憶装置
3:操作端末 101:CPU
102:メモリ 103:I/Oユニット
104:記憶媒体 130:情報格納領域

Claims (10)

  1. 学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、
    前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、
    特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、
    算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、
    特定した前記学習パラメータによる機械学習を実行する、
    処理を実行させることを特徴とする学習プログラム。
  2. 請求項1において、さらに、
    機械学習の学習パラメータと、前記学習パラメータによる機械学習の学習時間とをそれぞれが含む複数の実績情報を受け付ける、
    処理を実行させ、
    前記判定する処理では、受け付けた前記複数の実績情報のそれぞれに含まれる前記パラメータと前記学習時間とを参照し、前記不連続点が存在するか否かの判定を行う、
    ことを特徴とする学習プログラム。
  3. 請求項2において、
    前記判定する処理では、前記複数の実績情報に含まれる前記学習パラメータによる機械学習に、前記学習パラメータによる過去の機械学習の結果を用いることが可能な機械学習が含まれている場合、前記不連続点が存在すると判定する、
    ことを特徴とする学習プログラム。
  4. 請求項3において、
    前記結果は、前記学習パラメータによる過去の機械学習によって学習された試行パラメータから生成された学習データである、
    ことを特徴とする学習プログラム。
  5. 請求項1において、
    前記学習パラメータの範囲を特定する処理では、前記学習パラメータの範囲を、前記不連続点のそれぞれにおいて区分けする、
    ことを特徴とする学習プログラム。
  6. 請求項1において、
    前記学習パラメータを特定する処理では、前記推定値のうち、所定の条件を満たす推定値が得られる学習パラメータの特定を行う、
    ことを特徴とする学習プログラム。
  7. 請求項6において、
    前記学習パラメータを特定する処理では、前記推定値のうち、最大の推定値が得られる学習パラメータの特定を行う、
    ことを特徴とする学習プログラム。
  8. 請求項1において、
    前記試行は、検索パラメータを用いた検索処理であり、
    前記成績は、前記検索処理の検索結果の評価である、
    ことを特徴とする学習プログラム。
  9. 学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定する不連続点判定部と、
    前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定する範囲特定部と、
    特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出する推定値算出部と、
    算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定するパラメータ特定部と、
    特定した前記学習パラメータによる機械学習を実行する機械学習実行部と、を有する、
    ことを特徴とする学習装置。
  10. 学習パラメータの変化に対する学習時間の変化が不連続となる不連続点が存在するか否かを判定し、
    前記不連続点が存在する場合、前記不連続点に基づき、前記学習パラメータの変化に対する学習時間の変化が連続となる学習パラメータの範囲を特定し、
    特定した前記範囲ごとに、該範囲に含まれる学習パラメータによる機械学習の学習時間あたりの、機械学習により学習された試行パラメータを用いた試行の成績の推定値を算出し、
    算出した前記推定値のうち、該推定値の大きさに応じて選択されたいずれかの推定値が得られる学習パラメータを特定し、
    特定した前記学習パラメータによる機械学習を実行する、
    ことを特徴とする学習方法。
JP2017193933A 2017-10-04 2017-10-04 学習プログラム、学習装置及び学習方法 Active JP6886112B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017193933A JP6886112B2 (ja) 2017-10-04 2017-10-04 学習プログラム、学習装置及び学習方法
US16/133,833 US11488056B2 (en) 2017-10-04 2018-09-18 Learning program, learning apparatus, and learning method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017193933A JP6886112B2 (ja) 2017-10-04 2017-10-04 学習プログラム、学習装置及び学習方法

Publications (2)

Publication Number Publication Date
JP2019067272A JP2019067272A (ja) 2019-04-25
JP6886112B2 true JP6886112B2 (ja) 2021-06-16

Family

ID=65897913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017193933A Active JP6886112B2 (ja) 2017-10-04 2017-10-04 学習プログラム、学習装置及び学習方法

Country Status (2)

Country Link
US (1) US11488056B2 (ja)
JP (1) JP6886112B2 (ja)

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7970718B2 (en) * 2001-05-18 2011-06-28 Health Discovery Corporation Method for feature selection and for evaluating features identified as significant for classifying data
US7050953B2 (en) 2002-05-22 2006-05-23 Bigwood Technology Incorporated Dynamical methods for solving large-scale discrete and continuous optimization problems
US7516423B2 (en) 2004-07-13 2009-04-07 Kimotion Technologies Method and apparatus for designing electronic circuits using optimization
JP2010097369A (ja) * 2008-10-15 2010-04-30 Sharp Corp 最適パラメータ抽出装置及び抽出方法、並びに本方法を用いるマスクデータ、マスク及び半導体装置の製造方法
US9355414B2 (en) * 2010-05-30 2016-05-31 Hewlett Packard Enterprise Development Lp Collaborative filtering model having improved predictive performance
US8533224B2 (en) * 2011-05-04 2013-09-10 Google Inc. Assessing accuracy of trained predictive models
JP6101650B2 (ja) 2014-02-27 2017-03-22 日本電信電話株式会社 システムパラメタ学習装置、情報処理装置、方法、及びプログラム
WO2015179778A1 (en) * 2014-05-23 2015-11-26 Datarobot Systems and techniques for predictive data analytics
US10366346B2 (en) * 2014-05-23 2019-07-30 DataRobot, Inc. Systems and techniques for determining the predictive value of a feature
US20160132787A1 (en) * 2014-11-11 2016-05-12 Massachusetts Institute Of Technology Distributed, multi-model, self-learning platform for machine learning
JP2016126596A (ja) * 2015-01-06 2016-07-11 富士通株式会社 差分学習管理プログラム、差分学習管理装置及び差分学習管理方法
US10572447B2 (en) * 2015-03-26 2020-02-25 Nokia Technologies Oy Generating using a bidirectional RNN variations to music
JP6708385B2 (ja) * 2015-09-25 2020-06-10 キヤノン株式会社 識別器作成装置、識別器作成方法、およびプログラム
US10388404B2 (en) * 2015-10-27 2019-08-20 International Business Machines Corporation Using machine-learning to perform linear regression on a DNA-computing platform
CN105912500B (zh) * 2016-03-30 2017-11-14 百度在线网络技术(北京)有限公司 机器学习模型生成方法和装置
US10332508B1 (en) * 2016-03-31 2019-06-25 Amazon Technologies, Inc. Confidence checking for speech processing and query answering
CN107784364B (zh) * 2016-08-25 2021-06-15 微软技术许可有限责任公司 机器学习模型的异步训练
US10255550B1 (en) * 2017-06-07 2019-04-09 States Title, Inc. Machine learning using multiple input data types
US20200143240A1 (en) * 2017-06-12 2020-05-07 D5Ai Llc Robust anti-adversarial machine learning
US10679129B2 (en) * 2017-09-28 2020-06-09 D5Ai Llc Stochastic categorical autoencoder network

Also Published As

Publication number Publication date
US20190102699A1 (en) 2019-04-04
US11488056B2 (en) 2022-11-01
JP2019067272A (ja) 2019-04-25

Similar Documents

Publication Publication Date Title
CN107908803B (zh) 问答交互的响应方法及装置、存储介质、终端
JP6828001B2 (ja) 音声ウェイクアップ方法及び装置
US11122089B2 (en) Authorization policy optimization method and apparatus, and storage medium
CN105304082B (zh) 一种语音输出方法及装置
CN110096617B (zh) 视频分类方法、装置、电子设备及计算机可读存储介质
US20160365088A1 (en) Voice command response accuracy
CN110875059B (zh) 收音结束的判断方法、装置以及储存装置
KR101852527B1 (ko) 기계학습 기반의 동적 시뮬레이션 파라미터 교정 방법
US10971149B2 (en) Voice interaction system for interaction with a user by voice, voice interaction method, and program
EP4020305A1 (en) Pre-trained language model fine-tuning method and apparatus and non-transitory computer-readable medium
CN110263326A (zh) 一种用户行为预测方法、预测装置、存储介质及终端设备
CN108875502B (zh) 人脸识别方法和装置
CN115145812A (zh) 测试用例生成方法、装置、电子设备和存储介质
CN112397057A (zh) 基于生成对抗网络的语音处理方法、装置、设备及介质
CN108153735B (zh) 一种近义词的获取方法及系统
CN113360300B (zh) 接口调用链路生成方法、装置、设备及可读存储介质
JP6712046B2 (ja) 抽出プログラム、抽出装置及び抽出方法
CN110807476A (zh) 一种密码安全等级分类方法、装置及电子设备
WO2021135322A1 (zh) 一种自动出题方法、装置及系统
JP6886112B2 (ja) 学習プログラム、学習装置及び学習方法
CN117056728A (zh) 一种时间序列生成方法、装置、设备和存储介质
JP6993575B2 (ja) 情報処理プログラム、情報処理装置及び情報処理方法
JP2012230538A (ja) ソフトウェア評価装置、ソフトウェア評価方法およびシステム評価装置
JP2019067327A (ja) 学習プログラム、学習装置及び学習方法
CN116415548A (zh) 标签预测模型的训练方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210413

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210414

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210426

R150 Certificate of patent or registration of utility model

Ref document number: 6886112

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150