JP7489275B2

JP7489275B2 - 情報処理装置、情報処理システムおよび情報処理方法

Info

Publication number: JP7489275B2
Application number: JP2020151476A
Authority: JP
Inventors: 祐輝角谷; 清孝粕渕; 明子吉田; 万理寺田; 光規梅原
Original assignee: Screen Holdings Co Ltd
Current assignee: Screen Holdings Co Ltd
Priority date: 2020-09-09
Filing date: 2020-09-09
Publication date: 2024-05-23
Anticipated expiration: 2040-09-09
Also published as: EP3975069A1; US20220076057A1; JP2022045731A; CN114239842A

Description

本発明は、情報処理装置、情報処理システムおよび情報処理方法に関する。

機械学習により構築された学習モデルは、例えばデータに対応付けられたラベルを推測する分類タスク等を実行するために用いられる。特許文献１には、学習モデルの構築の手順が記載されている。この手順においては、処理対象データに対して前処理が行われることにより、処理対象データが処理サーバ装置により処理しやすいデータ形式に変換される。次に、データ処理が行われることにより、処理対象データがモデル構築用データセットとモデル検証用データセットとに分割される。

続いて、モデル構築用データセットを用いて機械学習アルゴリズムが実行されることにより、学習結果が取得される。その後、取得された学習結果がモデル検証用データセットを用いて評価される。学習結果の評価値が所定のしきい値より大きくなるまで機械学習アルゴリズムの実行が繰り返されることにより、学習モデルが構築される。

特開２０１９－３５６８号公報

構築される学習モデルの構造は、使用される機械学習アルゴリズムにより異なる。また、ラベルの推測の精度は、処理対象データが入力される学習モデルの構造により異なる。したがって、構造が異なる複数の学習モデルが構築され、構築された複数の学習モデルから処理対象データの処理に適した学習モデルが選択されることが好ましい。しかしながら、複数の学習モデルを構築するには長時間を要する。そのため、学習モデルを効率よく構築することが望まれる。

本発明の目的は、学習モデルを効率よく構築することが可能な情報処理装置、情報処理システムおよび情報処理方法を提供することである。

（１）第１の発明に係る情報処理装置は、説明変数と目的変数との関係を示す学習用データを取得する取得部と、取得部により取得された学習用データにおいて、目的変数に含まれる複数の項目の階層関係を決定する階層決定部と、階層決定部により決定された階層関係に基づいて、学習モデルを構築するための複数の構築アルゴリズムのうち実行すべき構築アルゴリズムを決定するアルゴリズム決定部と、アルゴリズム決定部により決定された構築アルゴリズムを実行することにより第１の学習モデルを構築する学習部とを備える。

この情報処理装置においては、学習用データの目的変数に含まれる複数の項目の階層関係に基づいて決定された構築アルゴリズムが実行されることにより、学習用データの学習が行われ、第１の学習モデルが構築される。この場合、複数の構築アルゴリズムの全部を実行する必要がなく、不要な構築アルゴリズムが実行されることもない。これにより、第１の学習モデルを効率よく構築することができる。

（２）複数の構築アルゴリズムの各々は、学習用データから特徴量を抽出するための特徴量抽出アルゴリズムと、学習用データに基づいて学習を行うための学習アルゴリズムとを含み、アルゴリズム決定部は、階層決定部により決定された階層関係に基づいて、複数の構築アルゴリズムにおける複数の学習アルゴリズムのうち実行すべき学習アルゴリズムを決定することにより実行すべき構築アルゴリズムを決定してもよい。この場合、実行すべき構築アルゴリズムを容易に決定することができる。

（３）階層決定部は、学習用データにおける複数の項目の包含関係に基づいて階層関係を自動的に決定してもよい。この場合、使用者の負担を低減することができる。

（４）階層決定部は、階層関係の指定または編集を受け付けることにより階層関係を決定してもよい。この場合、階層関係をより正確に決定することができる。

（５）情報処理装置は、処理時間を予測するための第２の学習モデルを用いて、決定された構築アルゴリズムに対応した第１の学習モデルの構築に要する時間を予測する予測部をさらに備えてもよい。この場合、使用者は、第１の学習モデルの構築に要する時間を容易に認識することが可能となる。

（６）情報処理装置は、決定された構築アルゴリズムに対応した第１の学習モデルの構築が終了したときに、実際の経過時間に基づいて第２の学習モデルを更新する更新部をさらに備えてもよい。この場合、第１の学習モデルの構築に要する時間をより高い精度で予測することが可能になる。

（７）第２の発明に係る情報処理システムは、第１の発明に係る情報処理装置と、情報処理装置で用いられる学習用データにおける複数の項目を表示する表示装置とをさらに備える。この情報処理システムにおいては、使用者は、学習用データにおける複数の項目を容易に認識することができる。

（８）表示装置は、複数の項目の階層関係を編集可能に表示してもよい。この場合、階層関係をより正確に決定することができる。

（９）第３の発明に係る情報処理方法は、説明変数と目的変数との関係を示す学習用データを取得するステップと、取得された学習用データにおいて、目的変数に含まれる複数の項目の階層関係を決定するステップと、決定された階層関係に基づいて、学習モデルを構築するための複数の構築アルゴリズムのうち実行すべき構築アルゴリズムを決定するステップと、決定された構築アルゴリズムを実行することにより第１の学習モデルを構築するステップとを含む。

この情報処理方法によれば、学習用データの目的変数に含まれる複数の項目の階層関係に基づいて決定された構築アルゴリズムが実行されることにより、学習用データの学習が行われ、第１の学習モデルが構築される。この場合、複数の構築アルゴリズムの全部を実行する必要がなく、不要な構築アルゴリズムが実行されることもない。これにより、第１の学習モデルを効率よく構築することができる。

（１０）複数の構築アルゴリズムの各々は、学習用データから特徴量を抽出するための特徴量抽出アルゴリズムと、学習用データに基づいて学習を行うための学習アルゴリズムとを含み、構築アルゴリズムを決定するステップは、決定された階層関係に基づいて、複数の構築アルゴリズムにおける複数の学習アルゴリズムのうち実行すべき学習アルゴリズムを決定することにより実行すべき構築アルゴリズムを決定することを含んでもよい。この場合、実行すべき構築アルゴリズムを容易に決定することができる。

（１１）階層関係を決定するステップは、学習用データにおける複数の項目の包含関係に基づいて階層関係を自動的に決定することを含んでもよい。この場合、使用者の負担を低減することができる。

（１２）階層関係を決定するステップは、階層関係の指定または編集を受け付けることを含んでもよい。この場合、階層関係をより正確に決定することができる。

（１３）情報処理方法は、処理時間を予測するための第２の学習モデルを用いて、決定された構築アルゴリズムに対応した第１の学習モデルの構築に要する時間を予測するステップをさらに含んでもよい。この場合、使用者は、第１の学習モデルの構築に要する時間を容易に認識することが可能となる。

（１４）情報処理方法は、決定された構築アルゴリズムに対応した第１の学習モデルの構築が終了したときに、実際の経過時間に基づいて第２の学習モデルを更新するステップをさらに含んでもよい。この場合、第１の学習モデルの構築に要する時間をより高い精度で予測することが可能になる。

本発明によれば、学習モデルを効率よく構築することができる。

本発明の一実施の形態に係る情報処理システムを示す図である。情報処理装置の構成を示す図である。学習用データの一例を示す図である。図３の学習用データの簡略図である。階層関係指定画面の一例を示す図である。アルゴリズム画面の一例を示す図である。学習開始画面の一例を示す図である。図２の情報処理装置によるモデル構築処理を示すフローチャートである。図２の情報処理装置によるモデル構築処理を示すフローチャートである。

（１）情報処理システムの構成
以下、本発明の実施の形態に係る情報処理装置、情報処理システムおよび情報処理方法について図面を用いて説明する。図１は、本発明の一実施の形態に係る情報処理システムの構成を示す図である。図１に示すように、情報処理システム１００は、情報処理装置１０、記憶装置２０、操作部３０および表示装置４０により構成される。情報処理装置１０、記憶装置２０、操作部３０および表示装置４０はバス１０１に接続される。

情報処理装置１０は、ＣＰＵ（中央演算処理装置）１１、ＲＡＭ（ランダムアクセスメモリ）１２およびＲＯＭ（リードオンリメモリ）１３を含む。ＲＡＭ１２は、ＣＰＵ１１の作業領域として用いられる。ＲＯＭ１３は、システムプログラムを記憶する。情報処理装置１０は、説明変数と目的変数との関係を示す学習用データを学習することにより、説明変数から目的変数のラベルを推測するための種々の学習モデルを構築する。情報処理装置１０の詳細については後述する。以下、情報処理装置１０により構築される学習モデルを推測モデルと呼ぶ。

記憶装置２０は、ハードディスクまたは半導体メモリ等の記憶媒体を含み、情報処理装置１０に後述する構築処理を実行させるための構築プログラムを記憶する。構築プログラムは、ＲＯＭ１３または他の外部記憶装置に記憶されてもよい。記憶装置２０は、情報処理装置１０により構築された構築プログラムを記憶してもよい。また、記憶装置２０は、情報処理装置１０による処理時間を予測するための複数の学習モデル（以下、予測モデルと呼ぶ。）を予め記憶する。

操作部３０は、キーボード、マウスまたはタッチパネル等の入力デバイスである。使用者は、操作部３０を操作することにより、学習用データにおいて、目的変数に含まれる項目の階層関係を指定または編集することができる。表示装置４０は、液晶表示装置等の表示デバイスであり、学習用データにおける複数の項目等を表示する。

（２）情報処理装置の構成
図２は、情報処理装置１０の構成を示す図である。図２に示すように、情報処理装置１０は、機能部として、取得部１、前処理部２、階層決定部３、アルゴリズム決定部４、学習部５、予測部６、更新部７および選択部８を含む。図１のＣＰＵ１１がＲＯＭ１３または記憶装置２０等に記憶された構築プログラムを実行することにより、情報処理装置１０の機能部が実現される。情報処理装置１０の機能部の一部または全てが電子回路等のハードウエアにより実現されてもよい。

取得部１は、説明変数と目的変数との関係を示す複数の学習用データを取得する。前処理部２は、取得部１により取得された複数の学習用データに前処理を行うことにより、複数の学習用データを階層決定部３または学習部５が読み込み可能な形式に変換する。

階層決定部３は、前処理部２により前処理された学習用データにおいて、目的変数に含まれる複数の項目の階層関係を決定する。階層関係は、学習用データにおける複数の項目の包含関係に基づいて自動的に決定されてもよいし、使用者による指定または編集が受け付けられることにより決定されてもよい。階層関係が自動的に決定される場合、使用者の負担が低減される。一方で、表示装置４０には、学習用データにおける複数の項目が階層関係を編集可能に表示される。使用者は、操作部３０を操作することにより項目の階層関係を指定または編集することができる。この場合、階層関係がより正確に決定される。

アルゴリズム決定部４は、階層決定部３により決定された階層関係に基づいて、推測モデルを構築するための複数の構築アルゴリズムのうち実行するべき１以上の構築アルゴリズムを決定する。ここで、複数の構築アルゴリズムの各々は、学習用データから特徴量を抽出するための特徴量抽出アルゴリズムと、学習用データに基づいて学習を行うための学習アルゴリズムとを含む。

本例では、階層決定部３により決定された階層関係に基づいて、予め定められた複数の学習アルゴリズムのうち実行するべき１以上の学習アルゴリズムが決定される。実行するべき１以上の構築アルゴリズムは、予め定められた１以上の特徴量抽出アルゴリズムと、実行するべき１以上の学習アルゴリズムとの組み合わせにより決定される。

学習部５は、アルゴリズム決定部４により決定された１以上の構築アルゴリズムを順次実行することにより、前処理部２により前処理が行われた複数の学習用データを学習する。これにより、１以上の構築アルゴリズムにそれぞれ対応する１以上の推測モデルが構築される。各推測モデルの構築においては、パラメータが最適になるようにパラメータが変化されつつ学習が繰り返される。

予測部６は、記憶装置２０に記憶された複数の予測モデルのうち、アルゴリズム決定部４により決定された構築アルゴリズムに対応する予測モデルを取得する。また、予測部６は、各構築アルゴリズムの実行時に、取得された予測モデルを用いて当該構築アルゴリズムに対応する推測モデルの構築に要する時間を予測し、推測モデルが構築されるまでの残り時間を表示装置４０に表示させる。予測部６は、残り時間とともに、または残り時間に代えて、推測モデルの構築の進捗度（％）を表示装置４０に表示させてもよい。

なお、予測モデルは、学習に関する属性が説明変数として入力されたときに処理時間を目的変数として出力する学習モデルであり、ランダムフォレスト、ＳＶＭ（Support Vector Machine）またはディープラーニング等の回帰モデルにより構築される。説明変数となる学習に関する属性は、例えば学習用データの容量、ＣＰＵ１１のコア数、ＲＡＭ１２の容量、パラメータ最適化のための学習繰り返し回数、特徴量抽出アルゴリズムのパラメータ探索範囲および学習アルゴリズムのパラメータ探索範囲を含む。

本例では、パラメータ最適化のための学習繰り返しが実行されるごとに、予測時間が補正される。補正後の予測時間ｔは、下記式（１）により示される。式（１）において、ｔ_０は現時点の処理時間である。ｎは、現時点でのパラメータ最適化のための学習実行回数である。ｎ_ｍは、現時点でのパラメータ最適化のための学習繰り返しの最大実行回数である。

更新部７は、アルゴリズム決定部４により決定された構築アルゴリズムに対応した推測モデルの構築が終了するごとに、実際の経過時間に基づいて記憶装置２０に記憶された予測モデルを更新する。この場合、推測モデルの構築に要する時間をより高い精度で予測することが可能になる。本例では、更新部７は、構築アルゴリズムの構築に用いられた学習に関する属性にさらに基づいて予測モデルを更新する。選択部８は、学習部５により構築された１以上の推測モデルのうち、最も高い精度を有する推測モデルを選択する。選択部８は、選択された推測モデルを記憶装置２０に記憶させてもよい。

（３）階層関係の決定
図３は、学習用データの一例を示す図である。図３の例では、「学習用データ１」～「学習用データ１０」の１０の学習用データが図示されている。各学習用データにおいて、説明変数は「災害状況」であり、目的変数は「項目１」～「項目５」の５の項目を含む。「項目１」～「項目５」は、それぞれ「業種大分類名」、「業種中分類名」、「業種小分類名」、「起因物大分類名」および「起因物中分類名」である。

図３の例では、「項目１」は「項目２」の上位階層にあり、「項目２」は「項目３」の上位階層にあり、「項目４」は「項目５」の上位階層にある。一方、「項目１」、「項目２」および「項目３」と、「項目４」および「項目５」とは階層関係を有しない。複数の項目間の階層関係の有無は、複数の項目の包含関係に基づく判定式により判定することが可能である。複数の項目間に階層関係があると判定された場合には、階層関係が自動的に決定される。

「項目ａ」と「項目ｂ」との間の階層関係の有無を判定するための判定式は、下記式（２）により示される。式（２）において、Ｎ_１は、「項目ａ」のラベルと「項目ｂ」のラベルとの組み合わせの総数である。Ｎ_２は、「項目ａ」⊇「項目ｂ」となるラベルの組み合わせの総数である。αは判定の厳密さを示すしきい値であり、０よりも大きく１よりも小さい範囲で使用者により設定される。式（２）が成立する場合、「項目ａ」と「項目ｂ」との間に階層関係があり、「項目ａ」は「項目ｂ」の上位階層にあると判定される。

以下、例として図３の「項目２」と「項目３」との間の階層関係の有無の判定について説明する。図４は、図３の学習用データの簡略図である。図４においては、図３の学習データから「項目２」および「項目３」のみが抽出されている。また、理解を容易にするために、各項目のラベルを「Ａ」～「Ｌ」と略記する。本例において、「項目２」のラベルの数は「Ａ」～「Ｅ」の５であり、「項目３」のラベルの数は「Ｆ」～「Ｌ」の７である。そのため、「項目２」のラベルと「項目３」のラベルとの組み合わせの総数Ｎ_１は５×７＝３５通りである。

また、「項目２」⊇「項目３」となるラベルの組み合わせの総数Ｎ_２は、｛「Ａ」，「Ｆ」｝、｛「Ａ」，「Ｇ」｝、｛「Ａ」，「Ｈ」｝、｛「Ｂ」，「Ｉ」｝、｛「Ｃ」，「Ｊ」｝、｛「Ｄ」，「Ｋ」｝および｛「Ｅ」，「Ｌ」｝の７通りである。この場合、上記式（２）の左辺の値は０．２となる。したがって、右辺のしきい値αが０．２よりも小さく設定されている場合、「項目２」と「項目３」との間に階層関係があり、「項目２」は「項目３」の上位階層にあると判定される。使用者は、図２の操作部３０を操作することにより、判定された階層関係を編集することができる。

また、階層関係は、自動的に決定されることなく、使用者に指定されることにより決定されてもよい。図２の表示装置４０には、階層関係の指定を受け付けるための階層関係指定画面が表示される。使用者は、図２の操作部３０を用いて階層関係指定画面を操作することにより、階層関係を指定することができる。

図５は、階層関係指定画面の一例を示す図である。図５に示すように、階層関係指定画面５０には、スイッチ５１が表示される。スイッチ５１がオフである場合、階層関係の指定が受け付けられない。スイッチ５１がオンである場合、項目間の複数の階層関係にそれぞれ対応する複数のチェックボックス５２が階層関係指定画面５０にさらに表示される。使用者は、所望のチェックボックス５２をチェックすることにより、当該チェックボックス５２に対応する階層関係を指定することができる。

また、階層関係の指定が受け付けられた場合、複数の項目の階層関係を示すツリー状の構造図５３が階層関係指定画面５０にさらに表示される。使用者は、構造図５３を操作することにより、階層関係をさらに編集することができる。構造図５３においては、階層ごとに項目の表示と非表示とを切り替え可能である。そのため、使用者は、階層の数が多い場合には、構造図５３において不要な階層の項目を非表示にすることにより、所望の項目の階層関係を容易に認識することができる。

（４）構築アルゴリズムの決定
学習用データにおいて、階層関係が決定されることにより実行するべき１以上の構築アルゴリズムが決定される。具体的には、階層関係が決定されることにより、予め定められた複数の学習アルゴリズムのうち、実行する必要がない学習アルゴリズムが定まる。そのため、予め定められた複数の学習アルゴリズムから実行する必要がない学習アルゴリズムが除外されることにより、実行するべき１以上の学習アルゴリズムが決定される。実行するべき１以上の構築アルゴリズムは、予め定められた１以上の特徴量抽出アルゴリズムと、決定された１以上の学習アルゴリズムとの組み合わせにより決定される。

決定された１以上の構築アルゴリズムを視認可能に示すアルゴリズム画面が図２の表示装置４０に表示される。図６は、アルゴリズム画面の一例を示す図である。図６に示すように、アルゴリズム画面６０は、特徴量抽出アルゴリズム表示欄６１および学習アルゴリズム表示欄６２を含む。特徴量抽出アルゴリズム表示欄６１には、予め定められた複数の特徴量抽出アルゴリズムにそれぞれ対応する複数のチェックボックス６１ａが表示される。予め定められた複数の特徴量抽出アルゴリズムは、Ｗｏｒｄ２Ｖｅｃ、ＢｏＷ(Bag of Words)およびＴＦ－ＩＤＦ（TermFrequency-Inverse Document Frequency）を含む。

学習アルゴリズム表示欄６２には、予め定められた複数の学習アルゴリズムにそれぞれ対応する複数のチェックボックス６２ａが表示される。予め定められた複数の学習アルゴリズムは、ＭＬＰ（Multilayer Perceptron）、ＲＦＣ（Random ForestClassifier)、ＳＷＥＭＮＮ（Simple Word-Embedding-based MethodsNeural Network）、ＣＮＮ（Convolutional Neural Network）、ＬｉｇｈｔＧＢＭ（Light Gradient Boosting Machine）およびＳＶＭを含む。

アルゴリズム画面６０においては、実行すべき特徴量抽出アルゴリズム（本例ではＷｏｒｄ２Ｖｅｃ、ＢｏＷおよびＴＦ－ＩＤＦ）にそれぞれ対応するチェックボックス６２ａがチェックされる。また、実行すべき学習アルゴリズム（本例ではＭＬＰ、ＳＷＥＭＮＮおよびＣＮＮ）にそれぞれ対応するチェックボックス６１ａがチェックされる。使用者は、所望のチェックボックス６１ａ，６２ａを操作して実行すべき特徴量抽出アルゴリズムまたは学習アルゴリズムを変更することができる。

チェックボックス６１ａがチェックされた特徴量抽出アルゴリズムと、チェックボックス６２ａがチェックされた学習アルゴリズムとの組み合わせが、実行するべき１以上の構築アルゴリズムとして示される。ＳＷＥＭＮＮは学習用データから特徴量を抽出するためのアルゴリズムを含むため、ＳＷＥＭＮＮが実行される場合には、特徴量抽出アルゴリズムを使用しない。そのため、図６の例では、３×２＋１＝７通りの構築アルゴリズムが示される。

なお、上記の階層関係の決定が行われない場合には、全部の特徴量抽出アルゴリズムおよび全部の学習アルゴリズムが実行されることとなる。この場合、全部のチェックボックス６１ａ，６２ａがチェックされることにより、３×５＋１＝１６通りの構築アルゴリズムが示される。

構築アルゴリズムが決定された後、学習開始画面が表示装置４０に表示される。図７は、学習開始画面の一例を示す図である。図７に示すように、学習開始画面７０には、開始ボタン７１が表示される。また、学習開始画面７０には、学習における説明変数、目的変数、特徴量抽出アルゴリズムおよび学習アルゴリズムが表示されるとともに、学習フローを示す図が表示される。使用者は、開始ボタン７１を操作することにより学習の開始を指示することができる。

（５）モデル構築処理
図８および図９は、図２の情報処理装置１０によるモデル構築処理を示すフローチャートである。図８および図９のモデル構築処理は、図１のＣＰＵ１１がＲＯＭ１３または記憶装置２０等に記憶された構築プログラムをＲＡＭ１２上で実行することにより行われる。以下、図２の情報処理装置１０ならびに図８および図９のフローチャートを用いてモデル構築処理を説明する。

まず、取得部１は、複数の学習用データを取得する（ステップＳ１）。複数の学習用データは、記憶装置２０から取得されてもよいし、外部の記憶媒体から取得されてもよい。次に、前処理部２は、ステップＳ１で取得された各学習用データを前処理する（ステップＳ２）。続いて、階層決定部３は、ステップＳ２で前処理された学習用データにおいて、目的変数に含まれる複数の項目間の階層関係の有無を式（２）に基づいて判定する（ステップＳ３）。階層関係が自動的に決定されない場合には、ステップＳ３は省略される。

その後、階層決定部３は、階層関係の指定または編集が指示されたか否かを判定する（ステップＳ４）。階層関係の指定または編集が指示されない場合には、階層決定部３はステップＳ６に進む。使用者は、図５の階層関係指定画面５０において、階層関係の指定または編集を指示することができる。階層関係の指定または編集が指示された場合には、階層決定部３は、指定または編集に基づいて階層関係を変更し（ステップＳ５）、ステップＳ６に進む。ステップＳ６で、階層決定部３は、階層関係を決定する（ステップＳ６）。

次に、アルゴリズム決定部４は、ステップＳ６で決定された階層関係に基づいて、予め定められた複数の学習アルゴリズムのうち実行するべき１以上の学習アルゴリズムを決定する（ステップＳ７）。続いて、アルゴリズム決定部４は、予め定められた１以上の特徴量抽出アルゴリズムと、ステップＳ７で決定された１以上の学習アルゴリズムとの組み合わせにより、実行するべき１以上の構築アルゴリズムを決定する（ステップＳ８）。本例では、決定されたＮ（Ｎは１以上の整数）の構築アルゴリズムに１～Ｎの固有の識別番号がそれぞれ付与される。

その後、アルゴリズム決定部４は、学習の開始が指示されたか否かを判定する（ステップＳ９）。使用者は、図７の学習開始画面７０で開始ボタン７１を操作することにより、学習の開始を指示することができる。一方、使用者は、学習の開始を指示せずに、図６のアルゴリズム画面６０のチェックボックス６１ａ，６２ａを操作することができる。この場合、アルゴリズム決定部４は、ステップＳ８に戻り、チェックボックス６１ａ，６２ａの操作内容に基づいて構築アルゴリズムを再度決定する。学習の開始が指示されるまでステップＳ８，Ｓ９が繰り返される。

学習の開始が指示された場合、学習部５は、構築アルゴリズムの識別番号を表す変数ｉの値を１に設定する（ステップＳ１０）。次に、学習部５は、第ｉ番目の構築アルゴリズムを選択する（ステップＳ１１）。続いて、予測部６は、ステップＳ１１で決定された構築アルゴリズムに対応する予測モデルを用いて、当該構築アルゴリズムに対応する推測モデルの構築に要する時間を予測する（ステップＳ１２）。その後、予測部６は、ステップＳ１２で予測された時間または後述するステップＳ１７で補正された予測時間に基づいて、推測モデルが構築されるまでの残り時間を表示装置４０に表示させる（ステップＳ１３）。

その後、学習部５は、ステップＳ１１で選択された構築アルゴリズムを実行することにより、ステップＳ２で前処理が行われた複数の学習用データを学習する（ステップＳ１４）。これにより、選択された構築アルゴリズムに対応する推測モデルが構築される。次に、学習部５は、パラメータの最適化が終了したか否かを判定する（ステップＳ１５）。

パラメータの最適化が終了していない場合、学習部５は、パラメータを変更する（ステップＳ１６）。また、予測部６は、式（１）に基づいて予測時間を補正し（ステップＳ１７）、ステップＳ１３に戻る。予め定められた学習繰り返しの最大実行回数の範囲内で、パラメータの最適化が終了するまでステップＳ１３～Ｓ１７が繰り返される。

パラメータの最適化が終了した場合、更新部７は、実際の経過時間および学習に関する属性に基づいて記憶装置２０に記憶された予測モデルを更新する（ステップＳ１８）。続いて、学習部５は、変数ｉの値がＮであるか否かを判定する（ステップＳ１９）。変数ｉの値がＮでない場合、学習部５は、変数ｉの値を１だけ増加し（ステップＳ２０）、ステップＳ１１に戻る。変数ｉの値がＮになるまでステップＳ１１～Ｓ２０が繰り返される。

変数ｉの値がＮである場合、選択部８は、ステップＳ１４の学習により構築されたＮの推測モデルのうち、最も高い精度を有する推測モデルを選択し（ステップＳ２１）、モデル構築処理を終了する。選択部８は、ステップＳ２１で選択された推測モデルを記憶装置２０に記憶させてもよい。

（６）効果
本実施の形態に係る情報処理装置１０においては、学習用データの目的変数に含まれる複数の項目の階層関係に基づいて決定された構築アルゴリズムが実行されることにより、学習用データの学習が行われ、推測モデルが構築される。この場合、複数の構築アルゴリズムの全部を実行する必要がなく、不要な構築アルゴリズムが実行されることもない。また、あり得ない階層関係についての学習が行われることが防止される。これにより、学習の精度を向上させるとともに、推測モデルを効率よく構築することができる。

また、予測モデルを用いて、決定された構築アルゴリズムに対応した推測モデルの構築に要する時間が予測される。この構成によれば、学習に関する属性と処理時間との関係が非線形である場合でも、推測モデルの構築に要する時間を予測することができる。したがって、使用者は、推測モデルの構築に要する時間を容易に認識することが可能となる。

さらに、予測時間は、パラメータ最適化のための学習繰り返しが実行されるごとに、実際の経過時間に基づいて補正される。そのため、推測モデルの構築に要する時間をより高い精度で予測することができる。その結果、情報処理装置１０の管理および推測モデルの構築の計画をより正確に行うことができる。

（７）他の実施の形態
（ａ）上記実施の形態において、各推測モデルの構築が終了したときに、実際の経過時間に基づいて予測モデルが更新されるが、実施の形態はこれに限定されない。予測モデルは更新されなくてもよい。この場合、情報処理装置１０は更新部７を含まなくてもよい。

（ｂ）上記実施の形態において、推測モデルの構築に要する時間が予測されるが、実施の形態はこれに限定されない。推測モデルの構築に要する時間は、予測されなくてもよい。この場合、情報処理装置１０は予測部６および更新部７を含まなくてもよく、記憶装置２０に予測モデルが記憶されなくてもよい。

（ｃ）上記実施の形態において、情報処理装置１０は選択部８を含むが、実施の形態はこれに限定されない。学習部５により構築された複数の推測モデルが記憶装置２０に記憶される場合、または１つの推測モデルのみが構築される場合等には、情報処理装置１０は選択部８を含まなくてもよい。

（８）請求項の各構成要素と実施の形態の各部との対応関係
以下、請求項の各構成要素と実施の形態の各要素との対応の例について説明するが、本発明は下記の例に限定されない。請求項の各構成要素として、請求項に記載されている構成または機能を有する他の種々の要素を用いることもできる。

上記実施の形態においては、取得部１が取得部の例であり、階層決定部３が階層決定部の例であり、アルゴリズム決定部４がアルゴリズム決定部の例であり、学習部５が学習部の例である。情報処理装置１０が情報処理装置の例であり、予測部６が予測部の例であり、更新部７が更新部の例であり、表示装置４０が表示装置の例であり、情報処理システム１００が情報処理システムの例である。

１…取得部，３…階層決定部，４…アルゴリズム決定部，５…学習部，６…予測部，７…更新部，８…選択部，１０…情報処理装置，１１…ＣＰＵ，１２…ＲＡＭ，１３…ＲＯＭ，２０…記憶装置，３０…操作部，４０…表示装置，５０…階層関係指定画面，５１…スイッチ，５２，６１ａ，６２ａ…チェックボックス，５３…構造図，６０…アルゴリズム画面，６１…特徴量抽出アルゴリズム表示欄，６２…学習アルゴリズム，７０…学習開始画面，７１…開始ボタン，１００…情報処理システム，１０１…バス

Claims

説明変数と目的変数との関係を示す学習用データを取得する取得部と、
前記取得部により取得された学習用データにおいて、目的変数に含まれる複数の項目の階層関係を決定する階層決定部と、
前記階層決定部により決定された前記階層関係に基づいて、学習モデルを構築するための複数の構築アルゴリズムのうち実行すべき構築アルゴリズムを決定するアルゴリズム決定部と、
前記アルゴリズム決定部により決定された構築アルゴリズムを実行することにより第１の学習モデルを構築する学習部とを備える、情報処理装置。
前記複数の構築アルゴリズムの各々は、学習用データから特徴量を抽出するための特徴量抽出アルゴリズムと、学習用データに基づいて学習を行うための学習アルゴリズムとを含み、
前記アルゴリズム決定部は、前記階層決定部により決定された前記階層関係に基づいて、前記複数の構築アルゴリズムにおける複数の学習アルゴリズムのうち実行すべき学習アルゴリズムを決定することにより前記実行すべき構築アルゴリズムを決定する、請求項１記載の情報処理装置。
前記階層決定部は、学習用データにおける複数の項目の包含関係に基づいて前記階層関係を自動的に決定する、請求項１または２記載の情報処理装置。
前記階層決定部は、前記階層関係の指定または編集を受け付けることにより前記階層関係を決定する、請求項１～３のいずれか一項に記載の情報処理装置。
処理時間を予測するための第２の学習モデルを用いて、前記決定された構築アルゴリズムに対応した前記第１の学習モデルの構築に要する時間を予測する予測部をさらに備える、請求項１～４のいずれか一項に記載の情報処理装置。
前記決定された構築アルゴリズムに対応した前記第１の学習モデルの構築が終了したときに、実際の経過時間に基づいて前記第２の学習モデルを更新する更新部をさらに備える、請求項５記載の情報処理装置。
請求項１～６のいずれか一項に記載の情報処理装置と、
前記情報処理装置で用いられる学習用データにおける複数の項目を表示する表示装置とをさらに備える、情報処理システム。
前記表示装置は、複数の項目の前記階層関係を編集可能に表示する、請求項７記載の情報処理システム。
説明変数と目的変数との関係を示す学習用データを取得するステップと、
取得された学習用データにおいて、目的変数に含まれる複数の項目の階層関係を決定するステップと、
決定された前記階層関係に基づいて、学習モデルを構築するための複数の構築アルゴリズムのうち実行すべき構築アルゴリズムを決定するステップと、
決定された構築アルゴリズムを実行することにより第１の学習モデルを構築するステップとを含む、情報処理方法。
前記複数の構築アルゴリズムの各々は、学習用データから特徴量を抽出するための特徴量抽出アルゴリズムと、学習用データに基づいて学習を行うための学習アルゴリズムとを含み、
前記構築アルゴリズムを決定するステップは、決定された前記階層関係に基づいて、前記複数の構築アルゴリズムにおける複数の学習アルゴリズムのうち実行すべき学習アルゴリズムを決定することにより前記実行すべき構築アルゴリズムを決定することを含む、請求項９記載の情報処理方法。
前記階層関係を決定するステップは、学習用データにおける複数の項目の包含関係に基づいて前記階層関係を自動的に決定することを含む、請求項９または１０記載の情報処理方法。
前記階層関係を決定するステップは、前記階層関係の指定または編集を受け付けることを含む、請求項９～１１のいずれか一項に記載の情報処理方法。
処理時間を予測するための第２の学習モデルを用いて、前記決定された構築アルゴリズムに対応した前記第１の学習モデルの構築に要する時間を予測するステップをさらに含む、請求項９～１２のいずれか一項に記載の情報処理方法。
前記決定された構築アルゴリズムに対応した前記第１の学習モデルの構築が終了したときに、実際の経過時間に基づいて前記第２の学習モデルを更新するステップをさらに含む、請求項１３記載の情報処理方法。