WO2019189016A1

WO2019189016A1 - 情報処理装置、情報処理方法、プログラム

Info

Publication number: WO2019189016A1
Application number: PCT/JP2019/012569
Authority: WO
Inventors: 白木　孝
Original assignee: 日本電気株式会社
Priority date: 2018-03-28
Filing date: 2019-03-25
Publication date: 2019-10-03
Also published as: US20210012247A1; JPWO2019189016A1; JP7081661B2

Abstract

本発明の情報処理装置１００は、複数の属性からなるデータに基づいて、属性を利用したモデルを生成するモデル生成手段１１０と、生成したモデルに基づいて、モデル生成に利用する属性を変更する属性変更手段１２０と、を備え、さらに、上記モデル生成手段１１０は、変更された属性からなるデータに基づいて、新たなモデルを生成する、という構成をとる。

Description

情報処理装置、情報処理方法、プログラム

　本発明は、モデルを生成する情報処理装置、情報処理方法、プログラムに関する。

　データ分析においては、多種多様なデータに混在するデータ同士の関連性から、特定の規則性を発見することが行われている。例えば、複数の属性からなるデータに基づいてモデルを生成する方法として、異種混合学習がある。異種混合学習は、決定木構造の予測モデルを生成するものであり、決定木の最下位階層に位置する葉ノードには回帰式で表される予測式を含み、葉ノード以外のノードである内部節点には予測式を選択するための分岐条件を含む。なお、最上位階層に位置する分岐条件からなるノードを、根ノードと呼ぶこととする。このとき、予測式と分岐条件には、それぞれ属性が含まれることとなる。このため、異種混合学習を行うことで、各モデルに対する各属性の影響を知ることができる。

　ここで、異種混合学習の一例を説明する。例えば、図１に示すように、ｙ，ｘ_１，ｘ_２，ｘ_３，・・・といった属性のデータにおいて、ｘ_１，ｘ_２，ｘ_３，・・・を説明変数とし、ｙを目的変数とした場合に、図２に示すような決定木とその葉ノードにおける予測式からなるモデルが得られる。つまり、この場合、多数の属性からなる説明変数の候補から選択された説明変数を用いて各内部接点の分岐条件が設定され、分岐により分割された葉ノード毎に説明変数を用いた線形回帰式で表される予測式を得ることができる。このとき、異種混合学習は結果に再現性がないため、マルチスタートと呼ぶ複数回の繰り返しによって、複数のモデルを生成することができる。そして、生成された複数のモデルの評価を行い、最善のモデルを選択する、ことが行われる。例えば、異種混合学習を行う事例としては、ビルの電力需要予測や店舗の売上げ予測、などがある。この場合、データの属性としては、目的変数となる電力や売上げ、説明変数となる天気、気温、月日、時刻、などが挙げられる。

特開２０１６－９１３４３号公報

　しかしながら、上述したようなモデル生成では、必ずしも所望のモデルを得ることができるとは限らない。例えば、異種混合学習では、最善のモデルを抽出することを目的としているため、生成したモデルによっては、当該モデルに影響する属性が少数しか抽出されず、また属性が偏ってしまう場合がある。換言すると、モデルに含まれていなかったり、含まれていてもわずかしか使用されていない属性については、強い属性に隠れ、モデルに対する影響を適切に表しているとは言えない。その結果、モデルは洗練された少数の属性を反映するのみで、それに準ずる他の属性の影響を適切に調べることはできない、という問題が生じる。

　ここで、異種混合モデルを生成する方法の一例として、特許文献１に記載の方法がある。この文献では、モデルの精度を高めるべく、選択する属性の削除や追加といった変更を行い、モデルを生成している。しかしながら、かかる方法では、単にモデルの生成に用いる属性を任意に直接的に変更しているため、膨大な数の選択肢があり、また選択された属性は異種混合によって洗練されたものとは言えない。従って、依然として異種混合学習による選択で洗練された属性、かつ少数に限らない属性の影響を適切に調べることができない、という問題がある。そして、かかる問題は、異種混合学習に限らず、あらゆる方法によるモデルの生成においても生じうる。

　このため、本発明の目的は、上述した課題である、生成するモデルに対する属性の影響を適切に調べることができない、という問題を解決することができる情報処理装置、情報処理方法、プログラムを提供することにある。

　本発明の一形態である情報処理装置は、
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成するモデル生成手段と、
　生成した前記モデルに基づいて、モデル生成に利用する前記属性を変更する属性変更手段と、を備え、
　前記モデル生成手段は、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
という構成をとる。

　また、本発明の一形態である情報処理方法は、
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成し、
　生成した前記モデルに基づいて、モデル生成に使用する前記属性を変更し、
　さらに、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
という構成をとる。

　また、本発明の一形態であるプログラムは、
　情報処理装置に、
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成し、
　生成した前記モデルに基づいて、モデル生成に使用する前記属性を変更し、
　さらに、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
処理を実行させる、
という構成をとる。

　本発明は、以上のように構成されることにより、生成するモデルに対するあらゆる属性の影響を適切に調べることができる。

モデル生成に使用するデータの一例を示す図である。生成したモデルの一例を示す図である。本発明の実施形態１における情報処理装置の構成を示すブロック図である。図３に開示した情報処理装置の動作を示すフローチャートである。本発明において削除する属性を決定するときの様子を説明するための図である。本発明において削除する属性を決定するときの様子を説明するための図である。本発明において削除する属性を決定するときの様子を説明するための図である。本発明において削除する属性を決定するときの様子を説明するための図である。本発明において削除する属性を決定するときの様子を説明するための図である。本発明の実施形態２における情報処理装置の構成を示すブロック図である。

　＜実施形態１＞
　本発明の第１の実施形態を、図１乃至図９を参照して説明する。図１は、分析対象となるデータの一例を示す図であり、図２は、生成したモデルの一例を示す図である。図３は、情報処理装置の構成を示すブロック図であり、図４は、情報処理装置の動作を示すフローチャートである。図５乃至図９は、モデル生成時の様子を説明するための図である。

　まず、本発明の情報処理装置は、分析対象となるデータからモデルを生成するものである。例えば、本実施形態では、図１に示すようなｙ，ｘ_１，ｘ_２，ｘ_３，・・・といった属性のデータを分析対象とし、かかるデータから図２に示すような決定木からなる複数のモデルを生成する異種混合学習を行う場合を説明する。但し、本発明は、異種混合学習に限らず、あらゆる方法によるモデル生成の場合にも適用可能である。

　情報処理装置１は、演算装置や記憶装置を備えた、１台又は複数台の情報処理装置にて構成されている。そして、情報処理装置１は、図３に示すように、演算装置がプログラムを実行することで構築された、属性選択部１１、モデル生成部１２、属性スコア算出部１３、を備えている。また、情報処理装置１は、記憶装置に形成された、データ記憶部１５、モデル記憶部１６、を備えている。以下、情報処理装置１の詳細な構成と動作について説明する。

　上記データ記憶部１５は、上述した図１に示すような分析対象となるデータを記憶する。分析対象となるデータは、例えば、ｙ，ｘ_１，ｘ_２，ｘ_３，・・・といった属性のデータがあることとし、一例として、各属性は、ビルの電力、天気、気温、月日、時刻、出勤人数などが挙げられる。但し、データは、いかなるデータであってもよい。なお、Ｎｏは、データの番号を示しており、同一番号の属性の値は、同時に観測された値である。

　上記モデル記憶部１６は、後述するようにデータを学習することによって生成したモデルを記憶する。記憶されるモデルは、例えば、図２に示すような分岐条件と回帰式とを含む決定木からなる。但し、モデルはいかなる構造であってもよい。

　上記属性選択部１１は、まず、データ記憶部１５に記憶されているデータのうち、モデルを作成するために用いる学習データを抽出して読み込む（図４のステップＳ１）。例えば、属性選択部１１は、図１に示すデータのうち、データ番号が１～ｎ番までを学習データとして読み込む。なお、残りのデータは、例えば、生成したモデルを検証するテストデータとなる。

　続いて、属性選択部１１は、読み込んだ学習データから、モデルの生成に使用する属性を選択する。本実施形態では、図１に示すようなデータの全ての属性をモデル生成に用いるが、このうち、目的変数として属性ｙを選択し、他の属性を説明変数の候補として、かかる候補の中から説明変数として用いる複数の属性ｘ_１～ｘ_ｎを選択する。一例として、目的変数ｙはビルの電力であり、説明変数ｘ_１～ｘ_ｎは天気、気温、月日、時刻、出勤人数、などである。なお、属性選択部１１による属性の選択は、事前に設定されている基準に基づいて自動的に行われる。但し、属性選択部１１は、データに含まれる一部の属性のみを目的変数や説明変数として選択することに限定されず、全ての属性を目的変数や説明変数として選択して用いてもよい。

　上記モデル生成部１２は、上記属性選択部１１によって目的変数及び説明変数として選択された属性の値を用いて異種混合学習を行い、図２に示すような、決定木構造の予測モデルを生成する（図４のステップＳ３）。ここで、本実施形態では、図２に示すような決定木構造において、最上位階層に位置する分岐条件からなるノードを根ノードと呼び（例えば、図２のモデル１における点線丸印で示す「ｘ_３＝α」の分岐条件）、最下段に位置する回帰式で表されるノードを葉ノードと呼ぶ。そして、決定木の葉ノードには、属性を含む回帰式で表される予測式Ｃ１を含み、葉ノード以外のノードである内部節点には、予測式を選択するためであり属性が含まれた分岐条件を含む。

　このとき、モデル生成部１２は、いわゆるマルチスタートといった手法で、複数のモデルを生成する。例えば、マルチスタートでは、分岐条件の根ノードで用いられる説明変数が変更されるなど学習方法が変更されることで、複数のモデルを生成することができる。なお、本実施形態では、３０回のマルチスタートによってそれぞれ別の学習を行い、図２に示すように３０個のモデルを生成することとする。但し、生成するモデルの数は上述した数に限定されない。

　続いて、上記属性スコア算出部１３は、上述したように生成したモデルに基づいて、当該モデルに使用されている各属性のスコアを算出する（図４のステップＳ４）。属性のスコアは、例えば、生成された１つ又は複数のモデルに対する属性の影響度合いを表すと考えられる値となるように算出する。なお、具体的な属性のスコアの算出方法については後述する。

　そして、上記属性選択部１１は、上述したように生成したモデルに基づいて算出した属性のスコアから、後に再度行われるモデル生成に使用する属性の変更を行う。つまり、上記属性スコア算出部１３と属性選択部１１とは、モデルの生成に使用する属性の変更を行う属性変更手段として機能する。特に、本実施形態では、直前のモデルを生成する際に使用された属性の中から、削除する属性を決定し、かかる属性を削除して次に使用する属性を変更する（図４のステップＳ５でＮｏ、ステップＳ６）。

　ここで、モデルに使用されている各属性のスコアの算出方法、及び、削除する属性の決定方法について説明する。上述したように、本実施形態では、情報処理装置１は、生成したモデルに対する影響度合いが高いと考えられる属性を、削除する属性として決定する。このため、生成したモデルにおける各属性の利用状況をスコア化する。

　一例として、生成した複数のモデルに使用される属性の数が多いほど、スコアを高く算出する。具体的に、生成した複数の全てのモデルにおいて、属性毎に、分岐条件と回帰式に含まれる数が多いほど、スコアが高くなるよう算出する。そして、スコアが最も高い属性を削除する属性として決定する。図５の例では、分岐条件と回帰式に属性ｘ_２が多く出現しているため、当該属性ｘ_２のスコアが高く算出され、当該属性ｘ_２が削除される属性として決定される。なお、上記では、全てのモデルにおける分岐条件と回帰式に出現する属性の数を足し合わせてスコアとして算出しているが、全モデルのうちいずれか複数のモデル内の属性の数を足し合わせてスコアを算出してもよく、１つのモデル内の属性の数に基づいてスコアを算出してもよい。また、モデル内の分岐条件や回帰式の一方だけに出現する属性の数に基づく値をスコアとしてもよく、ある属性が出現するモデルの数に基づく値を当該属性のスコアとしてもよい。なお、複数のモデルに出現する属性の数をモデル間で足し合わせる際には、モデル毎の予測精度の評価値などモデルの内容に応じて当該モデル内の属性の数に重みを付けて足し合わせ、これに基づいてスコアを算出してもよい。また、その他の基準でモデル内に出現する属性の数に基づいて当該属性のスコアとしてもよい。

　ここで、上述したモデルの評価値を算出する方法の一例を説明する。例えば、ホールドアウト法を用いれば、図１に示すデータを学習データ、評価データに分割し、学習データでモデルを作成し、そのモデルを評価データに対して適応した時に得られる平均絶対誤差の精度が得られ、かかる精度に基づく値をモデルの予測精度の評価値とすることができる。なお、モデルの評価方法は、ホールドアウト法に限らず、交差検定（Cross Validation）など他の方法を用いることも可能であり、精度指標も平均絶対誤差に限らず平均絶対誤差率やRSMEなどの他の指標を用いることができ、上述した方法に限定されない。

　そして、上述したように算出した各モデルの評価結果に基づいて、複数のモデル間でも重みを付けることができる。例えば、３０回のマルチスタートで３０のモデルが作成された時に、上記評価方法での予測精度の高い順に並べ、１位のモデルには重み３０、２位のモデルには重み２９，・・・，３０位のモデルには重み１を与えることで、それぞれのモデルに同様の属性の出現があった場合でも、重みで差を付けることもあり得る。また、予測精度の値により重みを付けることも可能である。例えば、上記ソートを行った後、誤差数１００のモデルには重み１／１００，誤差数１２０のモデルには重み１／１２０，・・・誤差数５３８のモデルには重み１／５３８などを設定することも可能である。

　他の例として、情報処理装置１は、生成した複数のモデルにおいて使用される属性のうち、決定木の根ノードからの距離が近い属性ほどスコアを高く算出する。ここで、「根ノードからの距離」とは、決定木の最上位階層に位置する根ノードからの階層の深さ、を意味する。そして、スコアが最も高い属性を削除する属性として決定する。図６の例では、属性ｘ_３が、モデル１の根ノードの分岐条件に位置し、モデル２の根ノードから１階層下の分岐条件に位置している。このように、属性ｘ_３が、モデル１では根ノードそのものに位置し、また、モデル２では根ノードから最も近くに位置しているため、当該属性ｘ_３のスコアが高く算出され、当該属性ｘ_３が削除される属性として決定される。但し、根ノードからの距離に基づいて削除する属性を決定する方法は、上述した方法に限定されない。例えば、根ノードの分岐条件に位置する属性だけを削除する対象としてもよく、他の基準で削除する属性を決定してもよい。

　他の例として、情報処理装置１は、生成した複数のモデルの回帰式における各属性の係数が大きいほど、かかる属性のスコアを高く算出する。そして、スコアが最も高い属性を削除する属性として決定する。例えば、図７の例では、各モデルの回帰式内の属性ｘ_１の係数ａの合計値が当該属性ｘ_１のスコアとして算出される。このとき、回帰式内の属性の係数の大きさは、正負を含めた数値で判断してもよく、正負を排除して絶対値で判断してもよい。また、回帰式内の属性の係数に基づくスコアは、上述したように、属性毎の係数の合計値をスコアとしてもよく、最大値をスコアとするなど、他の方法で係数に基づくスコアを算出してもよい。

　他の例として、情報処理装置１は、決定木からなるモデルを生成する際に、分岐条件や回帰式の生成に使用されたデータの数が多いほど、当該分岐条件や回帰式に含まれる属性のスコアを高く算出する。そして、スコアが最も高い属性を削除する属性として決定する。例えば、図８の例では、決定木の生成の際に、モデル２の決定木のうち点線の楕円で囲んだ条件分岐と回帰式を含む経路の生成に多くのデータが使用された場合、つまり、かかる経路を通るデータの数が多かった場合に、かかる経路に含まれる属性のスコアを高く算出する。この場合、例えば、通るデータの数が多かった楕円で囲まれる経路に含まれる属性ｘ_２のスコアが高く算出されたとすると、かかる属性ｘ_２を削除する属性として決定する。

　他の例として、情報処理装置１は、生成したモデルに利用される複数の属性同士の関連度合いを調べ、かかる関連度合いから属性のスコアを算出する。そして、スコアが最も高い属性を削除する属性として決定する。例えば、図９の例では、モデル２の決定木において、相互に連続する階層に位置する条件分岐に含まれる属性同士ｘ_２，ｘ_４を相互に関連度合いが高い属性であると判定して、これら属性のスコアをそれぞれ高く算出する。そして、属性ｘ_２，ｘ_４の両方あるいは一方を削除する属性として決定する。なお、一方を削除する属性と決定する場合には、より根ノードに近い属性を選択するなど、さらに別の基準を用いてもよい。

　他の例として、情報処理装置１は、生成したモデルに利用される属性のうち、予め制御不可能な性質のものであると設定された属性のスコアを高く算出し、かかる属性を削除する属性として決定する。例えば、上述した例では、目的変数がビルの電力である場合に、説明変数のうち「出勤人数」は制御可能であるが、「天気」は制御不可能である。このような制御不可能な属性のスコアを高く算出する。

　なお、上記では、一例として、スコアが最も高い属性を削除することを例示したが、必ずしもスコアが最も高い属性を削除することに限定されない。削除する属性は、スコアに基づいていかなる条件で決定してもよく、１つあるいは複数の属性を削除する属性として決定してもよい。また、情報処理装置１は、上述した属性のスコアの算出方法のうち、１つの方法を用いてもよく、いくつかを組み合わせてもよい。また、スコアの算出方法は上述した方法に限定されず、いかなる方法であってもよい。

　そして、上記属性選択部１１は、上述したように削除すると決定された属性を、モデル生成に用いる説明変数の候補から外し、残りの属性を説明変数の候補とし、その中から、モデル生成に用いる属性として選択する（図４のステップＳ２）。つまり、図４のステップＳ６で削除すると決定された属性を削除した残りの属性から、図４のステップＳ２で属性を選択する。

　その後、上記モデル生成部１２は、上記属性選択部１１によって選択された属性の値を用いて、上述同様に異種混合学習を行い、決定木構造の予測モデルを生成する（図４のステップＳ３）。このときも、モデル生成部１２は、いわゆるマルチスタートといった手法で、複数のモデルを生成する。

　その後はさらに、上述したように、生成したモデルに基づいて属性のスコアを算出してある属性を削除し、残りの属性を用いて再度モデルを生成してもよい。一方で、何らかの基準によりモデル生成が終了されると（図４のステップＳ５でＹｅｓ）、モデル生成部１２は、生成したモデルをモデル記憶部１６に記憶すると共に、ユーザに対して出力する（図４のステップＳ７）。

　以上のように、本発明では、まず複数の属性を用いてモデルを生成し、かかる生成したモデルに基づいて、当該モデルに影響があるような属性を削除することを決定する。そして、削除すると決定した属性を除いた残りの属性を用いて、再度モデルを生成する。必要に応じて、属性の削除とモデルの生成を繰り返す。これにより、再度生成したモデルは、削除した属性の影響を排除することができる。その結果、削除した属性とは異なる属性の影響を考慮したモデルも生成することができ、データにおける様々な属性の影響を適切に調べることができる。

　なお、上記では、モデル生成に利用した属性を削除する場合を例示したが、本発明では、生成したモデルに基づいてかかるモデル生成に利用していない他の属性を追加するよう変更した属性を用いて、再度モデル生成を行ってもよい。この場合には、追加した属性の影響を調べることができる。また、本発明では、生成したモデルに基づいて、モデル生成に利用した属性を削除すると共に、新たに別の属性を追加するよう変更した属性を用いて、再度モデル生成を行ってもよい。なお、モデル生成に利用する属性は、いかなる方法で変更されてもよい。

　＜実施形態２＞
　次に、本発明の第２の実施形態を、図１０を参照して説明する。図１０は、実施形態２における情報処理装置の構成を示すブロック図である。なお、本実施形態では、実施形態１で説明した情報処理装置の構成の概略を示している。

　図１０に示すように、本実施形態における情報処理装置１００は、
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成するモデル生成手段１１０と、
　生成した前記モデルに基づいて、モデル生成に利用する前記属性を変更する属性変更手段１２０と、を備え、
　前記モデル生成手段１１０は、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
という構成をとる。

　なお、上記モデル生成手段１１０と属性変更手段１２０とは、情報処理装置がプログラムを実行することで実現されるものである。

　そして、上記構成の情報処理装置１００は、
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成し、
　生成した前記モデルに基づいて、モデル生成に使用する前記属性を変更し、
　さらに、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
という処理を実行するよう作動する。

　上記発明によると、まず複数の属性を用いてモデルを生成し、かかる生成したモデルに基づいて属性が変更され、変更されたモデルを用いて、再度モデル生成を行う。このため、変更した属性の影響を考慮したモデルも生成することができ、その結果、データにおける様々な属性の影響を適切に調べることができる。

　＜付記＞
　上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における情報処理装置、情報処理方法、プログラムの構成の概略を説明する。但し、本発明は、以下の構成に限定されない。

（付記１）
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成するモデル生成手段と、
　生成した前記モデルに基づいて、モデル生成に利用する前記属性を変更する属性変更手段と、を備え、
　前記モデル生成手段は、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
情報処理装置。

（付記２）
　付記１に記載の情報処理装置であって、
　前記属性変更手段は、生成した前記モデルに基づいて、当該モデルに利用されている前記属性のうち少なくとも１つの属性を削除し、
　前記モデル生成手段は、削除された前記属性とは異なる他の前記属性からなるデータに基づいて、新たなモデルを生成する、
情報処理装置。

（付記３）
　付記１又は２に記載の情報処理装置であって、
　前記属性変更手段は、生成した前記モデルにおける前記属性の利用状況に基づいて、削除する前記属性を決定して当該属性を削除する、
情報処理装置。

（付記４）
　付記３に記載の情報処理装置であって、
　前記属性変更手段は、生成した前記モデルにおける前記属性の利用状況に基づいて前記モデルに対する予め設定された基準による前記属性の影響度合いを算出し、当該影響度合いが高い前記属性を削除する、
情報処理装置。

（付記５）
　付記３又は４に記載の情報処理装置であって、
　前記モデル生成手段は、同一の前記属性からなるデータに基づいて、前記モデルを複数回生成し、
　前記属性変更手段は、生成した複数の前記モデルに利用される前記属性の数に基づいて、削除する前記属性を決定する、
情報処理装置。

（付記６）
　付記３乃至５のいずれかに記載の情報処理装置であって、
　前記モデル生成手段は、決定木からなる前記モデルを生成し、
　前記属性変更手段は、生成した前記モデルに利用される前記属性の決定木における根ノードからの距離に基づいて、削除する前記属性を決定する、
情報処理装置。

（付記７）
　付記３乃至６のいずれかに記載の情報処理装置であって、
　前記モデル生成手段は、葉ノードが前記属性を含む回帰式である決定木からなる前記モデルを生成し、
　前記属性変更手段は、生成した前記モデルの前記回帰式における前記属性の係数に基づいて、削除する前記属性を決定する、
情報処理装置。

（付記８）
　付記３乃至６のいずれかに記載の情報処理装置であって、
　前記モデル生成手段は、葉ノードが前記属性を含む回帰式であり、前記葉ノード以外のノードが前記属性を含む分岐条件である決定木からなる前記モデルを生成し、
　前記属性変更手段は、生成した前記モデルの決定木における前記分岐条件及び／又は回帰式の生成に用いられた前記データの数に基づいて、削除する前記属性を決定する、
情報処理装置。

（付記９）
　付記３乃至８のいずれかに記載の情報処理装置であって、
　前記属性変更手段は、生成した前記モデルに利用される複数の前記属性同士の関連度合いに基づいて、前記複数の属性のうち少なくとも１つを削除する、
情報処理装置。

（付記１０）
　付記２乃至９のいずれかに記載の情報処理装置であって、
　前記属性変更手段は、予め設定された基準により制御不可能な前記属性を削除する、
情報処理装置。

（付記１０．１）
　付記１乃至１０のいずれかに記載の情報処理装置であって、
　前記モデル生成手段は、前記属性を利用したモデルを複数生成し、
　前記属性変更手段は、生成した複数の前記モデルにおける前記属性の利用状況に基づいて、削除する前記属性を決定して当該属性を削除する、
情報処理装置。

（付記１０．２）
　請求項１０．１に記載の情報処理装置であって、
　前記属性変更手段は、生成した複数の前記モデルをそれぞれ予め設定された方法で評価し、当該各モデルの評価結果に応じた重みを当該各モデルに設定して、当該各モデルにおける前記属性の利用状況と当該各モデルに設定された前記重みとに基づいて、削除する前記属性を決定して当該属性を削除する、
情報処理装置。

（付記１１）
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成し、
　生成した前記モデルに基づいて、モデル生成に使用する前記属性を変更し、
　さらに、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
情報処理方法。

（付記１１．１）
　付記１１に記載の情報処理方法であって、
　生成した前記モデルに基づいて、当該モデルに利用されている前記属性のうち少なくとも１つの属性を削除し、
　削除された前記属性とは異なる他の前記属性からなるデータに基づいて、新たなモデルを生成する、
情報処理方法。

（付記１１．２）
　付記１１又は１１．１に記載の情報処理方法であって、
　生成した前記モデルにおける前記属性の利用状況に基づいて、削除する前記属性を決定して当該属性を削除する、
情報処理装置。

（付記１１．３）
　付記１１．２に記載の情報処理方法であって、
　生成した前記モデルにおける前記属性の利用状況に基づいて前記モデルに対する予め設定された基準による前記属性の影響度合いを算出し、当該影響度合いが高い前記属性を削除する、
情報処理方法。

（付記１１．４）
　付記１１．２又は１１．３に記載の情報処理方法であって、
　前記モデルを生成する際に、同一の前記属性からなるデータに基づいて、前記モデルを複数回生成し、
　生成した複数の前記モデルに利用される前記属性の数に基づいて、削除する前記属性を決定する、
情報処理装置。

（付記１１．５）
　付記１１．２乃至１１．４のいずれかに記載の情報処理方法であって、
　前記モデルを生成する際に、決定木からなる前記モデルを生成し、
　生成した前記モデルに利用される前記属性の決定木における根ノードからの距離に基づいて、削除する前記属性を決定する、
情報処理方法。

（付記１１．６）
　付記１１．２乃至１１．５のいずれかに記載の情報処理方法であって、
　前記モデルを生成する際に、葉ノードが前記属性を含む回帰式である決定木からなる前記モデルを生成し、
　生成した前記モデルの前記回帰式における前記属性の係数に基づいて、削除する前記属性を決定する、
情報処理方法。

（付記１１．７）
　付記１１．２乃至１１．６のいずれかに記載の情報処理装置であって、
　前記モデルを生成する際に、葉ノードが前記属性を含む回帰式であり、前記葉ノード以外のノードが前記属性を含む分岐条件である決定木からなる前記モデルを生成し、
　生成した前記モデルの決定木における前記分岐条件及び／又は回帰式の生成に用いられた前記データの数に基づいて、削除する前記属性を決定する、
情報処理装置。

（付記１１．８）
　付記１１．２乃至１１．７のいずれかに記載の情報処理方法であって、
　生成した前記モデルに利用される複数の前記属性同士の関連度合いに基づいて、前記複数の属性のうち少なくとも１つを削除する、
情報処理方法。

（付記１１．９）
　付記１１．１乃至１１．８のいずれかに記載の情報処理方法であって、
　予め設定された基準により制御不可能な前記属性を削除する、
情報処理方法。

（付記１２）
　情報処理装置に、
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成し、
　生成した前記モデルに基づいて、モデル生成に使用する前記属性を変更し、
　さらに、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
処理を実行させるためのプログラム。

　なお、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。

　なお、本発明は、日本国にて２０１８年３月２８日に特許出願された特願２０１８－０６２０９３の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。

１０　情報処理装置
１１　属性選択部
１２　モデル生成部
１３　属性スコア算出部
１５　データ記憶部
１６　モデル記憶部
１００　情報処理装置
１１０　モデル生成手段
１２０　属性変更手段

Claims

　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成するモデル生成手段と、
　生成した前記モデルに基づいて、モデル生成に利用する前記属性を変更する属性変更手段と、を備え、
　前記モデル生成手段は、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
情報処理装置。
　請求項１に記載の情報処理装置であって、
　前記属性変更手段は、生成した前記モデルに基づいて、当該モデルに利用されている前記属性のうち少なくとも１つの属性を削除し、
　前記モデル生成手段は、削除された前記属性とは異なる他の前記属性からなるデータに基づいて、新たなモデルを生成する、
情報処理装置。
　請求項１又は２に記載の情報処理装置であって、
　前記属性変更手段は、生成した前記モデルにおける前記属性の利用状況に基づいて、削除する前記属性を決定して当該属性を削除する、
情報処理装置。
　請求項３に記載の情報処理装置であって、
　前記属性変更手段は、生成した前記モデルにおける前記属性の利用状況に基づいて前記モデルに対する予め設定された基準による前記属性の影響度合いを算出し、当該影響度合いが高い前記属性を削除する、
情報処理装置。
　請求項３又は４に記載の情報処理装置であって、
　前記モデル生成手段は、同一の前記属性からなるデータに基づいて、前記モデルを複数回生成し、
　前記属性変更手段は、生成した複数の前記モデルに利用される前記属性の数に基づいて、削除する前記属性を決定する、
情報処理装置。
　請求項３乃至５のいずれかに記載の情報処理装置であって、
　前記モデル生成手段は、決定木からなる前記モデルを生成し、
　前記属性変更手段は、生成した前記モデルに利用される前記属性の決定木における根ノードからの距離に基づいて、削除する前記属性を決定する、
情報処理装置。
　請求項３乃至６のいずれかに記載の情報処理装置であって、
　前記モデル生成手段は、葉ノードが前記属性を含む回帰式である決定木からなる前記モデルを生成し、
　前記属性変更手段は、生成した前記モデルの前記回帰式における前記属性の係数に基づいて、削除する前記属性を決定する、
情報処理装置。
　請求項３乃至６のいずれかに記載の情報処理装置であって、
　前記モデル生成手段は、葉ノードが前記属性を含む回帰式であり、前記葉ノード以外のノードが前記属性を含む分岐条件である決定木からなる前記モデルを生成し、
　前記属性変更手段は、生成した前記モデルの決定木における前記分岐条件及び／又は回帰式の生成に用いられた前記データの数に基づいて、削除する前記属性を決定する、
情報処理装置。
　請求項３乃至８のいずれかに記載の情報処理装置であって、
　前記属性変更手段は、生成した前記モデルに利用される複数の前記属性同士の関連度合いに基づいて、前記複数の属性のうち少なくとも１つを削除する、
情報処理装置。
　請求項２乃至９のいずれかに記載の情報処理装置であって、
　前記属性変更手段は、予め設定された基準により制御不可能な前記属性を削除する、
情報処理装置。
　請求項１乃至１０のいずれかに記載の情報処理装置であって、
　前記モデル生成手段は、前記属性を利用したモデルを複数生成し、
　前記属性変更手段は、生成した複数の前記モデルにおける前記属性の利用状況に基づいて、削除する前記属性を決定して当該属性を削除する、
情報処理装置。
　請求項１１に記載の情報処理装置であって、
　前記属性変更手段は、生成した複数の前記モデルをそれぞれ予め設定された方法で評価し、当該各モデルの評価結果に応じた重みを当該各モデルに設定して、当該各モデルにおける前記属性の利用状況と当該各モデルに設定された前記重みとに基づいて、削除する前記属性を決定して当該属性を削除する、
情報処理装置。
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成し、
　生成した前記モデルに基づいて、モデル生成に使用する前記属性を変更し、
　さらに、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
情報処理方法。
　請求項１３に記載の情報処理方法であって、
　生成した前記モデルに基づいて、当該モデルに利用されている前記属性のうち少なくとも１つの属性を削除し、
　削除された前記属性とは異なる他の前記属性からなるデータに基づいて、新たなモデルを生成する、
情報処理方法。
　請求項１３又は１４に記載の情報処理方法であって、
　生成した前記モデルにおける前記属性の利用状況に基づいて、削除する前記属性を決定して当該属性を削除する、
情報処理装置。
　請求項１５に記載の情報処理方法であって、
　生成した前記モデルにおける前記属性の利用状況に基づいて前記モデルに対する予め設定された基準による前記属性の影響度合いを算出し、当該影響度合いが高い前記属性を削除する、
情報処理方法。
　請求項１５又は１６に記載の情報処理方法であって、
　前記モデルを生成する際に、同一の前記属性からなるデータに基づいて、前記モデルを複数回生成し、
　生成した複数の前記モデルに利用される前記属性の数に基づいて、削除する前記属性を決定する、
情報処理装置。
　請求項１５乃至１７のいずれかに記載の情報処理方法であって、
　前記モデルを生成する際に、決定木からなる前記モデルを生成し、
　生成した前記モデルに利用される前記属性の決定木における根ノードからの距離に基づいて、削除する前記属性を決定する、
情報処理方法。
　請求項１５乃至１８のいずれかに記載の情報処理方法であって、
　前記モデルを生成する際に、葉ノードが前記属性を含む回帰式である決定木からなる前記モデルを生成し、
　生成した前記モデルの前記回帰式における前記属性の係数に基づいて、削除する前記属性を決定する、
情報処理方法。
　請求項１５乃至１９のいずれかに記載の情報処理装置であって、
　前記モデルを生成する際に、葉ノードが前記属性を含む回帰式であり、前記葉ノード以外のノードが前記属性を含む分岐条件である決定木からなる前記モデルを生成し、
　生成した前記モデルの決定木における前記分岐条件及び／又は回帰式の生成に用いられた前記データの数に基づいて、削除する前記属性を決定する、
情報処理装置。
　請求項１５乃至２０のいずれかに記載の情報処理方法であって、
　生成した前記モデルに利用される複数の前記属性同士の関連度合いに基づいて、前記複数の属性のうち少なくとも１つを削除する、
情報処理方法。
　請求項１４乃至２１のいずれかに記載の情報処理方法であって、
　予め設定された基準により制御不可能な前記属性を削除する、
情報処理方法。
　情報処理装置に、
　複数の属性からなるデータに基づいて、前記属性を利用したモデルを生成し、
　生成した前記モデルに基づいて、モデル生成に使用する前記属性を変更し、
　さらに、変更された前記属性からなるデータに基づいて、新たなモデルを生成する、
処理を実行させるためのプログラム。