WO2016147654A1

WO2016147654A1 - ルール生成装置、ルール生成方法及びルール生成プログラムを記憶する記録媒体

Info

Publication number: WO2016147654A1
Application number: PCT/JP2016/001456
Authority: WO
Inventors: 圭介梅津
Original assignee: 日本電気株式会社
Priority date: 2015-03-18
Filing date: 2016-03-15
Publication date: 2016-09-22
Also published as: JPWO2016147654A1

Abstract

　必要な性能に応じてルールを選択できるように、事象の発生を判定するルールを生成することができるルール生成装置を提供する。　本発明の一態様に係るルール生成装置は、事象を説明する１つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、を備える。

Description

ルール生成装置、ルール生成方法及びルール生成プログラムを記憶する記録媒体

　本発明は、ルールを生成する技術に関し、特に、判定に使用するルールを生成する技術に関する。

　ルールを生成する技術の例が、例えば特許文献１によって開示されている。

　特許文献１には、ルールを用いて異常兆候の有無を推論する異常兆候検出システムが記載されている。特許文献１におけるルールは、属性値の組み合わせに関連付けられる結論部によって表される。特許文献１の異常兆候検出システムは、事例データを使用して、ルールを生成する。

特開平１０－１８７４５２号公報

　特許文献１の異常兆候検出システムが生成するルールは１種類である。従って、特許文献１の技術では、性能によってルールを選択することはできない。

　本発明の目的の１つは、必要な性能に応じてルールを選択できるように、事象の発生を判定するルールを生成することができるルール生成装置を提供することにある。

　本発明の一態様に係るルール生成装置は、事象を説明する１つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、を備える。

　本発明の一態様に係るルール生成方法は、事象を説明する１つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成し、生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出する。

　本発明の一態様に係るルール生成プログラムは、コンピュータを、事象を説明する１つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、して動作させる。

　本発明には、必要な性能に応じてルールを選択できるように、事象の発生を判定するルールを生成することができるという効果がある。

図１は、本発明の第１、第２、第３の実施形態の判定システムの構成の例を表すブロック図である。図２は、本発明の第１の実施形態の予測モデル記憶部が記憶する、予測モデルの例を模式的に表す図である。図３は、異種混合学習に基づく予測モデルを模式的に表す図である。図４は、本発明の第１の実施形態の予測モデル記憶部が記憶する、異種混合学習に基づく木構造によって表される予測モデルを模式的に表す図である。図５は、本発明の第１の実施形態の予測モデル記憶部が記憶する、異種混合学習に基づく木構造によって表される予測モデルを模式的に表す図である。図６は、本発明の第１の実施形態のパラメータ記憶部が記憶するパラメータの例を模式的に表す図である。図７は、本発明の第１の実施形態のパラメータ記憶部が記憶するパラメータの他の例を模式的に表す図である。図８は、本発明の第１の実施形態のサンプルデータ記憶部が記憶するサンプルの例を模式的に表す図である。図９は、本発明の第１の実施形態のルール提示部が提示する指標値の例を模式的に表す図である。図１０は、統合ルールによる判定結果から算出された指標値の例を模式的に表す図である。図１１は、本発明の第１の実施形態の判定システムの動作の例を表すフローチャートである。図１２は、本発明の第１、第２、第３の実施形態の判定システムの動作の例を表すフローチャートである。図１３は、本発明の第２の実施形態の判定システムの動作の例を表すフローチャートである。図１４は、本発明の第３の実施形態の判定システムの動作の例を表すフローチャートである。図１５は、本発明の第３の実施形態の判定システムの動作の他の例を表すフローチャートである。図１６は、本発明の第４の実施形態のルール生成システムの構成の例を表すブロック図である。図１７は、本発明の各実施形態に係るルール生成装置を実現することができるコンピュータの、ハードウェア構成の一例を表す図である。図１８は、回路によって実装された、本発明の第１、第２、及び第３の実施形態の判定システムの構成の例を表すブロック図である。図１９は、回路によって実装された、本発明の第４の実施形態のルール生成システムの構成の例を表すブロック図である。図２０は、本発明の第４の実施形態のルール生成システムの動作の例を表すフローチャートである。

　次に、本発明の実施形態について図面を参照して詳細に説明する。

　＜第１の実施形態＞
　まず、本発明の第１の実施形態について図面を参照して詳細に説明する。

　図１は、本実施形態の判定システム１の構成の例を表すブロック図である。

　図１を参照すると、本実施形態の判定システム１は、ルール生成装置１０と、学習装置２０と、端末装置３０と、判定装置４０とを含む。ルール生成装置１０は、学習装置２０、端末装置３０、及び判定装置４０のそれぞれと、通信可能に接続されている。なお、図１及び他の図において、データ等が送信される方向は、図に示されている矢印の方向に限定されない。

　ルール生成装置１０は、ルール生成部１０１と、ルール評価部１０２と、ルール提示部１０３と、予測モデル記憶部１０４と、パラメータ記憶部１０５と、サンプルデータ記憶部１０６と、予測モデル送受信部１０７と、パラメータ受信部１０８と、ルール送信部１０９とを含む。

　予測モデル記憶部１０４は、予測モデルを記憶する。予測モデル記憶部１０４が記憶する予測モデルは、例えば、目的変数と、その目的変数を説明する説明変数との関係によって表される。本実施形態の予測モデル記憶部１０４に格納されている予測モデルでは、目的変数は、例えば、所定の対象に関する事象が発生する可能性の程度等の、対象の事象に関する変数を表す。説明変数は、例えば、対象又は環境などにおける、例えば、状況、性質、属性、又は、測定結果などの、対象に関する事象に影響がある変数を表す。本実施形態では、説明変数の値は、数値によって表される。説明変数の値が、例えば説明変数が天気である場合における説明変数の値である「晴れ」や「雨」のように、数値ではない値である場合、例えば判定システム１の設計者によって、それらの数値ではない値にあらかじめ数値が割り当られていればよい。

　対象は、例えば、顧客である。事象は、例えば、顧客が販促に反応することである。販促は、例えば、ダイレクトメール（例えば郵便物又は電子メール）、又は、インターネット広告などによる報知である。販促への反応は、例えば、商品の購入、来店、イベントなどへの参加、広告サイトへのアクセスなどである。この場合、説明変数は、例えば、それぞれの顧客の、過去の反応回数、過去の反応において使用した金額、最後の反応からの経過日数、住所、年齢、性別、及び、休日情報等である。

　対象は、例えば、商品需要予測、電力需要予測、又は来店数予測などの対象である日であってもよい。そして、事象は、例えば、行われた商品需要予測、電力需要予測、又は来店数予測などが大きく外れることであってもよい。この場合、説明変数は、過去の実績値、気象（例えば、天気、気温、降水量など）、休日情報、イベント開催日の情報、キャンペーン開催日の情報などである。過去の実績値は、例えば、過去の所定期間内における毎日の、商品需要の値、電力需要の値、又は、来店数の値などである。

　対象は、例えば、電子メールであってもよい。そして、事象は、電子メールが迷惑メール（例えばジャンクメール）であることである。この場合、説明変数は、特定の単語の有無、特定の単語の登場回数、特定の単語の組の共起の有無、特定の単語の共起回数等である。

　対象は、例えば、契約しているユーザであってもよい。そして、事象は、例えば、ユーザが所定期間内に解約することであってもよい。この場合、説明変数は、住所、性別、年齢、契約期間、過去の所定期間におけるサービスの利用頻度などである。

　対象は、例えば、使用されると劣化する部品であってもよい。対象は、例えば、使用されると摩耗するタイヤであってもよい。事象は、部品が所定期間内に所定の基準より摩耗することである。この場合、説明変数は、部品使用回数、部品使用期間、部品への負荷などである。

　対象は、例えば、故障する可能性がある部品であってもよい。事象は例えば、部品が所定期間内に故障することであってもよい。この場合、説明変数は、部品使用回数、部品使用期間、部品への負荷などである。

　以下では、具体例について説明する場合、主に、対象が顧客であり、事象が、顧客が販促に反応することである場合における例について説明する。

　上述のように、予測モデル記憶部１０４が記憶する予測モデルは、例えば、事象に関する変数である目的変数と、目的変数を説明する変数である説明変数との間の関係を表す。予測モデルが、例えば、重回帰分析に基づく予測モデルである場合、予測モデルは、説明変数の一次多項式（すなわち重回帰式）によって表される。すなわち、予測モデルは、説明変数の識別子（以下説明変数ＩＤ（Ｉｄｅｔｉｆｉｃａｔｉｏｎ）と表記）とその説明変数の係数の大きさとの、複数の組み合わせによって表される。

　図２は、予測モデル記憶部１０４が記憶する、予測モデルの例を模式的に表す図である。図２に示す予測モデルの例は、重回帰分析に基づく予測モデルである。図２に示す例では、説明変数ＩＤは「説明変数名」である。図２に示す例では、説明変数は、販促に反応した回数である「回数」、過去の販促への反応において使用した金額である「金額」、及び、最後の反応から経過した日数である「経過日数」等である。

　予測モデルが、異種混合学習に基づく予測モデルである場合、予測モデルは、葉ノードに重回帰式が割り当てられ、葉ノード以外のノードに説明変数の条件式が割り当てられている木構造によって表される。すなわち、異種混合学習に基づく予測モデルは、根ノードから葉ノードまでの経路に含まれるノードに割り当てられている、説明変数の条件式と重回帰式との組によって表される。本実施形態の説明では、根ノードから葉ノードまでの１つの経路が、１つの予測モデルを表す。

　図３は、異種混合学習に基づく予測モデルを模式的に表す図である。図３において、条件１及び条件２は、それぞれ、いずれかの説明変数に関する条件式である。予測式１、予測式２、及び予測式３は、説明変数の一次多項式（すなわち、上述のように、重回帰式）である。以下の説明では、予測モデルの少なくとも一部を表す重回帰式を、「予測式」とも表記する。例えば、条件１がＦａｌｓｅであり、条件２がＴｒｕｅである場合における予測モデルは、「条件１がＦａｌｓｅ」、「条件２がＴｒｕｅ」、及び、「予測式１」によって表される。条件１がＦａｌｓｅであり、条件２がＦａｌｓｅである場合における予測モデルは、「条件１がＦａｌｓｅ」、「条件２がＦａｌｓｅ」、及び、「予測式２」によって表される。条件１がＴｒｕｅである場合における予測モデルは、「条件１がＴｒｕｅ」、及び、「予測式３」によって表される。図３に示す木構造は、３つの予測モデルを表す。

　図４及び図５は、予測モデル記憶部１０４が記憶する、異種混合学習に基づく木構造によって表される予測モデルを模式的に表す図である。

　図４は、木構造と、葉ノード以外のノードにおける条件式を表す。図４において「ノード番号」は、ノード番号である。「葉ノード」は、ノード番号によって特定されるノードが、葉ノードであるか否かを表す。図４に示す例では、「葉ノード」の値が１であるノードは、葉ノードである。「葉ノード」の値が０であるノードは、葉ノードではない。また、「説明変数」及び「閾値」が、条件式を表す。「説明変数」は、説明変数ＩＤ（図４に示す例では説明変数名）をである。「閾値」は、説明変数の値についての閾値である。例えば、ノード番号が１であるノード（図３におけるノード１）における条件式（図３における条件１）は、説明変数「回数」が、閾値「５」より小さいことを表す式である。ノード番号が２であるノード（図３におけるノード２）における条件式（図３における条件２）は、説明変数「金額」が閾値「１００００（円）」より小さいことを表す式である。

　図４に例示する「説明変数」及び「閾値」は、「説明変数」の値が「閾値」の値より小さい場合、値がＴｒｕｅである条件式を表す。「次ノード番号（閾値より小）」は、説明変数の値が閾値より小さい場合（すなわち条件式がＴｒｕｅである場合）における、次のノードの番号である。「次ノード番号（閾値以上）」は、説明変数の値が閾値より小さくない場合（すなわち条件式がＦａｌｓｅである場合）における、次のノードの番号である。木構造は、葉ノード以外のノードの「次ノード番号（閾値より小）」及び「次ノード番号（閾値以上）」によって表される。

　図５は、葉ノードにおける予測式を表す。「ノード番号」は葉ノードのノード番号である。「説明変数名」は、図５に示す例では説明変数の名称である、説明変数ＩＤである。「係数」は、予測式における説明変数の係数の値である。図５に示す例では、ノード番号と、説明変数名と、係数とが関連付けられている。同じノード番号に関連付けられている、説明変数名と係数とが、そのノード番号によって特定される葉ノードにおける予測式を表す。

　予測モデル記憶部１０４は、予測モデル全体を記憶するのではなく、予測モデル毎に、予測モデルに含まれる説明変数の説明変数ＩＤを記憶していてもよい。以下の説明において、説明変数ＩＤを記憶することを、説明変数を記憶するとも表記する。

　予測モデル送受信部１０７は、学習装置２０から予測モデルを受信する。予測モデル送受信部１０７は、受信した予測モデルを、予測モデル記憶部１０４に格納する。予測モデル送受信部１０７は、さらに、予測モデル記憶部１０４に格納されている予測モデルを、端末装置３０に送信してもよい。

　端末装置３０は、予測モデルを受信し、受信した予測モデルを表示してもよい。そして、例えば端末装置３０を操作するルール生成装置１０のユーザが、予測モデルに含まれる説明変数毎に、後述される「カテゴリ数」及び「閾値数」を設定してもよい。その場合、端末装置３０は、設定された「カテゴリ数」及び「閾値数」を、ルール生成装置１０のパラメータ受信部１０８に送信する。

　パラメータ受信部１０８は、端末装置３０から「カテゴリ数」及び「閾値数」を受信する。パラメータ受信部１０８は、受信した「カテゴリ数」及び「閾値数」をパラメータ記憶部１０５に格納する。

　パラメータ記憶部１０５は、ルールの生成に関するパラメータを記憶する。具体的には、パラメータ記憶部１０５は、予測モデル記憶部１０４に格納されている予測モデルに含まれる説明変数の各々について、値域の分割に使用されるパラメータを記憶する。値域は、例えば、３つ以上の範囲に分割される。以下では、値域が３つ以上の範囲に分割される場合における範囲の数を、「カテゴリ数」と表記する。値域は、例えば、閾値によって２つの領域に分割される。値域は、異なる複数の閾値のそれぞれによって、２つの領域に分割されてもよい。以下では、値域を２つの領域に分割する閾値の数を「閾値数」と表記する。パラメータ記憶部１０５は、説明変数の各々についてのパラメータとして、カテゴリ数及び閾値数を記憶していてもよい。

　パラメータ記憶部１０５は、予測モデル記憶部１０４に格納されている予測モデルに含まれる説明変数の各々について、上限値及び下限値を記憶していてもよい。上限値及び下限値は、例えば、値域を３つ以上の範囲に分割する場合における、範囲の境界の上限値及び下限値であってもよい。上限値及び下限値は、複数の閾値の各々によって値域を２つの領域に場合における、閾値の上限値及び下限値であってもよい。パラメータ記憶部１０５は、説明変数の各々についてのパラメータとして、上限値及び下限値を含んでいてもよい。

　図６は、パラメータ記憶部１０５が記憶するパラメータの例を模式的に表す図である。図６に示すパラメータは、説明変数毎のカテゴリ数と閾値数とを含む。

　図７は、パラメータ記憶部１０５が記憶するパラメータの他の例を模式的に表す図である。図７に示すパラメータは、説明変数毎の、カテゴリ数と、閾値数と、上限と、下限とを含む。図７の上限は、説明変数の値域が領域の境界を表す値の上限であり、説明変数の値域を２つの範囲に分割する閾値の上限である。同様に、図７の下限は、説明変数の値域が領域の境界を表す値の下限であり、説明変数の値域を２つの範囲に分割する閾値の下限である。図７に示す例では、説明変数の値域が領域の境界を表す値の上限は、説明変数の値域を２つの範囲に分割する閾値の上限と同じである。しかし、説明変数の値域が領域の境界を表す値の上限は、説明変数の値域を２つの範囲に分割する閾値の上限と異なっていてもよい。また、説明変数の値域が領域の境界を表す値の下限は、説明変数の値域を２つの範囲に分割する閾値の下限と同じである。しかし、説明変数の値域が領域の境界を表す値の下限は、説明変数の値域を２つの範囲に分割する閾値の下限と異なっていてもよい。

　ルール生成部１０１は、パラメータ記憶部１０５に格納されているパラメータをもとに、予測モデル記憶部１０４に格納されている説明変数の値域を複数の値の範囲（以下、単に「範囲」とも表記）に分割する。そして、ルール生成部１０１は、説明変数の値域を分割することによって得られる範囲をもとに、その説明変数に関するルール要素を生成する。

　説明変数に関するルール要素は、例えば、その説明変数の値に関する条件式で表され、その条件式が満たされれば真であり、その条件式が満たされなければ偽である。値の範囲に基づく説明変数に関するルール要素は、例えば、その説明変数の値がその値の範囲に含まれる場合に真であり、それ以外の場合に偽である条件式である。ルール生成部１０１は、説明変数の値域を分割することによって得られる範囲の各々について、ルール要素を生成する。以下、値域の分割とルール要素の生成について、さらに詳しく説明する。

　説明変数のカテゴリ数として、３以上の値（以下Ｃと表記）が設定されている場合、ルール生成部１０１は、その説明変数の値域をＣ個の領域に分割する。以下の説明では、説明変数の値域をカテゴリ数と同じ個数の範囲に分割することを、カテゴリ数に基づく分割とも表記する。ルール生成部１０１は、例えば、上述の上限と下限とを範囲の境界に設定し、さらに、設定した境界によって区切られた範囲の数がＣ個になるように、上限と下限との間に等間隔で範囲の境界を設定すればよい。ルール生成部１０１は、設定された境界によって地域を分割することにより、Ｃ個の範囲を生成する。ルール生成部１０１は、生成した範囲のそれぞれについて、説明変数がその範囲に含まれるというルール要素を生成する。

　例えば説明変数の１つである説明変数Ａのカテゴリ数が３である場合、ルール生成部１０１は、説明変数Ａの値域を、３つの範囲に分割する。例えば、上述の上限と下限との間に、範囲が３つになるように、１つの、範囲の境界を設定する。例えば、説明変数Ａが説明変数「回数」であり、上限が１０であり、下限が２である場合、ルール生成部１０１は、上限である１０と下限である２とを、範囲の境界に設定する。その場合、説明変数「回数」の値域は、２回未満、２回以上１０回未満、及び、１０回以上の３つの範囲に区切られる。すなわち、３つの範囲が生成される。この場合、ルール生成部１０１は、カテゴリ数である３と同数の範囲が設定されているため、上限と下限との間に範囲の境界を設定しない。そして、ルール生成部１０１は、説明変数「回数」に関するルールとして、「回数が２回未満である」、「回数が２回以上１０回未満である」、及び、「回数が１０回以上である」の２つのルール要素を生成する。

　説明変数のカテゴリ数が１である場合、そのカテゴリ数は、説明変数の値域が分割されないことを表す。その場合、ルール生成部１０１は、その説明変数について、カテゴリ数に基づくルール要素を生成しなくてよい。説明変数のカテゴリ数が２である場合、そのカテゴリ数は、説明変数の値域が１個の値によって分割されることを表す。その場合、上限と下限とが同じ値であれば、ルール生成部１０１は、同一の値である上限及び下限を、範囲の境界に設定してもよい。上限と下限が異なる場合、ルール生成部１０１は、例えば上限と下限との平均を、範囲の境界に設定してもよい。

　以上の説明では、ルール生成部１０１は、範囲の境界を等間隔に設定する。しかし、ルール生成部１０１は、説明変数の値の対数について範囲の境界が等間隔であるように、範囲の境界を設定してもよい。ルール生成部１０１は、あらかじめ決められている、範囲の境界を設定する他の方法に従って、範囲の境界を設定してもよい。

　説明変数の閾値数として２以上の値（以下、Ｔと表記）が設定されている場合、ルール生成部１０１は、異なるＴ個の閾値を設定する。上限と下限とが異なる場合、ルール生成部１０１は、上限及び下限をそれぞれ閾値に設定する。さらに、ルール生成部１０１は、閾値の数がＴ個になるように、上限と下限との間に、例えば等間隔で閾値を設定する。そして、ルール生成部１０１は、異なるＴ個の閾値の各々について、その閾値を使用して、その説明変数の値域を２つの範囲に分割する。そして、ルール生成部１０１は、異なるＴ個の閾値の各々について、説明変数の値域が２つに分割することによって生成された２つの範囲のうち、あらかじめ定められた少なくともいずれか一方の範囲をもとに、ルール要素を生成する。ルール生成部１０１は、例えば、閾値以上の範囲をもとに、説明変数に関するルール要素として、「その説明変数の値が閾値以上である」というルール要素を生成してもよい。ルール生成部１０１は、例えば、閾値未満の範囲をもとに、説明変数に関するルール要素として、「その説明変数の値が閾値未満である」というルール要素を生成してもよい。ルール生成部１０１は、例えば、閾値以上の範囲をもとに「説明変数の値が閾値以上である」というルール要素を生成し、加えて、閾値未満の範囲をもとに「その説明変数の値が閾値未満である」というルール要素を生成してもよい。以下、閾値以上の範囲をもとに生成されたルール要素のグループを「第１要素グループ」と表記する。以下、閾値未満の範囲をもとに生成されたルール要素のグループを「第２要素グループ」と表記する。

　例えば、説明変数「回数」の閾値数が３である場合、ルール生成部１０１は、３つの閾値を設定する。上限と下限とが異なる場合、ルール生成部１０１は、上限及び下限をそれぞれ閾値に設定する。ルール生成部１０１は、さらに、閾値の数が３になるように、上限と下限との間に等間隔で閾値を設定する。上限が１０回であり、下限が２回である場合、ルール生成部１０１は、上限である１０回と、下限である２回を閾値に設定する。さらにルール生成部１０１は、閾値の数が３つであるように、上限と下限との間に、例えば等間隔で閾値を設定する。その場合、ルール生成部１０１は、閾値として６回を設定する。

　ルール生成部１０１は、生成した閾値の各々をもとに、ルール要素を設定する。閾値が２回、６回、及び１０回である場合、ルール生成部１０１は、説明変数「回数」について、例えば、「回数が２回以上である」、「回数が６回以上である」、及び「回数が１０回以上である」というルール要素を生成する。この場合、上述の第１要素グループは、「回数が２回以上である」、「回数が６回以上である」、及び「回数が１０回以上である」というルール要素のグループである。

　ルール生成部１０１は、説明変数「回数」について、例えば、「回数が２回未満である」、「回数が６回未満である」、及び「回数が１０回未満である」というルール要素を生成してもよい。この場合、上述の第２要素グループは、「回数が２回未満である」、「回数が６回未満である」、及び「回数が１０回未満である」というルール要素のグループである。ルール生成部１０１は、第１要素グループのルール要素に加えて第２要素グループのルール要素を生成してもよい。

　以上の説明では、ルール生成部１０１は、上限と下限との間で閾値が等間隔になるように、閾値を設定する。しかし、ルール生成部１０１は、閾値の対数について閾値が等間隔であるように、閾値を設定してもよい。ルール生成部１０１は、あらかじめ決められている、閾値を設定する他の方法に従って、閾値を設定してもよい。

　さらに、ルール生成部１０１は、予測モデルに含まれるそれぞれの説明変数について多くて１つの生成したルール要素を含む、ルール要素の組み合わせの各々に基づいて、ルールを生成する。

　予測モデルが重回帰分析に基づく予測モデルである場合、上述のように、その予測モデルは重回帰式によって表される。予測モデルが重回帰式によって表される場合、ルール生成部１０１は、その重回帰式に含まれるそれぞれの説明変数について多くて１つの生成したルール要素を含む、ルール要素の組み合わせ毎に、ルールを生成する。

　例えば、重回帰式に説明変数Ａが含まれ、説明変数Ａについてのルール要素の数が３である場合、生成されるルールに３つのルール要素のうちいずれかが含まれるか、生成されるルールには３つのルール要素はいずれも含まれない。よって、説明変数Ａについてのルール要素の数が３である場合、説明変数Ａに関して（３＋１）通りのルールが生成される。例えば、重回帰式に説明変数Ｂが含まれ、説明変数Ｂについてのルール要素の数が２である場合、生成されるルールに２つのルール要素のうちいずれかが含まれるか、生成されるルールには２つのルール要素はいずれも含まれない。よって、説明変数Ａについてのルール要素の数が２である場合、説明変数Ａに関して（２＋１）通りのルールが生成される。
さらに、例えば、重回帰式に説明変数Ａ及び説明変数Ｂが含まれ、説明変数Ａについて生成したルール要素の数は３であり、説明変数Ｂについて生成したルール要素の数が２である場合、上述のルール要素の組み合わせの数は、（３＋１）×（２＋１）＝１２である。この場合、ルール生成部１０１は、１２個のルールを生成する。

　重回帰分析に基づく予測モデルについてのルールは、上述のルール要素の組み合わせに含まれる、全てのルール要素についての判定が真である場合に真であり、それ以外の場合に偽である条件式によって表される。上述のように、ルール要素は条件式である。重回帰分析に基づく予測モデルについてのルールは、例えば、上述のルール要素の組み合わせに含まれる、全てのルール要素の論理積によって表される。

　予測モデルが異種混合学習に基づく予測モデルである場合、予測モデルは、条件式と、重回帰式との組み合わせによって表される。具体的には、予測モデルは、予測モデルを表す木構造における根ノードから葉ノードまでの経路上のノードのうち、葉ノード以外のノードにおける条件式と、葉ノードにおける重回帰式との組み合わせによって表される。そして、上述のように、本実施形態では、根ノードから葉ノードまでの１つの経路上の１つ以上の条件式及び重回帰式が、１つの予測モデルを表す。

　この場合、ルール生成部１０１は、例えば１つの予測モデルを選択し、選択した予測モデルの葉ノードにおける重回帰式に含まれる説明変数それぞれの説明変数について多くて１つの生成したルール要素を含む、ルール要素の組み合わせを生成する。この場合のルール要素の組み合わせを生成する方法は、予測モデルが重回帰分析に基づく予測モデルである場合における、ルール要素の組み合わせを生成する方法と同様である。ルール生成部１０１は、さらに、ルール要素の組み合わせ毎に、ルール要素の組み合わせと、選択した予測モデルの条件式とに基づいて、ルールを生成する。ルール生成部１０１は、組み合わせに含まれる全てのルール要素と、選択した予測モデルの全ての条件式とが、真である場合に真であり、そうでない場合に偽であるように、ルールを生成する。具体的には、ルール生成部１０１は、ルール要素の組み合わせに含まれる全てのルール要素と、選択した予測モデルの全ての条件式との論理積を表す条件式を、ルールとして生成する。

　ルール生成部１０１は、生成したルールの各々に、ルール番号を付与する。ルール生成部１０１は、例えば、後述されるルール提示部１０３が一度に提示するルールの中で、ルールに対して一意に定まる番号を、ルール番号として付与すればよい。

　サンプルデータ記憶部１０６は、ルールの評価に使用できる、複数のサンプルを記憶する。サンプルは、個々の対象について、例えば、対象又は環境から抽出された値、対象又は環境を測定することによって得られた値、それらが変換された値などを含むデータである。サンプルは、個々の対象について、さらに、対象に関する事象が発生したか否か（すなわち正解）を特定する情報を含む。

　図８は、サンプルデータ記憶部１０６が記憶するサンプルの例を模式的に表す図である。図８において「サンプル番号」は、サンプルに付与されている番号である。図８に示す例では、サンプル番号は、サンプルを特定する識別子として使用される。そして、「説明変数名」が、説明変数の識別子として使用される。図８に示す例では説明変数名に、判別結果（正解）が含まれている。判別結果（正解）の値は、サンプル番号によって特定されるサンプルによって表される対象に関する事象が発生したか否かを表す。判別結果（正解）の値は、サンプルの作成者による判別の結果を表していてもよい。図８に示す例では、判別結果（正解）の値が１である場合、対象に関する事象が発生し、判別結果（正解）の値が０である場合、対象に関する事象は発生していない。「値」は、説明変数の値である。

　例えば、対象は顧客であり、事象は顧客が販促に反応することである場合、判別結果（正解）が１であるサンプルは、販促に反応した顧客のデータである。

　ルール評価部１０２は、ルール生成部１０１が生成したルールの各々に対して、サンプルデータ記憶部１０６に格納されているサンプルを使用して、対象に関する事象が発生するか否かを判定する性能の評価を行う。

　ルール評価部１０２は、まず、ルールが表す評価式の値と、そのルールによる判定の結果との関係を設定する。具体的には、ルール評価部１０２は、ルールが表す評価式の値が真である場合における、そのルールによる判定の結果が、対象に関する事象が発生することを表すのか、対象に関する事象が発生しないことを表すのかを設定する。さらに、ルール評価部１０２は、ルールが表す評価式の値が偽である場合における、そのルールによる判定の結果を、その評価式の値が真である場合のそのルールの判定の結果として設定されなかった判定の結果に設定する。以下の説明では、ルールが表す評価式の値と、そのルールによる判定の結果との関係を、「判定種別」と表記する。

　ルール評価部１０２は、例えば、評価式の値が真である場合における、その評価式が表すルールによる判定の結果を、対象に関する事象が発生することを表すように設定する。その場合、ルール評価部１０２は、その評価式の値が偽である場合、そのルールによる判定の結果を、対象に関する事象が発生しないことを表すように設定する。以下の説明では、以上のように設定された、評価式の値と判定の結果との関係を、「第１の判定種別」と表記する。

　このケースでは、例えば、対象は顧客であり、事象は顧客が販促に反応することである場合、サンプルに関する評価式の値が真であれば、そのサンプルが得られた顧客は、販促に反応することを表す。また、サンプルに関する評価式が偽であれば、そのサンプルが得られた顧客は、販促に反応しないことを表す。

　ルール評価部１０２は、例えば、評価式の値が偽である場合における、その評価式が表すルールによる判定の結果を、対象に関する事象が発生することを表すように設定してもよい。その場合、ルール評価部１０２は、その評価式の値が真である場合、そのルールによる判定の結果を、対象に関する事象が発生しないことを表すように設定してもよい。以下の説明では、以上のように設定された、評価式の値と判定の結果との関係を、「第２の判定種別」と表記する。

　このケースでは、例えば、対象は顧客であり、事象は顧客が販促に反応することである場合、サンプルに関する評価式の値が真であれば、そのサンプルが得られた顧客は、販促に反応しないことを表す。また、サンプルに関する評価式が偽であれば、そのサンプルが得られた顧客は、販促に反応することを表す。

　以下、ルール評価部１０２において、ルールが表す評価式が真である場合におけるそのルールによる判定の結果は、対象に関する事象が発生することを表すよう設定されている場合について説明する。そして、以下の説明において、ルールが表す評価式が真である場合の、そのルールによる判定の結果を、「正（Ｐｏｓｉｔｉｖｅ）」と表記する。さらに、ルールが表す評価式が偽である場合の、そのルールによる判定の結果を、「負（Ｎｅｇａｔｉｖｅ）」と表記する。その場合、正（Ｐｏｓｉｔｉｖｅ）は、対象に関する事象が発生することを表す。さらに、負（Ｎｅｇａｔｉｖｅ）は、対象に関する事象が発生しないことを表す。

　例えば、対象は顧客であり、事象は顧客が販促に反応することである場合、Ｐｏｓｉｔｉｖｅは、顧客が販促に反応することを表す。さらに、Ｎｅｇａｔｉｅは、顧客が販促に反応しないことを表す。

　ルール評価部１０２は、説明変数の値が、サンプルに含まれる説明変数の値である場合に、ルールを表す評価式が真であるか偽であるかを判定する。そして、ルール評価部１０２は、判定の結果と、サンプルデータ記憶部１０６に格納されているサンプルの、判別結果（正解）の値とを比較する。以下、判別結果（正解）の値を、単に「正解」とも表記する。ルール評価部１０２は、例えばあらかじめ決められている数のサンプルについて判定、及び、判定の結果と判別結果（正解）との比較を行う。そして、ルール評価部１０２は、それぞれのルールについて、判定の結果と正解との比較の結果に基づいて、例えば以下に示す、ルールに基づく判別の性能を表す指標値を算出する。ルール評価部１０２は、以下に示す少なくともいずれかの指標値の代わりに、ルールに基づく判別の性能を表す他の指標値を算出してもよい。ルール評価部１０２は、以下に示す指標値に加えて、ルールに基づく判別の性能を表す他の指標値を算出してもよい。

　（１）Ｔｒｕｅ　Ｐｏｓｉｔｉｖｅ（以下、「ＴＰ」とも表記）
　（２）Ｆａｌｓｅ　Ｐｏｓｉｔｉｖｅ（以下、「ＦＰ」とも表記）
　（３）Ｔｒｕｅ　Ｎｅｇａｔｉｖｅ（以下、「ＴＮ］とも表記）
　（４）Ｆａｌｓｅ　Ｎｅｇａｔｉｖｅ（以下、「ＦＮ」とも表記）
　（５）Ｐｒｅｃｉｓｉｏｎ
　（６）Ｒｅｃａｌｌ
　（７）Ｆ値
　ＴＰは、正解がＰｏｓｉｔｉｖｅであるサンプルのうち、ルールによる判定の結果がＰｏｓｉｔｉｖｅであるサンプルの数を表す。本実施形態では、ＴＰは、対象に関する事象が発生したサンプルのうち、ルールに従った判定の結果、対象に関する事象が発生すると判定されたサンプルの数である。

　ＦＰは、正解がＮｅｇａｔｉｖｅであるサンプルのうち、ルールによる判定の結果がＰｏｓｉｔｉｖｅであるサンプルの数を表す。本実施形態では、ＦＰは、対象に関する事象が発生していないサンプルのうち、ルールに従った判定の結果、対象に関する事象が発生すると判定されたサンプルの数である。

　ＴＮは、正解がＮｅｇａｔｉｖｅであるサンプルのうち、ルールによる判定の結果がＮｅｇａｔｉｖｅであるサンプルの数を表す。本実施形態では、ＴＮは、対象に関する事象が発生していないサンプルのうち、ルールに従った判定の結果、対象に関する事象が発生しないと判定されたサンプルの数である。

　ＦＮは、正解がＰｏｓｉｔｉｖｅであるサンプルのうち、ルールによる判定の結果がＮｅｇａｔｉｖｅであるサンプルの数を表す。本実施形態では、ＦＮは、対象に関する事象が発生したサンプルのうち、ルールに従った判定の結果、対象に関する事象が発生しないと判定されたサンプルの数である。

　Ｐｒｅｃｉｓｉｏｎは、ルールによる判定の結果がＰｏｓｉｔｉｖｅであるサンプルのうち、正解がＰｏｓｉｔｉｖｅであるサンプルの割合である。本実施形態では、Ｐｒｅｓｉｃｉｏｎは、ルールに従った判定の結果、対象に関する事象が発生すると判定されたサンプルのうち、対象に関する事象が発生したサンプルの割合を表す。Ｐｒｅｓｉｃｉｏｎは、適合率又は精度とも表記される。Ｐｒｅｃｉｓｉｏｎは以下の式によって表される。以下の式において、「／」は割り算の演算子である。

　Ｐｒｅｃｉｓｉｏｎ＝ＴＰ／（ＴＰ＋ＦＰ）
　Ｒｅｃａｌｌは、正解がＰｏｓｉｔｉｖｅであるサンプルのうち、ルールによる判定の結果がＰｏｓｉｔｉｖｅであるサンプルの割合である。Ｒｅｃａｌｌは、再現率とも表記される。Ｒｅｃａｌｌは以下の式によって表される。

　Ｒｅｃａｌｌ＝ＴＰ／（ＴＰ＋ＦＮ）
　上述のＦ値は、ＰｒｅｃｉｓｉｏｎとＲｅｃａｌｌの調和平均である。Ｆ値は以下の式によって表される。以下の式において、「×」は掛け算の演算子である。

　Ｆ値＝２×Ｒｅｃａｌｌ×Ｐｒｅｃｉｓｉｏｎ／（Ｒｅｃａｌｌ＋Ｐｒｅｃｉｓｉｏｎ）
　ルール評価部１０２は、さらに、ＰｏｓｉｔｉｖｅとＮｅｇａｔｉｖｅの値を入れ替えた場合における、上述の各評価指標を計算してもよい。上述のように、最初に、正（Ｐｏｓｉｔｉｖｅ）が、対象に関する事象が発生することを表す場合の指標値を計算した場合、ルール評価部１０２は、今度は、正（Ｐｏｓｉｔｉｖｅ）が、対象に関する事象が発生しないことを表す場合の指標値を計算する。今度は、負（Ｎｅｇａｔｉｖｅ）は、対象に関する事象が発生しないことを表す。

　以下の説明において、ＰｏｓｉｔｉｖｅとＮｅｇａｔｉｖｅの値を入れ替えない場合における指標値を、「第１判定結果における」指標値と表記する。すなわち、上述の第１の判定種別の場合に算出された指標値を、「第１判定結果における」指標値と表記する。さらに、ＰｏｓｉｔｉｖｅとＮｅｇａｔｉｖｅの値を入れ替えた場合における指標値を、「第２判定結果における」指標値と表記する。すなわち、上述の第２の判定種別の場合に算出された指標値を、「第２判定結果における」指標値と表記する。

　第２判定結果における指標値を算出する際、ＴＰ、ＦＰ、ＴＮ、及びＦＮを再度計算する必要はない。ルール評価部１０２は、第１判定結果におけるＴＰを、第２判定結果におけるＦＮにすればよい。ルール評価部１０２は、第１判定結果におけるＦＰを、第２判定結果におけるＴＮにすればよい。ルール評価部１０２は、第１判定結果におけるＴＮを、第２判定結果におけるＦＰにすればよい。ルール評価部１０２は、第１判定結果におけるＦＮを、第２判定結果におけるＴＰにすればよい。ルール評価部１０２は、以上のように設定したＴＰ、ＦＰ、ＴＮ、及びＦＮを使用して、Ｐｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ、及びＦ値を算出すればよい。

　ルール評価部１０２は、ルール番号と判定種別との組み合わせに対して、ルール識別子を付与する。ルール識別子は、例えば、ルール番号と、指標値を算出した際の判定種別を表す値との組み合わせであってもよい。判定種別を表す値は、例えば、あらかじめ定められた、互いに異なる、第１の判定種別を表す値、及び、第２の判定種別を表す値のいずれかである。

　ルール提示部１０３は、ルール識別子と、そのルールについて算出した指標値とを、例えば端末装置３０のユーザに提示する。具体的には、ルール提示部１０３は、例えば、生成されたルールの各々について、ルール識別子と、そのルールについて算出した指標値とを、端末装置３０に送信する。端末装置３０は、受信したルールを区別できる情報と、そのルールについて算出した指標値とを表示する。

　図９は、ルール提示部１０３が提示する指標値の例を模式的に表す図である。図９に示す例では、ルール識別子は、ルール番号と上述の判定種別を表す値とが「－」によってつながれた文字列である。図９に示す例では、各行は、ルール識別子によって表されるルール番号のルール及び判定種別における指標値を表す。図９に示す判定種別では、上述の第１の判定種別を表す値が０であり、第２の判定種別を表す値が１である。また、図９に示す例では、提示される指標値は、ＴＰ、ＦＰ、ＴＮ、ＦＮ、Ｐｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ及びＦ値である。例えば、ルール識別子が「１－０」である行は、ルール番号が「１」であり、判定種別が第１の判定種別である場合における指標値を表す。また、例えば、ルール識別子が「２－１」である行は、ルール番号が「２」であり、判定種別が第２の判定種別である場合における指標値を表す。

　端末装置３０のユーザは、例えば端末装置３０の入力部（図示されない）を介して、少なくとも１つのルール識別子を選択する。端末装置３０は、ユーザによって選択されたルール識別子を、ルール提示部１０３に送信する。

　ルール提示部１０３は、受信したルール識別子によって特定されるルール番号及び判定種別における指標値を、端末装置３０のユーザにさらに提示してもよい。

　上述のように、端末装置３０のユーザは、２つ以上のルール識別子を選択してもよい。その場合、ユーザは、選択したルールを統合する方法を入力してもよい。そして、端末装置３０は、入力された、ルールを統合する方法を、ルール提示部１０３に送信する。選択したルールを統合する方法は、例えば、選択したルールを表す指標式をＡＮＤ又はＯＲ等の演算子によってつなげた論理式であってもよい。選択したルールを統合する方法は、あらかじめ定められていてもよい。

　ユーザが２つ以上のルール識別子を選択した場合、ルール提示部１０３は、選択されたルール識別子をルール生成部１０１に送信する。ルール提示部１０３は、さらに、例えば端末装置３０から受信した、ルールを統合する方法を、ルール生成部１０１に送信してもよい。その場合、ルール生成部１０１は、ルールを統合する方法に従ってユーザが選択したルールを統合ことによって、ユーザが選択したルールが統合されたルール（以下、統合ルールと表記）を生成する。そして、ルール評価部１０２は、統合ルールを使用して、サンプルデータ記憶部１０６に格納されているサンプルの判定を行う。ルール評価部１０２は、サンプルの判定結果から、上述の各指標値を算出する。ルール評価部１０２は、算出した指標値を、ルール提示部１０３に送信する。ルール提示部１０３は、受信した、統合ルールによる判定結果から算出された指標値を、端末装置３０のユーザに提示する。

　図１０は、統合ルールによる判定結果から算出された指標値の例を模式的に表す図である。

　端末装置３０のユーザは、再度ルールの選択を行ってもよい。その場合、ルール生成装置１０は、再度、ユーザによって選択されたルールにおける指標値を、端末装置３０のユーザに提示すればよい。端末装置３０のユーザは、選択したルールを採用する指示を入力してもよい。その場合、例えばルール送信部１０９が、採用されたルールを、判定装置４０に送信する。

　判定装置４０は、受信したルールに従って、対象に関する事象が発生するか否かを判定する。

　次に、本実施形態の判定システム１の動作について、図面を参照して詳細に説明する。

　図１１及び図１２は、本実施形態の判定システム１の動作の例を表すフローチャートである。判定システム１は、例えば、端末装置３０のユーザによる指示に応じて、図１１及び図１２に示す動作を開始する。図１１に示す動作の開始時において、予測モデル記憶部１０４は、学習装置２０によって生成された予測モデルが格納されている。

　図１１を参照すると、まず、ルール生成部１０１が、予測モデル記憶部１０４に格納されている予測モデルから、まだ選択されていない予測モデルを選択する（ステップＳ１０１）。ルール生成部１０１は、選択された予測モデルに含まれる説明変数から、まだ選択されていない説明変数を選択する（ステップＳ１０２）。ルール生成部１０１は、選択した説明変数のパラメータを、パラメータ記憶部１０５から読み出す。上述のように、パラメータは、カテゴリ数、閾値数を含む。パラメータは、上限及び下限をさらに含んでいてもよい。ルール生成部１０１は、読み出したパラメータを使用して、上述のように、選択した説明変数についてのルール要素を生成する（ステップＳ１０４）。

　選択されていない説明変数が存在する場合、すなわち、選択されている予測モデルが、まだ選択されていない説明変数を含んでいる場合（ステップＳ１０５においてＹＥＳ）、判定システム１は、ステップＳ１０２以降の動作を繰り返す。選択されていない説明変数が存在しない場合、すなわち、選択されている予測モデルが含む全ての説明変数が選択された場合（ステップＳ１０５においてＮＯ）、判定システム１は、次に、ステップＳ１０６の動作を行う。

　ステップＳ１０６において、ルール生成部１０１は、生成したルール要素に基づいて、上述のルールを生成する（ステップＳ１０６）。そして、選択されていない予測モデルが存在する場合（ステップＳ１０７においてＹＥＳ）、判定システム１は、ステップＳ１０１からの動作を繰り返す。選択されていない予測モデルが存在しない場合（ステップＳ１０７においてＮＯ）、ルール生成部１０１は、次に、図１２に示すステップＳ１０８の動作を行う。

　図１２を参照すると、ステップＳ１０８において、ルール評価部１０２は、生成されたルールから１つのルールを選択する。ルール評価部１０２は、サンプルデータ記憶部１０６に格納されているサンプルを使用して、選択されたルールによる判定を行う。サンプルデータ記憶部１０６は、複数のサンプルについて行った判定の結果を使用して、選択したルールの指標値を算出する（ステップＳ１０９）。まだ選択されていないルールが存在する場合（ステップＳ１１０においてＹＥＳ）、ルール評価部１０２は、ステップＳ１０８以降の動作を繰り返す。

　まだ選択されていないルールが存在しない場合、すなわち、生成された全てのルールの指標値が算出された場合（ステップＳ１１０においてＮＯ）、ルール提示部１０３は、端末装置３０のユーザに、ルールの指標値を提示する（ステップＳ１１１）。ステップＳ１１１において、ルール提示部１０３は、指標値の値を使用して、ユーザに提示するルールの指標値を選択してもよい。例えば、ルール提示部１０３は、ルールのＰｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ、及び、Ｆ値の少なくともいずれかが所定の基準より小さい場合、そのルールの指標値を提示しなくてもよい。ルールのＰｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ、及び、Ｆ値の基準は、例えば、Ｐｒｅｃｉｓｉｏｎ、Ｒｅｃａｌｌ、及び、Ｆ値のそれぞれについてあらかじめ定められている閾値によって表されていてもよい。

　端末装置３０のユーザは、提示されたルールから、１又は複数のルールを選択する。ユーザは、２つ以上のルールと、そのルールを統合する方法とを入力してもよい。端末装置３０は、選択されたルールのルール識別子をルール提示部１０３に送信する。端末装置３０は、選択されたルールのルール識別子と、それらのルールを統合する方法とを、ルール提示部１０３に送信してもよい。

　ルール提示部１０３は、ユーザによるルールの選択、具体的には、ユーザによって選択されたルールのルール識別子を受信する（ステップＳ１１２）。ルール提示部１０３は、さらに、選択された複数のルールを統合する方法を受信してもよい。

　例えば、新しくルールが選択された場合など、選択されたルールが更新された場合（ステップＳ１１３においてＹＥＳ）、ルール評価部１０２は、例えば受信した、複数のルールを統合する方法によって、選択されたルールを統合する（ステップＳ１１４）。そして、ルール評価部１０２は、統合されたルールの指標値を算出する（ステップＳ１１５）。そして、判定システム１の動作はステップＳ１１１に戻り、提示部１１１は、ステップＳ１１１において、統合されたルールの指標値を提示する。その際、提示部１１１は、統合されていないルールの指標値をさらに提示してもよい。
なお、２以上ではなく、１つのルールが選択された場合、ルール評価部１０２は、ステップＳ１１４及びステップＳ１１５の動作を行わない。そして、ステップＳ１１１において、提示部１１１は、選択されたルールの指標値を提示してもよい。

　ステップＳ１１１において、端末装置３０のユーザは、ルールを選択し直してもよい。端末装置３０のユーザは、ルールを選択し直さず、選択されたルールを採用する指示を入力してもよい。同じルールが選択された場合、及び、選択されたルールを採用する指示が入力された場合、ユーザによって選択されたルールは更新されない。ユーザによって選択されたルールは更新されなかった場合（ステップＳ１１３においてＮＯ）、ルール送信部１０９は、選択されたルールを、例えば判定装置４０に送信する（ステップＳ１１６）。

　以上で説明した本実施形態には、必要な性能に応じてルールを選択できるように、事象の発生を判定するルールを生成することができるという効果がある。

　その理由は、ルール生成部１０１が複数のルールを生成し、ルール評価部１０２が、生成されたルールの性能を表す指標値を算出するからである。したがって、ルール評価部１０２が算出する指標値をもとに、必要な性能に応じてルールを選択することができる。

　＜第２の実施形態＞
　次に、本発明の第２の実施形態について、図面を参照して詳細に説明する。

　図１は、本実施形態の判定システム１の構成を表すブロック図である。本実施形態の判定システム１は、以下の説明を除いて、第１の実施形態の判定システム１と同じである。本実施形態の判定システム１の、第１の実施形態の構成要素と同じ構成要素には、同じ符号を付与し、その説明を省略する。

　例えば予測モデルが異種混合学習に基づく予測モデルである場合、予測モデルは条件式と予測式（例えば重回帰式）の組み合わせによって表される。異種混合学習に基づく予測モデルを、例えば図３のような木構造によって表した場合、予測モデルは、葉ノード以外のノードにおける条件式と、葉ノードにおける予測式との組み合わせによって表される。その場合、葉ノード以外のノードにおける条件式と、葉ノードにおける予測式に基づく条件式（ルール要素である条件式）とに、同じ説明変数についての条件式が存在する場合がある。その場合、第１の実施形態におけるルールを表す条件式と同様に生成された、ルールを表す条件式は、同じ説明変数についての必ずしも同一でない複数の条件式を含む可能性がある。

　本実施形態のルール生成部１０１は、例えば、まず、第１の実施形態のルール生成部１０１と同様に、ルールを生成してもよい。すなわち、本実施形態のルール生成部１０１は、まず、第１の実施形態のルール生成部１０１と同様に、ルールを表す条件式を生成してもよい。そして、ルール生成部１０１は、生成したルールを表す条件式に、同じ説明変数についての複数の条件式が含まれるか否かを判定する。ルールを表す条件式に、同じ説明変数についての複数の条件式が含まれる場合、ルール生成部１０１は、それらの条件式に含まれる、説明変数の値の範囲の重複部分を特定する。言い換えると、同じ説明変数についての複数の条件式の値が全て真になる、その説明変数の値の範囲を、前述の重複部分として特定する。ルール生成部１０１は、同じ説明変数についての複数の条件式を、その説明変数の値が、特定した範囲の重複部分に含まれる場合に値が真になる条件式に変更する。本実施形態の説明では、同じ説明変数についての複数の条件式を、その説明変数の値が、特定した範囲の重複部分に含まれる場合に値が真になる条件式に変更することを、「ルール要素のマージ」とも表記する。ルール生成部１０１は、ルール要素のマージを、複数の条件式が存在する説明変数全てについて行う。

　ルール生成部１０１は、まず、葉ノードにおける予測式（例えば重回帰式）に基づいて生成されるルール要素の説明変数に、葉ノード以外のノードにおける条件式の説明変数と同じ説明変数があるか否かを特定してもよい。葉ノードにおける予測式に基づいて生成されるルール要素の説明変数に、葉ノード以外のノードにおける条件式の説明変数と同じ説明変数が存在する場合、ルール生成部１０１は、上述のように、説明変数の値の範囲の重複部分を特定する。そして、ルール生成部１０１は、その説明変数の値が、特定した範囲の重複部分に含まれる場合に値が真になる条件式を生成する。ルール生成部１０１は、葉ノードにおける予測式に基づくその説明変数の条件式と、葉ノード以外のノードにおけるその説明変数の条件式とを、生成した条件式に置き換える。そして、ルール生成部１０１は、生成した条件式に置き換えられた条件式を除く、葉ノードにおける予測式に基づく条件式及び葉ノード以外のノードにおける条件式と、生成した条件式とを使用して、ルールを表す条件式を生成する。

　なお、同じ説明変数についての、葉ノード以外のノードにおける条件式及び葉ノードにおける予測式に基づくルール要素において、その説明変数の値の範囲の重複部分が存在しない場合、その条件式とそのルール要素とを同時に含む条件式の値は、常に偽である。従って、ルール生成部１０１は、説明変数の値の範囲の重複部分が存在しない、同じ説明変数についての、葉ノード以外のノードにおける条件式及び葉ノードにおける予測式に基づくルール要素を同時に含む条件式が表すルールを生成しなくてよい。

　図１３及び図１２は、本実施形態の判定システム１の動作を表すフローチャートである。図１１及び図１２に示す、第１の実施形態の判定システム１の動作と比較すると、本実施形態の判定システム１は、図１３に示す、ステップＳ１０６の動作とステップＳ１０７の動作との間に、ステップＳ２０１及びステップＳ２０２の動作を行う点が異なる。本実施形態の判定システム１の、他のステップにおける動作は、第１の実施形態の判定システム１の、同じ符号が付与されているステップにおける動作と同じである。従って、それらの説明を省略する。

　ステップＳ２０１において、ルール生成部１０１は、生成したルールに、同じ説明変数に関する複数の条件式を含むルールが存在するか判定する。生成したルールに、同じ説明変数に関する複数の条件式を含むルールが存在しない場合（ステップＳ２０１においてＮＯ）、本実施形態の判定システム１は、次に、ステップＳ１０７の動作を行う。生成したルールに、同じ説明変数に関する複数の条件式を含むルールが存在する場合（ステップＳ２０１においてＹＥＳ）、本実施形態の判定システム１は、次に、ステップＳ２０２の動作を行う。

　ステップＳ２０２において、ルール生成部１０１は、同じ説明変数に関する複数の条件式を含むルールについて、上述のルール要素のマージを行う。

　以上で説明した本実施形態には、第１の実施形態と同じ効果がある。その理由は、第１の実施形態の効果が生じる理由と同じである。

　本実施形態には、さらに、処理時間を短縮できるという効果がある。

　その理由は、ルール生成部１０１が、ルール要素のマージを行うからである。
ルールを表す条件式において、同じ説明変数に関する複数の条件式を、値の範囲の重複部分に関する１つの条件式で表すことができる場合、条件式の数が減少する。その場合、指標を算出する際、同じ説明変数に関する条件式に関する判定を行う回数が減少するので、処理時間を短縮できる。

　＜第３の実施形態＞
　次に、本発明の第３の実施形態について、図面を参照して詳細に説明する。

　本実施形態のルール生成部１０１は、同じ説明変数についての２つ以上のルール要素を組み合わせることによって、それらのルール要素の少なくともいずれかが真である場合に真であるルール要素を、新たに生成する。以下の説明において、ルール要素を組み合わせることによって、それらのルール要素の少なくともいずれかが真である場合に真であるルール要素を生成することを、「ルール要素を合成する」と表記する。

　ルール生成部１０１は、あらかじめ定められている個数のルール要素を組み合わせることによって、ルール要素を合成してもよい。ルール生成部１０１は、所定範囲に含まれる個数のルール要素を組み合わせることによって、ルール要素を合成してもよい。ルール生成部１０１は、同じ説明変数の値域を分割することによって得られる値の範囲に基づいて生成されるルール要素の全ての組み合わせについて、ルール要素を合成してもよい。

　ルール生成部１０１は、各説明変数について、説明変数の地域の分割による値の範囲に基づくルール要素と、合成されたルール要素とから、多くて１つのルール要素を選択し、選択したルール要素を組み合わせることによってルールを生成する。

　図１４及び図１２は、本実施形態の判定システム１の動作の例を表すフローチャートである。

　図１４と図１１とを比較すると、本実施形態の判定システム１は、ステップＳ１０４の動作と、ステップＳ１０５の動作との間に、ステップＳ３０１の動作を行う。

　ステップＳ３０１において、ルール生成部１０１は、上述のように、ルール要素を合成する。

　また、ステップＳ１０６において、ルール生成部１０１は、合成したルール要素も使用して、ルールを生成する。

　本実施形態の判定システム１は、以上を除いて、第１の実施形態の判定システム１と同じ動作を行う。

　本実施形態には、さらに、ルールの性能を向上させることができるという効果がある。

　その理由は、ルール生成部１０１がルール要素のマージを行うからである。ルール要素のマージによって生成された範囲に基づくルール要素が選択された場合ルールの性能は、他のルール要素が選択される場合よりルールの性能が高くなる可能性がある。その場合、生成されるルールの性能は向上する。

　本実施形態の判定システム１は、さらに、第２の実施形態の判定システム１と同じ動作を行ってもよい。

　図１５及び図１２は、その場合の、本実施形態の判定システム１の動作の例を表すフローチャートである。

　図１５と図１４とを比較すると、図１５に示す例では、本実施形態のルール生成部１０１は、ステップＳ１０６の動作とステップＳ１０７の動作との間に、ステップＳ２０１の動作及びステップＳ２０２の動作を行う。その場合のステップＳ２０１の動作と、ステップＳ２０２の動作は、同じ符号が付与されている第２の実施形態のルール生成部１０１の動作と同じである。

　この場合の本実施形態には、さらに、第２の実施形態と同じ効果がある。その理由は、第２の実施形態の効果が生じる理由と同じである。

　＜第４の実施形態＞
　次に、本発明の第４の実施形態について、図面を参照して詳細に説明する。

　図１６は、本実施形態のルール生成装置１０Ａの構成の例を表すブロック図である。

　図１６を参照すると、本実施形態のルール生成装置１０Ａは、ルール生成部１０１と、ルール評価部１０２と、を備える。ルール生成部１０１は、事象を説明する１つ以上の説明変数の値の範囲の組み合わせに基づく、事象が発生するか否かを判定するルールを生成する。ルール評価部１０２は、生成したルールに、サンプルが適合するか否かを、サンプルの集合について判定した結果に基づいて、ルールの性能を表す指標値を算出する。サンプルは、事象が発生するか否かを表す値と説明変数の値とが関連付けられているデータである。

　図２０は、本実施形態のルール生成装置１０Ａの動作の例を表すフローチャートである。

　図２０によると、まず、ルール生成部１０１が、事象を説明する１つ以上の前記説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成する（ステップＳ４０１）。ルール評価部１０２は、生成したルールに、サンプルが適合するか否かを、サンプルの集合について判定した結果に基づいて、ルールの性能を表す指標値を算出する（ステップＳ４０２）。

　＜他の実施形態＞
　上述の実施形態のルール生成装置１０及び１０Ａは、それぞれ、回路構成（ｃｉｒｃｕｉｔｒｙ）によって実現することができる。回路構成は、例えば、１つ以上のメモリと、そのメモリにロードされているプログラムを実行する１つ以上のプロセッサとを含むコンピュータである。回路構成は、通信可能に接続された、２つ以上のコンピュータであってもよい。回路構成は、例えば、専用の、例えば回路（ｃｉｒｃｕｉｔ）などのハードウェアである。回路構成は、通信可能に接続された、２つ以上の回路であってもよい。回路構成は、上述のコンピュータと上述の回路との組み合わせであってもよい。

　図１７は、ルール生成装置１０及び１０Ａを実現することができる、コンピュータ１０００のハードウェア構成の一例を表す図である。図１７を参照すると、コンピュータ１０００は、プロセッサ１００１と、メモリ１００２と、記憶装置１００３と、Ｉ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）インタフェース１００４とを含む。また、コンピュータ１０００は、記録媒体１００５にアクセスすることができる。メモリ１００２と記憶装置１００３は、例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、ハードディスクなどの記憶装置である。記録媒体１００５は、例えば、ＲＡＭ、ハードディスクなどの記憶装置、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、可搬記録媒体である。記憶装置１００３が記録媒体１００５であってもよい。プロセッサ１００１は、メモリ１００２と、記憶装置１００３に対して、データやプログラムの読み出しと書き込みを行うことができる。プロセッサ１００１は、Ｉ／Ｏインタフェース１００４を介して、例えば、学習装置２０、端末装置３０、及び、判定装置４０にアクセスすることができる。プロセッサ１００１は、記録媒体１００５にアクセスすることができる。記録媒体１００５には、コンピュータ１０００を、ルール生成装置１０又はルール生成装置１０Ａとして動作させるプログラムが格納されている。

　プロセッサ１００１は、記録媒体１００５に格納されている、コンピュータ１０００を、ルール生成装置１０又はルール生成装置１０Ａとして動作させるプログラムを、メモリ１００２にロードする。そして、プロセッサ１００１が、メモリ１００２にロードされたプログラムを実行することにより、コンピュータ１０００は、ルール生成装置１０又はルール生成装置１０Ａとして動作する。

　以下の第１グループに含まれる部は、例えば、プログラムを記憶する記録媒体１００５からメモリ１００２に読み込まれた、各部の機能を実現することができる専用のプログラムと、そのプログラムを実行するプロセッサ１００１により実現することができる。第１グループは、ルール生成部１０１、ルール評価部１０２、ルール提示部１０３、予測モデル送受信部１０７、パラメータ受信部１０８、及びルール送信部１０９である。また、以下の第２グループに含まれる部は、コンピュータ１０００が含むメモリ１００２やハードディスク装置等の記憶装置１００３により実現することができる。第２グループに含まれる部は、予測モデル記憶部１０４、パラメータ記憶部１０５、及び、サンプルデータ記憶部１０６である。あるいは、第１グループに含まれる部及び第２グループに含まれる部の一部又は全部を、各部の機能を実現する専用の回路によって実現することもできる。

　図１８は、回路によって実装された、本発明の第１、第２、及び、第３の実施形態に係るルール生成装置１０の構成の例を表すブロック図である。図１９は、回路によって実装された、本発明の第４の実施形態に係るルール生成装置１０Ａの構成の例を表すブロック図である。

　図１８及び図１９に示す例において、ルール生成回路１１０１は、ルール生成部１０１として動作する。すなわち、ルール生成部１０１は、ルール生成回路１１０１によって実現される。ルール評価回路１１０２は、ルール評価部１０２として動作する。すなわち、ルール評価部１０２は、ルール評価回路１１０２によって実現される。ルール提示回路１１０３はルール提示部１０３として動作する。すなわち、ルール提示部１０３は、ルール提示回路１１０３によって実現される。予測モデル送受信回路１１０７は、予測モデル送受信部１０７として動作する。すなわち、予測モデル送受信部１０７は、予測モデル送受信回路１１０７によって実現される。
パラメータ受信回路１１０８は、パラメータ受信部１０８として動作する。すなわち、パラメータ受信部１０８は、パラメータ受信回路１１０８によって実現される。ルール送信回路１１０９は、ルール送信部１０９として動作する。すなわち、ルール送信部１０９によって実現される。

　同様に、予測モデル記憶装置１１０４は、予測モデル記憶部１０４として動作する。すなわち、予測モデル記憶部１０４は、予測モデル記憶装置１１０４によって実現される。パラメータ記憶装置１１０５は、パラメータ記憶部１０５として動作する。すなわち、パラメータ記憶部１０５は、パラメータ記憶装置１１０５によって実現される。サンプルデータ記憶装置１１０６は、サンプルデータ記憶部１０６として動作する。すなわち、サンプルデータ記憶部１０６は、サンプルデータ記憶装置１１０６によって実現される。予測モデル記憶装置１１０４、パラメータ記憶装置１１０５、及び、サンプルデータ記憶装置１１０６は、それぞれ、記憶回路であってもよい。予測モデル記憶装置１１０４、パラメータ記憶装置１１０５、及び、サンプルデータ記憶装置１１０６は、それぞれ、記憶装置であってもよい。

　また、上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

　（付記１）
　事象を説明する１つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、
　生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、
　を備えるルール生成装置。

　（付記２）
　前記説明変数は、前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す予測モデルに含まれる前記説明変数であり、
　前記ルール生成手段は、同じ前記予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する
　付記１に記載のルール生成装置。

　（付記３）
　前記予測モデルは、前記説明変数の値に関する条件をさらに含み、
　前記ルール生成手段は、前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する
　付記２に記載のルール生成装置。

　（付記４）
　前記ルール生成手段は、前記説明変数の値域を所定の規則に従って分割することによって前記範囲を設定する
　付記１乃至３のいずれか１項に記載のルール生成装置。

　（付記５）
　前記ルール生成手段は、さらに、同じ前記説明変数についての複数の前記範囲の共通な部分を、前記説明変数についての前記範囲として設定する
　付記１乃至４のいずれか１項に記載のルール生成装置。

　（付記６）
　前記ルール生成手段は、さらに、同じ前記説明変数についての、同一ではない複数の前記範囲を組み合わせることによって、前記説明変数についての新しい前記範囲を生成する
　付記１乃至５のいずれか１項に記載のルール生成装置。

　（付記７）
　前記指標値が算出された前記ルール毎に前記指標値を提示し、前記指標値が提示された前記ルールにおいて選択された前記ルールのルール識別子を取得するルール提示手段をさらに備え、
　前記ルール生成手段は、２つ以上の前記ルールが選択された場合、選択された２つ以上の前記ルールが統合された統合ルールを生成する
　付記１乃至６のいずれか１項に記載のルール生成装置。

　（付記８）
　事象を説明する１つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成し、
　生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出する
　ルール生成方法。

　（付記９）
　前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す、
　同じ予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する
　付記８に記載のルール生成方法。

　（付記１０）
　前記予測モデルがさらに含む、
　前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する
　付記９に記載のルール生成方法。

　（付記１１）
　前記説明変数の値域を所定の規則に従って分割することによって前記範囲を設定する
　付記８乃至１０のいずれか１項に記載のルール生成方法。

　（付記１２）
　さらに、同じ前記説明変数についての複数の前記範囲の共通な部分を、前記説明変数についての前記範囲として設定する
　付記８乃至１１のいずれか１項に記載のルール生成方法。

　（付記１３）
　さらに、同じ前記説明変数についての、同一ではない複数の前記範囲を組み合わせることによって、前記説明変数についての新しい前記範囲を生成する
　付記８乃至１１のいずれか１項に記載のルール生成方法。

　（付記１４）
　前記指標値が算出された前記ルール毎に前記指標値を提示し、前記指標値が提示された前記ルールにおいて選択された前記ルールのルール識別子を取得し、
　２つ以上の前記ルールが選択された場合、選択された２つ以上の前記ルールが統合された統合ルールを生成する
　付記８乃至１３のいずれか１項に記載のルール生成方法。

　（付記１５）
　コンピュータに、
　事象を説明する１つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成処理と、
　生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価処理と、
　を実行させるルール生成プログラム。

　（付記１６）
　前記説明変数は、前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す予測モデルに含まれる前記説明変数であり、
　前記ルール生成処理は、同じ前記予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する、
　付記１５に記載のルール生成プログラム。

　（付記１７）
　前記予測モデルは、前記説明変数の値に関する条件をさらに含み、
　前記ルール生成処理は、前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する、
　付記１６に記載のルール生成プログラム。

　（付記１８）
　前記ルール生成処理は、前記説明変数の値域を所定の規則に従って分割することによって前記範囲を設定する、
　付記１５乃至１７のいずれか１項に記載のルール生成プログラム。

　（付記１９）
　前記ルール生成処理は、さらに、同じ前記説明変数についての複数の前記範囲の共通な部分を、前記説明変数についての前記範囲として設定する
　付記１５乃至１８のいずれか１項に記載のルール生成プログラム。

　（付記２０）
　前記ルール生成処理は、さらに、同じ前記説明変数についての、同一ではない複数の前記範囲を組み合わせることによって、前記説明変数についての新しい前記範囲を生成する
　付記１乃至５のいずれか１項に記載のルール生成装置。

　（付記２１）
　コンピュータに、
　前記指標値が算出された前記ルール毎に前記指標値を提示し、前記指標値が提示された前記ルールにおいて選択された前記ルールのルール識別子を取得するルール提示処理を実行させ、
　前記ルール生成処理は、２つ以上の前記ルールが選択された場合、選択された２つ以上の前記ルールが統合された統合ルールを生成する、
　付記１５乃至２０のいずれか１項に記載のルール生成プログラム。

　以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０１５年３月１８日に出願された日本出願特願２０１５－０５４５２４を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　１　　判定システム
　１０　　ルール生成装置
　１０Ａ　　ルール生成装置
　２０　　学習装置
　３０　　端末装置
　４０　　判定装置
　１０１　　ルール生成部
　１０２　　ルール評価部
　１０３　　ルール提示部
　１０４　　予測モデル記憶部
　１０５　　パラメータ記憶部
　１０６　　サンプルデータ記憶部
　１０７　　予測モデル送受信部
　１０８　　パラメータ受信部
　１０９　　ルール送信部
　１０００　　コンピュータ
　１００１　　プロセッサ
　１００２　　メモリ
　１００３　　記憶装置
　１００４　　Ｉ／Ｏインタフェース
　１００５　　記録媒体

Claims

　事象を説明する１つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成手段と、
　生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価手段と、
　を備えるルール生成装置。
　前記説明変数は、前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す予測モデルに含まれる前記説明変数であり、
　前記ルール生成手段は、同じ前記予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する
　請求項１に記載のルール生成装置。
　前記予測モデルは、前記説明変数の値に関する条件をさらに含み、
　前記ルール生成手段は、前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する
　請求項２に記載のルール生成装置。
　前記ルール生成手段は、前記説明変数の値域を所定の規則に従って分割することによって前記範囲を設定する
　請求項１乃至３のいずれか１項に記載のルール生成装置。
　前記ルール生成手段は、さらに、同じ前記説明変数についての複数の前記範囲の共通な部分を、前記説明変数についての前記範囲として設定する
　請求項１乃至４のいずれか１項に記載のルール生成装置。
　前記ルール生成手段は、さらに、同じ前記説明変数についての、同一ではない複数の前記範囲を組み合わせることによって、前記説明変数についての新しい前記範囲を生成する
　請求項１乃至５のいずれか１項に記載のルール生成装置。
　前記指標値が算出された前記ルール毎に前記指標値を提示し、前記指標値が提示された前記ルールにおいて選択された前記ルールのルール識別子を取得するルール提示手段をさらに備え、
　前記ルール生成手段は、２つ以上の前記ルールが選択された場合、選択された２つ以上の前記ルールが統合された統合ルールを生成する
　請求項１乃至６のいずれか１項に記載のルール生成装置。
　事象を説明する１つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成し、
　生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出する
　ルール生成方法。
　前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す、
　同じ予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成する
　請求項８に記載のルール生成方法。
　前記予測モデルがさらに含む、
　前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する
　請求項９に記載のルール生成方法。
　コンピュータに、
　事象を説明する１つ以上の説明変数の値の範囲の組み合わせに基づく、前記事象が発生するか否かを判定するルールを生成するルール生成処理と、
　生成した前記ルールに、前記事象が発生するか否かを表す値と前記説明変数の値とが関連付けられているサンプルが適合するか否かを、前記サンプルの集合について判定した結果に基づいて、前記ルールの性能を表す指標値を算出するルール評価処理と、
　を実行させるルール生成プログラムを記憶する記録媒体。
　前記説明変数は、前記事象に関する目的変数と当該目的変数を説明する前記説明変数との関連を表す予測モデルに含まれる前記説明変数であり、
　記ルール生成処理は、同じ前記予測モデルに含まれる前記説明変数の値の範囲の組み合わせに基づく、前記ルールを生成、
　ルール生成プログラムを記憶する請求項１１に記載の記録媒体。
　前記予測モデルは、前記説明変数の値に関する条件をさらに含み、
　前記ルール生成処理は、前記説明変数の値に関する条件にさらに基づく、前記ルールを生成する、
　ルール生成プログラムを記憶する請求項１２に記載の記録媒体。