JP7424497B2

JP7424497B2 - ルール生成装置、ルール生成方法、及び制御プログラム

Info

Publication number: JP7424497B2
Application number: JP2022543208A
Authority: JP
Inventors: 優太畠山; 穣岡嶋; 邦彦定政
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2020-08-20
Filing date: 2020-08-20
Publication date: 2024-01-30
Anticipated expiration: 2040-08-20
Also published as: JPWO2022038729A1; WO2022038729A1; US20230214717A1

Description

本開示は、ルール生成装置、ルール生成方法、及び非一時的なコンピュータ可読媒体に関する。

機械学習の分野において、「実用例（real example）」及び「人工用例（synthetic example）」を含む「訓練用例」を用いて、モデルを学習させる手法が存在する（例えば、非特許文献１）。「訓練用例」は、訓練（学習）に用いる用例の集合であるので「訓練集合（training set）」と呼ぶこともできる。「実用例」は、実際に観測された用例であり、「人工用例」は人工的に形成された用例である。非特許文献１では、人工用例は、実用例に基づいて形成される。これにより、実用例に加えて人工用例も用いてモデルを学習させることができるので、モデルの精度を向上させることができる。なお、以下では、「実用例」と「人工用例」とを区別せずに、単に「用例」と呼ぶことがある。

モデルには、決定木や決定リストなどの「ルールベースのモデル（以下では、単に「ルールベースモデル」と呼ぶことがある）」が存在する。「ルールベースモデル」では、各「ルール」は、IF-THEN形式で表すことができ、「条件集合」とこの条件集合から得られる条件が満たされる場合の「予測値」とを含む。

Bucilua, Cristian, Caruana, Rich, and Niculescu-Mizil, Alexandru, "Model Compression". In Proceedings of the 12th ACMSIGKDD International Conference on Knowledge Discovery and Data Mining, KDD’06, pages 535-541, New York, NY, USA, 2006. ACM.

本発明者らは、実用例及び人工用例を含む訓練用例を用いてルールベースモデルを学習させた場合、ルールの精度が向上する一方で、ルールの「説明性（解釈性）」が低下してしまう可能性があることを見出した。すなわち、複数の実用例を用いてルールベースモデルを学習させた場合、各ルールの条件集合から得られる条件によって複数の用例が複数の「グループ（以下では、「クラスタ」と呼ぶことがある」に分けられる。各クラスタに含まれる用例の「目標値」を集計した集計結果がそのクラスタの「予測値」となる。このため、人工用例を用いずに複数の実用例を用いてルールベースモデルを学習させた場合、ユーザが、クラスタに含まれる各実用例を確認し、さらにそのクラスタに含まれる実用例の目標値を集計した集計結果と、ルールベースモデルによって得られた予測値とを比較することによって、ルールベースモデルによって得られたルールの正当性を検証することができる。しかしながら、実用例及び人工用例を含む訓練用例を用いてルールベースモデルを学習させた場合、クラスタに実用例が含まれず人工用例だけが含まれる可能性がある。この場合には、ルールベースモデルによって得られるルールの正当性を検証することができない。

本開示の目的は、ルールの説明性を向上させることができる、ルール生成装置、ルール生成方法、及び非一時的なコンピュータ可読媒体を提供することにある。

第１の態様にかかるルール生成装置は、複数の用例を含む訓練用例を取得する手段であって、前記複数の用例は、少なくとも１つの実用例及び少なくとも１つの人工用例を含み、前記実用例及び前記人工用例のそれぞれは、それぞれ異なる特徴パラメータに対応する１つ以上の特徴量をベクトル要素とする特徴量ベクトルと目標値とを含み、各実用例に含まれる特徴量及び目標値は実測値である一方、各人工用例は、前記実用例に基づいて形成された用例である、取得手段と、
前記訓練用例を前記目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成する手段であって、前記ルール群の各ルールは、前記特徴パラメータに関する１つ以上の単純条件を含む条件集合から得られる条件と前記目標値に関する予測値とを含む、ルール生成手段と、
を具備し、
前記第１の制約は、各クラスタがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む。

第２の態様にかかるルール生成方法は、複数の用例を含む訓練用例を取得することを含み、前記複数の用例は、少なくとも１つの実用例及び少なくとも１つの人工用例を含み、前記実用例及び前記人工用例のそれぞれは、それぞれ異なる特徴パラメータに対応する１つ以上の特徴量をベクトル要素とする特徴量ベクトルと目標値とを含み、各実用例に含まれる特徴量及び目標値は実測値である一方、各人工用例は、前記実用例に基づいて形成された用例であり、
前記ルール生成方法は、
前記訓練用例を前記目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成することをさらに含み、
前記ルール群の各ルールは、前記特徴パラメータに関する１つ以上の単純条件を含む条件集合から得られる条件と前記目標値に関する予測値とを含み、
前記第１の制約は、各クラスタがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む。

第３の態様にかかる非一時的なコンピュータ可読媒体は、
複数の用例を含む訓練用例を取得することを含む処理を、ルール生成装置に実行させ、
前記複数の用例は、少なくとも１つの実用例及び少なくとも１つの人工用例を含み、
前記実用例及び前記人工用例のそれぞれは、それぞれ異なる特徴パラメータに対応する１つ以上の特徴量をベクトル要素とする特徴量ベクトルと目標値とを含み、各実用例に含まれる特徴量及び目標値は実測値である一方、各人工用例は、前記実用例に基づいて形成された用例であり、
前記処理は、前記訓練用例を前記目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成することをさらに含み、
前記ルール群の各ルールは、前記特徴パラメータに関する１つ以上の単純条件を含む条件集合から得られる条件と前記目標値に関する予測値とを含み、
前記第１の制約は、各クラスタがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、
制御プログラムを格納している。

本開示により、ルールの説明性を向上させることができる、ルール生成装置、ルール生成方法、及び非一時的なコンピュータ可読媒体を提供することができる。

第１実施形態におけるルール生成装置の一例を示すブロック図である。第１実施形態におけるルール生成装置の処理動作の一例を示すフローチャートである。第２実施形態におけるルール生成装置の一例を示すブロック図である。訓練用例の説明に供する図である。第２実施形態における条件生成処理の一例を示すフローチャートである。第２実施形態における条件生成処理の一例を示すフローチャートである。第２実施形態における条件生成処理の一例を示すフローチャートである。第２実施形態における条件生成処理の一例を示すフローチャートである。第２実施形態における条件生成処理の一例を示すフローチャートである。第２実施形態における条件生成処理の一例を示すフローチャートである。条件生成処理の処理結果の説明に供する図である。第２実施形態における予測値生成処理の一例を示すフローチャートである。第３実施形態におけるルール生成装置の一例を示すブロック図である。第３実施形態における予測値生成処理の一例を示すフローチャートである。第４実施形態におけるルール生成装置の一例を示すブロック図である。第４実施形態における条件生成処理の一例を示すフローチャートである。第４実施形態における条件生成処理の一例を示すフローチャートである。第４実施形態における条件生成処理の一例を示すフローチャートである。第４実施形態における条件生成処理の一例を示すフローチャートである。第４実施形態における条件生成処理の一例を示すフローチャートである。第４実施形態における条件生成処理の一例を示すフローチャートである。ルール生成装置のハードウェア構成例を示す図である。

以下、図面を参照しつつ、実施形態について説明する。なお、実施形態において、同一又は同等の要素には、同一の符号を付し、重複する説明は省略される。

＜第１実施形態＞
＜ルール生成装置の構成例＞
図１は、第１実施形態におけるルール生成装置の一例を示すブロック図である。図１においてルール生成装置１０は、取得部１１と、ルール生成部１２とを有している。なお、ルール生成装置１０は、回帰問題及びクラス分類問題のいずれにも適用可能であるが、以下では、主に回帰問題に適用することを前提に説明する。

取得部１１は、「訓練用例（訓練集合）」を取得する。「訓練用例」は、少なくとも１つの「実用例」及び少なくとも１つの「人工用例」を含む。以下では、「実用例」と「人工用例」とを区別せずに、単に「用例」と呼ぶことがある。各用例は、異なる「特徴パラメータ」に対応する１つ以上の「特徴量」を「ベクトル要素」とする「特徴量ベクトル」と「目標値」とを含む。例えば、１つの用例が「観測日：８月」、「湿度：５６．８％」、「天気：曇り」、及び「気温：２３．７℃」である場合、「観測日」、「湿度」及び「天気」のそれぞれを特徴パラメータとし、（８月，５６．８％，曇り）を特徴量ベクトルとすることができる。そして、「２３．７℃」を目標値とすることができる。

各実用例に含まれる特徴量及び目標値は、機械学習モデルが予測すべき実際の予測対象が実際に測定（観測）されて得られた「実測値」である。一方、各人工用例は、実用例に基づいて形成された用例である。例えば、人工用例は、実用例と類似するようにアルゴリズムによって形成される。この人工用例は、例えば、上記の非特許文献１に記載された方法によって形成されてもよい。すなわち、人工用例は、疑似用例と呼ぶこともできる。このため、実用例と人工用例とは、互いに近い値の特徴量及び目標値を有している可能性が高いが、互いの特徴量及び目標値が一致することはない。

ルール生成部１２は、訓練用例に含まれる複数の用例を目標値に関する複数のグループ（以下では、このグループを「クラスタ」と呼ぶ）に分けるための「ルール群」を、「ルールベースモデル」を用いて且つ「第１の制約」を満たすように生成する。「ルールベースモデル」は、上記の通り、決定木及び決定リスト等である。

生成される「ルール群」の各ルールは、「条件集合」から得られる「条件（以下では、「複合条件」と呼ぶことがある）」と「目標値に関する予測値」とを含む。「条件集合」は、特徴パラメータに関する１つ以上の「単純条件」を含む。ここでは、「単純条件」は、「ルールベースモデル」において１つの「親ノード」を複数の「子ノード」に分割するための条件を意味する。

「第１の制約」は、各クラスタが少なくともＮ（Ｎは自然数）個以上の実用例を含むという制約を含む。以下では、Ｎ＝１の場合を例にとり説明する。

＜ルール生成装置の動作例＞
図２は、第１実施形態におけるルール生成装置の処理動作の一例を示すフローチャートである。

取得部１１は、訓練用例を取得する（ステップＳ１０１）。

ルール生成部１２は、ルール群を、ルールベースモデルを用いて且つ「第１の制約」を満たすように生成する（ステップＳ１０２）。「第１の制約」は、各クラスタが少なくとも１つの実用例を含むという制約を含む。

以上で説明した第１実施形態によれば、ルール生成装置１０にてルール生成部１２は、訓練用例を目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成する。第１の制約は、各クラスタが少なくともＮ（Ｎは自然数）個以上の実用例を含むという制約を含む。

このルール生成装置１０の構成により、生成されたルール群によって分けられた複数のクラスタのそれぞれには少なくとも１つの実用例が含まれるので、その実用例を用いてルールの正当性を検証することができる。すなわち、ルールの説明性を向上させることができる。また、上記訓練用例には、実用例の他に人工用例も含まれているので、当然、ルールの精度も向上させることができる。

＜第２実施形態＞
第２実施形態は、より具体的な実施形態に関する。

＜ルール生成装置の構成例＞
図３は、第２実施形態におけるルール生成装置の一例を示すブロック図である。図３においてルール生成装置２０は、取得部２１と、ルール生成部２２とを有している。なお、ルール生成装置２０は、回帰問題及びクラス分類問題のいずれにも適用可能であるが、以下では、主に回帰問題に適用することを前提に説明する。

取得部２１は、第１実施形態の取得部１１と同様に、「訓練用例（訓練集合）」を取得する。図４は、訓練用例の説明に供する図である。図４では、便宜的に、訓練用例がテーブル形式で示されている。図４に示す訓練用例は、５つの用例を含んでいる。用例ＩＤがＥ０，Ｅ１，Ｅ２である３つの用例は、実用例であり、用例ＩＤがＥ３，Ｅ４である２つの用例は、人工用例である。「観測日」、「湿度」及び「天気」のそれぞれは、特徴パラメータである。そして、各用例は、各特徴パラメータに対応する特徴量を含んでいる。また、「気温」は、目標値パラメータである。そして、各用例は、目標値パラメータに対応する目標値を含んでいる。

図３の説明に戻り、ルール生成部２２は、第１実施形態のルール生成部１２と同様に、訓練用例に含まれる複数の用例を目標値に関する複数のクラスタに分けるための「ルール群」を、「ルールベースモデル」を用いて且つ「第１の制約」を満たすように生成する。

例えば、ルール生成部２２は、条件生成部２３と、予測値生成部２４とを有している。

条件生成部２３は、各ルールの条件を生成する。

例えば、条件生成部２３は、条件生成制御部２３Ａと、単純条件候補生成部２３Ｂと、分割部２３Ｃと、第１保持部２３Ｄと、第２保持部２３Ｅとを有している。なお、ここでは、第１保持部２３Ｄ及び第２保持部２３Ｅが条件生成部２３に含まれるものとして説明しているが、本実施形態はこれに限定されるものではない。例えば、第１保持部２３Ｄ及び第２保持部２３Ｅは、ルール生成装置２０が備える記憶部（不図示）に含まれてもよい。

単純条件候補生成部２３Ｂは、「分割処理対象集合」に含まれる用例の複数の特徴パラメータにそれぞれ対応する複数の説明変数のうちの１つを選択する。最初の「分割処理対象集合」は、取得部２１にて取得された「訓練用例（訓練集合）」であり、２番目以降の「分割処理対象集合」は、条件生成制御部２３Ａから受け取る「情報グループ（情報ペア）」の「部分集合」である。「情報グループ」及び「部分集合」については後述する。

単純条件候補生成部２３Ｂは、選択した説明変数についての複数の閾値を生成し、生成した複数の閾値を用いて、選択した説明変数についての複数の「単純条件候補」を生成する。

例えば、用例に３つの特徴パラメータ（つまり、３つの説明変数）ｘ＿１，ｘ＿２，ｘ＿３が含まれている場合、単純条件候補生成部２３Ｂは、説明変数ｘ＿１を選択する。そして、単純条件候補生成部２３Ｂは、説明変数ｘ＿１の閾値として、「３」、「５」、「７」を生成する。そして、単純条件候補生成部２３Ｂは、「ｘ＿１＞３」、「ｘ＿１＞５」、「ｘ＿１＞７」をそれぞれ「単純条件候補」として生成する。

分割部２３Ｃは、単純条件候補生成部２３Ｂにて生成された複数の単純条件候補から１つの単純条件候補を「使用単純条件候補」として順次選択する。「使用単純条件候補」は、分割部２３Ｃの処理に用いられる単純条件候補である。

分割部２３Ｃは、使用単純条件候補に基づいて「分割処理対象集合」に含まれる複数の用例を分けることによって「第１部分集合」及び「第２部分集合」を形成する。そして、分割部２３Ｃは、第１部分集合に使用単純条件候補を「条件集合」として対応づけた「第１情報グループ（第１情報ペア）」と、第２部分集合に使用単純条件候補の否定条件を「条件集合」として対応づけた「第２情報グループ（第２情報ペア）」とを含む「情報セット」を、第１保持部２３Ｄへ出力する。これにより、単純条件候補生成部２３Ｂにて生成された各単純条件候補についての情報セットが、分割部２３Ｃから第１保持部２３Ｄへ出力される。

ここで、上記の通り、最初の「分割処理対象集合」は、取得部２１にて取得された「訓練用例」であり、２番目以降の「分割処理対象集合」は、条件生成制御部２３Ａから受け取る「情報グループ」の「部分集合」である。すなわち、本明細書において「部分集合」は、全体集合である「訓練用例」を「条件集合」によって分けることにより得られるものであり、「訓練用例」の部分的な集合である。また、２番目以降の「分割処理対象集合」には、少なくとも１つの単純条件を含む条件集合が対応づけられているので、この分割処理対象集合から得られる第１情報グループ及び第２情報グループのそれぞれの条件集合は、少なくとも２つ以上の単純条件を含むことになる。

第１保持部２３Ｄは、分割部２３Ｃから出力された複数の情報セットを一時保持する。また、第１保持部２３Ｄは、条件生成制御部２３Ａによる制御に従って、保持している情報セットの出力及び削除を実行する。

条件生成制御部２３Ａは、第１保持部２３Ｄに保持された複数の情報セットから、第１部分集合及び第２部分集合のそれぞれが「第２の制約」を満たし、且つ、第１部分集合及び第２部分集合から算出される「第１統計値」が最も小さい、情報セットを選択する。「第２の制約」は、各子ノードが少なくともＮ（Ｎは自然数）個以上の実用例を含むという制約を含む。以下では、Ｎ＝１の場合を例にとり説明する。すなわち、「分割処理対象集合」が親ノードであり第１部分集合及び第２部分集合のそれぞれが子ノードであるので、第１部分集合及び第２部分集合のそれぞれが少なくとも１つの実用例を含むことが要求される。また、「第２の制約」は、第１部分集合及び第２部分集合のそれぞれについて、部分集合に含まれる実用例の目標値の平均と人工用例の目標値の平均との差が所定値以下である、という制約を含んでいてもよい。また、条件生成制御部２３Ａが算出する上記「第１統計値」は、分類問題の場合には、不純度を表す量（例えば、ジニ係数又はエントロピーなど）であってもよく、回帰の場合には、データの散らばり具合を表す量（例えば、平均二乗誤差、又は目的変数の分散など）であってもよい。なお、「第１統計値」は、情報セットを選択する際の基準値として用いられるので、「情報セット選択基準値」と呼ぶことができる。

条件生成制御部２３Ａは、選択した情報セットの第１情報グループ及び第２情報グループを第１保持部２３Ｄから受け取って第２保持部２３Ｅに保持させ、その後、第１保持部２３Ｄに保持している情報セットのすべてを削除させる。

条件生成制御部２３Ａは、第２保持部２３Ｅに保持させた第１情報グループ及び第２情報グループのそれぞれについて「終了条件」を満たしているか否かを判定して、終了条件を満たしている情報グループに「処理完了情報」を付す。「終了条件」は、例えば、「部分集合に含まれる実用例の数が所定数以下となること」であってもよい。また、「処理完了情報」は、例えば、フラグであってもよい。

条件生成制御部２３Ａは、第２保持部２３Ｅに保持され且つ処理完了情報が付されていない情報グループを第２保持部２３Ｅから取得して、２番目以降の分割処理対象集合として単純条件候補生成部２３Ｂ及び分割部２３Ｃに出力する。その後、条件生成制御部２３Ａは、取得した情報グループを第２保持部２３Ｅに削除させる。

条件生成制御部２３Ａは、第２保持部２３Ｅに保持されている全ての情報グループに処理完了情報が付されている場合、これら全ての情報グループを第２保持部２３Ｅから取得する。そして、条件生成制御部２３Ａは、取得した全ての情報グループを予測値生成部２４に出力する。ここで、条件生成制御部２３Ａから出力される各情報グループは、１つのルールに対応する。そして、各情報グループの条件集合及び部分集合は、１つのルールの条件集合及びこの１つのルールに対応する「クラスタ」に対応する。なお、条件生成制御部２３Ａは、予測値生成部２４に出力する各情報グループの条件集合を、条件集合に含まれる複数の単純条件をＡＮＤで繋いだ「複合条件」の形にしてもよい。条件集合に１つの単純条件だけが含まれる場合、複合条件は、その単純条件と同じである。例えば、条件集合に２つの単純条件「Ｘ＿０＞１」，「Ｘ＿１＞４」が含まれている場合、「複合条件」は、「Ｘ＿０＞１ＡＮＤＸ＿１＞４」となる。

第２保持部２３Ｅは、条件生成制御部２３Ａから受け取る情報グループを保持する。

予測値生成部２４は、条件生成制御部２３Ａから出力された複数の情報グループに対応する複数のルールのそれぞれの予測値を生成する。

例えば、予測値生成部２４は、乖離値算出部２４Ａと、調整部２４Ｂと、予測値算出部２４Ｃとを有している。

乖離値算出部２４Ａは、条件生成制御部２３Ａから出力された複数の情報グループから「処理対象情報グループ」を順次選択する。そして、乖離値算出部２４Ａは、処理対象情報グループの部分集合（つまり、処理対象部分集合（処理対象クラスタ））に含まれる実用例の目標値に関する「第２統計値」と処理対象部分集合に含まれる各人工用例の目標値とに基づいて、「乖離値」を算出する。「第２統計値」は、処理対象情報グループの「処理対象部分集合（処理対象クラスタ）」に含まれる実用例の目標値に関する「代表値」である。「第２統計値」は、例えば、平均であってもよいし、中央値であってもよい。「乖離値」は、データの乖離具合を表す量である。乖離値は、例えば、「第２統計値」と人工用例の目標値との差であってもよいし、カルバック・ライブラーダイバージェンス又はコサイン類似度などであってもよい。

調整部２４Ｂは、第１閾値以上である「乖離値」に対応する人工用例を処理対象部分集合から除去することにより、処理対象部分集合を調整する。

予測値算出部２４Ｃは、調整後の処理対象部分集合に含まれるすべての用例の目標値に関する「第３統計値」を、調整後の処理対象部分集合の処理対象情報グループに対応するルールの「予測値」として、算出する。これにより、処理対象情報グループに対応するルールの条件集合（複合条件）及び予測値が揃うことになる。このように調整後の処理対象部分集合に基づいてルールの「予測値」を算出することにより、より精度の良いルールの予測値を算出することができる。

「第３統計値」は、調整後の処理対象部分集合に含まれるすべての用例の目標値の「代表値」である。例えば、「第３統計値」は、調整後の処理対象部分集合に含まれるすべての用例の目標値の平均であってもよい。

＜ルール生成装置の動作例＞
以上の構成を有するルール生成装置２０の処理動作の一例について説明する。ルール生成装置２０は、条件生成処理を行い、その後、予測値生成処理を行う。

（条件生成処理）
図５から図１０は、第２実施形態における条件生成処理の一例を示すフローチャートである。

取得部２１は、訓練用例を取得する（ステップＳ２０１）

単純条件候補生成部２３Ｂは、取得部２１にて取得された訓練用例に含まれる用例の複数の特徴パラメータにそれぞれ対応する複数の説明変数のうちの１つを選択する（ステップＳ２０２）。

単純条件候補生成部２３Ｂは、選択した説明変数についての複数の閾値を生成する（ステップＳ２０３）。

単純条件候補生成部２３Ｂは、生成した各閾値を用いて単純条件候補を生成する（ステップＳ２０４）。これにより、ステップＳ２０３にて生成された閾値の数に等しい数の単純条件候補が生成される。

分割部２３Ｃは、単純条件候補生成部２３Ｂにて生成された複数の単純条件候補から１つの単純条件候補を「使用単純条件候補」として選択する。（ステップＳ２０５）

分割部２３Ｃは、使用単純条件候補に基づいて訓練用例を分割して「第１部分集合」及び「第２部分集合」を形成する（ステップＳ２０６）。すなわち、分割部２３Ｃは、訓練用例に含まれる用例のうちで、使用単純条件候補を満たす用例を集合要素とする第１部分集合と、使用単純条件候補の否定条件（Negation）を満たす用例を集合要素とする第２部分集合とを形成する。そして、分割部２３Ｃは、第１部分集合に使用単純条件候補を「条件集合」として対応づけた「第１情報グループ」と、第２部分集合に使用単純条件候補の否定条件を「条件集合」として対応づけた「第２情報グループ」とを含む「情報セット」を、第１保持部２３Ｄへ出力する。これにより、使用単純条件候補についての情報セットが、分割部２３Ｃから第１保持部２３Ｄへ出力されて、第１保持部２３Ｄによって保持される。なお、ここでは、最初の分割処理なので、「訓練用例」が上記の「分割処理対象集合」である。

条件生成制御部２３Ａは、第１保持部２３Ｄに保持された情報セットの第１部分集合及び第２部分集合のそれぞれが「第２の制約」を満たすか否かを判定する（ステップＳ２０７）。上記の通り、「第２の制約」は、例えば、情報セットの第１部分集合及び第２部分集合のそれぞれが少なくとも１つの実用例を含むことである。

第２の制約が満たされる場合（ステップＳ２０７ＹＥＳ）、条件生成制御部２３Ａは、情報セットの第１部分集合及び第２部分集合を用いて「第１統計値」を算出する（ステップＳ２０８）。

第２の制約が満たされない場合（ステップＳ２０７ＮＯ）、条件生成制御部２３Ａは、第１保持部２３Ｄに保持された情報セットを削除させる（ステップＳ２０９）。

条件生成制御部２３Ａは、ステップＳ２０４にて生成された複数の単純条件候補のすべてが使用単純条件候補として選択されたか否かを判定する（ステップＳ２１０）。複数の単純条件候補のすべてが使用単純条件候補として選択されていないと判定された場合（ステップＳ２１０ＮＯ）、条件生成制御部２３Ａは、処理ステップをステップＳ２０５に戻す制御を実行する。これにより、分割部２３Ｃは、未だ選択していない単純条件候補を使用単純条件候補として選択することになる。

すべてが使用単純条件候補として選択されていると判定された場合（ステップＳ２１０ＹＥＳ）、条件生成制御部２３Ａは、第１保持部２３Ｄに保持されている情報セットが存在するか否かを判定する（ステップＳ２１１）。保持されている情報セットが存在しないと判定された場合（ステップＳ２１１ＮＯ）、条件生成制御部２３Ａは、処理ステップをステップＳ２０２に戻す制御を実行する。

保持されている情報セットが存在すると判定された場合（ステップＳ２１１ＹＥＳ）、条件生成制御部２３Ａは、第１保持部２３Ｄに保持されている情報セットのうちで対応する第１統計値が最も小さい情報セットを選択する（ステップＳ２１２）。

条件生成制御部２３Ａは、選択した情報セットの第１情報グループ及び第２情報グループを第１保持部２３Ｄから受け取って第２保持部２３Ｅに保持させる（ステップＳ２１３）。その後、条件生成制御部２３Ａは、第１保持部２３Ｄに保持している情報セットのすべてを削除させる（ステップＳ２１３）。

条件生成制御部２３Ａは、第２保持部２３Ｅに保持させた第１情報グループ及び第２情報グループのそれぞれについて終了条件を満たしているか否かを判定する（ステップＳ２１４）。

条件生成制御部２３Ａは、終了条件を満たしている情報グループにフラグを付す（ステップＳ２１４ＹＥＳ、ステップＳ２１５）。第１情報グループ及び第２情報グループのいずれも終了条件を満たしていないと判定された場合（ステップＳ２１４ＮＯ）、処理ステップは、ステップＳ２１６に進む。

条件生成制御部２３Ａは、第２保持部２３Ｅにフラグが付されていない情報グループが保持されているか否かを判定する（ステップＳ２１６）。

第２保持部２３Ｅにフラグが付されていない情報グループが保持されている場合（ステップＳ２１６ＹＥＳ）、条件生成制御部２３Ａは、第２保持部２３Ｅからフラグが付されていない情報グループを１つ取得して、単純条件候補生成部２３Ｂ及び分割部２３Ｃに出力する（ステップＳ２１７）。その後、条件生成制御部２３Ａは、取得した情報グループを第２保持部２３Ｅに削除させる（ステップＳ２１７）。単純条件候補生成部２３Ｂ及び分割部２３Ｃへ出力された情報グループの部分集合は、２番目以降の分割処理対象集合である。

単純条件候補生成部２３Ｂは、分割処理対象集合に含まれる用例の複数の特徴パラメータにそれぞれ対応する複数の説明変数のうちの１つを選択する（ステップＳ２１８）。

単純条件候補生成部２３Ｂは、選択した説明変数についての複数の閾値を生成する（ステップＳ２１９）。

単純条件候補生成部２３Ｂは、生成した各閾値を用いて単純条件候補を生成する（ステップＳ２２０）。これにより、ステップＳ２１９にて生成された閾値の数に等しい数の単純条件候補が生成される。

分割部２３Ｃは、単純条件候補生成部２３Ｂにて生成された複数の単純条件候補から１つの単純条件候補を使用単純条件候補として選択する。（ステップＳ２２１）

分割部２３Ｃは、使用単純条件候補に基づいて分割処理対象集合を分割して第１部分集合及び第２部分集合を形成する（ステップＳ２２２）。すなわち、分割部２３Ｃは、分割処理対象集合に含まれる用例のうちで、使用単純条件候補を満たす用例を集合要素とする第１部分集合と、使用単純条件候補の否定条件（Negation）を満たす用例を集合要素とする第２部分集合とを形成する。そして、分割部２３Ｃは、第１部分集合に使用単純条件候補を「条件集合」として対応づけた「第１情報グループ」と、第２部分集合に使用単純条件候補の否定条件を「条件集合」として対応づけた「第２情報グループ」とを含む「情報セット」を、第１保持部２３Ｄへ出力する。これにより、使用単純条件候補についての情報セットが、分割部２３Ｃから第１保持部２３Ｄへ出力されて、第１保持部２３Ｄによって保持される。

条件生成制御部２３Ａは、第１保持部２３Ｄに保持された情報セットの第１部分集合及び第２部分集合のそれぞれが「第２の制約」を満たすか否かを判定する（ステップＳ２２３）。

第２の制約が満たされる場合（ステップＳ２２３ＹＥＳ）、条件生成制御部２３Ａは、情報セットの第１部分集合及び第２部分集合を用いて「第１統計値」を算出する（ステップＳ２２４）。

第２の制約が満たされない場合（ステップＳ２２３ＮＯ）、条件生成制御部２３Ａは、第１保持部２３Ｄに保持された情報セットを削除させる（ステップＳ２２５）。

条件生成制御部２３Ａは、ステップＳ２２０にて生成された複数の単純条件候補のすべてが使用単純条件候補として選択されたか否かを判定する（ステップＳ２２６）。複数の単純条件候補のすべてが使用単純条件候補として選択されていないと判定された場合（ステップＳ２２６ＮＯ）、条件生成制御部２３Ａは、処理ステップをステップＳ２２１に戻す制御を実行する。これにより、分割部２３Ｃは、未だ選択していない単純条件候補を使用単純条件候補として選択することになる。

すべてが使用単純条件候補として選択されていると判定された場合（ステップＳ２２６ＹＥＳ）、条件生成制御部２３Ａは、第１保持部２３Ｄに保持されている情報セットが存在するか否かを判定する（ステップＳ２２７）。保持されている情報セットが存在しないと判定された場合（ステップＳ２２７ＮＯ）、条件生成制御部２３Ａは、処理ステップをステップＳ２１８に戻す制御を実行する。

保持されている情報セットが存在すると判定された場合（ステップＳ２２７ＹＥＳ）、条件生成制御部２３Ａは、第１保持部２３Ｄに保持されている情報セットのうちで対応する第１統計値が最も小さい情報セットを選択する（ステップＳ２２８）。

条件生成制御部２３Ａは、選択した情報セットの第１情報グループ及び第２情報グループを第１保持部２３Ｄから受け取って第２保持部２３Ｅに保持させる（ステップＳ２２９）。その後、条件生成制御部２３Ａは、第１保持部２３Ｄに保持している情報セットのすべてを削除させる（ステップＳ２２９）。

条件生成制御部２３Ａは、第２保持部２３Ｅに保持させた第１情報グループ及び第２情報グループのそれぞれについて終了条件を満たしているか否かを判定する（ステップＳ２３０）。

条件生成制御部２３Ａは、終了条件を満たしている情報グループにフラグを付す（ステップＳ２３０ＹＥＳ、ステップＳ２３１）。第１情報グループ及び第２情報グループのいずれも終了条件を満たしていないと判定された場合（ステップＳ２３０ＮＯ）、処理ステップは、ステップＳ２１６に進む。

条件生成制御部２３Ａは、第２保持部２３Ｅに保持されている全ての情報グループに処理完了情報が付されている場合（ステップＳ２１６ＮＯ）、これら全ての情報グループを第２保持部２３Ｅから取得して予測値生成部２４に出力する（ステップＳ２３２）。なお、条件生成制御部２３Ａは、予測値生成部２４に出力する各情報グループの条件集合を、条件集合に含まれる複数の単純条件をＡＮＤで繋いだ「複合条件」の形にしてもよい。

図１１は、条件生成処理の処理結果の説明に供する図である。図１１において訓練用例を分割処理対象集合としたときに、単純条件「ｘ_０＞１」の否定条件「ｘ_０≦１」によって終了条件を満たす部分集合Ｂ２が得られている。また、部分集合Ｂ１を分割処理対象集合としたときに、単純条件「ｘ_１＞５」によって終了条件を満たす部分集合Ｃ１が得られ、単純条件「ｘ_１＞５」の否定条件「ｘ_１≦５」によって終了条件を満たす部分集合Ｃ２が得られている。このとき、条件生成制御部２３Ａは、図１１に示す３つの情報グループを予測値生成部２４に出力する。すなわち、その３つの情報グループは、部分集合「Ｂ２」及び複合条件「ｘ_０≦１」の情報グループと、部分集合「Ｃ１」及び複合条件「ｘ_０＞１ＡＮＤｘ_１＞５」の情報グループと、部分集合「Ｃ２」及び複合条件「ｘ_０＞１ＡＮＤｘ_１≦５」の情報グループとである。

（予測値生成処理）
図１２は、第２実施形態における予測値生成処理の一例を示すフローチャートである。図１２に示すフローチャートは、条件生成制御部２３Ａから出力された複数の情報グループのそれぞれについて実行される。すなわち、複数の情報グループのそれぞれが順番に「処理対象情報グループ」となる。

乖離値算出部２４Ａは、処理対象情報グループの部分集合（処理対象部分集合）に含まれる実用例の目標値に関する第２統計値を算出する（ステップＳ３０１）。

乖離値算出部２４Ａは、算出した第２統計値と処理対象部分集合に含まれる各人工用例の目標値とに基づいて、乖離値を算出する（ステップＳ３０２）。

調整部２４Ｂは、第１閾値以上である「乖離値」に対応する人工用例を処理対象部分集合から除去する（ステップＳ３０３）。これにより、調整後の処理対象部分集合が得られる。

予測値算出部２４Ｃは、調整後の処理対象部分集合に含まれるすべての用例の目標値に関する第３統計値を算出する（ステップＳ３０４）。この第３統計値は、調整後の処理対象部分集合の処理対象情報グループに対応するルールの予測値である。

予測値算出部２４Ｃは、処理対象情報グループの複合条件と算出した予測値とを１つのルールとして出力する（ステップＳ３０５）。このため、図１２のフローを複数の情報グループについて繰り返すことにより、上記の「ルール群」が出力されることになる。

＜第３実施形態＞
第３実施形態は、予測値の生成方法のバリエーションに関する。

＜ルール生成装置の構成例＞
図１３は、第３実施形態におけるルール生成装置の一例を示すブロック図である。図１３においてルール生成装置３０は、取得部２１と、ルール生成部３１とを有している。なお、ルール生成装置３０は、回帰問題及びクラス分類問題のいずれにも適用可能である。

ルール生成部３１は、条件生成部２３と、予測値生成部３２とを有している。予測値生成部３２は、条件生成制御部２３Ａから出力された複数の情報グループに対応する複数のルールのそれぞれの予測値を生成する。

例えば、予測値生成部３２は、調整部３２Ａと、予測値算出部３２Ｂとを有している。

調整部３２Ａは、条件生成制御部２３Ａから出力された複数の情報グループから「処理対象情報グループ」を順次選択する。そして、調整部３２Ａは、処理対象情報グループの処理対象部分集合に含まれるすべての人工用例を処理対象部分集合から除去することにより、処理対象部分集合を調整する。

予測値算出部３２Ｂは、調整後の処理対象部分集合に含まれるすべての用例（つまり、実用例）の目標値に関する「第２統計値」を、調整後の処理対象部分集合の処理対象情報グループに対応するルールの「予測値」として、算出する。「第２統計値」は、例えば、平均であってもよいし、中央値であってもよい。このように調整後の処理対象部分集合に基づいてルールの「予測値」を算出することにより、より精度の良いルールの予測値を算出することができる。

＜ルール生成装置の動作例＞
以上の構成を有するルール生成装置２０の処理動作の一例について説明する。

（予測値生成処理）
図１４は、第３実施形態における予測値生成処理の一例を示すフローチャートである。図１４に示すフローチャートは、条件生成制御部２３Ａから出力された複数の情報グループのそれぞれについて実行される。すなわち、複数の情報グループのそれぞれが順番に「処理対象情報グループ」となる。

調整部３２Ａは、処理対象情報グループの処理対象部分集合に含まれるすべての人工用例を処理対象部分集合から除去する（ステップＳ４０１）。これにより、調整後の処理対象部分集合が得られる。

予測値算出部３２Ｂは、調整後の処理対象部分集合に含まれるすべての用例の目標値に関する「第２統計値」を算出する（ステップＳ４０２）。この第２統計値は、調整後の処理対象部分集合の処理対象情報グループに対応するルールの予測値である。

予測値算出部３２Ｂは、処理対象情報グループの複合条件と算出した予測値とを１つのルールとして出力する（ステップＳ４０３）。このため、図１４のフローを複数の情報グループについて繰り返すことにより、上記の「ルール群」が出力されることになる。

なお、以上の説明では、調整部３２Ａによる調整処理によって得られた調整後の処理対象部分集合を用いて予測値を算出したが、本実施形態はこれに限定されるものではない。例えば、予測値生成部３２は調整部３２Ａを有していなくてもよい。要するに、予測値算出部３２Ｂは、処理対象情報グループの処理対象部分集合に含まれる実用例の目標値に関する第２統計値を、処理対象部分集合の処理対象情報グループに対応するルールの予測値として算出できればよい。

＜第４実施形態＞
第４実施形態は、条件生成方法のバリエーションに関する。第４実施形態では、第２実施形態と異なり、第２の制約を課さずに訓練用例を葉ノードまで分割し、実用例をＮ（Ｎは自然数）以上含んでいない葉ノードを削除する。以下では、Ｎ＝１の場合を例にとり説明する。

＜ルール生成装置の構成例＞
図１５は、第４実施形態におけるルール生成装置の一例を示すブロック図である。図１５においてルール生成装置４０は、取得部２１と、ルール生成部４１とを有している。なお、ルール生成装置４０は、回帰問題及びクラス分類問題のいずれにも適用可能である。

ルール生成部４１は、条件生成部４２と、予測値生成部４３とを有している。

例えば、条件生成部４２は、条件生成制御部４２Ａと、単純条件候補生成部２３Ｂと、分割部２３Ｃと、第１保持部２３Ｄと、第２保持部２３Ｅとを有している。なお、ここでは、第１保持部２３Ｄ及び第２保持部２３Ｅが条件生成部４２に含まれるものとして説明しているが、本実施形態はこれに限定されるものではない。例えば、第１保持部２３Ｄ及び第２保持部２３Ｅは、ルール生成装置４０が備える記憶部（不図示）に含まれてもよい。

条件生成制御部４２Ａは、第１保持部２３Ｄに保持された複数の情報セットから、第１部分集合及び第２部分集合から算出される「第１統計値」が最も小さい情報セットを選択する。

条件生成制御部４２Ａは、選択した情報セットの第１情報グループ及び第２情報グループを第１保持部２３Ｄから受け取って第２保持部２３Ｅに保持させ、その後、第１保持部２３Ｄに保持している情報セットのすべてを削除させる。

条件生成制御部４２Ａは、第２保持部２３Ｅに保持させた第１情報グループ及び第２情報グループのそれぞれについて「終了条件」を満たしているか否かを判定して、終了条件を満たしている情報グループに「処理完了情報」を付す。

条件生成制御部４２Ａは、第２保持部２３Ｅに保持され且つ処理完了情報が付されていない情報グループを第２保持部２３Ｅから取得して、２番目以降の分割処理対象集合として単純条件候補生成部２３Ｂ及び分割部２３Ｃに出力する。その後、条件生成制御部４２Ａは、取得した情報グループを第２保持部２３Ｅに削除させる。

条件生成制御部４２Ａは、第２保持部２３Ｅに保持されている全ての情報グループに処理完了情報が付されている場合、第２保持部２３Ｅに保持されている複数の情報グループから、実用例を含んでいない部分集合の情報グループを削除する。このように第４実施形態では、第２実施形態と異なり、第２の制約を課さずに訓練用例を葉ノードまで分割し、実用例を含んでいない葉ノードを削除している。このようにしても第１の制約を満たすルールを生成することができる。そして、条件生成制御部４２Ａは、第２保持部２３Ｅに削除されずに残っている全ての情報グループを取得して予測値生成部４３に出力する。

予測値生成部４３は、第２実施形態の予測値生成部２４と同じ構成を有していてもよいし、第３実施形態の予測値生成部３２と同じ構成を有していてもよい。

＜ルール生成装置の動作例＞
以上の構成を有するルール生成装置４０の処理動作の一例について説明する。

（条件生成処理）
図１６から図２１は、第４実施形態における条件生成処理の一例を示すフローチャートである。

ステップＳ５０１～Ｓ５０６の処理は、ステップＳ２０１～Ｓ２０６と同じである。

条件生成制御部４２Ａは、第１保持部２３Ｄに保持された情報セットの第１部分集合及び第２部分集合を用いて「第１統計値」を算出する（ステップＳ５０７）。

条件生成制御部４２Ａは、ステップＳ５０４にて生成された複数の単純条件候補のすべてが使用単純条件候補として選択されたか否かを判定する（ステップＳ５０８）。複数の単純条件候補のすべてが使用単純条件候補として選択されていないと判定された場合（ステップＳ５０８ＮＯ）、条件生成制御部４２Ａは、処理ステップをステップＳ５０５に戻す制御を実行する。これにより、分割部２３Ｃは、未だ選択していない単純条件候補を使用単純条件候補として選択することになる。

すべてが使用単純条件候補として選択されていると判定された場合（ステップＳ５０８ＹＥＳ）、条件生成制御部４２Ａは、第１保持部２３Ｄに保持されている情報セットのうちで対応する第１統計値が最も小さい情報セットを選択する（ステップＳ５０９）。

条件生成制御部４２Ａは、選択した情報セットの第１情報グループ及び第２情報グループを第１保持部２３Ｄから受け取って第２保持部２３Ｅに保持させる（ステップＳ５１０）。その後、条件生成制御部２３Ａは、第１保持部２３Ｄに保持している情報セットのすべてを削除させる（ステップＳ５１０）。

条件生成制御部４２Ａは、第２保持部２３Ｅに保持させた第１情報グループ及び第２情報グループのそれぞれについて終了条件を満たしているか否かを判定する（ステップＳ５１１）。

条件生成制御部４２Ａは、終了条件を満たしている情報グループにフラグを付す（ステップＳ５１１ＹＥＳ、ステップＳ５１２）。第１情報グループ及び第２情報グループのいずれも終了条件を満たしていないと判定された場合（ステップＳ５１１ＮＯ）、処理ステップは、ステップＳ５１３に進む。

条件生成制御部４２Ａは、第２保持部２３Ｅにフラグが付されていない情報グループが保持されているか否かを判定する（ステップＳ５１３）。

第２保持部２３Ｅにフラグが付されていない情報グループが保持されている場合（ステップＳ５１３ＹＥＳ）、条件生成制御部４２Ａは、第２保持部２３Ｅからフラグが付されていない情報グループを１つ取得して、単純条件候補生成部２３Ｂ及び分割部２３Ｃに出力する（ステップＳ５１４）。その後、条件生成制御部４２Ａは、取得した情報グループを第２保持部２３Ｅに削除させる（ステップＳ５１４）。単純条件候補生成部２３Ｂ及び分割部２３Ｃへ出力された情報グループの部分集合は、２番目以降の分割処理対象集合である。

ステップＳ５１５～Ｓ５１９の処理は、ステップＳ２１８～Ｓ２２２と同じである。

条件生成制御部４２Ａは、第１保持部２３Ｄに保持された情報セットの第１部分集合及び第２部分集合を用いて「第１統計値」を算出する（ステップＳ５２０）。

条件生成制御部４２Ａは、ステップＳ５１７にて生成された複数の単純条件候補のすべてが使用単純条件候補として選択されたか否かを判定する（ステップＳ５２１）。複数の単純条件候補のすべてが使用単純条件候補として選択されていないと判定された場合（ステップＳ５１２ＮＯ）、条件生成制御部４２Ａは、処理ステップをステップＳ５１８に戻す制御を実行する。これにより、分割部２３Ｃは、未だ選択していない単純条件候補を使用単純条件候補として選択することになる。

すべてが使用単純条件候補として選択されていると判定された場合（ステップＳ５２１ＹＥＳ）、条件生成制御部４２Ａは、第１保持部２３Ｄに保持されている情報セットのうちで対応する第１統計値が最も小さい情報セットを選択する（ステップＳ５２２）。

条件生成制御部４２Ａは、選択した情報セットの第１情報グループ及び第２情報グループを第１保持部２３Ｄから受け取って第２保持部２３Ｅに保持させる（ステップＳ５２３）。その後、条件生成制御部２３Ａは、第１保持部２３Ｄに保持している情報セットのすべてを削除させる（ステップＳ５２３）。

条件生成制御部４２Ａは、第２保持部２３Ｅに保持させた第１情報グループ及び第２情報グループのそれぞれについて終了条件を満たしているか否かを判定する（ステップＳ５２４）。

条件生成制御部４２Ａは、終了条件を満たしている情報グループにフラグを付す（ステップＳ５２４ＹＥＳ、ステップＳ５２５）。第１情報グループ及び第２情報グループのいずれも終了条件を満たしていないと判定された場合（ステップＳ５２４ＮＯ）、処理ステップは、ステップＳ５１３に進む。

第２保持部２３Ｅに保持されているすべての情報グループにフラグが付されていると判定された場合（ステップＳ５１３ＹＥＳ）、条件生成制御部４２Ａは、第２保持部２３Ｅに保持されている複数の情報グループから、実用例を含んでいない部分集合の情報グループを削除する（ステップＳ５２６）。

条件生成制御部４２Ａは、第２保持部２３Ｅに保持されている情報グループが存在するか否かを判定する（ステップＳ５２７）。第２保持部２３Ｅに保持されている情報グループが存在しない場合（ステップＳ５２７ＮＯ）、処理ステップは、ステップＳ５０２に戻る。

第２保持部２３Ｅに保持されている情報グループが存在する場合（ステップＳ５２７ＹＥＳ）、条件生成制御部４２Ａは、第２保持部２３Ｅに保持されている全ての情報グループを取得して予測値生成部４３に出力する（ステップＳ５２８）。なお、条件生成制御部４２Ａは、予測値生成部４３に出力する各情報グループの条件集合を、条件集合に含まれる複数の単純条件をＡＮＤで繋いだ「複合条件」の形にしてもよい。

＜他の実施形態＞
＜１＞第１実施形態から第４実施形態では主に回帰が適用された場合を説明した。クラス分類の場合には、ルールの予測値としてクラスへの出現確率を計算すればよい。決定木を利用する場合、葉ノードに含まれる実用例が属するクラスの出現確率の高いクラスを、ルールの予測値としてもよい。

＜２＞図２２は、ルール生成装置のハードウェア構成例を示す図である。図２２においてルール生成装置１００は、プロセッサ１０１と、メモリ１０２とを有している。プロセッサ１０１は、例えば、マイクロプロセッサ、MPU（Micro Processing Unit）、又はCPU（Central Processing Unit）であってもよい。プロセッサ１０１は、複数のプロセッサを含んでもよい。メモリ１０２は、揮発性メモリ及び不揮発性メモリの組み合わせによって構成される。メモリ１０２は、プロセッサ１０１から離れて配置されたストレージを含んでもよい。この場合、プロセッサ１０１は、図示されていないI/Oインタフェースを介してメモリ１０２にアクセスしてもよい。

第１実施形態から第４実施形態のルール生成装置１０，２０，３０，４０は、それぞれ、図２２に示したハードウェア構成を有することができる。第１実施形態から第４実施形態のルール生成装置１０，２０，３０，４０の取得部１１，２１と、ルール生成部１２，２２，３１，４１とは、プロセッサ１０１がメモリ１０２に記憶されたプログラムを読み込んで実行することにより実現されてもよい。上記の記憶部（不図示）は、メモリ１０２によって実現されてもよい。プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、ルール生成装置１０，２０，３０，４０に供給することができる。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）を含む。さらに、非一時的なコンピュータ可読媒体の例は、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗを含む。さらに、非一時的なコンピュータ可読媒体の例は、半導体メモリを含む。半導体メモリは、例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory）を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってルール生成装置１０，２０，３０，４０に供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをルール生成装置１０，２０，３０，４０に供給できる。

以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

（付記１）
複数の用例を含む訓練用例を取得する手段であって、前記複数の用例は、少なくとも１つの実用例及び少なくとも１つの人工用例を含み、前記実用例及び前記人工用例のそれぞれは、それぞれ異なる特徴パラメータに対応する１つ以上の特徴量をベクトル要素とする特徴量ベクトルと目標値とを含み、各実用例に含まれる特徴量及び目標値は実測値である一方、各人工用例は、前記実用例に基づいて形成された用例である、取得手段と、
前記訓練用例を前記目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成する手段であって、前記ルール群の各ルールは、前記特徴パラメータに関する１つ以上の単純条件を含む条件集合から得られる条件と前記目標値に関する予測値とを含む、ルール生成手段と、
を具備し、
前記第１の制約は、各クラスタがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、
ルール生成装置。

（付記２）
前記ルール生成手段は、
前記各ルールの条件を生成する条件生成手段と、
前記各ルールの予測値を生成する予測値生成手段と、
を具備する、
付記１記載のルール生成装置。

（付記３）
前記条件生成手段は、
親ノードを複数の子ノードに分割するための単純条件を第２の制約に従って決定する手段であって、前記第２の制約は、各子ノードがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、条件生成制御手段を具備する、
付記２記載のルール生成装置。

（付記４）
前記条件生成手段は、
条件生成制御手段と、
分割処理対象集合に含まれる用例の複数の前記特徴パラメータにそれぞれ対応する複数の説明変数のうちの１つを選択し、前記選択した説明変数を用いて複数の閾値を生成することにより前記選択した説明変数についての複数の単純条件候補を生成する単純条件候補生成手段と、
前記生成された複数の単純条件候補から１つの単純条件候補を処理に使用する使用単純条件候補として順次選択し、前記使用単純条件候補に基づいて前記分割処理対象集合に含まれる複数の用例を分けることによって第１部分集合及び第２部分集合を形成し、前記第１部分集合に前記使用単純条件候補を条件集合として対応づけた第１情報グループと、前記第２部分集合に前記使用単純条件候補の否定条件を条件集合として対応づけた第２情報グループとを含む情報セットを、各単純条件候補について出力して第１保持手段に記憶させる分割手段と、
をさらに具備し、
最初の前記分割処理対象集合は、前記訓練用例であり、
前記条件生成制御手段は、
前記記憶されている複数の情報セットから、前記第１部分集合及び前記第２部分集合のそれぞれが第２の制約を満たし、且つ、前記第１部分集合及び前記第２部分集合から算出される第１統計値が最も小さい、情報セットを選択すること、
前記選択した情報セットの前記第１情報グループ及び前記第２情報グループを第２保持手段に保持させた後に、前記記憶されている情報セットを前記第１保持手段に削除させること、
前記保持させた第１情報グループ及び第２情報グループのそれぞれについて終了条件を満たしているか否かを判定して前記終了条件を満たしている情報グループに処理完了情報を付すこと、並びに、
２番目以降の前記分割処理対象集合として、前記第２保持手段に保持され且つ前記処理完了情報が付されていない情報グループを前記第２保持手段から取得して前記単純条件候補生成手段に出力すること、を実行し、
前記第２の制約は、前記第１部分集合及び前記第２部分集合のそれぞれがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、
付記２記載のルール生成装置。

（付記５）
前記条件生成制御手段は、前記第２保持手段に保持されている全ての情報グループに前記処理完了情報が付されている場合、前記全ての情報グループを前記第２保持手段から取得して出力する、
付記４記載のルール生成装置。

（付記６）
前記条件生成手段は、
条件生成制御手段と、
分割処理対象集合に含まれる用例の複数の前記特徴パラメータにそれぞれ対応する複数の説明変数のうちの１つを選択し、前記選択した説明変数を用いて複数の閾値を生成することにより前記選択した説明変数についての複数の単純条件候補を生成する単純条件候補生成手段と、
前記生成された複数の単純条件候補から１つの単純条件候補を処理に使用する使用単純条件候補として順次選択し、前記使用単純条件候補に基づいて前記分割処理対象集合に含まれる複数の用例を分けることによって第１部分集合及び第２部分集合を形成し、前記第１部分集合に前記使用単純条件候補を条件集合として対応づけた第１情報グループと、前記第２部分集合に前記使用単純条件候補の否定条件を条件集合として対応づけた第２情報グループとを含む情報セットを、各単純条件候補について出力して第１保持手段に記憶させる分割手段と、
をさらに具備し、
最初の前記分割処理対象集合は、前記訓練用例であり、
前記条件生成制御手段は、
前記記憶されている複数の情報セットから、前記第１部分集合及び前記第２部分集合から算出される第１統計値が最も小さい、情報セットを選択すること、
前記選択した情報セットの前記第１情報グループ及び前記第２情報グループを第２保持手段に保持させた後に、前記記憶されている情報セットを前記第１保持手段に削除させること、
前記保持させた第１情報グループ及び第２情報グループのそれぞれについて終了条件を満たしているか否かを判定して前記終了条件を満たしている情報グループに処理完了情報を付すこと、
２番目以降の前記分割処理対象集合として、前記第２保持手段に保持され且つ前記処理完了情報が付されていない情報グループを前記第２保持手段から取得して前記単純条件候補生成手段に出力すること、
前記第２保持手段に保持されている全ての情報グループに前記処理完了情報が付されている場合、前記第２保持手段に保持されている複数の情報グループから、実用例をＮ（Ｎは自然数）以上含んでいない部分集合の情報グループを削除すること、並びに、
前記第２保持手段に削除されずに残っている全ての情報グループを取得して出力すること、を実行する、
付記２記載のルール生成装置。

（付記７）
前記予測値生成手段は、
前記条件生成制御手段から出力された複数の情報グループから処理対象情報グループを順次選択し、前記処理対象情報グループの処理対象部分集合に含まれる実用例の目標値に関する第２統計値と前記処理対象部分集合に含まれる各人工用例の目標値とに基づいて乖離値を算出する乖離値算出手段と、
第１閾値以上である前記算出された乖離値に対応する人工用例を前記処理対象部分集合から除去して前記処理対象部分集合を調整する調整手段と、
前記調整後の処理対象部分集合に含まれるすべての用例の目標値に関する第３統計値を、前記調整後の処理対象部分集合の処理対象情報グループに対応するルールの予測値として算出する予測値算出手段と、
を具備する、
付記５又は６に記載のルール生成装置。

（付記８）
前記予測値生成手段は、
前記条件生成制御手段から出力された複数の情報グループから処理対象情報グループを順次選択し、前記処理対象情報グループの処理対象部分集合に含まれる実用例の目標値に関する第２統計値を、前記処理対象部分集合の処理対象情報グループに対応するルールの予測値として算出する予測値算出手段を具備する、
付記５又は６に記載のルール生成装置。

（付記９）
前記ルールベースモデルは、決定木又は決定リストである、
付記１から８のいずれか１項に記載のルール生成装置。

（付記１０）
ルール生成方法であって、
複数の用例を含む訓練用例を取得することを含み、前記複数の用例は、少なくとも１つの実用例及び少なくとも１つの人工用例を含み、前記実用例及び前記人工用例のそれぞれは、それぞれ異なる特徴パラメータに対応する１つ以上の特徴量をベクトル要素とする特徴量ベクトルと目標値とを含み、各実用例に含まれる特徴量及び目標値は実測値である一方、各人工用例は、前記実用例に基づいて形成された用例であり、
前記ルール生成方法は、
前記訓練用例を前記目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成することをさらに含み、
前記ルール群の各ルールは、前記特徴パラメータに関する１つ以上の単純条件を含む条件集合から得られる条件と前記目標値に関する予測値とを含み、
前記第１の制約は、各クラスタがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、
ルール生成方法。

（付記１１）
複数の用例を含む訓練用例を取得することを含む処理を、ルール生成装置に実行させ、
前記複数の用例は、少なくとも１つの実用例及び少なくとも１つの人工用例を含み、
前記実用例及び前記人工用例のそれぞれは、それぞれ異なる特徴パラメータに対応する１つ以上の特徴量をベクトル要素とする特徴量ベクトルと目標値とを含み、各実用例に含まれる特徴量及び目標値は実測値である一方、各人工用例は、前記実用例に基づいて形成された用例であり、
前記処理は、前記訓練用例を前記目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成することをさらに含み、
前記ルール群の各ルールは、前記特徴パラメータに関する１つ以上の単純条件を含む条件集合から得られる条件と前記目標値に関する予測値とを含み、
前記第１の制約は、各クラスタがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、
制御プログラムが格納された非一時的なコンピュータ可読媒体。

１０ルール生成装置
１１取得部
１２ルール生成部
２０ルール生成装置
２１取得部
２２ルール生成部
２３条件生成部
２３Ａ条件生成制御部
２３Ｂ単純条件候補生成部
２３Ｃ分割部
２３Ｄ第１保持部
２３Ｅ第２保持部
２４予測値生成部
２４Ａ乖離値算出部
２４Ｂ調整部
２４Ｃ予測値算出部
３０ルール生成装置
３１ルール生成部
３２予測値生成部
３２Ａ調整部
３２Ｂ予測値算出部
４０ルール生成装置
４１ルール生成部
４２条件生成部
４２Ａ条件生成制御部
４３予測値生成部

Claims

複数の用例を含む訓練用例を取得する手段であって、前記複数の用例は、少なくとも１つの実用例及び少なくとも１つの人工用例を含み、前記実用例及び前記人工用例のそれぞれは、それぞれ異なる特徴パラメータに対応する１つ以上の特徴量をベクトル要素とする特徴量ベクトルと目標値とを含み、各実用例に含まれる特徴量及び目標値は実測値である一方、各人工用例は、前記実用例に基づいて形成された用例である、取得手段と、
前記訓練用例を前記目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成する手段であって、前記ルール群の各ルールは、前記特徴パラメータに関する１つ以上の単純条件を含む条件集合から得られる条件と前記目標値に関する予測値とを含む、ルール生成手段と、
を具備し、
前記第１の制約は、各クラスタがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、
ルール生成装置。
前記ルール生成手段は、
前記各ルールの条件を生成する条件生成手段と、
前記各ルールの予測値を生成する予測値生成手段と、
を具備する、
請求項１記載のルール生成装置。
前記条件生成手段は、
親ノードを複数の子ノードに分割するための単純条件を第２の制約に従って決定する手段であって、前記第２の制約は、各子ノードがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、条件生成制御手段を具備する、
請求項２記載のルール生成装置。
前記条件生成手段は、
条件生成制御手段と、
分割処理対象集合に含まれる用例の複数の前記特徴パラメータにそれぞれ対応する複数の説明変数のうちの１つを選択し、前記選択した説明変数を用いて複数の閾値を生成することにより前記選択した説明変数についての複数の単純条件候補を生成する単純条件候補生成手段と、
前記生成された複数の単純条件候補から１つの単純条件候補を処理に使用する使用単純条件候補として順次選択し、前記使用単純条件候補に基づいて前記分割処理対象集合に含まれる複数の用例を分けることによって第１部分集合及び第２部分集合を形成し、前記第１部分集合に前記使用単純条件候補を条件集合として対応づけた第１情報グループと、前記第２部分集合に前記使用単純条件候補の否定条件を条件集合として対応づけた第２情報グループとを含む情報セットを、各単純条件候補について出力して第１保持手段に記憶させる分割手段と、
をさらに具備し、
最初の前記分割処理対象集合は、前記訓練用例であり、
前記条件生成制御手段は、
前記記憶されている複数の情報セットから、前記第１部分集合及び前記第２部分集合のそれぞれが第２の制約を満たし、且つ、前記第１部分集合及び前記第２部分集合から算出される第１統計値が最も小さい、情報セットを選択すること、
前記選択した情報セットの前記第１情報グループ及び前記第２情報グループを第２保持手段に保持させた後に、前記記憶されている情報セットを前記第１保持手段に削除させること、
前記保持させた第１情報グループ及び第２情報グループのそれぞれについて終了条件を満たしているか否かを判定して前記終了条件を満たしている情報グループに処理完了情報を付すこと、並びに、
２番目以降の前記分割処理対象集合として、前記第２保持手段に保持され且つ前記処理完了情報が付されていない情報グループを前記第２保持手段から取得して前記単純条件候補生成手段に出力すること、を実行し、
前記第２の制約は、前記第１部分集合及び前記第２部分集合のそれぞれがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、
請求項２記載のルール生成装置。
前記条件生成制御手段は、前記第２保持手段に保持されている全ての情報グループに前記処理完了情報が付されている場合、前記全ての情報グループを前記第２保持手段から取得して出力する、
請求項４記載のルール生成装置。
前記条件生成手段は、
条件生成制御手段と、
分割処理対象集合に含まれる用例の複数の前記特徴パラメータにそれぞれ対応する複数の説明変数のうちの１つを選択し、前記選択した説明変数を用いて複数の閾値を生成することにより前記選択した説明変数についての複数の単純条件候補を生成する単純条件候補生成手段と、
前記生成された複数の単純条件候補から１つの単純条件候補を処理に使用する使用単純条件候補として順次選択し、前記使用単純条件候補に基づいて前記分割処理対象集合に含まれる複数の用例を分けることによって第１部分集合及び第２部分集合を形成し、前記第１部分集合に前記使用単純条件候補を条件集合として対応づけた第１情報グループと、前記第２部分集合に前記使用単純条件候補の否定条件を条件集合として対応づけた第２情報グループとを含む情報セットを、各単純条件候補について出力して第１保持手段に記憶させる分割手段と、
をさらに具備し、
最初の前記分割処理対象集合は、前記訓練用例であり、
前記条件生成制御手段は、
前記記憶されている複数の情報セットから、前記第１部分集合及び前記第２部分集合から算出される第１統計値が最も小さい、情報セットを選択すること、
前記選択した情報セットの前記第１情報グループ及び前記第２情報グループを第２保持手段に保持させた後に、前記記憶されている情報セットを前記第１保持手段に削除させること、
前記保持させた第１情報グループ及び第２情報グループのそれぞれについて終了条件を満たしているか否かを判定して前記終了条件を満たしている情報グループに処理完了情報を付すこと、
２番目以降の前記分割処理対象集合として、前記第２保持手段に保持され且つ前記処理完了情報が付されていない情報グループを前記第２保持手段から取得して前記単純条件候補生成手段に出力すること、
前記第２保持手段に保持されている全ての情報グループに前記処理完了情報が付されている場合、前記第２保持手段に保持されている複数の情報グループから、実用例をＮ（Ｎは自然数）以上含んでいない部分集合の情報グループを削除すること、並びに、
前記第２保持手段に削除されずに残っている全ての情報グループを取得して出力すること、を実行する、
請求項２記載のルール生成装置。
前記予測値生成手段は、
前記条件生成制御手段から出力された複数の情報グループから処理対象情報グループを順次選択し、前記処理対象情報グループの処理対象部分集合に含まれる実用例の目標値に関する第２統計値と前記処理対象部分集合に含まれる各人工用例の目標値とに基づいて乖離値を算出する乖離値算出手段と、
第１閾値以上である前記算出された乖離値に対応する人工用例を前記処理対象部分集合から除去して前記処理対象部分集合を調整する調整手段と、
前記調整後の処理対象部分集合に含まれるすべての用例の目標値に関する第３統計値を、前記調整後の処理対象部分集合の処理対象情報グループに対応するルールの予測値として算出する予測値算出手段と、
を具備する、
請求項５又は６に記載のルール生成装置。
前記予測値生成手段は、
前記条件生成制御手段から出力された複数の情報グループから処理対象情報グループを順次選択し、前記処理対象情報グループの処理対象部分集合に含まれる実用例の目標値に関する第２統計値を、前記処理対象部分集合の処理対象情報グループに対応するルールの予測値として算出する予測値算出手段を具備する、
請求項５又は６に記載のルール生成装置。
ルール生成方法であって、
複数の用例を含む訓練用例を取得することを含み、前記複数の用例は、少なくとも１つの実用例及び少なくとも１つの人工用例を含み、前記実用例及び前記人工用例のそれぞれは、それぞれ異なる特徴パラメータに対応する１つ以上の特徴量をベクトル要素とする特徴量ベクトルと目標値とを含み、各実用例に含まれる特徴量及び目標値は実測値である一方、各人工用例は、前記実用例に基づいて形成された用例であり、
前記ルール生成方法は、
前記訓練用例を前記目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成することをさらに含み、
前記ルール群の各ルールは、前記特徴パラメータに関する１つ以上の単純条件を含む条件集合から得られる条件と前記目標値に関する予測値とを含み、
前記第１の制約は、各クラスタがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、
ルール生成方法。
複数の用例を含む訓練用例を取得することを含む処理を、ルール生成装置に実行させ、
前記複数の用例は、少なくとも１つの実用例及び少なくとも１つの人工用例を含み、
前記実用例及び前記人工用例のそれぞれは、それぞれ異なる特徴パラメータに対応する１つ以上の特徴量をベクトル要素とする特徴量ベクトルと目標値とを含み、各実用例に含まれる特徴量及び目標値は実測値である一方、各人工用例は、前記実用例に基づいて形成された用例であり、
前記処理は、前記訓練用例を前記目標値に関する複数のクラスタに分けるためのルール群を、ルールベースモデルを用いて且つ第１の制約を満たすように生成することをさらに含み、
前記ルール群の各ルールは、前記特徴パラメータに関する１つ以上の単純条件を含む条件集合から得られる条件と前記目標値に関する予測値とを含み、
前記第１の制約は、各クラスタがＮ（Ｎは自然数）個以上の実用例を含むという制約を含む、
制御プログラム。