JP7392304B2

JP7392304B2 - 予測プログラム、予測方法および予測装置

Info

Publication number: JP7392304B2
Application number: JP2019126209A
Authority: JP
Inventors: 拓也 ▲高▼木; 洋哲岩下; 啓介後藤; 耕太郎大堀
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-07-05
Filing date: 2019-07-05
Publication date: 2023-12-06
Anticipated expiration: 2039-07-05
Also published as: JP2021012531A; CN112183571A; US11989663B2; EP3764289A1; US20210004698A1; CN112183571B

Description

本発明の実施形態は、予測プログラム、予測方法および予測装置に関する。

従来、離散データの非線形分類に用いられる技術として、教師つきの訓練データによってデータを分類するために用いる分類ルール、すなわち決定木を機械学習し、学習した決定木を用いて入力データの分類結果を予測する技術がある。

L. Breiman, Machine Learning, vol.45, pp. 5-32 (2001)

入力データに対する予測については、分類ルールを用いて、最適なアクション（例えば、製造工程において次に行う工程の制御をどうするか、マーケティング対象の顧客に対して次に行うべき働きかけをどうするか等）を特定（予測）することが目的の１つとして挙げられる。

しかしながら、予測のための分類ルールは複数生成される場合がある。このため、上記の従来技術では、最適なアクションを予測する際に、複数の分類ルールそれぞれに基づくアクションをすべて（総当たりで）試行することとなり、処理コストの増大を招くという問題がある。

１つの側面では、入力データに対する予測を効率的に行うことを可能とする予測プログラム、予測方法および予測装置を提供することを目的とする。

第１の案では、予測プログラムは、受け付ける処理と、生成する処理と、判定する処理とをコンピュータに実行させる。受け付ける処理は、予測対象の入力データを受け付ける。生成する処理は、それぞれが複数の属性の属性値の組合せとラベルとの対応付けにより示される複数のルール情報に基づいて、複数の属性についての所定の順序条件に従って複数のルール情報を集約したデータであって、属性値を枝とする木構造データを生成する。判定する処理は、入力データに基づき、木構造データにおいて複数の属性のうちの所定の属性の属性値を所定の値に確定した場合に、判定結果として所定のラベルの値が得られる確度に基づいて、所定の属性の所定の値の、判定結果が所定のラベルとなることに対する寄与の度合を判定する。

本発明の１実施態様によれば、入力データに対する予測を効率的に行うことができる。

図１は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。図２は、実施形態にかかる情報処理装置の動作例を示すフローチャートである。図３は、訓練データの一例を示す説明図である。図４は、仮説の生成を説明する説明図である。図５は、仮説の生成を説明する説明図である。図６は、仮説の生成を説明する説明図である。図７は、生成された仮説の一例を示す説明図である。図８は、入力データに適合する仮説を説明する説明図である。図９は、ロジスティック回帰による重み付けを説明する説明図である。図１０は、仮説の選別を説明する説明図である。図１１は、木構造データの生成を説明する説明図である。図１２－１は、所定のラベルの値が得られる確度の算出例を説明する説明図である。図１２－２は、所定のラベルの値が得られる確度の算出例を説明する説明図である。図１２－３は、所定のラベルの値が得られる確度の算出例を説明する説明図である。図１３は、寄与の度合を例示する説明図である。図１４－１は、所定のラベルの値が得られる確度の算出例を説明する説明図である。図１４－２は、所定のラベルの値が得られる確度の算出例を説明する説明図である。図１４－３は、所定のラベルの値が得られる確度の算出例を説明する説明図である。図１５は、予測結果の出力を説明する説明図である。図１６は、実施形態にかかる情報処理装置のハードウエア構成例を説明する説明図である。

以下、図面を参照して、実施形態にかかる予測プログラム、予測方法および予測装置を説明する。実施形態において同一の機能を有する構成には同一の符号を付し、重複する説明は省略する。なお、以下の実施形態で説明する予測プログラム、予測方法および予測装置は、一例を示すに過ぎず、実施形態を限定するものではない。また、以下の各実施形態は、矛盾しない範囲内で適宜組みあわせてもよい。

図１は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。

図１に示すように、情報処理装置１は、入力部１０、記憶部２０、仮説生成部３０、学習部４０、予測部５０および出力部６０を有する。

入力部１０は、機械学習に関する訓練データ２１や、予測対象となる入力データ２２などの各種データの入力を受け付ける処理部である。入力部１０は、入力を受け付けた訓練データ２１や入力データ２２を記憶部２０に格納する。

記憶部２０は、例えば訓練データ２１、入力データ２２、仮説集合データ２３、重みデータ２４および結果データ２５などの各種データを記憶する。

仮説生成部３０は、それぞれに説明変数および目的変数を有する訓練データ２１から、説明変数の組み合わせにより構成される仮説（目的変数に応じた予測となることを説明するルール（根拠））を網羅的に探索する。

次いで、仮説生成部３０は、探索した仮説それぞれについて、訓練データ２１の説明変数および目的変数をもとに、訓練データ２１のいずれかを分類し、特定の条件を満たす仮説を特定する。ここで、特定の条件とは、仮説（説明変数の組み合わせ）が示すルールによって所定のクラスに分類される訓練データ２１の数または割合が所定の値以上であることなどである。例えば、仮説生成部３０は、探索した仮説について、その仮説により分類される訓練データ２１の数または割合が所定の値以上であり、仮説による分類結果があるクラスに属することを一定以上のサンプル数かつ（または）一定以上のサンプル割合で説明しているものを特定する。つまり、仮説生成部３０は、訓練データ２１の目的変数に応じた予測となることを正しく説明している可能性のある仮説を特定する。

次いで、仮説生成部３０は、特定した仮説を仮説集合に加える。このようにして、仮説生成部３０は、訓練データ２１の目的変数に応じた予測となることを正しく説明している可能性のある仮説を仮説集合に列挙する。次いで、仮説生成部３０は、仮説を列挙した仮説集合を示す仮説集合データ２３を記憶部２０に格納する。この仮説集合に列挙された各仮説は、それぞれが複数の属性の属性値の組み合わせ（説明変数の組み合わせ）とラベル（目的変数）との対応付けにより示される複数のルール情報の一例である。

学習部４０は、訓練データ２１それぞれに対する、仮説集合データ２３の仮説集合に含まれる複数の仮説それぞれの成立有無に基づき、複数の仮説それぞれの重みを算出する学習を行う。学習部４０は、学習結果により得られた複数の仮説それぞれの重みを重みデータ２４として記憶部２０に格納する。このようにして得られた仮説集合データ２３および重みデータ２４が、予測結果を得るための予測モデルである。

予測部５０は、仮説集合データ２３による仮説集合と、重みデータ２４による複数の仮説の重み、すなわち予測モデルを用いて、予測対象である入力データ２２に基づき予測結果を生成する処理部である。予測部５０は、生成した予測結果を結果データ２５として記憶部２０に格納する。

入力データ２２には、例えば既知のアクション（説明変数の一部）と、目標とするラベル（目的変数）とが含まれる。予測部５０は、未知のアクション（残りの説明変数）について、仮説集合データ２３による仮説集合と、予測モデルを用いて、既知のアクションを行ったうえで目標とするラベルとなるような最適な説明変数の値、すなわち最適なアクションを予測する。

例えば、製造工程において、良品を製造するために次に行う工程の制御をどうするかを予測する場合、入力データ２２に含まれる既知のアクションには、製造工程における観測値や制御の設定値などがある。また、目標とするラベルには、製造工程で製造される製品が良品であることを示すものがある。これにより、予測部５０は、良品を製造するために次に行う工程の制御（未知のアクション）をどうするかを予測することができる。

また、例えば、マーケティングが成功するために顧客に対して次に行うべき働きかけをどうするかを予測する場合、入力データ２２に含まれる既知のアクションには、マーケティングにおけるユーザへの応対内容などがある。また、目標とするラベルには、マーケティングが成功することを示すものがある。これにより、予測部５０は、マーケティングが成功するために顧客に対して次に行うべき働きかけ（未知のアクション）をどうするかを予測することができる。

具体的には、予測部５０は、仮説集合データ２３に基づいて、複数の属性についての所定の順序条件に従って仮説集合に列挙された各仮説を集約したデータであって、属性値（説明変数の値）を枝とする木構造データを生成する。

複数の属性の順序条件については、ルールベースや入力データ２２におけるユーザ設定として予め設定されているものとする。具体的には、複数の属性について、製造工程における工程順などに対応する順序（例えばＡ→Ｂ→Ｃ→…）が予め設定されている。したがって、予測部５０は、製造工程における工程順などに対応した順序で、製造工程における観測値や制御の設定値などの属性値を枝とする木構造データを生成する。

次いで、予測部５０は、生成した木構造データが示す木構造に沿って、入力データ２２に含まれる既知のアクションを行ったうえで目標とするラベルとなるような最適な説明変数の値、すなわち最適なアクションの探索を行う。具体的には、予測部５０は、入力データ２２に基づき、木構造データにおいて複数の属性のうちの所定の属性の属性値を所定の値に確定した場合に、予測モデルの判定結果として所定のラベルの値が得られる確度（例えば予測スコア）に基づいて、所定の属性が所定の値であることが所定のラベルとなることに対する寄与の度合を判定する。次いで、予測部５０は、判定した寄与の度合をもとに、所定の属性における属性値を探索する。具体的には、寄与の度合をより高くする値を所定の属性における属性値とする。

例えば、予測部５０は、入力データ２２に含まれる既知の属性値を木構造データに適用して枝刈りを行う。次いで、予測部５０は、複数の属性のうちの属性値が未知の属性について、未知の属性の属性値を所定の値に確定した場合の判定結果が入力データ２２に含まれるラベルとなることに対する寄与の度合を判定する。次いで、予測部５０は、判定した寄与の度合をもとに、未知の属性における属性値を探索する。例えば、予測部５０は、木構造データをもとに属性値が０の枝をたどって判定した寄与の度合と、属性値が１の枝をたどって判定した寄与の度合いとを比較し、寄与の度合がより高くなる方を求める。

出力部６０は、記憶部２０に格納された結果データ２５を読み出し、ディスプレイやファイルなどに出力する処理部である。これにより、情報処理装置１は、予測部５０が予測した予測結果をディスプレイやファイルなどに出力する。具体的には、情報処理装置１は、予測部５０が予測した最適なアクションの予測結果を出力する。

このように、情報処理装置１は、学習装置および予測装置の一例である。なお、本実施形態では学習および予測を一つの情報処理装置１で統合して行う構成を例示するが、学習および予測については、別々の情報処理装置１で実現してもよい。

次に、情報処理装置１の動作例を示しながら、上記の各機能部の処理を詳細に説明する。図２は、実施形態にかかる情報処理装置１の動作例を示すフローチャートである。

図２に示すように、情報処理装置１の動作は、予測モデルを生成する学習時の動作（Ｓ１）と、生成した予測モデルを予測対象の入力データ２２に適用して予測結果を得る予測時の動作（Ｓ２）とがある。まず、学習時の動作（Ｓ１）について説明する。

図２に示すように、処理が開始されると、入力部１０は、訓練データ２１の入力を受け付け（Ｓ１１）、記憶部２０に格納する。

図３は、訓練データの一例を示す説明図である。訓練データ２１は、複数の事例ごとの教師付きデータであり、データの性質を説明するＡ～Ｄの説明変数と、＋または－への分類結果（正解情報）である目的変数とを含む。

図３に示すように、訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）は、データの性質を説明するＡ～Ｄの説明変数（予測に用いる情報）と、＋または－へのＣｌａｓｓ（分類）を示す正解情報である目的変数（予測したい情報）とを含む。例えば、訓練データＰ_１～Ｐ_４は、目的変数Ａ～Ｄそれぞれが０または１であり、＋に分類されるデータである。同様に、訓練データＮ_１～Ｎ_３は、目的変数Ａ～Ｄそれぞれが０または１であり、－に分類されるデータである。

例えば、製造工程の分野などにおいて、工程のデータから製造品の結果（良品／不良品）を分類する予測モデルを生成するための訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）の場合、Ａ～Ｄの説明変数は工程ごとの観測値、制御値などに対応する。また、目的変数は、良品（Ｐ）／不良品（Ｎ）などの製造結果に対応する。

なお、説明変数（１／０）については、オーバーライン（以下、「バー」と称する）の有無で表現している。例えばＡは、Ａ＝１であり、ＡバーはＡ＝０を示す。また、目的変数（＋／－）については、網掛けで表現している。例えば、訓練データＰ_１～Ｐ_４などの網掛けは、目的変数が＋を示す。また、訓練データＮ_１～Ｎ_３などの網掛けは、目的変数が－を示す。なお、これらの表現は、他の図面でも共通であるものとする。

次いで、仮説生成部３０は、訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）に含まれる説明変数について、それぞれとり得る値（使用しない＝＊、値＝１、値＝０）の組み合わせ、すなわち仮説を網羅的に列挙する（Ｓ１２）。

なお、組み合わせる説明変数の数は、所定の数以下とするように制限（条件）を設けてもよい。例えば、Ａ～Ｄの４説明変数の場合、組み合わせる説明変数の数を２以下とする（４説明変数のうち「使用しない＝＊」とするものを少なくとも２つ組み合わせる）ように制限してもよい。これにより、組み合わせが増大することを事前に抑止できる。

次いで、仮説生成部３０は、Ｓ１２で列挙した組み合わせから所定の組み合わせを選択する（Ｓ１３）。次いで、仮説生成部３０は、訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）の説明変数および目的変数をもとに、選択した組み合わせが訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）のいずれかを分類し、特定の条件を満たす有効な組み合わせであるか否かを判定する（Ｓ１４）。

図４は、仮説の生成を説明する説明図である。図４では、Ａ～Ｄの４説明変数の全てが「＊」である組み合わせＣ０１からＣＤ（ＡＢは「＊」）である組み合わせＣ０９が一例として示されている。

図４に示すように、仮説生成部３０は、訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）の説明変数をもとに、組み合わせＣ０１～Ｃ０９それぞれの仮説（ルール）に該当する訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）を列挙する。

例えば、組み合わせＣ０２のＤバー（残り３説明変数は「使用しない＝＊」）のルールには、訓練データＰ_２、Ｎ_１、Ｎ_２が該当する。この組み合わせＣ０２のルール（Ｄバー）では、目的変数が＋である訓練データ（Ｐ_２）と、目的変数が－である訓練データ（Ｎ_１、Ｎ_２）とが混在している。したがって、組み合わせＣ０２は、あるクラスに分類することを正しく説明する仮説としての可能性が低く、有効な組み合わせとは言えない。

ここで、組み合わせＣ０４のルール（Ｃバー）には、目的変数が＋である訓練データ（Ｐ_１、Ｐ_３、Ｐ_４）が該当する。すなわち、組み合わせＣ０４は、＋のクラスに分類される訓練データ（Ｐ_１、Ｐ_３、Ｐ_４）の数または割合が所定の値以上であり、＋のクラスに分類することを正しく説明するルールとしての可能性が高い。よって、仮説生成部３０は、組み合わせＣ０４（Ｃバー）を、＋のクラスに分類する有効な組み合わせ（仮説）と判定する。同様に、仮説生成部３０は、組み合わせＣ０５、Ｃ０６についても＋のクラスに分類する有効な組み合わせ（仮説）と判定する。

また、組み合わせＣ０８のルール（ＣＤバー）には、目的変数が－である訓練データ（Ｎ_１、Ｎ_２）が該当する。すなわち、組み合わせＣ０８は、－のクラスに分類される訓練データ（Ｎ_１、Ｎ_２）の数または割合が所定の値以上であり、－のクラスに分類することを正しく説明するルールとしての可能性が高い。よって、仮説生成部３０は、組み合わせＣ０８（ＣＤバー）を、－のクラスに分類する有効な組み合わせ（仮説）と判定する。

有効な組み合わせと判定するための条件である、所定のクラスに分類される訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）の数または割合は、任意に設定してもよい。例えば、訓練データにはノイズが混じる場合があることから、所定のクラス（例えば＋）とは逆のクラス（例えば－）を所定数許容するように設定してもよい。

一例として、訓練データ１つ分のノイズを許容する場合、組み合わせＣ０３（Ｄ）については、＋のクラスに分類する有効な組み合わせ（仮説）と判定される。同様に、組み合わせＣ０７（Ｃ）については、－のクラスに分類する有効な組み合わせ（仮説）と判定される。

図２に戻り、組み合わせが有効でない場合（Ｓ１４：ＮＯ）、仮説生成部３０は、選択した組み合わせを仮説集合に加えることなく、Ｓ１７へ処理を進める。

組み合わせが有効である場合（Ｓ１４：ＹＥＳ）、仮説生成部３０は、選択した組み合わせが仮説集合に含まれる他の仮説の特殊ケースになっているか否かを判定する（Ｓ１５）。

例えば、図４における組み合わせＣ０５のＣバーＤと、組み合わせＣ０６のＣバーＤバーとは、組み合わせＣ０４のＣバーに新たなリテラルを付加して作られるものである。このような組み合わせＣ０５、Ｃ０６について、仮説生成部３０は、組み合わせＣ０４のＣバーの特殊ケースになっているものと判定する。

特殊ケースになっている場合（Ｓ１５：ＹＥＳ）、仮説生成部３０は、選択した組み合わせを仮説集合に加えることなく、Ｓ１７へ処理を進める。

図５は、仮説の生成を説明する説明図である。図５に示すように、仮説生成部３０は、Ｃバーの特殊ケースになっている組み合わせ（組み合わせＣ０５、Ｃ０６）は省略し、Ｃバーの組み合わせＣ０４ａを仮説集合として残すようにする。

特殊ケースになっていない場合（Ｓ１５：ＮＯ）、仮説生成部３０は、選択した組み合わせを仮説集合データ２３の仮説集合に加える（Ｓ１６）。次いで、仮説生成部３０は、Ｓ１２で列挙した全ての組み合わせを選択済みであるか否かを判定する（Ｓ１７）。未選択の組み合わせがある場合（Ｓ１７：ＮＯ）、仮説生成部３０はＳ１３へ処理を戻す。

このＳ１３～Ｓ１７の処理を繰り返すことで、仮説生成部３０は、訓練データ２１の目的変数に応じた予測となることを正しく説明している可能性のある仮説をもれなく仮説集合に列挙する。

図６は、仮説の生成を説明する説明図であり、具体的には図４、５の内容をカルノー図例で説明する図である。

図６に示すように、仮説生成部３０は、Ａ（残り３説明変数は「使用しない＝＊」）の組み合わせ（Ｓ３１）、Ａバー（残り３説明変数は「使用しない＝＊」）の組み合わせ（Ｓ３２）…の順に組み合わせを変更して有効な組み合わせを検討する（Ｓ３１～Ｓ３５…）。

ここで、Ｓ３３の（Ｃバー）の組み合わせでは、目的変数が＋である訓練データ（Ｐ_１、Ｐ_３、Ｐ_４）が該当する。すなわち、Ｓ３３では、＋のクラスに分類される訓練データ（Ｐ_１、Ｐ_３、Ｐ_４）の数または割合が所定の値以上である。よって、Ｓ３３の（Ｃバー）の組み合わせを＋のクラスに分類する有効な組み合わせ（仮説）と判定する。なお、以下の処理では、（Ｃバー）にリテラルを加える組み合わせは除外する。

次いで、仮説生成部３０は、３説明変数を「使用しない＝＊」とする全ての組み合わせの検討後に、２説明変数を「使用しない＝＊」とする組み合わせの検討を開始する（Ｓ３４）。ここで、Ｓ３５の（ＡバーＢ）の組み合わせでは、目的変数が＋である訓練データ（Ｐ_１、Ｐ_２）が該当する。すなわち、Ｓ３５では、＋のクラスに分類される訓練データ（Ｐ_１、Ｐ_２）の数または割合が所定の値以上である。よって、Ｓ３５の（ＡバーＢ）の組み合わせを＋のクラスに分類する有効な組み合わせ（仮説）と判定する。

図７は、生成された仮説の一例を示す説明図である。図７に示すように、訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）からは、分類結果が＋または－となる仮説Ｈ１～Ｈ１１の仮説が生成され、仮説集合データ２３として記憶部２０に格納される。

この仮説Ｈ１～Ｈ１１のそれぞれは、訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）の分類結果が＋または－となることについて正しく説明していることを要件とする独立した仮説である。よって、仮説Ｈ２と、仮説Ｈ６のように、相互には矛盾した仮説が含まれる場合がある。

また、訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）に含まれていない入力データ（ＩＮ_１、ＩＮ_２、ＩＮ_３）については、仮説Ｈ１～Ｈ１１の中で適合する仮説から予測結果を得ることができる。

図８は、入力データ（ＩＮ_１、ＩＮ_２、ＩＮ_３）に適合する仮説を説明する説明図である。図８に示すように、入力データＩＮ_１については、仮説Ｈ２のＣＤバー⇒－、仮説Ｈ６のＢＤバー⇒＋、仮説Ｈ８のＡバーＢ⇒＋が適合する仮説である。また、入力データＩＮ_２については、仮説Ｈ４のＢバーＤ⇒＋、仮説Ｈ５のＢバーＣ⇒－、仮説Ｈ７のＡバーＤ⇒＋、仮説Ｈ９のＡバーＢバー⇒－が適合する仮説である。また、入力データＩＮ_３については、仮説Ｈ１のＣバー⇒＋、仮説Ｈ７のＡバーＤ⇒＋、仮説Ｈ８のＡバーＢ⇒＋が適合する仮説である。

図２に戻り、未選択の組み合わせがない場合（Ｓ１７：ＹＥＳ）、学習部４０は、訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）それぞれに対する、仮説集合データ２３の仮説集合に含まれる各仮説（Ｈ１～Ｈ１１）の成立有無に基づき、各仮説（Ｈ１～Ｈ１１）の重みを算出する（Ｓ１８）。次いで、学習部４０は、算出結果を重みデータ２４として記憶部２０に格納する。

学習部４０における重み算出は、例えば次の３つの手法のいずれであってもよい。
・どのルール（Ｈ１～Ｈ１１）も重み１（ルールの数による多数決）とする。
・ルール（Ｈ１～Ｈ１１）を支持（該当）する訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）の数に応じた重みとする。
・訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）を適用したロジスティック回帰による重み付けを行う。

図９は、ロジスティック回帰による重み付けを説明する説明図である。ロジスティック回帰では、図９に示すように、モデル式に訓練データ（Ｐ_１～Ｐ_４、Ｎ_１～Ｎ_３）適用し、仮説Ｈ１～Ｈ１１に関する重み（β_１～β_１１）を求める。このモデル式は、例えば予測スコアを求めるスコア関数に相当する。

ここで、学習部４０は、ロジスティック回帰などで得られた各仮説（Ｈ１～Ｈ１１）の重みに応じて、仮説の選別を行ってもよい。

図１０は、仮説の選別を説明する説明図である。図１０に示すように、学習部４０は、仮説Ｈ１～Ｈ１１の重み（β_１～β_１１）をもとに、重みが所定値以上であり、予測結果に大きな影響を与える主要な仮説を選別する。図示例では、０ではい重みを有する、Ｃバー、ＣＤバー、ＢバーＤバー、ＡバーＢ、ＡＣの５つの仮説Ｈ１～３、Ｈ８、Ｈ１１を主要な仮説として選別している。

図２に戻り、予測時（Ｓ２）の動作について説明する。Ｓ２が開始されると、入力部１０は、予測対象の入力データ２２を受け付けて記憶部２０に格納する（Ｓ２１）。

次いで、予測部５０は、仮説集合データ２３に基づいて、所定の順序条件（例えば工程順）に従って仮説集合に列挙された各仮説を集約し、属性値（説明変数の値）を枝とする木構造データを生成する（Ｓ２２）。

図１１は、木構造データの生成を説明する説明図である。図１１に示すように、仮説集合データ２３は、説明変数Ａ、Ｂ、Ｃ…とラベル（Ｐ・Ｎ）との対応について、Ａ＝１∧Ｂ＝０→Ｐ、Ａ＝１∧Ｃ＝０→Ｎ、Ｂ＝０∧Ｄ＝０→Ｎ…などのルール（仮説）の集合を有する。予測部５０は、この仮説集合データ２３に含まれる各仮説について、順序条件（Ａ→Ｂ→Ｃ→…）をもとに順序関係（Ａ＝１→Ｂ＝１→Ｐ）を導入することで、パスで表現を行う。次いで、予測部５０は、各仮説のパスをルートに近い属性値から順に接続して共通部分を集約することで、属性値を枝として木構造に変換した木構造データ２３ａを生成する。

次いで、予測部５０は、入力データ２２に含まれる既知の属性値を木構造データ２３ａに適用して枝刈りを行った上で、未知の属性値について、所定のラベルの値が得られる確度を求め、所定のラベルとなることに対する寄与の度合を判定する（Ｓ２３）。予測部５０は、寄与の度合の判定による予測結果を結果データ２５として記憶部２０に格納する。

図１２－１～図１２－３は、所定のラベルの値が得られる確度の算出例を説明する説明図である。図１２－１に示すように、Ａ＝１∧Ｂ＝０→Ｐ、Ａ＝１∧Ｃ＝０→Ｎ、Ｂ＝０∧Ｄ＝０→Ｎ…などの仮説集合データ２３より、Ａ、Ｂ、Ｃ、Ｄの属性値を枝とする木構造データ２３ａが得られているものとする。また、入力データ２２には、Ａ＝１、Ｂ＝０とする既知のアクション（説明変数の一部）と、目標とするラベル（Ｐ）とが含まれているものとする。よって、予測部５０は、木構造データ２３ａにおける木構造において、Ａ＝１、Ｂ＝０で枝刈りを行うことで、Ａ、Ｂの枝については探索済（確定済）として扱うものとする。

図１２－２に示すように、予測部５０は、未知の属性値Ｃについて、Ｃ＝０に確定した場合の木構造データ２３ａにおける木構造のパスをたどることで、ＰまたはＮのラベルの値が得られる確度を算出する。

例えば、ラベルＰについては、Ａ＝１→Ｂ＝０→Ｐのパス（ルール）がＣ＝０の場合に成り立つものとして見つかる。また、ラベルＮについては、Ａ＝１→Ｃ＝０→Ｎのパス（ルール）がＣ＝０の場合に成り立つものとして見つかる。Ｂ＝０、Ｄ＝０のパス（ルール）は、Ｃより後順のＤにより未定であるが、Ｃ＝０の場合にラベルＮとして成り立つ可能性のあるものとして見つかる。

予測部５０は、パス（ルール）の総数に対してＣ＝０の場合にＰまたはＮが成り立つ（成り立つ可能性のあるものも含める）数をもとに、Ｃ＝０の場合でＰまたはＮのラベルの値が得られる確度を求める。また、予測部５０は、ＰまたはＮが成り立つパス（ルール）に対してスコア関数の重み付けを行うことで、Ｃ＝０の場合にＰまたはＮのラベルの値が得られる確度を求めてもよい。

また、図１２－３に示すように、予測部５０は、未知の属性値Ｃについて、Ｃ＝１に確定した場合の木構造データ２３ａにおける木構造のパスをたどることで、ＰまたはＮのラベルの値が得られる確度を算出する。

例えば、ラベルＰについては、Ａ＝１→Ｂ＝０→Ｐのパス（ルール）がＣ＝１の場合に成り立つものとして見つかる。また、ラベルＮについては、Ｂ＝０、Ｄ＝０のパス（ルール）がＣ＝１の場合に成り立つ可能性のあるものとして見つかる。

予測部５０は、パス（ルール）の総数に対してＣ＝１の場合にＰまたはＮが成り立つ（成り立つ可能性のあるものも含める）数をもとに、Ｃ＝１の場合でＰまたはＮのラベルの値が得られる確度を求める。また、予測部５０は、ＰまたはＮが成り立つパス（ルール）に対してスコア関数の重み付けを行うことで、Ｃ＝１の場合にＰまたはＮのラベルの値が得られる確度を求めてもよい。

図１３は寄与の度合を例示する説明図である。図１３に示すように、ケース７１は、Ｃ＝０の場合を例示しており、Ｐの満たしているルール数は１、Ｎの満たしているルール数は１となる。また、Ｐの満たしそうな（可能性のある）ルール数は０、Ｎの満たしそうな（可能性のある）ルール数は１である。よって、予測部５０は、Ｃ＝０の場合について、ＰよりもＮのラベルの値が得られる確度を高く算出する。

また、ケース７２は、Ｃ＝１の場合を例示しており、Ｐの満たしているルール数は１、Ｎの満たしているルール数は０となる。また、Ｐの満たしそうな（可能性のある）ルール数は０、Ｎの満たしそうな（可能性のある）ルール数は１である。よって、予測部５０は、Ｃ＝１の場合について、ＮよりもＰのラベルの値が得られる確度を高く算出する。

予測部５０は、ケース７１、７２を比較する（例えばＰとする確度を比較する）ことで、よりＰとする確度が高くなるＣ＝１を予測結果として得る。また、予測部５０は、例えば、Ｃ＝０の場合にＰのラベルの値が得られる確度と、Ｃ＝１の場合にＰのラベルの値が得られる確度との差に基づいて、Ｐのラベルの値に対する属性値Ｃの寄与の度合を判定してもよい。例えば、Ｃ＝０の場合にＰの満たしそうな（可能性のある）ルール数は０、Ｃ＝１の場合にＰの満たしそうな（可能性のある）ルール数は１の場合を第１のケースとする。また、Ｃ＝０の場合にＰの満たしそうな（可能性のある）ルール数は０、Ｃ＝１の場合にＰの満たしそうな（可能性のある）ルール数は２の場合を第２のケースとする。第１のケースと第２のケースを比較すると、Ｃ＝０の場合に対して、Ｃ＝１の場合にＰの満たしそうな（可能性のある）ルール数が、第１のケースでは１増加し、第２のケースでは２増加する。この場合、予測部５０は、第２のケースにおけるＣ＝１の属性値が、Ｐのラベルの値に対して第１のケースにおけるＣ＝１の属性値よりも大きく寄与すると判定することとしてもよい。あるいは、予測部５０は、複数の属性値の中で、属性値が０の場合と１の場合でのＰの満たしそうな（可能性のある）ルール数の差が大きい属性値ほどＰのラベルの値に対する寄与が大きいと判定してもよい。

図１４－１～図１４－３は、所定のラベルの値が得られる確度の算出例を説明する説明図である。図１４－１～図１４－３の例では、図１２－１～図１２－３に例示したものよりも変数を増やしたケースを例示している。

具体的には、Ａ＝１∧Ｃ＝０∧Ｄ＝１→Ｎ、Ａ＝１∧Ｃ＝０∧Ｅ＝１→Ｐ、Ｂ＝０∧Ｄ＝０→Ｎ…などの仮説集合データ２３より、Ａ、Ｂ、Ｃ、Ｄ、Ｅの属性値を枝とする木構造データ２３ａが得られているものとする。また、入力データ２２には、Ａ＝１、Ｂ＝０とする既知のアクション（説明変数の一部）と、目標とするラベル（Ｐ）とが含まれているものとする。よって、予測部５０は、木構造データ２３ａにおける木構造において、Ａ＝１、Ｂ＝０で枝刈りを行うことで、Ａ、Ｂの枝については探索済（確定済）として扱うものとする。

図１４－２に示すように、予測部５０は、未知の属性値Ｃについて、Ｃ＝０に確定した場合の木構造データ２３ａにおける木構造のパスをたどることで、ＰまたはＮのラベルの値が得られる確度を算出する。

例えば、ラベルＰについては、Ａ＝１→Ｃ＝０→Ｅ＝１のパス（ルール）がＣ＝０の場合に成り立つ可能性のあるものとして見つかる。また、ラベルＮについては、Ａ＝１→Ｃ＝０→Ｅ＝０、Ｂ＝０→Ｄ＝０のパス（ルール）がＣ＝０の場合に成り立つ可能性のあるものとして見つかる。

また、図１４－３に示すように、予測部５０は、未知の属性値Ｃについて、Ｃ＝１に確定した場合の木構造データ２３ａにおける木構造のパスをたどることで、ＰまたはＮのラベルの値が得られる確度を算出する。

例えば、ラベルＰについては、Ｃ＝１の場合に成り立つ（可能性のある）ものは０となる。また、ラベルＮについては、Ａ＝１→Ｃ＝１→Ｄ＝１、Ｂ＝０→Ｄ＝０のパス（ルール）がＣ＝１の場合に成り立つ可能性のあるものとして見つかる。

したがって、予測部５０は、Ｃ＝０の場合と、Ｃ＝１の場合とを比較する（例えばＰとする確度を比較する）ことで、よりＰとする確度が高くなるＣ＝０を予測結果として得る。

図２に戻り、出力部６０は、記憶部２０より結果データ２５を読み出し、上記の処理により予測部５０が予測した予測結果をディスプレイやファイルなどに出力する（Ｓ２４）。すなわち、出力部６０は、既知のアクションを行ったうえで目標とするラベルとなるような未知の属性（説明変数）におけるアクション（属性値）を出力する。

図１５は、予測結果の出力を説明する説明図である。図１５に示すように、情報処理装置１には、途中までのデータ（例えば製造工程の途中までに得られた既知の属性値）、満たしてほしいラベル（良品）、スコア計算に使う関数などを含む入力データ２２が入力される。

情報処理装置１の予測部５０は、例えば以後の製造工程における未知のアクションについて、途中までのデータが示す既知のアクションを行ったうえで満たしてほしいラベルとなるような最適なアクション（属性値）を予測する。次いで、出力部６０は、予測した属性値に応じた最適なアクションを結果データ２５として出力する。これにより、ユーザは、例えば以後の製造工程において、満たしてほしいラベル（良品）となるアクションを容易に確認することができる。

以上のように、情報処理装置１は、入力部１０と、予測部５０とを有する。入力部１０は、予測対象の入力データ２２を受け付ける。予測部５０は、それぞれが複数の属性の属性値の組合せとラベルとの対応付けにより示される複数のルール情報（仮説）を含む仮説集合データ２３に基づいて、複数の属性についての所定の順序条件に従って複数の仮説を集約したデータであって、属性値を枝とする木構造データ２３ａを生成する。また、予測部５０は、入力データ２２に基づき、木構造データ２３ａにおいて複数の属性のうちの所定の属性の属性値を所定の値に確定した場合に、判定結果として所定のラベルの値が得られる確度に基づいて、所定の属性が所定の値であることが所定のラベルとなることに対する寄与の度合を判定する。

このように、情報処理装置１では、複数の属性についての所定の順序条件に従って属性値を枝とする木構造データ２３ａを生成し、生成した木構造データ２３ａを用いて所定の属性の値を求めるようにしている。このため、情報処理装置１では、複数の分類ルールそれぞれに基づくアクション（属性）をすべて（総当たりで）試行することなく、木構造に沿ってアクションを試行して予測を効率的に行うことができる。

また、予測部５０は、入力データ２２に含まれる既知の属性値を木構造データ２３ａに適用して枝刈りを行う。そして、予測部５０は、複数の属性のうちの属性値が未知の属性について、未知の属性の属性値を所定の値に確定した場合の判定結果が入力データ２２に含まれるラベルとなることに対する寄与の度合を判定する。これにより、情報処理装置１では、入力データ２２に含まれる既知の属性値（説明変数の一部）と、ラベル（目的変数）とをもとに、未知の属性（残りの説明変数）の予測を効率的に行うことができる。

また、予測部５０は、所定の属性の属性値を第１の値（例えばＣ＝０）に確定した場合の判定結果が所定のラベル（例えばＰ）となることに対する寄与の度合を求める。また、予測部５０は、所定の属性の属性値を第２の値（例えばＣ＝１）に確定した場合の判定結果が所定のラベル（例えばＰ）となることに対する寄与の度合を求める。次いで、予測部５０は、所定の属性の属性値を第１の値とした場合の寄与の度合と、所定の属性の属性値を第２の値とした場合の寄与の度合とを比較して、所定の属性を第１の値および第２の値のいずれにするかを判定する。これにより、情報処理装置１では、例えば寄与の度合がより高くなる方の属性値を予測することができる。

なお、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

情報処理装置１で行われる各種処理機能は、ＣＰＵ（またはＭＰＵ、ＭＣＵ（Micro Controller Unit）等のマイクロ・コンピュータ）上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、ＣＰＵ（またはＭＰＵ、ＭＣＵ等のマイクロ・コンピュータ）で解析実行されるプログラム上、またはワイヤードロジックによるハードウエア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。また、情報処理装置１で行われる各種処理機能は、クラウドコンピューティングにより、複数のコンピュータが協働して実行してもよい。

ところで、上記の実施形態で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータ（ハードウエア）の一例を説明する。図１６は、実施形態にかかる情報処理装置１のハードウエア構成例を説明する説明図である。

図１６に示すように、情報処理装置１は、各種演算処理を実行するＣＰＵ１０１と、データ入力を受け付ける入力装置１０２と、モニタ１０３と、スピーカ１０４とを有する。また、情報処理装置１は、記憶媒体からプログラム等を読み取る媒体読取装置１０５と、各種装置と接続するためのインタフェース装置１０６と、有線または無線により外部機器と通信接続するための通信装置１０７とを有する。また、情報処理装置１は、各種情報を一時記憶するＲＡＭ１０８と、ハードディスク装置１０９とを有する。また、情報処理装置１内の各部（１０１～１０９）は、バス１１０に接続される。

ハードディスク装置１０９には、上記の実施形態で説明した各種の処理を実行するためのプログラム１１１が記憶される。また、ハードディスク装置１０９には、プログラム１１１が参照する各種データ１１２（例えば訓練データ２１、入力データ２２、仮説集合データ２３、重みデータ２４および結果データ２５）が記憶される。入力装置１０２は、例えば、情報処理装置１の操作者から操作情報の入力を受け付ける。モニタ１０３は、例えば、操作者が操作する各種画面を表示する。インタフェース装置１０６は、例えば印刷装置等が接続される。通信装置１０７は、ＬＡＮ（Local Area Network）等の通信ネットワークと接続され、通信ネットワークを介した外部機器との間で各種情報をやりとりする。

ＣＰＵ１０１は、ハードディスク装置１０９に記憶されたプログラム１１１を読み出して、ＲＡＭ１０８に展開して実行することで、入力部１０、仮説生成部３０、学習部４０、予測部５０および出力部６０に関する各種の処理を行う。なお、プログラム１１１は、ハードディスク装置１０９に記憶されていなくてもよい。例えば、情報処理装置１が読み取り可能な記憶媒体に記憶されたプログラム１１１を、情報処理装置１が読み出して実行するようにしてもよい。情報処理装置１が読み取り可能な記憶媒体は、例えば、ＣＤ－ＲＯＭやＤＶＤディスク、ＵＳＢ（Universal Serial Bus）メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、ＬＡＮ等に接続された装置にこのプログラム１１１を記憶させておき、情報処理装置１がこれらからプログラムを読み出して実行するようにしてもよい。

以上の実施形態に関し、さらに以下の付記を開示する。

（付記１）予測対象の入力データを受け付け、
それぞれが複数の属性の属性値の組合せとラベルとの対応付けにより示される複数のルール情報に基づいて、前記複数の属性についての所定の順序条件に従って前記複数のルール情報を集約したデータであって、属性値を枝とする木構造データを生成し、
前記入力データに基づき、前記木構造データにおいて前記複数の属性のうちの所定の属性の属性値を所定の値に確定した場合に、判定結果として所定のラベルの値が得られる確度に基づいて、前記所定の属性の前記所定の値の、前記判定結果が前記所定のラベルとなることに対する寄与の度合を判定する、
処理をコンピュータに実行させることを特徴とする予測プログラム。

（付記２）前記判定する処理は、前記入力データに含まれる既知の属性値を前記木構造データに適用して枝刈りを行った上で、前記複数の属性のうちの属性値が未知の属性について、当該未知の属性の属性値を所定の値に確定した場合の前記判定結果が前記入力データに含まれるラベルとなることに対する寄与の度合を判定する、
ことを特徴とする付記１に記載の予測プログラム。

（付記３）前記判定する処理は、前記所定の属性の属性値を第１の値に確定した場合の前記判定結果が前記所定のラベルとなることに対する寄与の度合と、前記所定の属性の属性値を第２の値に確定した場合の前記判定結果が前記所定のラベルとなることに対する寄与の度合とを比較して、前記所定の属性を前記第１の値および前記第２の値のいずれにするかを判定する、
ことを特徴とする付記１または２に記載の予測プログラム。

（付記４）予測対象の入力データを受け付け、
それぞれが複数の属性の属性値の組合せとラベルとの対応付けにより示される複数のルール情報に基づいて、前記複数の属性についての所定の順序条件に従って前記複数のルール情報を集約したデータであって、属性値を枝とする木構造データを生成し、
前記入力データに基づき、前記木構造データにおいて前記複数の属性のうちの所定の属性の属性値を所定の値に確定した場合に、判定結果として所定のラベルの値が得られる確度に基づいて、前記所定の属性の前記所定の値の、前記判定結果が前記所定のラベルとなることに対する寄与の度合を判定する、
処理をコンピュータが実行することを特徴とする予測方法。

（付記５）前記判定する処理は、前記入力データに含まれる既知の属性値を前記木構造データに適用して枝刈りを行った上で、前記複数の属性のうちの属性値が未知の属性について、当該未知の属性の属性値を所定の値に確定した場合の前記判定結果が前記入力データに含まれるラベルとなることに対する寄与の度合を判定する、
ことを特徴とする付記４に記載の予測方法。

（付記６）前記判定する処理は、前記所定の属性の属性値を第１の値に確定した場合の前記判定結果が前記所定のラベルとなることに対する寄与の度合と、前記所定の属性の属性値を第２の値に確定した場合の前記判定結果が前記所定のラベルとなることに対する寄与の度合とを比較して、前記所定の属性を前記第１の値および前記第２の値のいずれにするかを判定する、
ことを特徴とする付記４または５に記載の予測方法。

（付記７）予測対象の入力データを受け付ける入力部と、
それぞれが複数の属性の属性値の組合せとラベルとの対応付けにより示される複数のルール情報に基づいて、前記複数の属性についての所定の順序条件に従って前記複数のルール情報を集約したデータであって、属性値を枝とする木構造データを生成し、前記入力データに基づき、前記木構造データにおいて前記複数の属性のうちの所定の属性の属性値を所定の値に確定した場合に、判定結果として所定のラベルの値が得られる確度に基づいて、前記所定の属性の前記所定の値の、前記判定結果が前記所定のラベルとなることに対する寄与の度合を判定する予測部と、
を有することを特徴とする予測装置。

（付記８）前記予測部は、前記入力データに含まれる既知の属性値を前記木構造データに適用して枝刈りを行った上で、前記複数の属性のうちの属性値が未知の属性について、当該未知の属性の属性値を所定の値に確定した場合の前記判定結果が前記入力データに含まれるラベルとなることに対する寄与の度合を判定する、
ことを特徴とする付記７に記載の予測装置。

（付記９）前記予測部は、前記所定の属性の属性値を第１の値に確定した場合の前記判定結果が前記所定のラベルとなることに対する寄与の度合と、前記所定の属性の属性値を第２の値に確定した場合の前記判定結果が前記所定のラベルとなることに対する寄与の度合とを比較して、前記所定の属性を前記第１の値および前記第２の値のいずれにするかを判定する、
ことを特徴とする付記７または８に記載の予測装置。

１…情報処理装置
１０…入力部
２０…記憶部
２１…訓練データ
２２…入力データ
２３…仮説集合データ
２３ａ…木構造データ
２４…重みデータ
２５…結果データ
３０…仮説生成部
４０…学習部
５０…予測部
６０…出力部
７１、７２…ケース
１０１…ＣＰＵ
１０２…入力装置
１０３…モニタ
１０４…スピーカ
１０５…媒体読取装置
１０６…インタフェース装置
１０７…通信装置
１０８…ＲＡＭ
１０９…ハードディスク装置
１１０…バス
１１１…プログラム
１１２…各種データ
Ｃ０１～Ｃ０９…組み合わせ
Ｈ１～Ｈ１１…仮説

Claims

属性値が未知の属性と、目標とする所定のラベルとを含む予測対象の入力データを受け付け、
それぞれが複数の属性の属性値の組合せとラベルとの対応付けにより示される複数のルール情報に基づいて、前記複数の属性についての所定の順序条件に従って前記複数のルール情報を集約したデータであって、属性値を枝とする木構造データを生成し、
前記入力データに基づき、前記木構造データにおいて前記複数の属性のうちの前記未知の属性の属性値を所定の値に確定した場合に、判定結果として前記所定のラベルの値が得られる確度に基づいて、前記未知の属性の前記所定の値の、前記判定結果が前記所定のラベルとなることに対する寄与の度合を判定し、
判定した前記寄与の度合をより高くする値を前記未知の属性の属性値とする、
処理をコンピュータに実行させることを特徴とする予測プログラム。
前記判定する処理は、前記入力データに含まれる既知の属性値を前記木構造データに適用して枝刈りを行った上で、前記複数の属性のうちの属性値が未知の属性について、当該未知の属性の属性値を所定の値に確定した場合の前記判定結果が前記入力データに含まれるラベルとなることに対する寄与の度合を判定する、
ことを特徴とする請求項１に記載の予測プログラム。
前記判定する処理は、前記未知の属性の属性値を第１の値に確定した場合の前記判定結果が前記所定のラベルとなることに対する寄与の度合と、前記未知の属性の属性値を第２の値に確定した場合の前記判定結果が前記所定のラベルとなることに対する寄与の度合とを比較して、前記未知の属性を前記第１の値および前記第２の値のいずれにするかを判定する、
ことを特徴とする請求項１または２に記載の予測プログラム。
属性値が未知の属性と、目標とする所定のラベルとを含む予測対象の入力データを受け付け、
それぞれが複数の属性の属性値の組合せとラベルとの対応付けにより示される複数のルール情報に基づいて、前記複数の属性についての所定の順序条件に従って前記複数のルール情報を集約したデータであって、属性値を枝とする木構造データを生成し、
前記入力データに基づき、前記木構造データにおいて前記複数の属性のうちの前記未知の属性の属性値を所定の値に確定した場合に、判定結果として前記所定のラベルの値が得られる確度に基づいて、前記未知の属性の前記所定の値の、前記判定結果が前記所定のラベルとなることに対する寄与の度合を判定し、
判定した前記寄与の度合をより高くする値を前記未知の属性の属性値とする、
処理をコンピュータが実行することを特徴とする予測方法。
属性値が未知の属性と、目標とする所定のラベルとを含む予測対象の入力データを受け付ける入力部と、
それぞれが複数の属性の属性値の組合せとラベルとの対応付けにより示される複数のルール情報に基づいて、前記複数の属性についての所定の順序条件に従って前記複数のルール情報を集約したデータであって、属性値を枝とする木構造データを生成し、前記入力データに基づき、前記木構造データにおいて前記複数の属性のうちの前記未知の属性の属性値を所定の値に確定した場合に、判定結果として前記所定のラベルの値が得られる確度に基づいて、前記未知の属性の前記所定の値の、前記判定結果が前記所定のラベルとなることに対する寄与の度合を判定し、判定した前記寄与の度合をより高くする値を前記未知の属性の属性値とする予測部と、
を有することを特徴とする予測装置。