JP3638310B2 - 事例推論支援装置 - Google Patents

事例推論支援装置 Download PDF

Info

Publication number
JP3638310B2
JP3638310B2 JP14725094A JP14725094A JP3638310B2 JP 3638310 B2 JP3638310 B2 JP 3638310B2 JP 14725094 A JP14725094 A JP 14725094A JP 14725094 A JP14725094 A JP 14725094A JP 3638310 B2 JP3638310 B2 JP 3638310B2
Authority
JP
Japan
Prior art keywords
case
expression
value
attribute
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14725094A
Other languages
English (en)
Other versions
JPH0816400A (ja
Inventor
千絵 森田
洋 月本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP14725094A priority Critical patent/JP3638310B2/ja
Priority to US08/495,927 priority patent/US6009239A/en
Publication of JPH0816400A publication Critical patent/JPH0816400A/ja
Application granted granted Critical
Publication of JP3638310B2 publication Critical patent/JP3638310B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【産業上の利用分野】
この発明は、事例推論支援装置に関する。
【0002】
【従来の技術】
ある事例集合を用いて新事例の予測を行う手法の一つとして、統計による重回帰分析が知られている。即ち、この重回帰分析は、事例をよく表すような回帰式を求め、回帰式に新たな事例の値を代入することによって新事例の予測を行うものである。
【0003】
しかしながら、重回帰分析では、数値データしか扱うことができず、また、予測をすることができても、回帰式に基づいて事例に内在する定性的なルールを理解することは困難であり、予測規則を明確に表現した知識を獲得する目的に対しては不十分であった。
【0004】
また、事例をクラス毎に分類する手法として、統計による判別分析が知られている。
しかしながら、判別分析では、図やグラフ表現によって事例を分析しているため、人による解釈が必要である。従って、分析者の主観が含まれることを避けることができないという問題を有していた(「多変量統計解析法」、田中豊、脇本和昌著、現代数学社)。
【0005】
一方、機械学習の分野では、事例の集合から決定木を生成し、新事例の予測の用いる手法が種々提案されている。例えば、情報量等を用いて最適な決定木を生成する手法が知られているが(「Induction of Decision Trees 」 Machine Learning 1 1,pp81-106,1986 )、属性の数や属性値の数が増加した場合には生成される決定木が複雑になるという問題があった。また、一般に複雑になっても予測は可能であるが、属性間の関係やクラス決定の要因等を決定木から読取ることは困難となり、人間にとって理解し易いとはいえなかった。
【0006】
【発明が解決しようとする課題】
上述のように、従来の統計的手法や機械学習で提案されている学習方法では、得られた回帰式や決定木は人間にとって理解しにくいものであった。
また、分析者の主観が入ることや、扱えるデータが数値データや離散的なデータのみであった。
【0007】
そこで、本発明は、数値データと離散的なデータとの混在を許すことで、扱えるデータの対象を広げ、また、人間に理解し易いルールの獲得及び新事例に対する予測を行うことができる装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
請求項1係る発明は、複数の属性、属性値及びクラスによって構成され、該複数の属性は離散型又は連続型のいずれかのデータ型によって表現される事例集合に基づいて、新たな事例集合の属するクラスの予測を行う事例推論支援装置において、前記離散型の属性の属性値を第1のデータ表現に変換し、前記連続型の属性の属性値を第2のデータ表現に変換する事例表現手段と、この手段により変換された第1のデータ表現及び第2のデータ表現に基づいて、前記属性値を変数としたときに該変数の係数をパラメータとする所定の関数式を生成し、該所定の関数式について前記クラス毎に前記パラメータを算出するパラメータ算出手段と、前記新たな事例集合の属するクラスの予測を行う際に、前記新たな事例集合のうち欠損している属性値以外の属性値を、前記係数をパラメータとする所定の関数式の変数に代入し、該所定の関数式について前記クラス毎に解を求め、該求められた解からクラスの予測を行う予測手段とからなる事例推論支援装置である。
【0009】
また、請求項2に係る発明は、複数の属性、属性値及びクラスによって構成され、該複数の属性は離散型又は連続型のいずれかのデータ型によって表現される事例集合に基づいて、該事例集合に共通するルールを生成する事例推論支援装置において、前記離散型の属性の属性値を第1のデータ表現に変換し、前記連続型の属性の属性値を第2のデータ表現に変換する事例表現手段と、この手段により変換された第1のデータ表現及び第2のデータ表現に基づいて、前記属性値を変数としたときに該変数の係数をパラメータとする所定の関数式を生成し、該所定の関数式について前記クラス毎に前記パラメータを算出するパラメータ算出手段と、この手段により算出された係数に対して直交関数展開を行って直交関数式を求め、該直交関数式の係数を前記第1のデータ表現に変換し、該第1のデータ表現に基づく前記直交関数式の係数の値に基づいて論理式を算出するルール生成手段とからなる事例推論支援装置である。
【0010】
より具体的には、前記事例表現手段は、前記属性の属性値に欠損が存在する場合に、所定の演算処理を行って該演算結果を仮属性値とし、該欠損が存在する属性値について補填をする欠損値補填手段を具備する。
【0011】
また、前記第1のデータ表現は、前記事例集合の中の一の事例の属性値を2値で表現し、前記第2のデータ表現は、所定の最小値から最大値までの間で正規化して実数で表現する。
【0012】
【作用】
請求項1に係る発明によれば、入力された事例に欠損値があれば、これを所定の値で補填し、離散値又は連続値は、所定のデータ表現で表現し直して、所定の関数式のパラメータを算出するので、離散値と連続値とが混在するような事例に対しても、クラスの予測を行うことができる。
【0013】
具体的には、前記事例表現手段は、離散型の属性の属性値に対しては、“0”又は“1”のいずれか一方となるように2値化表現(第1のデータ表現)に、また、連続型の属性の属性値に対しては、“0”以上“1”以下の実数で正規化表現(第2のデータ表現)に表現し直す。
【0014】
また、パラメータ算出手段は、これらのデータ表現に基づいて、事例集合の属性の属性値を変数としたときに、この変数の係数をパラメータとする線形関数式を生成して、所定の近似法を用いることにより、該パラメータを算出する。
【0015】
予測手段は、新たな事例集合について欠損している属性値以外の属性値を、パラメータ算出手段により算出したパラメータ(係数)に対応する変数からなる所定の関数式の該変数に代入して解を求めることにより、クラスを予測することができる。
【0016】
ルール生成手段は、パラメータ算出手段により算出された係数に対して直交関数展開を行って直交関数式を求め、該直交関数式の係数を前記第1のデータ表現に変換するので、該第1のデータ表現に基づく前記直交関数式の係数の値に基づいて論理式を算出することができる。
【0017】
【実施例】
以下、図面を参照しながら本発明の一実施例について説明する。
図1は、本発明に係る事例予測支援装置の構成を示す図である。同図において、事例記憶部1は、複数の属性、その属性値及びクラスによって記述される事例集合を格納する。事例表現部2は、この事例記憶部1に記憶されている各事例について所定の形式に表現し直すものである。即ち、各事例について“0”若しくは“1”のいずれか一方(本実施例では、これを「{0,1}」と表現する。)又は“0”以上“1”以下の実数(本実施例では、これを「[0,1]」と表現する。)とする形式に表現し直すものである。パラメータ算出部3は、事例表現部2によって表現し直された事例集合に対し、属性値からクラスを予測する予測式に用いられる各変数に対応したパラメータを算出する。この予測式は、線形関数により表現されている。
【0018】
ルール生成部4は、利用者の入力装置(図示せず)からの指示により、後述するように算出されたパラメータに基づいて所定のルールを生成し、これをルール格納部5に記憶し、又は表示装置6を介して利用者に提示する。また、利用者の入力装置からの指示により、予測部7は、算出されたパラメータに基づいて新たな事例のクラスを予測し、その結果を予測結果格納部8に記憶し、又は表示装置6を介して利用者に提示する。このルール生成部4と予測部7とは、ユーザの指示により適宜選択され、処理を行う。
【0019】
次に、本発明に係る事例予測支援装置の各機能実現手段の詳細について説明する。
図2は、事例表現部2の構成を示す図である。同図に示すように、事例表現部2は、事例記憶部1から入力された事例の属性値に欠損値があるか否かを判断し、欠損値がある場合には所定の値を補填する欠損値補填部21と、離散属性に対してダミー変数を用いて{0,1}により表現する離散値表現部22と、連続属性の値を[0,1]に正規化する連続値正規化部23とからなっている。ここで、欠損値とは、事例の属性値が何らかの原因において不明であるものをいう。
【0020】
図3は、ルール生成部4の構成を示す図である。同図に示すように、ルール生成部4は、パラメータ算出部3によって得られた予測式について直行関数展開を行う直行関数展開部31と、この展開された関数の係数を所定の近似方法によって近似する近似部32と、近似した係数を論理命題の形式で表現する論理命題表現部33とからなっている。なお、この近似部32は、本実施例では、所定の閾値を基準にして近似を行っている。
【0021】
図4は、予測部7の構成を示す図である。同図に示すように、予測部7は、新事例入力部41から入力された予測をする新事例に対して、[0,1]又は{0,1}で表現する新事例表現部41と、この新事例表現部42によって表現し直された事例集合に対して、上述のパラメータ算出部3によって算出されたパラメータに基づきクラス毎の予測値を求める予測値算出部43と、予測値の中から所定の基準(例えば、最大のもの)によりクラスを選出する予測クラス選出部44とからなっている。新事例表現部42は、上述した事例表現部2とほとんどにおいて同じであるが、後述するように欠損値補填部45の機能が異なっている。
【0022】
次に、上記のように構成された事例予測支援装置の処理動作について、具体例をもって説明する。なお、推論に先だって、事例記憶部1には、事例集合が予め格納されているものとする。
【0023】
本実施例では、製品の品質に関する推論を例に説明する。これは、工場で生産される製品に対して、生産工程と原材料及び製品の品質との関係を調べる問題である。この問題に関して、ルールを獲得し、また、新たな材料や工程の組合せに関して品質を予測することを目的とする。
【0024】
図5は、本実施例で扱う事例における複数の属性とこれらの各属性がとり得る属性値の要素を示したものである。同図において、左から1列目は「属性」を示しており、これらの属性のうち「材料1」、「材料2」及び「工程」は推論条件であり、品質の決定に関わるものである。属性「材料1」は材料1の投入量、属性「材料2」は材料2の投入量が、数値で表される。また、属性「工程」は “P”又は“Q”のいずれかが選択される。これに対し、属性「品質」はこの推論の結論、即ち、クラスを示す。事例は、前記3つの属性とクラス(本実施例では「品質」)の値で表される。これらの事例の具体的内容は、事例記憶部1に格納されている。
【0025】
図6は、事例記憶部1に格納されている事例集合の例を示す図である。同図において、事例「E2」の属性「材料2」欄に示す「?」は、欠損値、即ち、該属性に関する値が不明であることを示している。
【0026】
事例表現部2は、事例格納部1より事例を読み出し、該事例を所定の形式に表現し直す。図7は、事例表現部2の処理動作を示す図である。同図に示すように、事例表現部2は、ステップ701〜705では、各事例に対して欠損値の補填と離散値表現とを行なう。また、ステップ706〜708では、連続値をとる属性に対して、連続値の正規化を行なう。
【0027】
即ち、事例表現部2は、まず、未処理の事例があるか否かを判断し(ステップ701)、あると判断された場合には、未処理の事例を1つ選択する(ステップ702)。本実施例では、図6に示す事例のうち、「E1」が選択されたものとする。次に、事例表現部2は、該選択された事例の中に欠損値があるか否かを判断する(ステップ703)。「E1」には欠損値がないので、離散値表現を行う(ステップ705)。ここにいう離散値表現は、離散属性の属性値を属性のように扱うことにより、各事例の属性値を{0,1}の2値で表現する。具体的には、事例が該当する属性値には「1」を、その他の場合には「0」を与える。例えば、「工程」で「P」を用いた事例に対しては、工程「P」、「Q」に対してそれぞれ「1」、「0」という値が与えられる。属性値が3つ以上あるときも同様である。例えば、「工程」としてとり得る値が「P」、「Q」及び「R」であったとした場合に、その値が「Q」である事例には「P」、「Q」及び「R」に対してそれぞれ「0」、「1」及び「0」という値を与える。また、結論(クラス)である品質の値については、該当する値に対しては「1」、その他の場合は「0」として、クラスごとに事例集合を生成する。従って、本実施例では、「品質」のとり得る値は2つであるため、事例集合は2つ作成される。この表現の変換は一意に定まる。
【0028】
「E1」について離散値表現が完了した後、再びステップ701に戻り、未処理の事例があるか否かを判断する。次に、「E2」が選択されたものとする。この「E2」には欠損値があるため、該欠損値の補填を行う(ステップ704)。欠損値の補填を以下に示す。
【0029】
即ち、欠損値を持つ事例と同じクラスであって、対象とする属性が欠損していない事例により部分集合を生成する。本実施例では欠損値を持つ「E2」のクラスは「良」であるので、クラスが「良」である事例の集合として、{E4,E5,E6}という集合を生成する。次に、この集合のうち、値が欠損している属性の値に注目し、例えば、離散属性に対しては値のうち最頻値、連続属性に対しては値の平均値を用いて補填を行う。本実施例では、値が欠損している属性は「材料2」であり(即ち、連続属性である)、{E4,E5,E6}の「材料2」の値は{40,10,20}である。従って、この平均値は、
平均値=(40+10+20)/3=23.3
であるので、事例「E2」の「材料2」の値として“23.3”を補填する。
【0030】
欠損値の補填が完了したら、上述した離散値表現を行なう(ステップ705)。従って、「E2」の「工程」は「Q」であるので、工程「P」及び「Q」の値としてそれぞれ「0」及び「1」を割り付ける。
【0031】
このようにして、全ての事例に対する欠損値の補填及び離散値表現の完了後、連続値をとる属性に対して、連続値の正規化を行う(ステップ706〜708)。
【0032】
まず、未処理の連続属性があるか否かを判断し(ステップ706)、あると判断した場合には、その中から未処理の連続属性を1つ選択する。次に、この選択された連続属性に対して以下のようにして正規化を行う。
【0033】
即ち、各属性の影響を相対的に抽出するための準備として、連続属性の値を [0,1](0以上1以下の数値)の値で表現する。具体的には、各事例の連続属性の値のうち最小値をmin、最大値をmaxとして、各事例の値xを式1に従って変換する。
【0034】
【数1】
Figure 0003638310
【0035】
例えば、「材料1」が選択された場合、その属性値は、
“5, 20, 50, 30, 50, 10”
であり、従って、最小値は5,最大値は50であるので、
“0.000, 0.333, 1.000, 0.555, 1.000, 0.111”
となる。このようにして全ての連続属性に対して、同様の処理を繰り返す。
【0036】
なお、本実施例では、離散値表現を行った後に、連続値をとる属性に対して連続値の正規化を行ったが、特にこれにこだわることはなく、欠損値の補填完了後であれば、連続値をとる属性に対して連続値の正規化を行った後に、離散値表現を行うようにしてもよい。
【0037】
図8及び図9は、図3に示した事例に対して事例表現が完了した事例集合を示す図であり、このうち、図8は、品質が「優」である場合、図9は、品質が「良」である場合の事例表現である。なお、本来、これらの図は、利用者側には提示されるものではない。
【0038】
このような処理を行うことにより、離散値及び連続値が混在した事例を対象とすることができるようになる。
事例表現部2により事例集合が所定の形式に表現し直されると、次に、パラメータ算出部3によってパラメータの算出が行われる。パラメータ算出部3は、上述したように、事例表現部2によって表現し直された事例集合に基づいて、属性値からクラスを予測する予測式に用いられる各属性に対応したパラメータを算出する。ここで、パラメータとは、クラスを決定するための重みのことをいい、各変数に対して求められる。本実施例では、図8及び図9の事例集合に対して、最小2乗法によって求めた線形関数の係数をパラメータとして使用する。最小2乗法とは、あるデータを線形関数をモデルとして近似するにあたって、そのモデルによる推定値と実測値との差の2乗が最小になるように線形関数を定める方法をいう。この手法は広く知られているため、説明は省略する。一般式としては、各変数xn (n=1,2,3,…)に対して、係数をa,b,c,…とし、また、定数項をCとすれば、
【0039】
【数2】
Figure 0003638310
として表される。
【0040】
本実施例では、「材料1」、「材料2」、「工程P」及び「工程Q」の4変数であるので、事例の値を
0 =(x01,x02,x03,x04
で表すことにする。また、それぞれに対応する係数(パラメータ)を a,b,c,d、定数項をeとする。これにより、データを近似するモデルである線形関数は次のように表すことができる。
【0041】
【数3】
Figure 0003638310
ここで、事例の実測値を
i =(xi1,xi2,xi3,xi4) (i=1,2,3,…)
とすれば、
【0042】
【数4】
Figure 0003638310
が最小になるようなa,b,c,dを求めれば良い。ただし、前述の離散値表現により、「工程」の値に関してP+Q=1という制約がある。この制約の下で、事例集合との2乗誤差が最小になるようにパラメータを求める。
【0043】
具体的には、Q=1−PよりQを消去して最小2乗法を適用すれば良い。
図10は、パラメータ算出部3の処理動作を示す図である。同図において、まず、ステップ1001により、クラスごとの事例集合が選択される。ここでは、「品質」の値「優」がまず選択されたこととする。即ち、図8に対するパラメータが算出されることになる。最小2乗法によるパラメータ算出の方法は、統計分野で提案されているため(例えば、東洋経済新報社「統計学辞典」 p.150-152参照)、ここでは説明を省略する。以下の式5は、図8に対して求められたパラメータを線形関数の形式で示したものである。
【0044】
【数5】
Figure 0003638310
【0045】
次に、まだ処理していないクラスがあるのでステップ1003によってステップ1001に戻り、「品質」の値が「良」、即ち、図9に対するパラメータを算出して、パラメータの算出は終了する。以下の式6は、図9に対して求めたパラメータを線形関数の形式で示したものである。
【0046】
【数6】
Figure 0003638310
【0047】
なお、パラメータの算出方法は上述の方法に限られるものではない。条件と結論(クラス)の関係を線形関数で表現することができれば、他の方法によって定めてもかまわない。例えば、専門家が直接指定することも可能である。
【0048】
以上のようにパラメータ算出部3によってパラメータが算出されたら、ユーザは、予測を行うか又はルールを生成するかを選択する。以下では、まず予測を選択した場合について説明する。
【0049】
図11は、予測部7の動作処理を示す図である。同図において、まず、予測をする新事例を[0,1]で表現する(ステップ1101,1102)。ただし、欠損値の補填は行なわず、欠損している属性に該当する値を全て0とおく(ステップ1103,1104)。このことは、予測の際に欠損している属性の情報は用いないことを意味している。例えば、図12は、ある事例に対して離散値表現、連続値正規化、欠損値処理を行なって表現したものを示す図である。「工程」の値が欠損しているため、表現し直した後の右側の表では、該当する属性の値(「工程P」と「工程Q」)は両方とも0となる。
このように表現された事例をクラスごとの線形関数に代入し、値を求める(ステップ1105)。この中で最大の値を持つクラスが、この事例に対して予測されるクラスである(ステップ1106)。この例では、式1と式2に代入した結果は、次のようになる。
式5に対して、
【0050】
【数7】
Figure 0003638310
式6に対して、
【0051】
【数8】
Figure 0003638310
これにより式1に関する値の方が大きいので、この事例の品質は「優」と予想される。
【0052】
これら予想された結果は、出力装置を介して利用者に提示される。これにより、利用者は、新たな事例集合のクラスの予測をする際に、最も確からしいクラスを容易に把握することができるようになる。
【0053】
次に、ルール生成について説明する。図13は、ルール生成に関する処理動作を示す図である。まず、線形関数を直交関数に展開する(ステップ1303)。即ち、この例では、4つの変数に対し、a,b,c,d又は(1−a),(1−b),(1−c),(1−d)の組合せによりを式3のように表す。このとき、展開した各項は、論理関数のアトムに対応している。(1−x)はxの否定(以下「(NOT) x」と示す)を表している。アトムとは、論理関数の最小の単位であり、例えば{X,Y}という2変数の場合、アトムは、XY,X(NOT) Y,(NOT) 結XY,(NOT) X(NOT) Yの4通りがある。具体例として、式5を直交関数に展開した結果を以下に示す。
【0054】
【数9】
Figure 0003638310
【0055】
次に、この各項の係数について所定の値、例えば、0.5を閾値として{0,1}に近似し(ステップ1304)、整理すると、次のようになる(ステップ1305)。
【0056】
(1−x2 ) +x24
1 ,x2 ,x3 ,x4 は論理関数の変数とみることができ、(1- x2 ) はx2 の否定、即ち、(NOT) x2 を表しているので、これを論理式で表現すると(ステップ1303)、次のようになる。
【0057】
(NOT) x2 ∨x24
ここで、ここで、「(NOT) 」は否定、「∨」は論理和を表し、「又は」を示している。つまり、x2 は「材料2」、x4 は「工程Q」を表しているので、これは「材料2」の投入量が少ないか又は「材料2」の投入量が多くかつ工程がQである場合には品質が「優」であるというルールを意味している。
【0058】
また、品質が「良」であるクラスの式2についても同様の処理により、
2 ∨(NOT) x24
が得られる。これは、「材料2」の投入量が多いか又は「材料2」の投入量が少なくかつ工程がQである場合には品質が「良」であるというルールを意味している。
【0059】
これら得られたルールは、図14に示すように、出力装置6上に表示される。これにより、利用者は、現在取り扱っている事例集合に対するルールを容易に把握することができるようになる。
(他の実施例)
ところで、全ての属性が離散的な値をとる(連続属性はない)場合には、以下のようにすることも考えられる。その場合においても、事例表現部2、パラメータ算出部3、予測部7における処理は同様であるが、ルール生成部4は、計算量を抑えることができる。
【0060】
図15は、全ての属性が離散属性である場合のルール生成部を示す図である。また、図16は、ルール生成部4の処理動作を示す図である。これらの図を参照しつつ、本実施例を説明する。
【0061】
今、属性の数がn個であるとすると、上述したようにパラメータ算出部によってn個のパラメータが得られる。ここではこれを「p1 ,…,pn 」とする。
まず、パラメータの組合せの数を1とセットする(ステップ1601)。ルール生成部4では、パラメータを任意の数だけ組み合わせてルールを生成していくので、結局、これはパラメータを組み合わせる数を表す。本実施例では、初期値は1であるが、徐々に増やしていき、予め設定した値に達した場合に終了する(ステップ1602)。
【0062】
まず、パラメータ選択部151により、p1 を選択し、p1 ,…,pn のうちp1 を除いて負の値があれ場合はそれらを全て選択する(ステップ1603)。それは、p1 ,…,pn のp1 を含む任意の組合せのうち、組み合わせたパラメータの値の和が最小になる組合せを選択するためである。例えば、p1 とp1 +p2 を比較すると、p2 が0以上のときにはp1 の方が小さいが、p2 が負の場合にはp1 +p2 の方が小さい。そこで、p1 を含んで和が最小になる値を求めるために、p1 を除いた負の値を全て選択する。
【0063】
次に、判定部152において、パラメータ選択部151で選択したパラメータを全て加え(ステップ1604)、所定の閾値(例えば、0.5)と比較する (ステップ1605)。上述したように、パラメータ選択部では、p1 を含むパラメータの組合せの中でそれらの和が最小になる組合せを選択している。ここでは、p1 を含む組合せの和の最小値を0.5と比較することになる。これは、最小2乗法により、各パラメータの重みが得られているが、パラメータはもともと連続的な値なので、ルールを得るためにそれを“0”か“1”に近似するために行なわれる。即ち、0.5を境として、それより大きければ1に、小さければ0に近似されることになる。従って、本実施例では、所定の閾値0.5よりも大きければp1 に対応する属性値を保存部143において保存する(ステップ1606)。この後、選択すべきパラメータがまだ残っているかチェックし、残っていればパラメータ選択部151に戻り、そのパラメータを選択する(ステップ1607)。選択すべきパラメータとは、全てのパラメータの中で、パラメータの組合せの数が同じである場合にまだ選択していないパラメータのことである。この例では、p1 以外のパラメータはまだ処理されていないので、パラメータ選択に戻る。
パラメータ選択部151では、未選択のパラメータ、例えば、p2 を選択し、p2 を除いてp1 ,…,pn の中で負の値があればそれらを選択する(ステップ1603)。判定部142でそれらを全て加え(ステップ1604)、0.5より大きければ(ステップ1605)、保存部153でp2 に対応する属性値を保存する(ステップ1606)。
【0064】
以上の処理を同様にp3 ,…,pn に対して行なう。pn まで終了すると、全てのパラメータに対して一通り処理したことになり、選択すべきパラメータが残っていないので(ステップ1607)、パラメータの組合せの数をセットし直す(ステップ1601)。上記の例では組合せの数を1増やして2にする。そこで、次に、パラメータを2つ組み合わせて考える。このとき、このセットした数が予め決めておいた終了条件の数よりも大きい場合には、ステップ1608の接続部154へ進む。一方、小さい場合には再びパラメータ選択部151へ進む。
【0065】
パラメータ選択部151では、pi とpj を選択し、pi とpj を除いた負の値を選択する(ステップ1003)。但し、既に保存されている属性値に対応する pk は以降の処理では使用しない。判定部152では、それらの値を加え(ステップ1604)、その結果を所定の閾値0.5と比較する(ステップ1605)。その結果、0.5より大きい場合には、p1 とp2 に対応する属性値の論理積を保存部において保存する(ステップ1606)。
【0066】
上記のパラメータ選択部151及び判定部153の動作についてまとめると、pi とpj に対応する属性値の論理積は、以下の式が成立する場合に保存されるといえる。これをここでは判定式と呼ぶことにする。
【0067】
【数10】
Figure 0003638310
【0068】
これらの処理を一定の回数繰り返した後、停止する。停止したら、接続部により、保存されている属性値あるいは属性値の論理積を論理和 (「∨」で示す。) により接続する(ステップ1608)。これが、クラスに対して得られるルールである。
【0069】
次に、上記に説明したパラメータ算出部3とルール生成部4の動作を具体例で説明する。例えば、属性の数をn=5とし、得られたパラメータを
A p1 = 0.1
B p2 = 0.1
C p3 = 0.6
D p4 = 0.73
E p5 = 0.06
とする。A,B,C,D,Eは、パラメータに対応する属性を表している。まず、
パラメータの組合せの数は、初期値として1がセットされる(ステップ1601)。パラメータ選択部151により、p1 が選択される。さらに、p1 を除いたp1 ,…,pn から負の値を選択するが、本例においては負の値がないので、p1 のみが判定部153に渡される。判定部153では、その和を求める(本例では、p1 =0.1である)と所定の閾値0.5と比較する。
【0070】
その結果、p1 =0.1<0.5であるので、p1 に対応する属性値は保存されない。同様にして、p2 についても、判定部153においてp2 =0.1<0.5であるので、対応する属性「A」は保存されない。以下、同様に処理していくと、p3 が0.6≧0.5、p4 が0.73≧0.5となり、それぞれから「C」と「D」とが保存される。また、p5 は0.06≧0.5であるので、保存されない。
【0071】
以上の処理により、選択すべきパラメータがなくなったので、パラメータの組合せの数を2とセットし(ステップ1601)、パラメータを2つ組み合わせて同様に処理する。
【0072】
まず、パラメータ選択部151により、p1 とp2 が選択される。負の値は存在しないので、判定部153にはp1 とp2 が渡され、p1 +p2 =0.2と0.5とを比較する。その結果、0.2<0.5なので、判定式を満たさないことになり、保存はされない。
【0073】
次に、パラメータ選択部により、p1 とp3 という組合せが考えられるが、p3 は既に対応する属性値が保存されているので、使用しない。同様にp4 も保存がすでにされているので、次に選択される組合せはp1 とp5 となる。判定部153では、それらの和と0.5とを比較し、0.1+0.06=0.16<0.5であるので、保存されない。同様にして順に処理していくと、2つずつの組合せでは上記の判定条件を満たすものは存在しないことがわかる。
【0074】
再度、ステップ1601に戻って組合せの数を増やし、既に保存されているp3 とp4 を除いて組合せた場合に、p125 の組合せが考えられるが、0.1+0.1+0.06=0.26<0.5であるので、判定式は成立せず、ステップ1602の終了条件により、ステップ1608へ進む。ステップ1608では保存されている属性値を論理和で接続し、ルール生成部4より出力する。この場合は、保存されている属性値は「C」と「D」であるので、このクラスに関して「C∨D(C又はD)」というルールを得ることができる。
【0075】
上述したように、本装置では、事例の集合を全て[0,1]で表現し、最小2乗法に基づいて誤差を小さくするようにパラメータを求める。このパラメータよりルールを生成し、また新しい事例に対してクラスの予測を行なう。
【0076】
【発明の効果】
以上のように、本発明によれば、属性が連続値又は離散値が混在する場合に対しても、第1のデータ表現又は第2のデータ表現を用いることにより、所定の関数式の変数のパラメータを算出することができ、このパラメータを算出した後に、新たな事例集合が与えられた場合には、該パラメータを用いて新たな事例集合のクラスを予測することができ、これを出力装置を介して利用者に提示するので、事例集合のクラスの予測の把握が容易になる。
【0077】
同様に、パラメータを算出した後、該パラメータを用いて論理式を生成し、この論理式に基づいたルールを出力装置を介して利用者に提示するので、該事例集合に当てはまるルールの把握が容易になる。
【0078】
また、事例集合の属性の属性値が欠損している場合であっても、所定の方法により予め該欠損値を補填することで、上記処理に支障なくクラスの予測又はルールの生成に関する事例推論を行うことができる。
【図面の簡単な説明】
【図1】 本発明に係る事例予測支援装置の構成を示す図。
【図2】 事例表現部2の構成を示す図。
【図3】 ルール生成部4の構成を示す図。
【図4】 予測部7の構成を示す図。
【図5】 本実施例で扱う事例における複数の属性とこれらの各属性がとり得る属性値の要素を示す図。
【図6】 事例記憶部1に格納されている事例集合の例を示す図。
【図7】 事例表現部2の処理動作を示す図。
【図8】 図3の事例に対して事例表現が完了した事例集合を示す図。
【図9】 図3の事例に対して事例表現が完了した事例集合を示す図。
【図10】 パラメータ算出部3の処理動作を示す図。
【図11】 予測部7の動作処理を示す図。
【図12】 予測を行う新たな事例集合を事例表現で示した図。
【図13】 ルール生成に関する処理動作を示す図。
【図14】 生成されたルールが出力装置6上に表示された状態を示す図。
【図15】 他の実施例におけるルール生成部3の構成を示す図。
【図16】 図15におけるルール生成部4の処理動作を示す図
【符号の説明】
1…事例記憶部
2…事例表現部
3…パラメータ算出部
4…ルール生成部
5…ルール格納部
6…表示装置
7…予測部
8…予測結果格納部

Claims (2)

  1. 複数の属性、属性値及びクラスによって構成され、該複数の属性は離散型又は連続型のいずれかのデータ型によって表現される事例集合に基づいて、該事例集合に共通するルールを生成する事例推論支援装置において、
    前記事例集合を格納する事例記憶手段と、
    前記事例記憶手段に格納された事例について、前記離散型の属性の属性値を2値表現に変換し、前記連続型の属性の属性値を前記2値表現の2つの値のそれぞれを最小値及び最大値として正規化変換する事例表現手段と
    前記事例表現手段により変換された前記属性値を変数としたときに該変数の係数をパラメータとする所定の関数式を重回帰分析により生成し、該所定の関数式について前記クラス毎に前記パラメータを算出するパラメータ算出手段と
    この手段により算出された係数に対して直交関数展開を行って直交関数式を求め、該直交関数式の係数を2値表現に変換し、該2値表現に基づく前記直交関数式の係数の値に基づいて論理式を算出するルール生成手段と
    前記ルール生成手段により生成されたルールを利用者に提示する出力手段と;
    を具備することを特徴とする事例推論支援装置。
  2. 事例記憶手段に記憶された、複数の属性、属性値及びクラスによって構成され、該複数の属性は離散型又は連続型のいずれかのデータ型によって表現される事例集合に基づいて、該事例集合に共通するルールを生成する事例推論支援装置において実行される事例推論支援方法において、
    前記事例推論支援装置に具備された事例表現手段により、前記離散型の属性の属性値を2値表現に変換し、前記連続型の属性の属性値を前記2値表現の2つの値のそれぞれを最小値及び最大値として正規化変換する事例表現ステップと;
    前記事例推論支援装置に具備されたパラメータ算出手段により、前記属性値を変数としたときに、該変数の係数をパラメータとする所定の関数式を重回帰分析により生成し、該所定の関数式について前記クラス毎に前記パラメータを算出するパラメータ算出ステップと;
    前記事例推論支援装置に具備されたルール生成手段により、このパラメータ算出ステップにより算出された係数に対して直交関数展開を行って直交関数式を求め、該直交関数式の係数を2値表現に変換し、該2値表現に基づく前記直交関数式の係数の値に基づいて論理式を算出するルール生成ステップと
    前記事例推論支援装置に具備された出力手段により、前記ルール生成ステップにより生成されたルールを利用者に提示する出力ステップと;
    を具備することを特徴とする事例推論支援方法。
JP14725094A 1994-06-29 1994-06-29 事例推論支援装置 Expired - Fee Related JP3638310B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP14725094A JP3638310B2 (ja) 1994-06-29 1994-06-29 事例推論支援装置
US08/495,927 US6009239A (en) 1994-06-29 1995-06-28 Inference apparatus and method for processing instances using linear functions of each class

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14725094A JP3638310B2 (ja) 1994-06-29 1994-06-29 事例推論支援装置

Publications (2)

Publication Number Publication Date
JPH0816400A JPH0816400A (ja) 1996-01-19
JP3638310B2 true JP3638310B2 (ja) 2005-04-13

Family

ID=15425987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14725094A Expired - Fee Related JP3638310B2 (ja) 1994-06-29 1994-06-29 事例推論支援装置

Country Status (2)

Country Link
US (1) US6009239A (ja)
JP (1) JP3638310B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549908B1 (en) * 1998-11-18 2003-04-15 Siebel Systems, Inc. Methods and apparatus for interpreting user selections in the context of a relation distributed as a set of orthogonalized sub-relations
US20030023593A1 (en) * 2000-05-11 2003-01-30 Richard Schmidt Real-time adaptive data mining system and method
US7831467B1 (en) 2000-10-17 2010-11-09 Jpmorgan Chase Bank, N.A. Method and system for retaining customer loyalty
US8175908B1 (en) 2003-09-04 2012-05-08 Jpmorgan Chase Bank, N.A. Systems and methods for constructing and utilizing a merchant database derived from customer purchase transactions data
JP5572615B2 (ja) * 2004-04-30 2014-08-13 庸一郎 伊藤 エキスパートシステム生成装置及びエキスパートシステム生成装置の実施方法
JP2009301447A (ja) * 2008-06-17 2009-12-24 Nec Corp 情報処理装置
NL2014413B1 (en) 2015-03-06 2016-10-13 Jarik B V Tray stack dispenser and method of dispensing stacks of nested trays.
US10476946B2 (en) * 2017-07-27 2019-11-12 Citrix Systems, Inc. Heuristics for selecting nearest zone based on ICA RTT and network latency
JP7010363B2 (ja) * 2018-03-07 2022-01-26 日本電気株式会社 情報処理装置、情報処理方法、プログラム
JP7392304B2 (ja) * 2019-07-05 2023-12-06 富士通株式会社 予測プログラム、予測方法および予測装置
CN113742324A (zh) * 2021-08-02 2021-12-03 北京思特奇信息技术股份有限公司 数据质量检查方法、系统、存储介质及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2624751B2 (ja) * 1988-03-09 1997-06-25 株式会社日立製作所 コンパイル型知識処理ツールの高速推論方法
JPH07107668B2 (ja) * 1989-01-25 1995-11-15 株式会社日立製作所 知識処理ツールの推論方法
JPH02195473A (ja) * 1989-01-25 1990-08-02 Hitachi Ltd 学習システムにおける属性値予測方法
KR940009987B1 (ko) * 1989-04-28 1994-10-19 오므론 가부시끼가이샤 멤버쉽 함수의 설정 방법 및 장치와 해석 방법 및 장치
US5293585A (en) * 1989-08-31 1994-03-08 Kabushiki Kaisha Toshiba Industrial expert system
US5195172A (en) * 1990-07-02 1993-03-16 Quantum Development Corporation System and method for representing and solving numeric and symbolic problems
JPH06119309A (ja) * 1992-10-02 1994-04-28 Intetsuku:Kk 購入見込み度合予測方法及び顧客管理システム

Also Published As

Publication number Publication date
US6009239A (en) 1999-12-28
JPH0816400A (ja) 1996-01-19

Similar Documents

Publication Publication Date Title
JP3638310B2 (ja) 事例推論支援装置
Regis Multi-objective constrained black-box optimization using radial basis function surrogates
CN107562795A (zh) 基于异构信息网络的推荐方法及装置
US20050049913A1 (en) Method and apparatus for automated feature selection
US20220284286A1 (en) Method and apparatus for providing recommendations for completion of an engineering project
Lakshminarayanan et al. New product design via analysis of historical databases
US20170034111A1 (en) Method and Apparatus for Determining Key Social Information
JP5082511B2 (ja) 因果構造決定装置、因果構造決定装置の制御方法、および因果構造決定装置の制御プログラム
JP6652398B2 (ja) パラメータ選定方法、パラメータ選定プログラム及びパラメータ選定装置
CN108470251B (zh) 基于平均互信息的社区划分质量评价方法及系统
JPH09204310A (ja) 判断規則修正装置と判断規則修正方法
JP2022079376A (ja) 最適解探索装置及び最適解探索プログラム
JPH09167152A (ja) 対話的モデル作成方法
CN116302088B (zh) 一种代码克隆检测方法、存储介质及设备
EP3754564A1 (en) Ising machine data input apparatus and method of inputting data into an ising machine
Burgos et al. Solving random mean square fractional linear differential equations by generalized power series: Analysis and computing
US20230186108A1 (en) Control device, method, and program
CN113435572A (zh) 一种面向智能制造业的自进化神经网络模型的构建方法
JPH0736849A (ja) 情報処理システム
WO2023175922A1 (ja) モデル分析装置、モデル分析方法、及び、記録媒体
Vázquez-Rodríguez et al. Calibrating continuous multi-objective heuristics using mixture experiments
JPH08161172A (ja) 知識修正型学習システム
JPH0793284A (ja) 特性値予測装置及び特性値予測方法
WO2022106438A1 (en) Predicting the state of a system using elasticities
Achiepo et al. The SMH Algorithm: An Heuristic for Structural Matrix Computation in the Partial Least Square Path Modeling

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041006

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050111

LAPS Cancellation because of no payment of annual fees