JP3956581B2 - 事例の類似性に基づいた推論システム - Google Patents

事例の類似性に基づいた推論システム Download PDF

Info

Publication number
JP3956581B2
JP3956581B2 JP2000152668A JP2000152668A JP3956581B2 JP 3956581 B2 JP3956581 B2 JP 3956581B2 JP 2000152668 A JP2000152668 A JP 2000152668A JP 2000152668 A JP2000152668 A JP 2000152668A JP 3956581 B2 JP3956581 B2 JP 3956581B2
Authority
JP
Japan
Prior art keywords
case
inference
cases
value
unknown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000152668A
Other languages
English (en)
Other versions
JP2001331316A (ja
Inventor
嘉則 佐藤
豊久 森田
幸康 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000152668A priority Critical patent/JP3956581B2/ja
Priority to US09/755,138 priority patent/US6782376B2/en
Publication of JP2001331316A publication Critical patent/JP2001331316A/ja
Application granted granted Critical
Publication of JP3956581B2 publication Critical patent/JP3956581B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Description

【0001】
【発明の属する技術分野】
本発明は自然現象、人口統計等の社会的現象、株価変動等の経済的現象、工業プラント等の化学的、物理的現象等のデータを用いた推論、予測の方法、および推論手段を組み込んだシステムに関する。
【0002】
【従来の技術】
蓄積データを有効に活用する技術としてデータマイニングと呼ばれる大量データ向けの分析技術が活発に研究されている。取り出す情報の形は利用目的によって異なるが、一般的な目的の一つとして未知データの推論、予測がある。
【0003】
MBR(Memory-Based Reasoning:記憶に基づく推論)は、大量に蓄積したデータから、類似度に基づいて推論結果を算出する手法として知られている。MBRに関しては「Craig Stanfill, DavidWaltz, "TOWARD MEMORY-BASED REASOING, Communications of the ACM", Dec 1986,Vol.29. Number 29, pp.1213-1228」に概要が述べられている(以下、従来技術1と呼ぶ)。
【0004】
従来技術1はレコード形式で与えられる事例データをベクトルと見なし、ベクトル間距離の大小により事例間の類似性を判定する。類似性が大きい事例を類似事例として抽出し、類似事例の出力フィールド値をベクトル間距離で加重平均して推論値を算出する。
【0005】
また、MBRに関連する技術として、例えば、日本国特許第2632117号がある。以下、特許第2632117号を従来技術2と呼ぶ。従来技術2では、出力誤差がしきい値よりなるべく小さくなるように入力空間を分割し、入力変数で張る空間上にメッシュを構成する。事例をメッシュ化空間に埋め込む(量子化する)ことで、推論時に使用する事例データベースを作成する。メッシュ化された空間における距離を用いて、推論誤差の推定値を得る。
【0006】
【発明が解決しようとする課題】
従来技術1は新規の事例に対して採用する類似事例の個数を決める手段を提供しておらず、ユーザが類似事例数を決定する。一般に、ベクトル空間で見たときに事例の分布は一様であるとは限らない。従って単に採用個数を指定するだけでは、ベクトル間距離の分布を考慮した適切な類似事例が集まるとは限らない。
【0007】
従来技術2は、事例を間引いて得られる代表事例を推論時に用いる手法である。しかし、間引かれる前の事例全体から見ると、未知事例に対して決まる類似事例が持つベクトル間距離は、事例の分布とは無関係に、メッシュの大きさで定まることになる。しかし、各メッシュの大きさは一様であるため、事例の分布が一様でない場合に、各メッシュ毎に適切な類似事例が集まるとは限らない。さらに、このような場合、推論誤差の推定値を適切に算出することが困難になる。
【0008】
本発明の目的は、従来技術では推論精度が低下しやすい、事例の分布が一様でない場合であっても、適切な推論を行う手段を提供し、また推論値の妥当性を判断できるよう適切な確信度を算出する手段を提供することにある。
【0009】
【課題を解決するための手段】
本発明は、事例の類似度を算出するステップを実行後、類似性が高い事例の推論値算出用フィールド値の分布情報を利用することにより類似事例を決定する。即ち、未知事例の周辺分布を考慮して類似事例を決定するため、事例の分布が一様でない場合にも適切な類似事例を選択し、推論を行うことが可能になる。
【0010】
また、本発明は、類似性が高い事例の推論値算出用フィールド値の分布情報を利用することにより確信度を決定する。これにより事例の分布が一様ではない場合にも適切な確信度を算出することが可能になる。
【0011】
【発明の実施の形態】
まず、各実施の形態に共通する用語を以下に定義する。事例はレコードデータの形式で表現され、1個のレコードは2個以上のフィールドからなる。既知事例とは推論に用いる知識を表す事例であり、未知事例とは1個以上のフィールド値が不明の事例である。値が不明のフィールドのことを出力フィールド、値が分かっているフィールドのことを入力フィールドと呼ぶ。
【0012】
本発明の実施の形態における推論処理は、既知事例を用いて、未知事例の入力フィールド値から未知事例の出力フィールド値を推定し、推論値として算出する。事例間の距離から類似度を算出し、類似した事例の出力フィールド値から推論値が算出される。未知事例と既知事例の間の距離は、入力フィールドの値を用いて定義される。例えばM個の入力フィールドからなるN個の既知事例があるとき、レコード内のj番目の入力フィールドと出力フィールドの関連度を重みW(j)として与える場合、i番目の既知事例I(i)と未知事例I'の距離D(i)は次の式で表される。
【0013】
【数1】
Figure 0003956581
【0014】
ただし、I(i,j)はi番目の既知事例のj番目のフィールド値で、iは0以上N以下の整数、jは0以上M以下の整数。またI'(j)は未知事例のj番目のフィールド値を表す。曜日などの非数値型のフィールドに関しては、予め月、火、水などを0、1、2などの数値に変換しておく。
【0015】
それぞれの既知事例が1個の未知事例に対して持つ類似度とは、その値が大きいほど類似性が高いことを意味する評価値のことである。i番目の事例が持つ類似度S(i)は次の式で表される。
【0016】
【数2】
Figure 0003956581
【0017】
推論値は次式に示すように類似事例の出力フィールド値を平均することで得られる。
【0018】
【数3】
Figure 0003956581
【0019】
ただし、O(i)はi番目の既知事例の出力フィールド値で、Cは類似事例として採用する既知事例番号の集合である。また、SはS(i)の総和である。
【0020】
以下、第1の実施の形態を説明する。図1は第1の実施形態における推論方法100のフローチャートを表している。図1のフローは通常の計算機を用いて実行される。ステップ101は推論に使用するフィールド設定の入力を受ける処理、ステップ102は推論パラメータの入力を受ける処理である。ステップ102の終了後、ステップ103では推論対象の事例を未知事例として1個読み込む。ステップ104では式(2)を用いて類似度を決定する。ステップ105では類似事例の出力フィールド値と類似度を用いて確信度を決定する。ステップ106では類似事例から推論値を決定する。ステップ107ではステップ105で算出した確信度と、ステップ106で決定した推論値を出力する。
【0021】
図2は本実施形態における推論システム200のモジュール間のデータフローを示している。データファイル201には1個以上の未知事例が格納され、データファイル202には1個以上の既知事例が格納される。類似度算出手段203、推論値算出手段204、確信度算出手段205、出力手段206、フィールド設定入力手段207、および推論パラメータ入力手段208の各モジュールによって推論システムが構成される。
【0022】
図3は第1の実施の形態で扱う入力データ300を示している。データ301は既知事例を表すレコードデータの集まりで、1行目はフィールド名、2行目以降の各行が1個の既知事例を表している。また、データファイル202がデータ301を格納する。ここで、データファイル202に格納されている既知事例の総数をNとする。
【0023】
データ302、303はステップ101で受け付けるフィールド設定を示している。データ302の1行目は事例間の距離計算に用いるフィールド名である。2行目は出力フィールドの関係の強さを示す数値で、これらの数値は式(1)におけるフィールドの重みを意味する。データ303は出力フィールドを表している。
【0024】
データ304は、ステップ102で入力を受け付ける推論パラメータを示している。データ304は、ユーザが許容できる当日生産量の推定誤差(許容誤差)を±100以下に設定し、且つ推定誤差±100以下を満たす類似事例の個数下限値(許容確信度)を10個に設定することを示している。
【0025】
本実施形態では、推定誤差を満たす類似事例の個数を推論の確信度と呼ぶ。確信度が大きいほど推論値の妥当性を支持する根拠が明確で、確信度を真値と比較した場合、推論値が許容誤差の範囲内に収まる可能性が高くなる。一方、確信度が小さいほど推論値が許容誤差の範囲内に収まる可能性が低くなる。
【0026】
データ305は1個の未知事例を示している。図3の例では、「当日生産量」が出力フィールドであり、その他のフィールドは入力フィールドである。
【0027】
図4のデータ401は本実施形態の出力400を示している。データ401は当日生産量の推論値が3500で、確信度が15であることを表している。
【0028】
以下図1のフローに従って本実施形態の処理を説明する。
【0029】
設定入力手段208がステップ101を実行し、データ302、303をシステム内に読み込み、「稼働後経過日数」、「曜日」、「最高気温」、「最低気温」、「最高水温」及び「前日生産量」を入力フィールドに設定し、「当日生産量」を出力フィールドに設定する。推論パラメータ入力手段209がステップ102を実行し、データ304をシステム内に読み込む。ステップ102により、ユーザが許容可能な推論値の誤差、及び確信度が設定される。
【0030】
類似度算出手段203はステップ103を実行し、データファイル201が格納しているデータ305の未知事例を1個システム内に読み込む。次に、類似度算出手段203はステップ104を実行し、式(1)と式(2)に従って、データファイル202が格納している全ての既知事例の未知事例に対する類似度を算出する。
【0031】
図5のデータ500はステップ104の出力を示している。データ500の各行は各既知事例の類似度と出力フィールド値を表しており、類似度の降順に並んでいて、データの総数は既知事例の総数Nに等しい。
【0032】
確信度算出手段205はステップ105を実行する。ステップ105は、データ500を用いて類似度が大きい既知事例の出力フィールド値を使用して、推論の確信度を算出する。ステップ105の詳細を図6のフローチャート600に示す。
【0033】
ステップ601は変数を初期化する。ステップ602は、データ501を1行づつ処理するループの条件判定を行っている。
【0034】
ステップ602でループの条件が真である場合、ステップ603が実行される。nはループ内で参照されるデータ501の行番号を表し、例えば、n=0のときは類似度=3.2の行が参照される。ステップ603は参照中の既知事例が許容誤差を満たしているか否かを判定する。変数aはループ中で参照した出力フィールド値の最大値、変数bは最小値である。従って、変数a及びbはループ繰り替えし中に随時変更される。変数Eはデータ304にある許容誤差の値である。
【0035】
ステップ603で許容誤差の条件が真である場合、ステップ604が実行される。ステップ604はaを更新し、ステップ605はbを更新する。配列O[i]はデータ501におけるi行目の出力フィールド値である。ステップ606はループカウンタnを更新する。
【0036】
ステップ602のループの条件が偽である場合、またはステップ602の条件が偽である場合、ステップ607が実行される。ステップ607は確信度Cを決定し、C=n−1が設定される。
【0037】
ステップ607が実行された後、推論値算出手段204はステップ106を実行する。本実施形態では、ステップ607で確定した確信度Cは類似事例として採用する既知事例の個数を表している。ステップ106ではデータ501から類似度が大きい上位C個を使用して、式(3)に従って推論値を決定する。出力手段206はステップ107を実行し、推論値と確信度を出力する。
【0038】
ステップ108の条件判定では、データファイル201の全ての未知事例を処理したかどうかを判定する。条件が偽である場合ステップ103から処理を繰り返す。条件が真である場合処理を推論処理は終了する。
【0039】
このように、出力フィールド値が特定の範囲に収まる既知事例を類似事例として採用することで、事例の分布が一様ではない場合でも適切な類似事例を選択でき、また、選択された類似事例の数を推論の確信度として用いることに第1の実施形態の特徴がある。
【0040】
次に、本発明における第2の実施の形態を説明する。第1の実施形態と第2の実施形態の相違点は、ステップ105の確信度算出ステップである。また、推論パラメータとしてデータ304の代わりにデータ306が用いられ、出力データとしてデータ402が得られる。
【0041】
本実施形態において、データ306は採用する類似事例の個数、許容誤差、確信度を推論パラメータとして設定する。許容誤差はデータ304と同様である。ただし、第1の実施形態と異なり、本実施形態における確信度とは、許容誤差を満たす事例の個数が採用した類似事例に占める割合である。
【0042】
出力データ402は推論値と確信度を表している。データ306を与えた場合、確信度0.9とは類似事例20個中18個の出力フィールド値が許容誤差を満たすことを意味する。
【0043】
本実施形態におけるステップ105の詳細を図7のフローチャート700に示す。ステップ701では類似事例として採用する既知事例の出力フィールド値を平均し、変数AVEに代入する。変数Mはデータ306で設定した類似事例数である。本実施形態では類似事例の個数がパラメータとして与えられるため、類似度が大きい上位M個をデータ501から取得することで、類似事例の出力フィールド値が得られる。
【0044】
ステップ702ではカウンタ変数を初期化する。ステップ703では類似事例を1個ずつ参照するループの条件判定を行っている。
【0045】
ステップ703のループの条件が真である場合、ステップ704が実行される。ステップ704、705では参照中の類似事例の出力フィールド値O[i]が、平均値AVE−E以上で、且つAVE+E以下の誤差許容範囲にあるか否かを判定する。出力フィールド値O[i]が許容範囲にある場合ステップ706で変数nがカウントアップされる。ステップ707ではループカウンタをカウントアップする。
【0046】
ステップ703のループの条件が偽である場合、ステップ707が実行されて確信度Cが決定される。
【0047】
このように、類似事例の出力フィールド値のレンジ、及び許容誤差に収まる事例数を使って推論の確信度を算出することに本実施形態の特徴がある。
【0048】
次に、第3の実施の形態を説明する。第1の実施形態と本実施形態を比較すると、事例との出力フィールド値が非数値であり、図1におけるステップ105の確信度算出ステップ、及びステップ106の推論値算出ステップが異なる。ただし、入力フィールドの扱いは変わらないため、その他の処理には影響を与えない。
【0049】
本実施形態に与える入力データを図8に示す。
【0050】
データ801はN個の既知事例、データ802は入力フィールド設定、データ803は出力フィールドの設定、データ804は推論パラメータ、データ805は未知事例である。第1の実施形態と比べて、本実施形態では推論パラメータ804が異なっている。データ806は類似度算出手段203が出力するデータを示している。
【0051】
本実施形態では、「今回購入品目」のように出力フィールドが非数値型である場合、品目H1、品目H2のような非数値のフィールド値を予めいくつかのカテゴリに分類しておく。カテゴリの総数はフィールド値の種類の総数以下であれば良い。例えば、カテゴリ数を3つにする場合、一番目のカテゴリ値には品目H1とH2が属し、2番目のカテゴリには品目H3,H4,H5が属し、3番目のカテゴリにはそれ以外の品目が属する、などのように分類しておく。ただし、1種類のフィールド値が属するカテゴリの数は必ず1である。
【0052】
本実施形態の推論の目的は、出力フィールドが非数値型である未知事例があるとき、最も確からしいカテゴリを算出することである。
【0053】
データ804は、採用する類似事例の個数、許容確信度を推論パラメータとして設定することを示している。ただし、ある未知事例に対する類似事例の個数をM、最も確からしいカテゴリに属する類似事例の数をmとしたとき、本実施形態の確信度はm/Mで与えられる。
【0054】
本実施形態におけるステップ105の詳細を図9のフローチャート900に示す。ステップ105はフロー900のステップ901,902,903,904,905から構成される。ステップ901では配列m[i]が初期化される。ステップ902以降の処理で配列m[j]には、j番目のカテゴリに属する類似事例の数が格納される。カテゴリの数をCとしたとき、jは0以上C未満の整数をとる。変数Mはデータ804で設定した類似事例数である。本実施形態では類似事例の個数がパラメータとして与えられるため、類似度が大きい上位M個をデータ501から取得することで、類似事例の出力フィールド値が得られる。
【0055】
ステップ902では類似事例を1個ずつ参照するループの条件判定を行う。ステップ903はカテゴリを表す変数jを設定し、jはO[i]が属するカテゴリの番号である。ステップ904では、j番目のカテゴリに属する類似事例数をカウントアップする。
【0056】
ステップ905では確信度を算出する。最も多くの類似事例が属するカテゴリを選び、このカテゴリに属する事例数が、類似事例の総数Mに占める割合を確信度とする。
【0057】
ステップ105が終了した後、ステップ106では確信度算出時に用いたカテゴリを推論値として選択する。
【0058】
データ403は本実施形態の出力データを示している。データ403は、未知事例における「今回購入品目」の推論値は「カテゴリ1」に属し、確信度は0.8であることを意味する。
【0059】
このように、出力フィールドが非数値型である場合に、あるカテゴリに属する類似事例の個数を確信度として用いる点に本実施形態の特徴がある。
【0060】
次に、本発明の第4の実施形態を説明する。図10は第4の実施形態のフローチャートを表している。ステップ101,102は図1のステップと同様であり、またステップ1003は図1中のステップ103、104、105,106,107から構成される。また、推論パラメータには第1の実施形態と同様にデータ304を用いる。
【0061】
本実施形態は、2個以上の未知事例を推論する場合には、許容確信度を満たさない未知事例を選択し、推論パラメータを変更しながら推論処理を繰り返す手段を提供する。
【0062】
図11は本実施形態におけるモジュール間のデータフローを示している。図11中の手段201、202、203、204、205、206、207、208は図2中の各手段と同様である。事例分類手段1101は推論処理の対象となる未知事例を選択し、確信度集計手段1102は複数の推論値の確信度を集計する。
【0063】
ステップ1001では各未知事例の確信度を0に初期化する。これによりステップ102以降では、1回目の推論で全ての未知事例が推論され、2回目以降の繰り返しでは、特定の事例のみが推論処理対象となる。ステップ1002は推論処理対象となる事例を決定する。2回目以降の繰り返しでは、以下で述べる非許容事例が推論処理対象となる。
【0064】
ステップ1002では非許容事例、すなわち許容確信度を満たさない未知事例が選択される。ステップ1003で全ての未知事例の確信度と推論値が算出された後、確信度集計手段1102によりステップ1004が実行され、確信度が集計される。
【0065】
図12中のデータ1201はステップ1004の処理結果を示している。許容事例とは、推論パラメータの許容誤差と許容確信度を満たす未知事例、すなわち、類似事例の出力フィールド値のばらつきが許容誤差以下で、且つ類似事例数が許容確信度に指定した値より大きい未知事例である。非許容事例とは、許容誤差もしくは許容確信度を満たさない未知事例である。ステップ1004では、許容事例と非許容事例のそれぞれについて、事例数、確信度の平均値、誤差の平均値を算出する。ステップ1005ではステップ1004の処理結果を出力する。ステップ1006では非許容事例について推論パラメータを変更して推論を再実行するか否かを問い合わせる。
【0066】
このように、推論パラメータで設定した許容誤差、確信度を満たさない未知事例を選択的に再推論する手段を提供する点に本実施形態の特徴がある。
【0067】
再推論の場合は、許容事例と非許容事例の状況を見ながら、推論パラメータをユーザが対話的に変更することが可能である。また、再推論時に使用するパラメータセットを予め用意しておき、対話的な操作をユーザに要求せず自動的に再推論を行うことも可能である。図13のデータ1300はパラメータセットを示しており、各行は再推論で使用するパラメータを表している。例えば、1回目の推論では許容誤差が100、許容確信度が10である。同様に、2回目の推論では許容誤差が120、許容確信度が10である。
【0068】
【発明の効果】
本発明によれば、事例の類似性に基づく推論において、事例の分布が一様でないような場合であっても、適切な推論値を得ることができ、また推論値の妥当性を判断できるよう適切な確信度を得ることができる。
【図面の簡単な説明】
【図1】推論方法の処理手続きである。
【図2】図1の処理方法を実現するモジュール間のデータフローである。
【図3】入力データの例である。
【図4】出力データの例である。
【図5】確信度算出モジュールが処理するデータの例である。
【図6】第1の実施の形態における確信度算出手続きである。
【図7】第2の実施の形態における確信度算出手続きである。
【図8】第3の実施の形態における入力データ、確信度算出モジュールが処理するデータの例である。
【図9】第3の実施の形態における確信度算出手続きである。
【図10】第4の実施の形態の処理手続きである。
【図11】第4の実施の形態を実現するモジュール間のデータフローである。
【図12】第4の実施の形態の出力データ例である。
【図13】第4の実施の形態の入力データ例である。
【符号の説明】
100:推論方法のフローチャート、200:モジュール間のデータフロー、
300:入力データ、400:出力データ、500:出力データ

Claims (5)

  1. 未知事例を1個以上格納する第1のデータファイルと、既知事例を1個以上格納する第2のデータファイルと、設定入力手段と、パラメータ入力手段と、類似度算出手段と、確信度算出手段と、推論値算出手段と、出力手段とを備え、
    前記未知事例は、2個以上のフィールドを含むレコードからなり、該レコードは1個以上のフィールド値が不明である事例であり、
    前記既知事例は、少なくとも2個以上のフィールドを含むレコードからなる事例であり、
    前記設定入力手段は、値が分かっているフィールドである入力フィールドと、値が不明であるフィールドである出力フィールドを、前記既知事例におけるフィールド名あるいはフィールド番号で指定し、
    前記パラメータ入力手段は、推定誤差の許容値を有する推論パラメータの入力を受け付け、
    前記類似度算出手段は、前記未知事例を前記第1のデータファイルから読み込み、該未知事例と前記第2のデータファイルに格納された前記既知事例から、入力フィールドの値から算出される前記未知事例と前記既知事例の間の距離を用いて、1つ1つの既知事例に対して前記距離と類似度を算出し、
    前記確信度算出手段は、前記類似度の大きい順に、前記未知事例の出力フィールドに対応する前記既知事例のフィールドの値を参照し、前記推定誤差の許容値に収まる前記既知事例を類似事例として採用し、該類似事例の個数であり、推論の確からしさを示す確信度を算出し、
    前記推論値算出手段は、前記類似度の大きい順位に前記確信度が示す個数の前記既知事例を選択し、前記未知事例の出力フィールドに対応する該選択した既知事例のフィールドの値と前記類似度から前記未知事例の出力フィールドの推論値を算出し、
    前記出力手段は、前記確信度と前記推論値を出力することを特徴とする推論システム。
  2. 請求項1記載の推論システムにおいて、
    前記第1のデータファイルに未処理の前記未知事例が格納されている場合、前記パラメータ入力手段と前記類似度算出手段と前記確信度算出手段と前記推論値算出手段と前記出力手段の動作を繰り返すことを特徴とする推論システム。
  3. 請求項1 又は 2記載の推論システムにおいて、
    前記確信度算出手段は、前記確信度に代えて、前記推定誤差を満たす事例の数を、前記類似事例の総数で除したものを確信度とすることを特徴とする推論システム。
  4. 請求項1 又は 2記載の推論システムにおいて、
    事例の出力フィールド値が非数値型である場合、該フィールド値を予めいくつかのカテゴリに分類し、
    前記確信度算出手段は、前記確信度に代えて、最も多くの類似事例が属する前記カテゴリの事例数を、前記類似事例の総数で除したものを確信度とすることを特徴とする推論システム。
  5. 請求項1 又は 2記載の推論システムにおいて、
    事例分類手段と確信度集計手段と繰り返し手段を備え、
    前記推論パラメータは、前記類似事例の確信度を利用者が許容する個数下限値を有し、
    前記推定誤差の許容値を満たし、かつ、類似事例の数が前記個数下限値より多い未知事例を許容事例とし、
    前記推定誤差の許容値を満たさない、又は、類似事例の数が前記個数下限値より少ない未知事例を非許容事例とし、
    前記事例分類手段は、
    1 回目の推論では全ての前記未知事例を選択し、
    2 回目以降の推論では前記非許容事例を選択し、
    前記確信度集計手段は、
    前記許容事例と前記非許容事例について、事例数、確信度の平均値及び誤差の平均値を算出し、
    前記出力手段は前記確信度集計手段の前記算出の結果を出力し、
    前記繰り返し手段は、利用者に推論パラメータを変更して再度推論処理を行うか否かを問い合わせることを特徴とする推論システム。
JP2000152668A 2000-05-18 2000-05-18 事例の類似性に基づいた推論システム Expired - Fee Related JP3956581B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000152668A JP3956581B2 (ja) 2000-05-18 2000-05-18 事例の類似性に基づいた推論システム
US09/755,138 US6782376B2 (en) 2000-05-18 2001-01-08 Reasoning method based on similarity of cases

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000152668A JP3956581B2 (ja) 2000-05-18 2000-05-18 事例の類似性に基づいた推論システム

Publications (2)

Publication Number Publication Date
JP2001331316A JP2001331316A (ja) 2001-11-30
JP3956581B2 true JP3956581B2 (ja) 2007-08-08

Family

ID=18658063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000152668A Expired - Fee Related JP3956581B2 (ja) 2000-05-18 2000-05-18 事例の類似性に基づいた推論システム

Country Status (2)

Country Link
US (1) US6782376B2 (ja)
JP (1) JP3956581B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7107525B2 (en) 2002-07-23 2006-09-12 Xerox Corporation Method for constraint-based document generation
US7487445B2 (en) * 2002-07-23 2009-02-03 Xerox Corporation Constraint-optimization system and method for document component layout generation
US7225401B2 (en) * 2002-07-23 2007-05-29 Xerox Corporation Case-based system and method for generating a custom document
US20040034613A1 (en) * 2002-07-23 2004-02-19 Xerox Corporation System and method for dynamically generating a style sheet
US7337086B2 (en) * 2005-10-18 2008-02-26 Honeywell International, Inc. System and method for combining diagnostic evidences for turbine engine fault detection
US8862433B2 (en) 2010-05-18 2014-10-14 United Technologies Corporation Partitioning of turbomachine faults
DE102011079034A1 (de) 2011-07-12 2013-01-17 Siemens Aktiengesellschaft Ansteuerung eines technischen Systems
EP3306617A1 (en) 2016-10-06 2018-04-11 Fujitsu Limited Method and apparatus of context-based patient similarity

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU1458492A (en) * 1991-03-04 1992-10-06 Inference Corporation Case-based reasoning system
US5701400A (en) * 1995-03-08 1997-12-23 Amado; Carlos Armando Method and apparatus for applying if-then-else rules to data sets in a relational data base and generating from the results of application of said rules a database of diagnostics linked to said data sets to aid executive analysis of financial data
US5768475A (en) * 1995-05-25 1998-06-16 Pavilion Technologies, Inc. Method and apparatus for automatically constructing a data flow architecture
JP4155363B2 (ja) * 1997-06-19 2008-09-24 富士通株式会社 データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体
US6571251B1 (en) * 1997-12-30 2003-05-27 International Business Machines Corporation Case-based reasoning system and method with a search engine that compares the input tokens with view tokens for matching cases within view
JP3762840B2 (ja) * 1998-11-24 2006-04-05 富士通株式会社 類似事例に基づく予測を行う予測装置および方法

Also Published As

Publication number Publication date
US20010054033A1 (en) 2001-12-20
US6782376B2 (en) 2004-08-24
JP2001331316A (ja) 2001-11-30

Similar Documents

Publication Publication Date Title
CN106056136A (zh) 一种聚类中心快速确定的数据聚类方法
CN111581445B (zh) 基于图基元的图嵌入学习方法
CN110991474A (zh) 一种机器学习建模平台
CN106961356A (zh) 基于动态QoS和主客观权重的Web服务选取方法及其装置
JP3956581B2 (ja) 事例の類似性に基づいた推論システム
CN112633401B (zh) 一种高光谱遥感图像分类方法、装置、设备及存储介质
CN111080360A (zh) 行为预测方法、模型训练方法、装置、服务器及存储介质
CN110321493A (zh) 一种社交网络的异常检测与优化方法、系统及计算机设备
CN108459997A (zh) 基于深度学习和神经网络的高偏态数据价值概率预测方法
CN116719714A (zh) 一种测试用例的筛选模型的训练方法及相应的装置
CN111680973B (zh) 一种催收系统的催收任务优先级智能编排方法
CN112150179B (zh) 一种信息推送方法和装置
CN116089401B (zh) 用户数据管理方法及系统
CN116703568A (zh) 信用卡异常交易识别方法及装置
CN116151857A (zh) 一种营销模型的构建方法及装置
CN115936841A (zh) 一种构建信贷风险评估模型的方法及装置
CN108429632B (zh) 一种业务监控方法和装置
CN111651512A (zh) 基于半监督学习的多源异构商品特征权重求解方法和装置
CN117436936B (zh) 基于销量预测与bom成品加工系统及方法
TWI826087B (zh) 派工系統和派工方法
CN114239743B (zh) 一种基于稀疏时间序列数据的天气事件发生时间预测方法
CN112508250B (zh) 指挥信息系统生成方案增量分析方法、系统、介质及终端
CN117217522A (zh) 基于人工智能的财务预开票风险管控系统及其运行方法
JP7040619B2 (ja) 学習装置、学習方法及び学習プログラム
CN117994026A (zh) 一种基于大数据的金融风险智能分析方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040218

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060613

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061121

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070430

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110518

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees