JP2005310179A - 類似事例に基づく予測を行う予測装置および方法 - Google Patents
類似事例に基づく予測を行う予測装置および方法 Download PDFInfo
- Publication number
- JP2005310179A JP2005310179A JP2005151465A JP2005151465A JP2005310179A JP 2005310179 A JP2005310179 A JP 2005310179A JP 2005151465 A JP2005151465 A JP 2005151465A JP 2005151465 A JP2005151465 A JP 2005151465A JP 2005310179 A JP2005310179 A JP 2005310179A
- Authority
- JP
- Japan
- Prior art keywords
- case
- similar
- case data
- similarity
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 55
- 238000000605 extraction Methods 0.000 claims abstract description 111
- 238000004364 calculation method Methods 0.000 claims abstract description 88
- 238000012545 processing Methods 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 description 75
- 238000009826 distribution Methods 0.000 description 32
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 15
- 230000004044 response Effects 0.000 description 12
- 239000000284 extract Substances 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 238000012937 correction Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 238000010187 selection method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】 類似度条件計算手段6は、類似事例抽出条件と既に得られている暫定的な類似事例データの集合を用いて、既知事例データを暫定的な類似事例データの集合に加えるための類似度条件を計算する。条件付き類似度計算手段7は、既知事例データと未知事例データの類似度を計算し、類似度が類似度条件を満たすとき、その既知事例データを類似事例データとして出力し、類似度が類似度条件を満たさないことが確定したとき、計算を中止する。生成手段8は、条件付き類似度計算手段7から出力された類似事例データを用いて、新たな類似事例データの集合を生成する。
【選択図】図1
Description
毛利隆夫(Takao Mori), 「Nearest Neighbor法と記憶に基づく推論」, 人口知能学会誌, Vol.12 No.2, p188-p195, March 1997.
ある未知事例に関する予測を行うためには、その未知事例と各既知事例との間の類似度を計算して、類似事例を抽出しなければならない。実は、類似事例に基づく予測に要する処理時間のほとんどが、この類似度計算の時間である。従来の予測方法では、類似度計算の時間を短縮するために、既知事例に対して一定の前処理を行う必要があった(非特許文献1)。
本発明の第1の原理による予測装置は、決定手段1と予測手段2を備え、類似事例に基づく予測を行う。
類似事例抽出手段3は、1つ以上のフィールドからなる既知事例データの集合から、類似度に基づいて未知事例データに類似する1つ以上の類似事例データを抽出する。
類似度計算手段5は、上記既知事例データの集合における上記未知フィールドの値の分布と上記未知事例データの未知フィールドの値に依存する重みをフィールドごとに計算し、フィールドごとの重みを用いて類似度を計算する。
類似度条件計算手段6は、類似事例抽出条件と既に得られている暫定的な類似事例データの集合を用いて、既知事例データを暫定的な類似事例データの集合に加えるための類似度条件を計算する。
条件付き類似度計算手段7は、類似度計算の途中で、類似度条件計算手段6が出力した類似度条件が満たされないことが確定した時点で、その既知事例データは類似事例データになり得ないと判断し、計算を中止する。そして、生成手段8は、類似度計算が中止されなかった既知事例データを用いて類似事例データの集合を生成し、予測装置は、その類似事例データの集合を用いて予測を行う。
本発明では、事例間の類似度計算の際に、ある既知事例が類似事例になり得ないことが分かった時点で計算を中止する。これにより、類似事例の抽出が高速化され、既知事例集合に対する前処理を行わなくても、予測が高速化される。
a=0 or 1/k1≦a≦1 (1)
b=0 or s1≦b≦s2 (2)
ただし、a>0もしくはb>0であるものとする。k1、s1、およびs2の値は、上述したような方法で設定することができる。この場合、最大条件計算部26は、次のような条件を最大条件として出力する。
s≧s1もしくはk=k1 (3)
次に、図5は、図2の予測部13の構成図である。図5の予測部13は、類似事例抽出部41と予測結果生成部42を備える。類似事例抽出部41は、既知事例集合Aと未知事例集合Uを入力とし、類似事例抽出条件決定部12が出力する条件に合致する類似事例集合を出力する。予測結果生成部42は、類似事例抽出部41の出力を用いて予測を行い、予測結果を出力する。
図7は、図3の入力用事例生成部21の第1の例を示している。図7の入力用事例生成部21は分割部61を備え、既知事例集合Aを2つに分割して、一方を既知事例入力用事例集合Bとして出力し、もう一方を未知事例入力用事例集合Cとして出力する。分割部61における分割方法としては、例えば、ランダムサンプリング等が考えられる。
s(i)=s1+i*(s2−s1)/100 (7)
ただし、iは、0≦i≦100なる整数である。(7)式により、sは、s(0)からs(100)までの101点に離散化され、これに対応して101個の類似事例抽出条件が生成される。
例えば、図18、19、20、および21に示した類似事例集合が入力された場合、“類似事例数=1”という条件に従うと、各類似事例集合から類似度が最大の類似事例が1つずつ抽出され、図22、23、24、および25に示すような類似事例集合が生成される。
次に、条件評価部34は、未知事例入力用事例集合Cを用いて条件ごとの予測結果を評価し、各条件に対する評価値を生成する。テスト用の未知事例のクラス値は以下では、評価値の値が大きいほど良好な評価結果を表すものとして、条件評価部34のいくつかの実施形態について説明する。
(+,+)の場合 w=1.0
(+,−)の場合 w=1.0
(−,+)の場合 w=2.0
(−,−)の場合 w=1.0
そして、評価値の初期値を0とおき、各未知事例に対して、予測値と未知事例のクラス値が一致した場合には両者の組合せから得られる重みを評価値に加え、両者が一致しなかった場合にはその重みを評価値から減ずる。これにより、最終的にクラスフィールドの重みを加味した評価値が得られる。
(類推実行時間)=(既知事例数)×(フィールド数)+α×(類似事例数) (11)
(評価値)=(実行時間を加味する前の評価値)−β×(類推実行時間) (12)
(11)式において、類似事例数が類似事例抽出条件のみから定まらない場合は、条件付き類似事例抽出部32から出力された類似事例集合の事例数の平均をとればよい。また、パラメータαは、類似事例抽出条件を基に決められ、パラメータβは、ユーザが実行時間をどれほど重要と認識するかを基に決められる。
図44は、図8の事例削除部62の処理のフローチャートである。事例削除部62は、まず、未知事例入力用事例集合Cの事例の番号を表す制御変数Iを1とおき(ステップS1)、Iを未知事例入力用事例集合Cの事例数|C|と比較する(ステップS2)。ここでは、未知事例入力用事例集合Cは既知事例集合Aに一致している。
以上説明した図2の予測装置11は、任意のデータ分類処理に適用することができる。図50は、予測装置11を含むデータ分類装置の構成図である。図50のデータ分類装置は、予測装置11、既知事例データベース81、未知事例データベース82、入力装置83、分類装置84、および出力装置85を備える。
2 予測手段
3 類似事例抽出手段
4 予測結果生成手段
5 類似度計算手段
6 類似度条件計算手段
7 条件付き類似度計算手段
8 生成手段
11 予測装置
12 類似事例抽出条件決定部
13 予測部
21 入力用事例生成部
22、41 類似事例抽出部
23 類似事例削除部
24 最適条件決定部
25 条件出力部
26 最大条件計算部
27 最大条件修正部
31 条件離散化部
32 条件付き類似事例抽出部
33、42 予測結果生成部
34 条件評価部
35 最適条件選択部
51 条件付き類似度計算部
52 類似事例集合更新部
53 類似事例集合記憶部
54 類似度条件計算部
61 分割部
62 事例削除部
63 サンプリング部
71 一次予測生成部
72 予測修正部
81、82、100 データベース
83、93 入力装置
84 分類装置
85、94 出力装置
86 ネットワーク
91 CPU
95 外部記憶装置
96 媒体駆動装置
97 ネットワーク接続装置
98 バス
99 可搬記録媒体
Claims (4)
- 類似事例に基づく予測を行う予測装置であって、
類似事例抽出条件と既に得られている暫定的な類似事例データの集合を用いて、既知事例データを該暫定的な類似事例データの集合に加えるための類似度条件を計算する類似度条件計算手段と、
前記既知事例データと未知事例データの類似度を計算し、該類似度が前記類似度条件を満たすとき、該既知事例データを類似事例データとして出力し、該類似度が該類似度条件を満たさないことが確定したとき、計算を中止する条件付き類似度計算手段と、
前記条件付き類似度計算手段から出力された類似事例データを用いて、新たな類似事例データの集合を生成する生成手段と
を備えることを特徴とする予測装置。 - 前記生成手段は、前記条件付き類似度計算手段から出力された類似事例データを前記暫定的な類似事例データの集合に加え、前記類似事例抽出条件に合致するように余分な事例データを取り除いて、新しい類似事例データの集合を生成する類似事例集合更新手段と、該新しい類似事例データの集合を暫定的な類似事例データの集合として記憶する類似事例集合記憶手段とを含み、与えられたすべての既知事例データの処理が終了したとき、該類似事例集合記憶手段に記憶された類似事例データの集合を出力することを特徴とする請求項1記載の予測装置。
- 類似事例に基づく予測を行うコンピュータのためのプログラムを記録した記録媒体であって、
類似事例抽出条件と既に得られている暫定的な類似事例データの集合を用いて、既知事例データを該暫定的な類似事例データの集合に加えるための類似度条件を計算するステップと、
前記既知事例データと未知事例データの類似度を計算するステップと、
前記類似度が前記類似度条件を満たすとき、該既知事例データを類似事例データとして決定するステップと、
前記類似度が前記類似度条件を満たさないことが確定したとき、計算を中止するステップと、
決定された類似事例データを用いて、新たな類似事例データの集合を生成するステップと
を含む処理を前記コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。 - コンピュータを用いた類似事例に基づく予測方法であって、
類似事例抽出条件と既に得られている暫定的な類似事例データの集合を用いて、既知事例データを該暫定的な類似事例データの集合に加えるための類似度条件を計算し、
前記既知事例データと未知事例データの類似度を計算し、
前記類似度が前記類似度条件を満たすとき、該既知事例データを類似事例データとして決定し、
前記類似度が前記類似度条件を満たさないことが確定したとき、計算を中止し、
決定された類似事例データを用いて、新たな類似事例データの集合を生成し、
与えられたすべての既知事例データの処理が終了したとき、生成された類似事例データの集合を用いて、前記未知事例データの未知フィールドの値を予測する
ことを特徴とする予測方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151465A JP4440828B2 (ja) | 2005-05-24 | 2005-05-24 | 類似事例に基づく予測を行う予測装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151465A JP4440828B2 (ja) | 2005-05-24 | 2005-05-24 | 類似事例に基づく予測を行う予測装置および方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33250398A Division JP3762840B2 (ja) | 1998-11-24 | 1998-11-24 | 類似事例に基づく予測を行う予測装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005310179A true JP2005310179A (ja) | 2005-11-04 |
JP4440828B2 JP4440828B2 (ja) | 2010-03-24 |
Family
ID=35438783
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005151465A Expired - Fee Related JP4440828B2 (ja) | 2005-05-24 | 2005-05-24 | 類似事例に基づく予測を行う予測装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4440828B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163482A (zh) * | 2019-04-19 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 确定活动方案的安全方案数据的方法、终端设备及服务器 |
-
2005
- 2005-05-24 JP JP2005151465A patent/JP4440828B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163482A (zh) * | 2019-04-19 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 确定活动方案的安全方案数据的方法、终端设备及服务器 |
CN110163482B (zh) * | 2019-04-19 | 2023-01-13 | 创新先进技术有限公司 | 确定活动方案的安全方案数据的方法、终端设备及服务器 |
Also Published As
Publication number | Publication date |
---|---|
JP4440828B2 (ja) | 2010-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3762840B2 (ja) | 類似事例に基づく予測を行う予測装置および方法 | |
US8990145B2 (en) | Probabilistic data mining model comparison | |
Ahn et al. | Global optimization of case-based reasoning for breast cytology diagnosis | |
CN111950810B (zh) | 一种基于自演化预训练的多变量时间序列预测方法和设备 | |
US11366806B2 (en) | Automated feature generation for machine learning application | |
CN112508177A (zh) | 一种网络结构搜索方法、装置、电子设备及存储介质 | |
JP7481902B2 (ja) | 管理計算機、管理プログラム、及び管理方法 | |
Zhou et al. | Deep learning-based intelligent multilevel predictive maintenance framework considering comprehensive cost | |
Liu et al. | Residual useful life prognosis of equipment based on modified hidden semi-Markov model with a co-evolutional optimization method | |
Hasanpour et al. | Improving rule-based classification using Harmony Search | |
JP7488718B2 (ja) | プロジェクト予兆検知装置及びプロジェクト予兆検知方法 | |
CN110717537B (zh) | 训练用户分类模型、执行用户分类预测的方法及装置 | |
Zhang et al. | Developing and experimenting on approaches to explainability in AI systems | |
JP4202339B2 (ja) | 類似事例に基づく予測を行う予測装置および方法 | |
JP4440828B2 (ja) | 類似事例に基づく予測を行う予測装置および方法 | |
KR20200112495A (ko) | 상권 분석 서비스 제공 서버 및 그 방법 | |
WO2020059136A1 (ja) | 決定リスト学習装置、決定リスト学習方法および決定リスト学習プログラム | |
JP2005135010A (ja) | プロセスの状態類似事例検索方法および状態予測方法並びに記憶媒体 | |
WO2020044413A1 (ja) | 仮説推論装置、仮説推論方法、及びコンピュータ読み取り可能な記録媒体 | |
CN113537731A (zh) | 基于强化学习的设计资源能力评估方法 | |
JP4230890B2 (ja) | モデル同定装置,モデル同定プログラム及びモデル同定装置の動作方法 | |
Konar et al. | An introduction to time-series prediction | |
KR102708193B1 (ko) | 이종 데이터 기반 챔피언 모델을 이용한 향상된 예측 시스템 및 예측 방법 | |
JP7436830B2 (ja) | 学習プログラム、学習方法、および学習装置 | |
JP4010843B2 (ja) | 行動量生成装置、行動量生成方法および行動量生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080722 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090915 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20091110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20091110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100105 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100107 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140115 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |