JP2005302054A - 類似事例に基づく予測を行う予測装置および方法 - Google Patents
類似事例に基づく予測を行う予測装置および方法 Download PDFInfo
- Publication number
- JP2005302054A JP2005302054A JP2005151464A JP2005151464A JP2005302054A JP 2005302054 A JP2005302054 A JP 2005302054A JP 2005151464 A JP2005151464 A JP 2005151464A JP 2005151464 A JP2005151464 A JP 2005151464A JP 2005302054 A JP2005302054 A JP 2005302054A
- Authority
- JP
- Japan
- Prior art keywords
- case
- similar
- unknown
- condition
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】 類似事例抽出手段3は、1つ以上のフィールドからなる既知事例データの集合から、類似度に基づいて未知事例データに類似する1つ以上の類似事例データを抽出する。予測結果生成手段4は、上記1つ以上の類似事例データを用いて、未知事例データの未知フィールドの値を予測し、予測値を出力する。類似度計算手段5は、上記既知事例データの集合における上記未知フィールドの値の分布と上記未知事例データの未知フィールドの値に依存する重みをフィールドごとに計算し、フィールドごとの重みを用いて類似度を計算する。
【選択図】図1
Description
毛利隆夫(Takao Mori), 「Nearest Neighbor法と記憶に基づく推論」, 人口知能学会誌, Vol.12 No.2, p188-p195, March 1997.
ある未知事例に関する予測を行うためには、その未知事例と各既知事例との間の類似度を計算して、類似事例を抽出しなければならない。実は、類似事例に基づく予測に要する処理時間のほとんどが、この類似度計算の時間である。従来の予測方法では、類似度計算の時間を短縮するために、既知事例に対して一定の前処理を行う必要があった(非特許文献1)。
本発明の第1の原理による予測装置は、決定手段1と予測手段2を備え、類似事例に基づく予測を行う。
類似事例抽出手段3は、1つ以上のフィールドからなる既知事例データの集合から、類似度に基づいて未知事例データに類似する1つ以上の類似事例データを抽出する。
類似度計算手段5は、上記既知事例データの集合における上記未知フィールドの値の分布と上記未知事例データの未知フィールドの値に依存する重みをフィールドごとに計算し、フィールドごとの重みを用いて類似度を計算する。
類似度条件計算手段6は、類似事例抽出条件と既に得られている暫定的な類似事例データの集合を用いて、既知事例データを暫定的な類似事例データの集合に加えるための類似度条件を計算する。
条件付き類似度計算手段7は、類似度計算の途中で、類似度条件計算手段6が出力した類似度条件が満たされないことが確定した時点で、その既知事例データは類似事例データになり得ないと判断し、計算を中止する。そして、生成手段8は、類似度計算が中止されなかった既知事例データを用いて類似事例データの集合を生成し、予測装置は、その類似事例データの集合を用いて予測を行う。
本発明では、事例間の類似度計算の際に、ある既知事例が類似事例になり得ないことが分かった時点で計算を中止する。これにより、類似事例の抽出が高速化され、既知事例集合に対する前処理を行わなくても、予測が高速化される。
a=0 or 1/k1≦a≦1 (1)
b=0 or s1≦b≦s2 (2)
ただし、a>0もしくはb>0であるものとする。k1、s1、およびs2の値は、上述したような方法で設定することができる。この場合、最大条件計算部26は、次のような条件を最大条件として出力する。
s≧s1もしくはk=k1 (3)
次に、図5は、図2の予測部13の構成図である。図5の予測部13は、類似事例抽出部41と予測結果生成部42を備える。類似事例抽出部41は、既知事例集合Aと未知事例集合Uを入力とし、類似事例抽出条件決定部12が出力する条件に合致する類似事例集合を出力する。予測結果生成部42は、類似事例抽出部41の出力を用いて予測を行い、予測結果を出力する。
図7は、図3の入力用事例生成部21の第1の例を示している。図7の入力用事例生成部21は分割部61を備え、既知事例集合Aを2つに分割して、一方を既知事例入力用事例集合Bとして出力し、もう一方を未知事例入力用事例集合Cとして出力する。分割部61における分割方法としては、例えば、ランダムサンプリング等が考えられる。
s(i)=s1+i*(s2−s1)/100 (7)
ただし、iは、0≦i≦100なる整数である。(7)式により、sは、s(0)からs(100)までの101点に離散化され、これに対応して101個の類似事例抽出条件が生成される。
例えば、図18、19、20、および21に示した類似事例集合が入力された場合、“類似事例数=1”という条件に従うと、各類似事例集合から類似度が最大の類似事例が1つずつ抽出され、図22、23、24、および25に示すような類似事例集合が生成される。
次に、条件評価部34は、未知事例入力用事例集合Cを用いて条件ごとの予測結果を評価し、各条件に対する評価値を生成する。テスト用の未知事例のクラス値は以下では、評価値の値が大きいほど良好な評価結果を表すものとして、条件評価部34のいくつかの実施形態について説明する。
(+,+)の場合 w=1.0
(+,−)の場合 w=1.0
(−,+)の場合 w=2.0
(−,−)の場合 w=1.0
そして、評価値の初期値を0とおき、各未知事例に対して、予測値と未知事例のクラス値が一致した場合には両者の組合せから得られる重みを評価値に加え、両者が一致しなかった場合にはその重みを評価値から減ずる。これにより、最終的にクラスフィールドの重みを加味した評価値が得られる。
(類推実行時間)=(既知事例数)×(フィールド数)+α×(類似事例数) (11)
(評価値)=(実行時間を加味する前の評価値)−β×(類推実行時間) (12)
(11)式において、類似事例数が類似事例抽出条件のみから定まらない場合は、条件付き類似事例抽出部32から出力された類似事例集合の事例数の平均をとればよい。また、パラメータαは、類似事例抽出条件を基に決められ、パラメータβは、ユーザが実行時間をどれほど重要と認識するかを基に決められる。
図44は、図8の事例削除部62の処理のフローチャートである。事例削除部62は、まず、未知事例入力用事例集合Cの事例の番号を表す制御変数Iを1とおき(ステップS1)、Iを未知事例入力用事例集合Cの事例数|C|と比較する(ステップS2)。ここでは、未知事例入力用事例集合Cは既知事例集合Aに一致している。
以上説明した図2の予測装置11は、任意のデータ分類処理に適用することができる。図50は、予測装置11を含むデータ分類装置の構成図である。図50のデータ分類装置は、予測装置11、既知事例データベース81、未知事例データベース82、入力装置83、分類装置84、および出力装置85を備える。
2 予測手段
3 類似事例抽出手段
4 予測結果生成手段
5 類似度計算手段
6 類似度条件計算手段
7 条件付き類似度計算手段
8 生成手段
11 予測装置
12 類似事例抽出条件決定部
13 予測部
21 入力用事例生成部
22、41 類似事例抽出部
23 類似事例削除部
24 最適条件決定部
25 条件出力部
26 最大条件計算部
27 最大条件修正部
31 条件離散化部
32 条件付き類似事例抽出部
33、42 予測結果生成部
34 条件評価部
35 最適条件選択部
51 条件付き類似度計算部
52 類似事例集合更新部
53 類似事例集合記憶部
54 類似度条件計算部
61 分割部
62 事例削除部
63 サンプリング部
71 一次予測生成部
72 予測修正部
81、82、100 データベース
83、93 入力装置
84 分類装置
85、94 出力装置
86 ネットワーク
91 CPU
95 外部記憶装置
96 媒体駆動装置
97 ネットワーク接続装置
98 バス
99 可搬記録媒体
Claims (4)
- 類似事例に基づく予測を行う予測装置であって、
1つ以上のフィールドからなる既知事例データの集合から、類似度に基づいて未知事例データに類似する1つ以上の類似事例データを抽出する類似事例抽出手段と、
前記1つ以上の類似事例データを用いて、前記未知事例データの未知フィールドの値を予測し、予測値を出力する予測結果生成手段と、
前記既知事例データの集合における前記未知フィールドの値の分布と前記未知事例データの未知フィールドの値に依存する重みをフィールドごとに計算し、フィールドごとの重みを用いて前記類似度を計算する類似度計算手段と
を備えることを特徴とする予測装置。 - 前記類似度計算手段は、フィールドごとに前記既知事例データの集合を該フィールドの値により部分集合に分割し、前記未知事例データが属する部分集合の未知フィールドの値の分布が全体の未知フィールドの値の分布に近いほど小さくなり、該未知事例データが属する部分集合の未知フィールドの値の分布が該全体の未知フィールドの値の分布から遠いほど大きくなるような重みを計算することを特徴とする請求項1記載の予測装置。
- 類似事例に基づく予測を行うコンピュータのためのプログラムを記録した記録媒体であって、
1つ以上のフィールドからなる既知事例データの集合において、未知事例データの未知フィールドに対応するフィールドの値の分布を計算するステップと、
前記分布に依存する重みをフィールドごとに計算するステップと、
フィールドごとの重みを用いて類似度を計算するステップと、
前記既知事例データの集合から、前記類似度に基づいて前記未知事例データに類似する1つ以上の類似事例データを抽出するステップと、
前記1つ以上の類似事例データを用いて、前記未知事例データの未知フィールドの値を予測し、予測値を生成するステップと
を含む処理を前記コンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。 - コンピュータを用いた類似事例に基づく予測方法であって、
1つ以上のフィールドからなる既知事例データの集合において、未知事例データの未知フィールドに対応するフィールドの値の分布を計算し、
前記分布に依存する重みをフィールドごとに計算し、
フィールドごとの重みを用いて類似度を計算し、
前記既知事例データの集合から、前記類似度に基づいて前記未知事例データに類似する1つ以上の類似事例データを抽出し、
前記1つ以上の類似事例データを用いて、前記未知事例データの未知フィールドの値を予測する
ことを特徴とする予測方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151464A JP4202339B2 (ja) | 2005-05-24 | 2005-05-24 | 類似事例に基づく予測を行う予測装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005151464A JP4202339B2 (ja) | 2005-05-24 | 2005-05-24 | 類似事例に基づく予測を行う予測装置および方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33250398A Division JP3762840B2 (ja) | 1998-11-24 | 1998-11-24 | 類似事例に基づく予測を行う予測装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005302054A true JP2005302054A (ja) | 2005-10-27 |
JP4202339B2 JP4202339B2 (ja) | 2008-12-24 |
Family
ID=35333396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005151464A Expired - Fee Related JP4202339B2 (ja) | 2005-05-24 | 2005-05-24 | 類似事例に基づく予測を行う予測装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4202339B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7552105B2 (en) | 2006-03-13 | 2009-06-23 | Fujitsu Limited | Importance degree calculation program, importance degree calculation method, and importance degree calculation apparatus |
JP2018061335A (ja) * | 2016-10-04 | 2018-04-12 | パナソニックIpマネジメント株式会社 | 発電設備情報推定システムおよび発電設備情報推定方法 |
-
2005
- 2005-05-24 JP JP2005151464A patent/JP4202339B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7552105B2 (en) | 2006-03-13 | 2009-06-23 | Fujitsu Limited | Importance degree calculation program, importance degree calculation method, and importance degree calculation apparatus |
JP2018061335A (ja) * | 2016-10-04 | 2018-04-12 | パナソニックIpマネジメント株式会社 | 発電設備情報推定システムおよび発電設備情報推定方法 |
WO2018066370A1 (ja) * | 2016-10-04 | 2018-04-12 | パナソニックIpマネジメント株式会社 | 発電設備情報推定システムおよび発電設備情報推定方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4202339B2 (ja) | 2008-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3762840B2 (ja) | 類似事例に基づく予測を行う予測装置および方法 | |
US8990145B2 (en) | Probabilistic data mining model comparison | |
Ahn et al. | Bankruptcy prediction modeling with hybrid case-based reasoning and genetic algorithms approach | |
Araújo et al. | Hybrid morphological methodology for software development cost estimation | |
Kiliç et al. | Comparison of different strategies of utilizing fuzzy clustering in structure identification | |
EP3792841A1 (en) | Automated feature generation for machine learning application | |
CN112508177A (zh) | 一种网络结构搜索方法、装置、电子设备及存储介质 | |
JP7481902B2 (ja) | 管理計算機、管理プログラム、及び管理方法 | |
Hasanpour et al. | Improving rule-based classification using Harmony Search | |
Liu et al. | Residual useful life prognosis of equipment based on modified hidden semi-Markov model with a co-evolutional optimization method | |
Zhou et al. | Deep learning-based intelligent multilevel predictive maintenance framework considering comprehensive cost | |
JP4202339B2 (ja) | 類似事例に基づく予測を行う予測装置および方法 | |
CN110717537B (zh) | 训练用户分类模型、执行用户分类预测的方法及装置 | |
Zhang et al. | Developing and experimenting on approaches to explainability in AI systems | |
JP4440828B2 (ja) | 類似事例に基づく予測を行う予測装置および方法 | |
WO2020059136A1 (ja) | 決定リスト学習装置、決定リスト学習方法および決定リスト学習プログラム | |
JP2005135010A (ja) | プロセスの状態類似事例検索方法および状態予測方法並びに記憶媒体 | |
JP5033155B2 (ja) | 類似部分シーケンス検出装置、類似部分シーケンス検出方法、および、類似部分シーケンス検出プログラム | |
CN113537731A (zh) | 基于强化学习的设计资源能力评估方法 | |
JP4230890B2 (ja) | モデル同定装置,モデル同定プログラム及びモデル同定装置の動作方法 | |
Basir et al. | Integrated bio-search approaches with multi-objective algorithms for optimization and classification problem | |
KR20200112495A (ko) | 상권 분석 서비스 제공 서버 및 그 방법 | |
Huang | Stock Price Prediction Based on Trend Characterization | |
Hulianytskyi et al. | Development and analysis of genetic algorithm for time series forecasting problem | |
Nandal et al. | Employee Attrition: Analysis of Data Driven Models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080722 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080905 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081007 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081008 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111017 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121017 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131017 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |