JP2000172671A - K近傍法による類似予測の結果表示装置 - Google Patents
K近傍法による類似予測の結果表示装置Info
- Publication number
- JP2000172671A JP2000172671A JP35221698A JP35221698A JP2000172671A JP 2000172671 A JP2000172671 A JP 2000172671A JP 35221698 A JP35221698 A JP 35221698A JP 35221698 A JP35221698 A JP 35221698A JP 2000172671 A JP2000172671 A JP 2000172671A
- Authority
- JP
- Japan
- Prior art keywords
- field
- record
- prediction
- influence
- similar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000010586 diagram Methods 0.000 description 14
- 238000001514 detection method Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
Landscapes
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
(57)【要約】
【課題】本発明は多数のレコードからなる事例データに
対するK近傍法による類似予測の結果表示装置に関し,
影響度を含めた結果出力を平行軸座標グラフ上に同時に
表示できることを目的とする。 【解決手段】類似予測の結果表示装置に備えられた影響
度表示部は,類似予測の結果得られた影響度ファイルか
ら各フィールドの予測に対する影響度を読み込んで,各
フィールドの影響度の最大値と最小値を検出して各フィ
ールドの長さまたは太さの何れか一方または両方を影響
度に対応した値に設定する手段を備える。設定されたフ
ィールドの長さまたは太さの一方または両方の値に基づ
いて類似事例データの各フィールド軸の長さと太さを表
示し,軸に合わせて類似予測により得られたK個の類似
する各レコードのフィールド値に対応した位置をプロッ
トするよう構成する。
対するK近傍法による類似予測の結果表示装置に関し,
影響度を含めた結果出力を平行軸座標グラフ上に同時に
表示できることを目的とする。 【解決手段】類似予測の結果表示装置に備えられた影響
度表示部は,類似予測の結果得られた影響度ファイルか
ら各フィールドの予測に対する影響度を読み込んで,各
フィールドの影響度の最大値と最小値を検出して各フィ
ールドの長さまたは太さの何れか一方または両方を影響
度に対応した値に設定する手段を備える。設定されたフ
ィールドの長さまたは太さの一方または両方の値に基づ
いて類似事例データの各フィールド軸の長さと太さを表
示し,軸に合わせて類似予測により得られたK個の類似
する各レコードのフィールド値に対応した位置をプロッ
トするよう構成する。
Description
【0001】
【発明の属する技術分野】本発明はK近傍法による類似
予測の結果表示装置に関し,予測した結果を平行軸座標
上で表示する類似予測の結果表示装置に関する。
予測の結果表示装置に関し,予測した結果を平行軸座標
上で表示する類似予測の結果表示装置に関する。
【0002】類似予測手法は,複数のフィールド(特
性)により構成された多数の実際のレコード(項目)の
データ(事例データ)を基礎として,予測対象データの
予測フィールドにおけるレコード値を求める。また,予
測に影響したフィールドと事例データの中から類似する
K個のレコードをK近傍法により出力するものである
が,予測結果の出力は大量のテキスト出力のため理解困
難であり,出力結果を理解できる表示手法が要求されて
いる。
性)により構成された多数の実際のレコード(項目)の
データ(事例データ)を基礎として,予測対象データの
予測フィールドにおけるレコード値を求める。また,予
測に影響したフィールドと事例データの中から類似する
K個のレコードをK近傍法により出力するものである
が,予測結果の出力は大量のテキスト出力のため理解困
難であり,出力結果を理解できる表示手法が要求されて
いる。
【0003】
【従来の技術】図10は類似予測に使用するデータの構
成例を示し,A.は事例データ,B.は予測対象データ
である。事例データは,二次元のデータであり,列方向
はフィールドを表し,例えば,性別,年齢,年収,学歴
等をフィールドとして設けることができ,図10のA.
はフィールドとしてa〜fのフィールドが設けられてい
る。この中のa,b,c及びeのフィールドは連続した
数値の中の一つの数値を表し,dは離散数値(例えば,
男か女かに対応して「1」か「0」を表す)を表し,f
も各レコードによる離散数値を表す。また,A.の行方
向は個別のレコード(項目)を表し,各レコードにはI
D番号として,ID:1,ID:2,ID:3,ID:
4 ,・・・が割り当てられているが,個人名でもよい。
成例を示し,A.は事例データ,B.は予測対象データ
である。事例データは,二次元のデータであり,列方向
はフィールドを表し,例えば,性別,年齢,年収,学歴
等をフィールドとして設けることができ,図10のA.
はフィールドとしてa〜fのフィールドが設けられてい
る。この中のa,b,c及びeのフィールドは連続した
数値の中の一つの数値を表し,dは離散数値(例えば,
男か女かに対応して「1」か「0」を表す)を表し,f
も各レコードによる離散数値を表す。また,A.の行方
向は個別のレコード(項目)を表し,各レコードにはI
D番号として,ID:1,ID:2,ID:3,ID:
4 ,・・・が割り当てられているが,個人名でもよい。
【0004】図10のA.の事例データが,各レコード
のID番号に対して,ダイレクトメールを送信した時に
返信が有ったか否かの結果に対応して,フィールドfに
“1”か“0”を設定されているものとする。
のID番号に対して,ダイレクトメールを送信した時に
返信が有ったか否かの結果に対応して,フィールドfに
“1”か“0”を設定されているものとする。
【0005】このA.に示す事例データに対し,B.に
示す予測対象データには上記の事例データと同様のレコ
ードとa〜eのフィールド(fを除く)を持つデータが
設定されているが,予測対象データのfのフィールドは
類似予測の処理により各レコード毎に予測値が決められ
る。なお,事例データと予測対象データの各レコードの
間には何の関係もない(図10の例では,事例データの
各レコードは予測対象データと一致している)。
示す予測対象データには上記の事例データと同様のレコ
ードとa〜eのフィールド(fを除く)を持つデータが
設定されているが,予測対象データのfのフィールドは
類似予測の処理により各レコード毎に予測値が決められ
る。なお,事例データと予測対象データの各レコードの
間には何の関係もない(図10の例では,事例データの
各レコードは予測対象データと一致している)。
【0006】類似予測の従来の手法を図11を用いて以
下に説明する。
下に説明する。
【0007】図11は類似予測の処理の流れを示す。図
中,80と81は上記図10に示す事例データと予測対
象データを表し,82は選択数Kを表し,83は類似予
測の処理,84〜86は類似予測の処理により得られる
各データであり,84は予測によって得られた予測結
果,85は各フィールドの影響度,86は類似事例K個
のテキストデータ(レコードと同じ),87は類似予測
結果表示装置である。また,88は類似予測結果の表示
例である。
中,80と81は上記図10に示す事例データと予測対
象データを表し,82は選択数Kを表し,83は類似予
測の処理,84〜86は類似予測の処理により得られる
各データであり,84は予測によって得られた予測結
果,85は各フィールドの影響度,86は類似事例K個
のテキストデータ(レコードと同じ),87は類似予測
結果表示装置である。また,88は類似予測結果の表示
例である。
【0008】事例データ80,予測対象データ81及び
選択数K(例えばK=10とする)が入力されると類似
予測の処理83が実行される。この類似予測の処理では
事例データ80を使用して,予測対象データ81の各レ
コード毎にそのレコードの中のそれぞれのフィールドに
ついて類似しているフィールドを持つレコード(ID番
号)を指定された個数(K個)だけ選択する。すなわ
ち,事例データ80の中から予測対象データの1つのレ
コードに対して類似するK個のレコードを選択する。図
11の例では符号86に示すように類似事例K個のテキ
ストデータ(レコード)として,各レコードID毎に1
0個のレコード番号がテキスト形式で出力される。すな
わち,レコードID:1については,類似事例のレコー
ド番号として2,8,4,27,1(抽出対象の元と同
じレコード番号),7,8,55,27,12の合計1
0個である。同様にレコードID:2,ID:3につい
てもそれぞれ図に示すような10個のレコード番号が選
択される。
選択数K(例えばK=10とする)が入力されると類似
予測の処理83が実行される。この類似予測の処理では
事例データ80を使用して,予測対象データ81の各レ
コード毎にそのレコードの中のそれぞれのフィールドに
ついて類似しているフィールドを持つレコード(ID番
号)を指定された個数(K個)だけ選択する。すなわ
ち,事例データ80の中から予測対象データの1つのレ
コードに対して類似するK個のレコードを選択する。図
11の例では符号86に示すように類似事例K個のテキ
ストデータ(レコード)として,各レコードID毎に1
0個のレコード番号がテキスト形式で出力される。すな
わち,レコードID:1については,類似事例のレコー
ド番号として2,8,4,27,1(抽出対象の元と同
じレコード番号),7,8,55,27,12の合計1
0個である。同様にレコードID:2,ID:3につい
てもそれぞれ図に示すような10個のレコード番号が選
択される。
【0009】また,類似予測の処理83により,類似事
例K個のテキストデータ86に含まれたK個のレコード
の各フィールドの影響度(重み)を表すデータ85を用
いて,予測対象データ81の各レコード番号(ID:
1,ID:2,…等)毎に予測フィールド(データ81
のfの列)に設定する予測値を決定して,予測結果84
を出力する。この場合の予測値としては,例えば,ダイ
レクトメールが返信される可能性が高いことが予測され
る場合(従って,ダイレクトメールを送信する必要があ
る場合)を“1”とし,その可能性が低い場合を“0”
とする。但し,“1”と予測した場合にも,その確率
(返信される可能性の確率)100%であるのか,60
%であるのかといった根拠となる数値を含めて出力する
場合もあり,“0”と予測した場合にも同様である。
例K個のテキストデータ86に含まれたK個のレコード
の各フィールドの影響度(重み)を表すデータ85を用
いて,予測対象データ81の各レコード番号(ID:
1,ID:2,…等)毎に予測フィールド(データ81
のfの列)に設定する予測値を決定して,予測結果84
を出力する。この場合の予測値としては,例えば,ダイ
レクトメールが返信される可能性が高いことが予測され
る場合(従って,ダイレクトメールを送信する必要があ
る場合)を“1”とし,その可能性が低い場合を“0”
とする。但し,“1”と予測した場合にも,その確率
(返信される可能性の確率)100%であるのか,60
%であるのかといった根拠となる数値を含めて出力する
場合もあり,“0”と予測した場合にも同様である。
【0010】このようにして,類似予測結果として,8
4〜86の各データが得られると,プリンタまたは表示
装置にこれらのテキストデータが印刷または表示され
る。
4〜86の各データが得られると,プリンタまたは表示
装置にこれらのテキストデータが印刷または表示され
る。
【0011】また,類似予測結果表示装置87により,
類似事例K個のテキストデータ86と予測結果84を含
めた表示をする方法がある。すなわち,類似する複数の
レコードを視覚的に理解できるようにするため,平行軸
座標グラフが用いられる。平行軸座標グラフは,図11
の類似予測結果の表示例88として概要を示すが,図1
2,図13を用いて以下に説明する。
類似事例K個のテキストデータ86と予測結果84を含
めた表示をする方法がある。すなわち,類似する複数の
レコードを視覚的に理解できるようにするため,平行軸
座標グラフが用いられる。平行軸座標グラフは,図11
の類似予測結果の表示例88として概要を示すが,図1
2,図13を用いて以下に説明する。
【0012】図12は類似予測を行う前の平行軸座標グ
ラフを表し,上記図10のB.の予測対象データ81に
示すフィールドa〜eを持つレコードの中の予測する前
の6個のレコードを平行軸グラフにより表示したもので
ある。図12のA.はグラフを表し,B.は平行軸座標
グラフの類似予測前の予測対象データのデータ構造を表
し,フィールド(図ではfield で表す,以下同じ)a〜
フィールドeについて,それぞれ,数値の特性(連続値
か,0か1のようなカテゴリ値か),最大値,最小値等
のデータが設定される構造となっている。このデータ構
造に基づいて,A.に示すように,各フィールドについ
てそれぞれの最小値と最大値が設定されて,その間に各
レコードの値に対応する点が抽出され,各抽出点を線に
より結ぶことにより平行軸座標グラフが描かれる。
ラフを表し,上記図10のB.の予測対象データ81に
示すフィールドa〜eを持つレコードの中の予測する前
の6個のレコードを平行軸グラフにより表示したもので
ある。図12のA.はグラフを表し,B.は平行軸座標
グラフの類似予測前の予測対象データのデータ構造を表
し,フィールド(図ではfield で表す,以下同じ)a〜
フィールドeについて,それぞれ,数値の特性(連続値
か,0か1のようなカテゴリ値か),最大値,最小値等
のデータが設定される構造となっている。このデータ構
造に基づいて,A.に示すように,各フィールドについ
てそれぞれの最小値と最大値が設定されて,その間に各
レコードの値に対応する点が抽出され,各抽出点を線に
より結ぶことにより平行軸座標グラフが描かれる。
【0013】次に図13は類似予測をした後の予測結果
表示の平行軸座標グラフを表し,上記図12と同様に
A.には類似予測の対象となった各レコードのa〜eか
らなる各フィールドを表す平行軸座標グラフが表示され
ると共に予測結果(この場合は,カテゴリー値である
“1”か“0”の値)を表す予測フィールドfが表示さ
れている。図13のB.はA.に表示された各レコード
のデータ構造を表し,各レコードのフィールドa〜eと
予測フィールドfの情報が格納されている。
表示の平行軸座標グラフを表し,上記図12と同様に
A.には類似予測の対象となった各レコードのa〜eか
らなる各フィールドを表す平行軸座標グラフが表示され
ると共に予測結果(この場合は,カテゴリー値である
“1”か“0”の値)を表す予測フィールドfが表示さ
れている。図13のB.はA.に表示された各レコード
のデータ構造を表し,各レコードのフィールドa〜eと
予測フィールドfの情報が格納されている。
【0014】
【発明が解決しようとする課題】上記したように従来の
類似予測によって出力した結果の表示は,予測する前の
データの分布を表示する平行軸座標グラフと同様の予測
結果表示の平行軸座標グラフにより表示するか,予測結
果用の別のグラフ,例えば折れ線グラフを用いるか,ま
たは大量のテキストを出力(上記図11の類似事例K個
のテキストデータ)するかの何れかの方法であった。
類似予測によって出力した結果の表示は,予測する前の
データの分布を表示する平行軸座標グラフと同様の予測
結果表示の平行軸座標グラフにより表示するか,予測結
果用の別のグラフ,例えば折れ線グラフを用いるか,ま
たは大量のテキストを出力(上記図11の類似事例K個
のテキストデータ)するかの何れかの方法であった。
【0015】しかし,これらの予測前と予測後のグラフ
が異なると予測する前と後のデータの関係がつき難く,
また大量テキスト出力では結果の正当性が理解しにくい
という問題があった。
が異なると予測する前と後のデータの関係がつき難く,
また大量テキスト出力では結果の正当性が理解しにくい
という問題があった。
【0016】また,予測前と予測後を同じ平行軸座標グ
ラフで表示した場合も,単に予測フィールドの値が付加
されるだけで,予測結果に対する影響度等が表示されて
なく予測の正当性を理解することができないという問題
があった。
ラフで表示した場合も,単に予測フィールドの値が付加
されるだけで,予測結果に対する影響度等が表示されて
なく予測の正当性を理解することができないという問題
があった。
【0017】本発明は類似予測の出力結果の表示におい
て影響度を含めた結果出力を平行軸座標グラフ上に同時
に表示でき,且つ類似予測手法の正当性を表現できるK
近傍法による類似予測の結果表示装置を提供することを
目的とする。
て影響度を含めた結果出力を平行軸座標グラフ上に同時
に表示でき,且つ類似予測手法の正当性を表現できるK
近傍法による類似予測の結果表示装置を提供することを
目的とする。
【0018】
【課題を解決するための手段】図1は本発明の第1の原
理構成である。図中,1は類似予測の結果表示装置,2
は影響度表示部,20は影響度の最大・最小値検出手
段,21は影響度に応じて各フィールド軸の長さ(太
さ)を割り当てるフィールド軸サイズ決定手段,22は
フィールド軸へのレコードのプロット手段,4は表示
部,5は従来技術と同様にK近傍法の類似予測の処理を
行う類似予測部,5a〜5cは類似予測部5から出力さ
れる予測結果であり,5aは影響度ファイル,5bは類
似事例(K個/レコード(1レコードに対してK個))
データ,5cは予測対象データの各レコードに対する予
測結果データであり,5d,5eは類似予測を行う時に
使用するデータであり,5dは事例データ,5eは予測
対象データ,5fは設定された類似事例の選択数Kの値
である。
理構成である。図中,1は類似予測の結果表示装置,2
は影響度表示部,20は影響度の最大・最小値検出手
段,21は影響度に応じて各フィールド軸の長さ(太
さ)を割り当てるフィールド軸サイズ決定手段,22は
フィールド軸へのレコードのプロット手段,4は表示
部,5は従来技術と同様にK近傍法の類似予測の処理を
行う類似予測部,5a〜5cは類似予測部5から出力さ
れる予測結果であり,5aは影響度ファイル,5bは類
似事例(K個/レコード(1レコードに対してK個))
データ,5cは予測対象データの各レコードに対する予
測結果データであり,5d,5eは類似予測を行う時に
使用するデータであり,5dは事例データ,5eは予測
対象データ,5fは設定された類似事例の選択数Kの値
である。
【0019】図2は本発明の第2の原理構成である。図
中,1,5b,5cの各符号は上記図1と同様であり説
明を省略する。3は類似事例の表示部,30は事例デー
タ5dの各フィールド別にそれぞれの最大値(最大距
離)を検出するフィールド対応最大距離検出手段,31
は類似予測部5から出力された類似事例(K個)データ
から各レコードに対して類似するK個のレコードが配置
される類似レコード番号テーブルを作成する類似レコー
ド番号テーブル作成手段,32は指定されたレコードを
基準レコードとして,その基準レコードの各フィールド
の値を基準(原点)として各類似レコードのフィールド
値(事例データの値)との差を算出する基準レコード対
応のフィールド別距離計算手段,33は各類似レコード
について前記フィールド別距離計算手段32により求め
た値に従って上記のフィールド軸上にプロットするプロ
ット手段である。
中,1,5b,5cの各符号は上記図1と同様であり説
明を省略する。3は類似事例の表示部,30は事例デー
タ5dの各フィールド別にそれぞれの最大値(最大距
離)を検出するフィールド対応最大距離検出手段,31
は類似予測部5から出力された類似事例(K個)データ
から各レコードに対して類似するK個のレコードが配置
される類似レコード番号テーブルを作成する類似レコー
ド番号テーブル作成手段,32は指定されたレコードを
基準レコードとして,その基準レコードの各フィールド
の値を基準(原点)として各類似レコードのフィールド
値(事例データの値)との差を算出する基準レコード対
応のフィールド別距離計算手段,33は各類似レコード
について前記フィールド別距離計算手段32により求め
た値に従って上記のフィールド軸上にプロットするプロ
ット手段である。
【0020】本発明の第1の原理構成は,図1に示す類
似予測部5で従来と同様に事例データ5d,予測対象デ
ータ5eを用いたK近傍法による類似予測を行って,類
似事例の選択数Kの値5fに従って,影響度ファイル5
a,類似事例データ5b,及び各レコードの予測フィー
ルドに値が設定された予測結果データ5cが出力される
と,類似予測の結果表示装置1へ入力される。類似予測
の結果表示装置1では,影響度表示部2が駆動され,影
響度の最大・最小値検出手段20が影響度ファイル5a
からデータを取り出して影響度の最大値と最小値を検出
する。次に,検出された最大値と最小値に基づいて,各
フィールドを表示するフィールド軸のサイズ(長さと幅
(太さ)の一方または両方)をそれぞれの影響度に対応
して決定する。この場合,影響度が大きいものは,フィ
ールド軸の長さを長くし(線を太くし),影響度が小さ
いものは短く(細く)する。各フィールドのフィールド
軸のサイズが決まると,次にフィールド軸へのレコード
のプロット手段22により,類似事例データ5bの各レ
コード(K個)を事例データ5dから取り出して,上記
のサイズが決定した各フィールド軸上に各レコードの値
に対応した位置にプロットして各位置を線で結合した表
示を行う。
似予測部5で従来と同様に事例データ5d,予測対象デ
ータ5eを用いたK近傍法による類似予測を行って,類
似事例の選択数Kの値5fに従って,影響度ファイル5
a,類似事例データ5b,及び各レコードの予測フィー
ルドに値が設定された予測結果データ5cが出力される
と,類似予測の結果表示装置1へ入力される。類似予測
の結果表示装置1では,影響度表示部2が駆動され,影
響度の最大・最小値検出手段20が影響度ファイル5a
からデータを取り出して影響度の最大値と最小値を検出
する。次に,検出された最大値と最小値に基づいて,各
フィールドを表示するフィールド軸のサイズ(長さと幅
(太さ)の一方または両方)をそれぞれの影響度に対応
して決定する。この場合,影響度が大きいものは,フィ
ールド軸の長さを長くし(線を太くし),影響度が小さ
いものは短く(細く)する。各フィールドのフィールド
軸のサイズが決まると,次にフィールド軸へのレコード
のプロット手段22により,類似事例データ5bの各レ
コード(K個)を事例データ5dから取り出して,上記
のサイズが決定した各フィールド軸上に各レコードの値
に対応した位置にプロットして各位置を線で結合した表
示を行う。
【0021】このような構造を持つ平行軸座標グラフを
表示することにより類似予測の結果を表示することで,
どのフィールドの影響度が大きく,どのフィールドが影
響度が小さいかが分かり,各フィールドにおける各レコ
ードの値の影響を直ちに理解することができる。
表示することにより類似予測の結果を表示することで,
どのフィールドの影響度が大きく,どのフィールドが影
響度が小さいかが分かり,各フィールドにおける各レコ
ードの値の影響を直ちに理解することができる。
【0022】本発明の第2の原理構成は,図2には図示
省略されているが上記図1の類似予測部5から類似事例
データ5b,及び予測結果データ5cが出力されて結果
表示装置1へ入力され,同時に事例データ5d,予測対
象データ5e,選択数Kの値5fも入力される。結果表
示装置1の類似事例の表示部4は,フィールド対応最大
距離検出手段30が事例データ5dの各フィールド別に
それぞれの最大値(最大距離)を検出してデータ構造フ
ァイル3aに保持する。また,類似レコード番号テーブ
ル作成手段31が類似事例データ5bから各レコードに
対して類似するK個のレコードが配置される類似レコー
ド番号テーブル3bを作成する。また,フィールド別距
離計算手段32が指定されたレコードを基準レコードと
して,その基準レコードの各フィールドの値を基準(原
点)として各類似レコードのフィールド値(事例データ
の値)との差を算出し,プロット手段33が各類似レコ
ードについて前記算出した値に従って上記の各フィール
ド軸上にプロットして表示部4に表示する。
省略されているが上記図1の類似予測部5から類似事例
データ5b,及び予測結果データ5cが出力されて結果
表示装置1へ入力され,同時に事例データ5d,予測対
象データ5e,選択数Kの値5fも入力される。結果表
示装置1の類似事例の表示部4は,フィールド対応最大
距離検出手段30が事例データ5dの各フィールド別に
それぞれの最大値(最大距離)を検出してデータ構造フ
ァイル3aに保持する。また,類似レコード番号テーブ
ル作成手段31が類似事例データ5bから各レコードに
対して類似するK個のレコードが配置される類似レコー
ド番号テーブル3bを作成する。また,フィールド別距
離計算手段32が指定されたレコードを基準レコードと
して,その基準レコードの各フィールドの値を基準(原
点)として各類似レコードのフィールド値(事例データ
の値)との差を算出し,プロット手段33が各類似レコ
ードについて前記算出した値に従って上記の各フィール
ド軸上にプロットして表示部4に表示する。
【0023】
【発明の実施の形態】図3は実施例1の影響度表示の処
理フローであり,上記図1の類似予測の結果表示装置1
を情報処理装置(コンピュータ)により構成して影響度
の表示部4の機能を実現するためのフローである。ま
た,図4は平行軸座標グラフの類似予測後のデータ構造
を示し,図5は実施例1の影響度を含む平行軸座標グラ
フの例である。
理フローであり,上記図1の類似予測の結果表示装置1
を情報処理装置(コンピュータ)により構成して影響度
の表示部4の機能を実現するためのフローである。ま
た,図4は平行軸座標グラフの類似予測後のデータ構造
を示し,図5は実施例1の影響度を含む平行軸座標グラ
フの例である。
【0024】類似予測の結果表示装置の情報処理装置に
対し,類似予測部から影響度ファイル,類似事例データ
及び予測結果のデータが入力されると,結果表示装置の
中の影響度の表示制御の処理が実行される。最初に影響
度のファイルの読み込みが行われ(図3のS1),読み
込まれた各フィールド毎の影響度の数値が平行軸座標グ
ラフの類似予測後のデータに対し追加される(同S
2)。これにより,図4に示すようなデータ構造が得ら
れる。次に各フィールドの影響度を判別し最大値と最小
値を求め,各フィールド軸の長さと太さ(または線幅)
を決定する(同S3)。この実施例では,各フィールド
の軸の長さと太さの両方を影響度に比例する値にしてい
るが,その一方だけでも良い。次に各類似するレコード
のフィールド値に応じてフィールド軸上の位置にプロッ
トし,軸に合わせてレコードラインをプロットする(図
3のS4)。
対し,類似予測部から影響度ファイル,類似事例データ
及び予測結果のデータが入力されると,結果表示装置の
中の影響度の表示制御の処理が実行される。最初に影響
度のファイルの読み込みが行われ(図3のS1),読み
込まれた各フィールド毎の影響度の数値が平行軸座標グ
ラフの類似予測後のデータに対し追加される(同S
2)。これにより,図4に示すようなデータ構造が得ら
れる。次に各フィールドの影響度を判別し最大値と最小
値を求め,各フィールド軸の長さと太さ(または線幅)
を決定する(同S3)。この実施例では,各フィールド
の軸の長さと太さの両方を影響度に比例する値にしてい
るが,その一方だけでも良い。次に各類似するレコード
のフィールド値に応じてフィールド軸上の位置にプロッ
トし,軸に合わせてレコードラインをプロットする(図
3のS4)。
【0025】図5に図3の処理フローにより作成された
実施例1による影響度を含む平行軸座標グラフの例を示
す。この例では,フィールド2と予測フィールドの影響
度が大きく(重い)ため,そのフィールド軸の長さが長
く,太さも大になっており,フィールド1や,フィール
ド3は影響度が小さく,それに対応してフィールド軸の
長さや太さが小さい値となっており,近似する割合が各
フィールドの影響度に対応してどの程度であるかを理解
し易くなっている。
実施例1による影響度を含む平行軸座標グラフの例を示
す。この例では,フィールド2と予測フィールドの影響
度が大きく(重い)ため,そのフィールド軸の長さが長
く,太さも大になっており,フィールド1や,フィール
ド3は影響度が小さく,それに対応してフィールド軸の
長さや太さが小さい値となっており,近似する割合が各
フィールドの影響度に対応してどの程度であるかを理解
し易くなっている。
【0026】図6は実施例2の類似事例表示の処理フロ
ーであり,上記図2の類似予測の結果表示装置1を情報
処理装置(コンピュータ)により構成して類似事例の表
示部3の機能を実現するためのフローである。また,図
7は実施例2による類似事例の平行軸座標グラフの例,
図8は実施例2による類似事例K個のレコードの平行軸
座標グラフの表示例である。
ーであり,上記図2の類似予測の結果表示装置1を情報
処理装置(コンピュータ)により構成して類似事例の表
示部3の機能を実現するためのフローである。また,図
7は実施例2による類似事例の平行軸座標グラフの例,
図8は実施例2による類似事例K個のレコードの平行軸
座標グラフの表示例である。
【0027】図7について説明すると,Aは予測対象デ
ータ構造を示し,フィールド(field)情報1〜5及び予
測フィールド(field)情報の6個のフィールド情報で構
成され,各フィールド情報について,数値の属性(連続
値またはカテゴリ値),最大値(連続値の場合),最小
値(連続値の場合)及びこの実施例により使用する最大
距離の各値を備え,その後に各レコード(r1,r2,
・・・で表示)を構成する各フィールド情報が設定され
ている。図7のBは類似レコード番号テーブルであり,
各レコードr1,r2,・・・に対してそれぞれに類似
するK個のレコード番号が設定されている。図7のCは
事例データ構造であり,各事例のレコード(レコードr
1,r2,・・・)に対応して,それぞれを構成するフ
ィールド1情報〜フィールド6情報が設定される。
ータ構造を示し,フィールド(field)情報1〜5及び予
測フィールド(field)情報の6個のフィールド情報で構
成され,各フィールド情報について,数値の属性(連続
値またはカテゴリ値),最大値(連続値の場合),最小
値(連続値の場合)及びこの実施例により使用する最大
距離の各値を備え,その後に各レコード(r1,r2,
・・・で表示)を構成する各フィールド情報が設定され
ている。図7のBは類似レコード番号テーブルであり,
各レコードr1,r2,・・・に対してそれぞれに類似
するK個のレコード番号が設定されている。図7のCは
事例データ構造であり,各事例のレコード(レコードr
1,r2,・・・)に対応して,それぞれを構成するフ
ィールド1情報〜フィールド6情報が設定される。
【0028】図7及び図8を参照しながら図6の処理フ
ローの説明をすると,類似予測の結果表示装置に対し,
類似予測部から類似事例データ及び予測結果のデータが
入力されると,この実施例2による類似事例の表示制御
が実行される。最初に,各フィールドの最大距離を決定
し,各フィールドテーブルに最大距離を追加する(図6
のS1)。これにより図7のAに示すように予測対象デ
ータ構造の各フィールド情報について決定された最大距
離が設定される。
ローの説明をすると,類似予測の結果表示装置に対し,
類似予測部から類似事例データ及び予測結果のデータが
入力されると,この実施例2による類似事例の表示制御
が実行される。最初に,各フィールドの最大距離を決定
し,各フィールドテーブルに最大距離を追加する(図6
のS1)。これにより図7のAに示すように予測対象デ
ータ構造の各フィールド情報について決定された最大距
離が設定される。
【0029】次に追加された最大距離に基づいて類似レ
コードファイルを読み込んで類似レコード番号テーブル
が作成される(図6のS2)。これにより,図7のBに
示すテーブルが得られる。続いて,予測対象フィールド
のレコード番号から類似レコード番号テーブルへのリン
ク構造を作成する(図6のS3)。これにより,図7の
Aの予測対象データ構造の中の予測フィールド情報の各
行に設定された各レコードr1,r2,・・・が格納さ
れた領域には,図7のBに示すテーブル内の各レコード
r1,r2,・・・の類似レコード番号が格納された位
置(行方向の位置)を示すリンク情報(またはポイン
タ)が格納される。
コードファイルを読み込んで類似レコード番号テーブル
が作成される(図6のS2)。これにより,図7のBに
示すテーブルが得られる。続いて,予測対象フィールド
のレコード番号から類似レコード番号テーブルへのリン
ク構造を作成する(図6のS3)。これにより,図7の
Aの予測対象データ構造の中の予測フィールド情報の各
行に設定された各レコードr1,r2,・・・が格納さ
れた領域には,図7のBに示すテーブル内の各レコード
r1,r2,・・・の類似レコード番号が格納された位
置(行方向の位置)を示すリンク情報(またはポイン
タ)が格納される。
【0030】次に類似レコード番号から事例データテー
ブルへリンク構造が作成される(図6のS4)。図7の
例では,図7のB内に設定された各K個の類似レコード
番号を表す数字(数字「1」,「9」,「2」,「1
2」,・・等)は,図7のCに示す事例データのデータ
構造の中の行数に対応付けるようリンク構造が作成され
る。例えば,数値「2」のレコード番号に対応する事例
データは図7のCの2行目の「r2」で表示された行の
各フィールド情報から得られる。
ブルへリンク構造が作成される(図6のS4)。図7の
例では,図7のB内に設定された各K個の類似レコード
番号を表す数字(数字「1」,「9」,「2」,「1
2」,・・等)は,図7のCに示す事例データのデータ
構造の中の行数に対応付けるようリンク構造が作成され
る。例えば,数値「2」のレコード番号に対応する事例
データは図7のCの2行目の「r2」で表示された行の
各フィールド情報から得られる。
【0031】続いて,指定したレコード番号(基準とな
るレコード)のフィールド値とそのレコードに対して類
似するレコード番号(K個)のフィールド値との距離を
計算して,平行軸座標グラフにプロットする(図6のS
5)。
るレコード)のフィールド値とそのレコードに対して類
似するレコード番号(K個)のフィールド値との距離を
計算して,平行軸座標グラフにプロットする(図6のS
5)。
【0032】この結果,図8に示すようなグラフの例が
得られる。この場合,各フィールド軸の長さは最大距離
が異なっていても同じ長さになるよう設定されている。
そして,指定したレコード番号(基準レコード)が持つ
各フィールド1〜6の値を各フィールド軸の原点(零
点)として,各類似レコードの各フィールドのプロット
位置は基準レコードの対応するフィールドとの差の値を
表す。
得られる。この場合,各フィールド軸の長さは最大距離
が異なっていても同じ長さになるよう設定されている。
そして,指定したレコード番号(基準レコード)が持つ
各フィールド1〜6の値を各フィールド軸の原点(零
点)として,各類似レコードの各フィールドのプロット
位置は基準レコードの対応するフィールドとの差の値を
表す。
【0033】これにより,指定レコードと類似レコード
(K個)との類似する程度が各フィールドについて原点
からどれだけ離れているか(差分がどれだけか)を視覚
的に容易に確認することができる。
(K個)との類似する程度が各フィールドについて原点
からどれだけ離れているか(差分がどれだけか)を視覚
的に容易に確認することができる。
【0034】上記図6乃至図8に示す実施例2の構成で
は,図7に示すように予測対象データ構造中に各フィー
ルド毎に最大距離を求めて,その最大距離に対して,指
定されたレコード番号(基準レコード)と類似事例の各
レコード番号のフィールドとの差分の値をプロットして
いるが,各フィールドの軸長は各フィールドに対して同
じ(フィールド間で最大距離は異なるがフィールド軸長
を変える必要性がない)にしている。
は,図7に示すように予測対象データ構造中に各フィー
ルド毎に最大距離を求めて,その最大距離に対して,指
定されたレコード番号(基準レコード)と類似事例の各
レコード番号のフィールドとの差分の値をプロットして
いるが,各フィールドの軸長は各フィールドに対して同
じ(フィールド間で最大距離は異なるがフィールド軸長
を変える必要性がない)にしている。
【0035】図9は実施例3の類似事例のレコードの説
明図であり,A.は実施例3の予測対象データ構造を示
し,B.は実施例3の類似事例のレコード表示の平行軸
座標グラフである。
明図であり,A.は実施例3の予測対象データ構造を示
し,B.は実施例3の類似事例のレコード表示の平行軸
座標グラフである。
【0036】処理フローは上記図6と同様であるため図
示省略したが,この実施例3では上記図6のステップS
1において,類似予測部(図1の5)から影響度ファイ
ル(図1の5a)を受け取って予測対象データ構造(図
7のA)の各フィールドに対して影響度を設定する点が
相違すると共に,図6のステップS5において,レコー
ド番号のフィールド値との距離を計算しプロットする場
合に,各フィールドの軸の長さ及び太さ(幅)を影響度
に比例した値に設定して決定し,その軸上に各レコード
のフィールドの値をプロットとしてラインを表示する点
が相違する。
示省略したが,この実施例3では上記図6のステップS
1において,類似予測部(図1の5)から影響度ファイ
ル(図1の5a)を受け取って予測対象データ構造(図
7のA)の各フィールドに対して影響度を設定する点が
相違すると共に,図6のステップS5において,レコー
ド番号のフィールド値との距離を計算しプロットする場
合に,各フィールドの軸の長さ及び太さ(幅)を影響度
に比例した値に設定して決定し,その軸上に各レコード
のフィールドの値をプロットとしてラインを表示する点
が相違する。
【0037】このように影響度によりフィールド軸の長
さと太さを変更することにより,図9に示すよう平行軸
座標グラフが表示される。
さと太さを変更することにより,図9に示すよう平行軸
座標グラフが表示される。
【0038】この実施例3に示す表示を行うことで,距
離と影響度の関係では,距離が大きく離れている時で
も,影響度が大きいために実際の距離よりも近似して表
示することができ,距離が小さく指定レコードに近似し
ている場合でも影響度が小さい場合には実際の距離より
も離して,近似しないように表示することができ,K個
の近傍のレコードを実際の距離を歪める形式で表示する
ことで,近似の実質的な程度を表現することが可能とな
る。
離と影響度の関係では,距離が大きく離れている時で
も,影響度が大きいために実際の距離よりも近似して表
示することができ,距離が小さく指定レコードに近似し
ている場合でも影響度が小さい場合には実際の距離より
も離して,近似しないように表示することができ,K個
の近傍のレコードを実際の距離を歪める形式で表示する
ことで,近似の実質的な程度を表現することが可能とな
る。
【0039】
【発明の効果】本発明によれば,類似予測の出力結果の
表示において,予測結果に影響を及ぼすフィールドにつ
いて視覚化して重要なフィールドとそうでないフィール
ドとのレコードの相違を明確に区別することができる。
また,指定レコードとK個の類似事例レコードとの距離
を視覚的に簡単に表示することが可能となった。
表示において,予測結果に影響を及ぼすフィールドにつ
いて視覚化して重要なフィールドとそうでないフィール
ドとのレコードの相違を明確に区別することができる。
また,指定レコードとK個の類似事例レコードとの距離
を視覚的に簡単に表示することが可能となった。
【0040】更に,指定レコードとK個の類似事例レコ
ードとの相違が影響度に応じたフィールド軸の長さ等を
変えた表示により有効に表示することが可能となる。
ードとの相違が影響度に応じたフィールド軸の長さ等を
変えた表示により有効に表示することが可能となる。
【図1】本発明の第1の原理構成を示す図である。
【図2】本発明の第2の原理構成を示す図である。
【図3】実施例1の影響度表示の処理フローを示す図で
ある。
ある。
【図4】平行軸座標グラフの類似予測後のデータ構造を
示す図である。
示す図である。
【図5】実施例1の影響度を含む平行軸座標グラフの例
を示す図である。
を示す図である。
【図6】実施例2の類似事例表示の処理フローを示す図
である。
である。
【図7】実施例2による類似事例の平行軸座標グラフの
例を示す図である。
例を示す図である。
【図8】実施例2による類似事例K個のレコードの平行
軸座標グラフの表示例を示す図である。
軸座標グラフの表示例を示す図である。
【図9】実施例3の類似事例のレコードの説明図であ
る。
る。
【図10】類似予測に使用するデータの構成例を示す図
である。
である。
【図11】類似予測の処理の流れを示す図である。
【図12】類似予測を行う前の平行軸座標グラフを表す
図である。
図である。
【図13】類似予測をした後の予測結果表示の平行軸座
標グラフを表す図である。
標グラフを表す図である。
1 類似予測の結果表示装置 2 影響度表示部 20 影響度の最大・最小値検出手段 21 フィールド軸サイズ決定手段 22 プロット手段 4 表示部 5 類似予測部 5a 影響度ファイル 5b 類似事例(K個)データ 5c 予測結果データ 5d 事例データ 5e 予測対象データ
Claims (4)
- 【請求項1】 複数の特性に対応する各フィールドの値
によって特徴付けられた多数のレコードからなる事例デ
ータに対するK近傍法による類似予測の結果表示装置に
おいて,前記類似予測の結果表示装置は影響度表示部を
備え,前記影響度表示部は,類似予測の結果得られた影
響度ファイルから各フィールドの予測に対する影響度を
読み込んで,各フィールドの影響度の最大値と最小値を
検出して各フィールドの長さまたは太さの何れか一方ま
たは両方を影響度に対応した値に設定する手段と,前記
設定された影響度に対応した値に基づいて類似予測の結
果得られた類似事例データの各フィールド軸の長さと太
さを表示し,前記軸に合わせて前記類似予測により得ら
れたK個の類似する各レコードのフィールド値に対応し
た位置をプロットすることを特徴とするK近傍法による
類似予測の結果表示装置。 - 【請求項2】 複数の特性に対応する各フィールドの値
によって特徴付けられた多数のレコードからなる事例デ
ータに対するK近傍法による類似予測の結果表示装置に
おいて,前記結果表示装置は,前記類似予測の結果得ら
れたK個の類似事例を表示する類似事例表示部を備え,
前記類似事例表示部は,多数の予測対象のレコードにつ
いてそれぞれのフィールド情報と予測対象フィールドと
を含む予測対象データと,予測対象データの各フィール
ド毎にそれぞれの最大距離を検出して予測対象データに
付加する手段と,レコード番号対応にそれぞれの類似レ
コード番号を格納したテーブルを作成する手段と,指定
レコード番号のレコードのフィールドと各類似レコード
のフィールドとの距離を計算して,計算結果である差の
値に応じて前記各フィールドの最大距離中の対応する位
置にプロットして,指定レコード番号を基準とする類似
事例の差分を表示することを特徴とするK近傍法による
類似予測の結果表示装置。 - 【請求項3】 請求項2において,前記予測対象データ
構造の中の予測フィールド情報中に,各レコードの予測
値と共に前記類似レコード番号テーブルへのリンク情報
を格納し,前記類似レコード番号に格納された各事例デ
ータのレコード番号に対応する各レコードのフィールド
情報を,事例データを構成する各フィールド情報の中の
各レコード番号に対応する位置に格納することを特徴と
するK近傍法による類似予測の結果表示装置。 - 【請求項4】 請求項2または3において,前記類似事
例表示部は,予測対象データの各フィールド毎に前記予
測結果として得られた影響度を前記予測対象データに付
加する手段を備え,指定レコード番号のレコードのフィ
ールドと各類似レコードのフィールドとの距離を計算し
て,計算結果である差の値に応じて前記各フィールドの
最大距離中の対応する位置にプロットする時,前記各フ
ィールドの最大距離を各フィールド毎の前記影響度に対
応したフィールド軸の長さまたは太さの何れか一方また
は両方を表示して,該フィールド軸上に各レコードのフ
ィールド値に対応した位置にプロットすることを特徴と
するK近傍法による類似予測の結果表示装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35221698A JP2000172671A (ja) | 1998-12-11 | 1998-12-11 | K近傍法による類似予測の結果表示装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP35221698A JP2000172671A (ja) | 1998-12-11 | 1998-12-11 | K近傍法による類似予測の結果表示装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000172671A true JP2000172671A (ja) | 2000-06-23 |
Family
ID=18422561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP35221698A Pending JP2000172671A (ja) | 1998-12-11 | 1998-12-11 | K近傍法による類似予測の結果表示装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000172671A (ja) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0695880A (ja) * | 1992-09-14 | 1994-04-08 | Yamatake Honeywell Co Ltd | 事例ベース推論装置 |
JPH06161989A (ja) * | 1992-11-24 | 1994-06-10 | Toshiba Corp | 予測装置 |
JPH06282574A (ja) * | 1993-03-24 | 1994-10-07 | Toshiba Corp | 類似検索装置 |
JPH0721029A (ja) * | 1993-07-05 | 1995-01-24 | Komatsu Ltd | 推論装置 |
JPH07325834A (ja) * | 1994-05-31 | 1995-12-12 | Fujitsu Ltd | 検索装置 |
JPH0895789A (ja) * | 1994-09-28 | 1996-04-12 | Fujitsu Ltd | 事例ベース推論装置 |
JPH10240715A (ja) * | 1997-03-03 | 1998-09-11 | Toshiba Corp | 予測・推定装置及び予測・推定方法 |
JPH10254884A (ja) * | 1997-03-06 | 1998-09-25 | Mitsubishi Electric Corp | ファジィシソーラス生成装置 |
JPH10307847A (ja) * | 1997-02-28 | 1998-11-17 | Fujitsu Ltd | 類似事例の選択方法及び装置及び記録媒体 |
-
1998
- 1998-12-11 JP JP35221698A patent/JP2000172671A/ja active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0695880A (ja) * | 1992-09-14 | 1994-04-08 | Yamatake Honeywell Co Ltd | 事例ベース推論装置 |
JPH06161989A (ja) * | 1992-11-24 | 1994-06-10 | Toshiba Corp | 予測装置 |
JPH06282574A (ja) * | 1993-03-24 | 1994-10-07 | Toshiba Corp | 類似検索装置 |
JPH0721029A (ja) * | 1993-07-05 | 1995-01-24 | Komatsu Ltd | 推論装置 |
JPH07325834A (ja) * | 1994-05-31 | 1995-12-12 | Fujitsu Ltd | 検索装置 |
JPH0895789A (ja) * | 1994-09-28 | 1996-04-12 | Fujitsu Ltd | 事例ベース推論装置 |
JPH10307847A (ja) * | 1997-02-28 | 1998-11-17 | Fujitsu Ltd | 類似事例の選択方法及び装置及び記録媒体 |
JPH10240715A (ja) * | 1997-03-03 | 1998-09-11 | Toshiba Corp | 予測・推定装置及び予測・推定方法 |
JPH10254884A (ja) * | 1997-03-06 | 1998-09-25 | Mitsubishi Electric Corp | ファジィシソーラス生成装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019194028A1 (ja) | 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体 | |
US11514700B2 (en) | Image-processing device, image-processing method, and storage medium on which program is stored | |
CN110825805A (zh) | 一种数据的可视化方法及装置 | |
US20220292934A1 (en) | Processing apparatus, and accounting apparatus | |
JP2024023957A (ja) | 処理装置、処理方法及びプログラム | |
WO2019193923A1 (ja) | 画像処理装置、画像処理方法および記録媒体 | |
JP4629280B2 (ja) | 知識発見支援装置および支援方法 | |
JP2000172671A (ja) | K近傍法による類似予測の結果表示装置 | |
EP4160507A1 (en) | Order management device and order management method | |
US11163918B2 (en) | Assistance system, design assistance apparatus, and non-transitory computer readable medium storing design assistance program | |
JP2018005801A (ja) | 画像処理装置 | |
JPWO2016194062A1 (ja) | 商品特定装置、商品特定方法及び商品特定プログラム | |
JP4249929B2 (ja) | 住所情報と位置座標のマッチング方法 | |
US20030052881A1 (en) | Graphical value display program, graphical value display method and recording medium | |
US20230245232A1 (en) | Processing apparatus, processing method, and non-transitory storage medium | |
CN117993956B (zh) | 一种基于目标客户及市场数据处理方法 | |
JP7095744B2 (ja) | 予測状況可視化装置、予測状況可視化方法および予測状況可視化プログラム | |
Lehmann | A universal and robust computation procedure for geometric observations | |
CN111159398B (zh) | 一种识别商户类型的方法及装置 | |
US20240233163A1 (en) | Image comparison device | |
JP2008217283A (ja) | 評価情報収集方法及びサーバ | |
JP2002149671A (ja) | 情報処理装置および情報処理方法ならびに記録媒体 | |
JP2010231471A (ja) | インターネット上の掲示板分析システム及び方法 | |
CN114202394A (zh) | 商品智能推荐方法、装置、设备及存储介质 | |
CN117806464A (zh) | 商品选择方法、电子称以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040823 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20041102 |