JP4155363B2

JP4155363B2 - データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体

Info

Publication number: JP4155363B2
Application number: JP16304997A
Authority: JP
Inventors: 義典柳沼; 達也進藤; 純一萩原; 克彦田口; 和宏松本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1997-06-19
Filing date: 1997-06-19
Publication date: 2008-09-24
Anticipated expiration: 2017-06-19
Also published as: US6477538B2; JPH1115895A; US6470352B2; US20010055018A1; US20010049678A1

Description

【０００１】
【発明の属する技術分野】
本発明は、多次元データを表示する装置および方法に係わり、特に、データマイニングのフロントエンドとしての機能を備えた表示ツールに関する。
【０００２】
【従来の技術】
コンピュータやインターネットの発達、および記憶装置の高密度化、低価格化などにより、大量かつ様々な種類の情報を容易に入手・蓄積できるようになっってきた。たとえば、流通業界においては、ＰＯＳ（Point Of Sale ）システムにより全国各地の小売店の売上と時間帯との関係に係わる情報、金融業界においては、各顧客のクレジットカードの使用状況に関する情報、保険業界においては、各加入者の個人データと保険の使用状況に関する情報を収集している。
【０００３】
このようにして蓄積された大量の情報からビジネス戦略を練る上で有効な情報を抽出するための技術の１つとして、近年、データマイニング技術の研究開発が盛んである。データマイニングとは、収集した大量のデータから、そのデータが示す法則、動向、パターン、規則性、相関関係などを導き出す技術であり、人工知能（ＡＩ）、ニューロ技術、統計技術などを基盤にしている場合が多い。
【０００４】
データマイニングにおいては、例えば、ニューロ分析、クラスタリング、決定木、ＭＢＲ（Memory Based Reasoning）、相関分析などの手法が利用される。これらの各分析手法を実現するソフトウェアは、データマイニングエンジンと呼ばれることがある。以下では、これらのソフトウェアのことを、「データマイニングエンジン」、あるいは、単に「エンジン」と呼ぶことがある。
【０００５】
ところが、情報抽出の目的や分析対象となる情報の性質により、最適な分析手法が異なり、期待した分析結果を簡単に得られないこともしばしばある。この場合、ユーザは、期待した分析結果が得られるまで試行錯誤を伴った作業をすることになる。
【０００６】
【発明が解決しようとする課題】
期待したデータマイニング結果を得るための作業の負担を軽減するためには、各種分析手法による結果を統一された形態で表示することが望ましいと考えられる。ところが、従来は、データマイニング技術においては、分析手法ごとにフロントエンド表示装置（表示用のソフトウェア）が個別に開発されていた。分析手法に応じて作成されたフロントエンド表示装置は、その手法によって分析された結果を明確に表示する点では優れているが、各分析手法ごとにそれぞれ専門的な知識を必要とする場合が多く、複数の分析手法を駆使するには熟練を要する。
【０００７】
また、従来は、データマイニングの結果は、通常、表形式で出力されることが多く、データの規則性や相関関係なとがわかりやすく表示されているとは言えなかった。
【０００８】
さらに、現在までのところ、各分析手法を連携あるいは統合させる技術は提供されていない。すなわち、ユーザインタフェース部とデータマイニングエンジンとの間のデータの授受方法、データマイニングエンジンの起動方法、データマイニング結果の表示方法等は、それぞれデータマイニングエンジン毎に独立していた。このため、ユーザは、作業内容に応じて各データマイニングツールを使いわける必要があり、予め最適な分析手法がわかっている場合以外は、期待する分析結果を得るための作業負担が大きかった。
【０００９】
本発明の課題は、データマイニングによる結果を理解しやすく表示させるデータ表示装置および方法を提供することである。また、本発明の他の課題は、専門的知識がなくても複数のデータマイニングエンジンを統一的に扱えるようにするデータ表示装置および方法を提供することである。
【００１０】
【課題を解決するための手段】
本発明のデータ表示装置は、多次元データを所定の形式のグラフを用いて表示装置に表示する構成であって、以下の手段を有する。起動手段は、データマイニング処理を実行するデータマイニングエンジンに対する起動指示を受け付け、その起動指示に従って該データマイニングエンジンを起動する。表示制御手段は、上記データマイニングエンジンによる結果を受け取り、その結果を上記所定の形式のグラフと同じ形式で上記表示装置に表示する。
【００１１】
本発明の他の形態のデータ表示装置は、以下の各手段を有する。入力変換手段は、多次元データについてのデータマイニングによる分析結果を受け取り、表示すべき多次元データにその分析結果を組み込む。表示制御手段は、その入力変換手段の出力に基づいて上記分析結果を所定の形式のグラフを用いて上記表示装置に表示する。
【００１２】
データマイニングとしては、たとえば、相関分析、クラスタリング、ＭＢＲ、決定木分析、ニューロ分析などの統計手法が利用されるが、本発明の構成によれば、それらのデータマイニングの結果が上記所定の形式のグラフを用いて表示される。この結果、ユーザは、様々な分析手法による結果を統一的なグラフとして得ることができる。
【００１３】
【発明の実施の形態】
本発明のデータ表示ツールは、多次元データをグラフ表示する装置において使用され、データマイニングの結果をそのグラフと同じ形式で表示する。データマイニングの結果は、そのグラフに追加することによりあるいはそのグラフの一部を変化させることにより表示される。また、データマイニングの結果は、通常、分析手法により互いにデータ形式が異なる。本発明のデータ表示ツールは、このような分析手法による差異を吸収してユーザに統一的な表示を提供する。また、本発明のデータ表示ツールは、表示されているグラフを利用して選択されたデータをデータマイニングエンジンに転送することにより、その選択されたデータに対してデータマイニングを実行させることができる。
【００１４】
図１は、本発明の原理図である。ビジュアルデータマイニングツール（データマイニング・ビジュアライズ・ツール）１は、ユーザインタフェース部２、入力変換部３、および出力変換部４を備える。
【００１５】
ユーザインタフェース部２は、表示制御部９および起動部１０を有する。表示制御部９は、データベース７から抽出した多次元データをディスプレイスクリーンなどの表示装置８に表示する。起動部１０は、ユーザからの指示に基づいてデータマイニングの対象となる範囲をエンジン部６に通知すると共に、エンジン部６を起動して処理を実行させる。さらに、ユーザインタフェース部２は、ユーザからの指示に基づいて、表示装置８に表示した多次元データあるいはデータマイニングの結果を所定の形式に変換するための指示を出力変換部４に対して出力する。
【００１６】
入力変換部３は、コンロトール部５から受け取ったデータを必要に応じて所定の形式に変換してユーザインタフェース部２に渡す。出力変換部４は、表示装置８に表示した多次元データあるいはデータマイニングの結果をユーザインタフェース部２により指示された形式に変換して出力する。
【００１７】
コントロール部５は、ユーザインタフェース部２からの要求に従ってデータベース部７からデータを抽出し、そのデータをユーザインタフェース部２に転送する。また、コントロール部５は、ユーザインタフェース部２からの指示に従ってエンジン部６を起動してデータマイニングを実行させる。そして、データマイニングの結果をビジュアルデータマイニングツール１が受け取れる形式に変換して出力する。このとき、コントロール部５は、必要に応じてデータマイニングの結果に所定の付加情報を付加する。さらに、コントロール部５は、エンジン部６における処理の途中経過をビジュアルデータマイニングツール１に通知する。
【００１８】
エンジン部６は、コントロール部５により指定されたデータに対してデータマイニングを実行してその結果をコントロール部５へ渡す。エンジン部６は、複数のデータマイニングエンジンを含み、ユーザにより指定されたデータマイニングエンジンを用いて分析処理を実行する。データマイニングエンジンとしては、相関分析用エンジン、決定木用エンジン、クラスタリング用エンジン、ＭＢＲ用エンジン、およびニューロ分析用エンジンなどを備える。
【００１９】
図２〜図４を参照しながら上記構成のデータ表示ツールの動作を簡単に説明する。図２は、ビジュアルデータマイニングツールとデータマイニングエンジンとの連携動作を説明する図であり、図３は、出力変換動作を説明する図である。また、図４は、データ表示ツールの全体フローチャートである。
【００２０】
データマイニングを実行するときには、ユーザは、データマイニングの対象とすべきデータ範囲（データ指定）を入力する。ユーザインタフェース部２の起動部１０は、ユーザからの指示を検出すると、ステップＳ１において、データ指定指示およびエンジン実行要求をコントロール部５へ送出する。
【００２１】
ステップＳ２およびＳ３は、コントロール部５の処理である。コントロール部５は、上記データ指定指示およびエンジン実行要求を受信すると、必要に応じて前処理を実行し、エンジン部６を起動する。このとき、データマイニングの対象とすべきデータ範囲がエンジン部６に通知される。なお、前処理については後述する。
【００２２】
エンジン部６は、ステップＳ４において、データマイニングを実行してその結果を出力する。コントロール部５は、ステップＳ５において、エンジン部６から受け取ったデータマイニングの結果をビジュアルデータマイニングツール１が処理できる形式に変換して出力する。このとき、コントロール部５は、エンジン部６における処理の進行状況を逐一ビジュアルデータマイニングツール１に報告する。
【００２３】
入力変換部３は、ステップＳ６において、コントロール部５から受け取った結果データを表示形式に変換してユーザインタフェース部２に渡す。そして、ユーザインタフェース部２の表示制御部９は、データマイニング結果を表示装置８にグラフ表示する。
【００２４】
表示装置８に表示されているグラフ等を保存する場合には、ユーザインタフェース部２は、ステップＳ１１およびＳ１２において、ユーザからの保存要求を検出した時点でのグラフ等の状態を認識し、それを不図示のメモリまたはハードディスクに書き込む。ここで、グラフ等は、データベース部７から抽出した多次元データおよびデータマイニング結果を含む。
【００２５】
表示装置８にグラフとして表示されているデータを他のデータ形式に変換して出力する場合には、ユーザインタフェース部２は、ステップＳ２１において、ユーザにより指定された出力形式を出力変換部４に通知する。出力変換部４は、ステップＳ２２およびＳ２３において、出力すべきデータを指定された形式に変換して出力する。出力変換部４は、データを帳票形式あるいはＣＳＶ形式に変換できる。
【００２６】
以下、具体的な実施例を説明する。
図５は、データマイニングの対象となるデータの一例である。ここでは、自動車の性能等に関するデータを対象とする。なお、図５に示すデータは、図１に示すデータベース部７から抽出してきたものである。データ構成としては、図５に示すように、車種ごとに１つのレコード（データ列）が割り当てられている。また、データ項目としては、燃費、シリンダ数、馬力、重量、年式、および国が設定されている。各項目を「フィールド」と呼ぶ。このように、各レコードに複数の項目のデータが含まれている場合、そのデータ列を多次元データと呼ぶ。
【００２７】
図６〜図７は、図５に示した多次元データの図形表示した例の図である。図６に示す表示方法では、多次元データを複数の平行座標軸を用いて表す。即ち、各フィールド（項目）をそれぞれ１本の座標軸で表す。そして、各レコードのデータは、それらの座標軸上の所定の点を結ぶ折れ線グラフとして表される。図５に示す多次元データを図６に示すグラフに変換して表示する処理は、本実施例ではユーザインタフェース部２で行うが、他の図形表示ツールに実行させてもよい。
上記グラフ表示のための変換処理は、以下の手順を含む。
(1) フィールド数を検出する。図５〜図６の例では、フィールド数は、「６」である。
(2) 上記(1) で検出したフィールド数と同じ数の平行座標軸を表示する。即ち、各フィールドに対応する座標軸を表示する。画面上における各座標軸の上限位置および下限位置を画面上限（gmax）および画面下限（gmin）とする。
(3) 全レコードをサーチし、各フィールドごとに最大値および最小値を求める。
【００２８】
たとえば、「燃費」においては、最も燃費の良い自動車の燃費値および最も燃費の悪い自動車の燃費値を検出する。ただし、データを数値で表すことのできないフィールド（例えば、「国」）においては、データの種類の数を検出しておく。
(4) 各フィールドごとにデータと座標軸上の座標とのマップを作成する。マッピング方法の一例としては、上記(3) で求めた各フィールドごとに最大値および最小値をそれぞれ上記(2) で設定した各座標軸の画面上限（gmax）および画面下限（gmin）に対応させる。なお、上記各フィールドごとの最大値および最小値をそれぞれ上記画面上限（gmax）および画面下限（gmin）に対応させるのではなく、マージンを持たせるようにしてもよい。
(5) 各レコード毎に、上記(4) のマップを参照しながらデータを座標軸上に配置する。
(6) 各レコード毎に配置されたデータ点を線で結ぶ。
【００２９】
なお、多次元データを上述の形式のグラフとして表示する方法は、たとえば、米国特許5,546,516 に開示されている。なお、米国特許5,546,516 は、データマイニングの結果を表示することは考慮していない。
【００３０】
本実施形態のビジュアルデータマイニングツールは、多次元データを表すグラフ上にその多次元データに関連するデータマイニングの結果を表示させるものである。なお、本実施形態において、多次元データをグラフとして表示させる方法は、図６に示す方法に限定されない。すなわち、図６に示した平行座標軸を用いたグラフは、単なる一実施例であり、例えば、図７に示すように、放射状座標軸を利用した表示方法において本実施形態のビジュアルでツールを適用することも可能である。ただし、以下では、平行座標軸を用いたグラフを前提として実施例を説明する。
【００３１】
ユーザインタフェース部２は、画面上でユーザにデータ範囲を指定させる機能を備える。たとえば、図６に示すグラフが表示装置８に表示されている状態において、ユーザがマウス等で所望の範囲を指定（図中、指定された範囲をグレーの領域として示している）すると、ユーザインタフェース部２は、その範囲内に含まれるデータを、例えばハイライト表示させるなどして、他のデータから識別させることができる。なお、ユーザは、例えば、各フィールド毎に所望の２点をクリックすることにより、所望のデータ範囲をユーザインタフェース部２に通知する。
【００３２】
図８を参照しながら、データマイニングの依頼およびその結果を表示させる処理の概要を説明する。ここでは、表示装置８に多次元データがグラフ表示されている状態において、ユーザが所望のデータマイニング方法および対象とするデータ範囲を指定したときの処理の流れを示す。
【００３３】
ビジュアルデータマイニングツール１は、ユーザの指示を認識すると、それをコントロール部５に転送する。このとき転送されるデータを図９に示す。ユーザインタフェース部２は、ユーザが指定したデータ範囲を認識すると、その範囲内に含まれるレコードまたはフィールドを「選択レコード」または「選択フィールド」としてコントロール部５に通知する。また、ユーザインタフェース部２は、ユーザが指定するデータマイニング方法を認識すると、その方法に対応するデータマイニングエンジンの「エンジン名」をコントロール部５に通知する。尚、データマイニングに際して「教師値」などを必要とする場合には、「エンジン名」と共にその値やフィールドをも通知する。
【００３４】
エンジン部６は、指定されたデータ範囲に対して指定されたエンジンを用いてデータマイニングを実行し、その結果をコントロール部５に送出する。また、エンジン部６は、データマイニング処理の実行の途中結果を逐一コントロール部５に通知する。
【００３５】
コントロール部５は、エンジン部６からデータマイニング結果を受け取ると、必要に応じて付加情報を作成し、結果データと共にその付加情報をビジュアルデータマイニングツール１へ送出する。付加情報としては、データマイニング方法によって異なるが、階層情報、色情報、ルール番号、パス番号、軸追加指示情報などである。付加情報については、後述する各実施例において詳しく説明する。また、コントロール部５は、エンジン部６から受信する途中結果を逐一「進行状況データ」に変換してビジュアルデータマイニングツール１へ送出する。
【００３６】
入力変換部３は、コントロール部５から受け取った付加情報を解釈し、ユーザインタフェース部２がデータマイニングの結果をグラフ表示させられるようにデータ形式を変換する。そして、ユーザインタフェース部２は、入力変換部３から受け取ったデータマイニングの結果を、先に表示されているグラフに追加するようにして、あるいはそのグラフの一部を変化させるようにして表示する。このことにより、ユーザによって指定されたデータマイニングの処理結果が、グラフ上に表現される。
【００３７】
次に、グラフ形式で表示されている多次元データを他の形式に変換して出力する処理を説明する。以下では、帳票形式に変換して出力する例、およびＣＳＶ形式に変換して出力する例を示すが、他の形式に変換することも可能である。
【００３８】
図１０は、表示されているデータを帳票形式に変換した結果の例である。ユーザは、表示されているグラフを利用して帳票出力する範囲を指定できる。たとえば、特定のフィールドを指定したり、あるいは、図６に示すように、各フィールド毎にデータ範囲を指定することも可能である。後者の場合には、指定された範囲内に属するレコードのみが変換対象として抽出される。なお、図１０は、図６に示すグラフにおいて、ユーザが「燃費」、「重量」および「国」を指定した場合の変換結果の例である。
【００３９】
図１１は、データを帳票形式へ変換する際の処理を説明するフローチャートである。ここでは、ユーザが特定のフィールドを指定した場合を示す。
ステップＳ３１は、変換対象のレコードを１つずつ抽出してステップＳ３２以降を実行させる処理である。ここでは、各レコードのレコード番号を「ｋ」としている。レコード番号の初期値は、「０」であり、以降、その値が全レコード数に達するまで１ずつインクリメントされる。ステップＳ３２は、表示されているフィールドを１つずつ抽出してステップＳ３３以降を実行させる処理である。ここでは、各フィールドのフィールド番号を「ｉ」としている。フィールド番号の初期値は、「０」であり、以降、その値が全フィールド数に達するまで１ずつインクリメントされる。
【００４０】
ステップＳ３３では、ステップＳ３２において抽出されたフィールドとユーザにより指定されたフィールドＸとが一致するか否かを調べ、一致すればステップＳ３４へ進み、一致しなければステップＳステップＳ３２へ戻る。ステップＳ３４では、ステップＳ３１で抽出したレコードのデータとして、ステップＳ３２において抽出したフィールドのデータを出力し、そのデータに続いて改行を表す情報を出力する。
【００４１】
このように、全レコードにおいて指定されたフィールド毎にデータを２項に転換することにより、指定されたデータを帳票形式データへと変換する。なお、ユーザが各フィールド毎にデータ範囲を指定（図６では、グレーのエリアで示す）した場合には、その範囲内に属するレコードのみに対して図１１の処理が実行される。
【００４２】
図１２は、表示されているデータをＣＳＶ形式に変換した例である。ユーザによるデータ指定については、帳票形式の場合と同じである。図１２は、図６に示すグラフにおいて、ユーザが「燃費」、「重量」、「シリンダ数」、「馬力」および「国」を指定した場合の変換結果の例である。
【００４３】
図１３は、データをＣＳＶ形式へ変換する際の処理を説明するフローチャートである。なお、図１３において、ステップＳ３１およびステップＳ３２は、図１１に示した帳票形式の場合と同じである。
【００４４】
ステップＳ４１では、ステップＳ３２において抽出したフィールドが、最終フィールドであるか否か調べ、最終フィールドでなければステップＳ４２へ進み、最終フィールドならばステップＳ４３へ進む。ステップＳ４２では、ステップＳ３２において抽出したフィールドのデータを出力すると共に、そのデータに続いて「，」を出力する。一方、ステップＳ４３では、ステップＳ３２において抽出したフィールドのデータを出力すると共に、そのデータに続いて改行を表す情報を出力する。
【００４５】
このように、指定されたフィールド毎にフィールド値とカンマ（，）とを交互に並べて各レコードを展開することにより、指定されたデータをＣＳＶ形式へと変換する。
【００４６】
次に、表示装置８にグラフとして表示されている多次元データからその一部を選択して、その選択したデータに対してデータマイニングを実行させる処理を説明する。ここでは、表示されているデータのうち、所定のレコードのデータに対してデータマイニングを実行するような場合を想定する。一例としては、図６において、「燃費が１３km/l以上であり、かつ重量が１１００kg以下であるような車種」を対象としてデータマイニングを行うような場合を想定する。この場合、ユーザは、マウス等を用いて、「燃費」および「重量」に対応する座標軸上において、指定したい範囲の最大値および最小値を入力する。そして、利用したいデータマイニング方法に対応するエンジンを起動するための指示を入力する。
【００４７】
図１４は、指定されたデータに対してデータマイニングを行わせる処理の概念を説明する図である。ユーザインタフェース部２は、ユーザにより入力されたデータマイニングエンジンの指定、その起動命令、およびデータマイニングの対象とするデータ範囲などを検出すると、それらをコントロール部５を介してエンジン部６に通知する。
【００４８】
エンジン部６は、ユーザインタフェース部２からコントロール部５を介して受け取った情報に従い、データベース部７にアクセスする。データベース部７は、要求されたデータを再構成してデータをエンジン部６に送出する。そして、エンジン部６は、その再構成されたデータに対してデータマイニングを実行する。
【００４９】
このように、本実施例では、ユーザがグラフ上で所望の範囲を指定し、その指定した範囲に対してデータマイニングを行わせることができる。ここで、表示装置８に表示されるグラフは、画面を構成するドッドデータとして表されている。したがって、ユーザがグラフ上で指定するデータは、ドットデータとしてユーザインタフェース部２に入力される。
【００５０】
ところが、エンジン部６は、表示装置８の画面構成を考慮せずに作成されている。このため、エンジン部６は、データマイニングを行う対象として、表示装置８の画面を構成するドットデータで表されたデータ範囲を受け取っても、それを理解できない。たとえば、図６のグラフが表示されている画面上において、ユーザが「燃費」の範囲として、「１３km/l以上」を入力した場合、ユーザインタフェース部２には、「第Ｙ1 ドット目から第Ｙ2 ドット目までの範囲」というように入力されるが、この情報をそのままエンジン部６に渡しても、エンジン部６はそれを理解することができない。したがって、ユーザインタフェース部２（あるいは、ユーザインタフェース部２およびコントロール部５）は、そのドットデータとして表された範囲情報をエンジン部６が理解できる値に変換する。以下にこの変換方法を示す。
【００５１】
図１５は、画面上のドットデータから各フィールド毎のデータ値への変換を説明する図である。表示装置８の画面において、多次元データをグラフとして表示する際、各フィールドに対応する座標軸の上端および下端の位置は、それぞれ画面全体上限値（gmax）および画面全体下限値（gmin）として保持されている。ここで、画面全体上限値および画面全体下限値は、共にドットデータで表される。また、各フィールド毎のデータの最大値（fmax(i) ）および最小値（fmin(i) ）は、それぞれ画面全体上限値および画面全体下限値に対応付けられている。この対応関係は、たとえば、不図示のメモリ内にテーブルとして設定されている。ドットデータで表される座標軸上の任意の座標点に対応するフィールド毎のデータ値は、上記対応関係に基づく変換比率により算出される。すなわち、座標軸上におけるドットデータがｙ0 である点に対応するフィールド毎のデータ値ｘ0 は、以下の式で表される。
（gmax−gmini）：（ｙ0 −gmini）＝（fmax−fmin）：（ｘ0 −fmin）
∴ ｘ0 ＝（ｙ0 −gmini）×｛（fmax−fmin）÷（gmax−gmini）｝＋fmin
たとえば、座標軸の画面全体上限値および画面全体下限値が、それぞれ「１００（ドット）」および「９００（ドット）」であり、「燃費」の最大値および最小値がそれぞれ「１６」および「６」であった場合において、「燃費」の座標軸において第５００ドット目に位置するデータｘは、下式により得られる。
ｘ＝（１６−６）×｛（５００−１００）／（９００−１００）｝＋６＝１１km/l
上記ドットデータをフィールド毎のデータ値に変換する処理は、ユーザインタフェース部２において実行される。すなわち、ユーザがマウス等を用いて各フィールドに対応する座標軸上の所望の点を指定すると、ユーザインタフェース部２は、その指定された点のドットデータを当該フィールドにおけるデータ値に変換することができる。
【００５２】
図１６は、ユーザにより所望の座標軸が選択されてその座標軸上でデータ範囲が指定された場合に、そのデータ範囲に含まれるレコードを抽出する処理を説明する図である。ここでは、ユーザが、データ範囲の上限値および下限値としてグラフが表示されている画面上で座標軸上の２点を指定したものとする。
【００５３】
この場合、ユーザインタフェース部２は、ユーザにより選択された座標軸を識別する情報（軸番号）をコントロール部５に通知する。また、ユーザインタフェース部２は、画面上で指定された上限値および下限値のドットデータをそれぞれフィールド毎のデータ値に変換してフィールド最大値（fmax(i) ）およびフィールド最小値（fmin(i) ）としてコントロール部５に通知する。
コントロール部５は、上記通知を受けると、ステップＳ５１〜Ｓ５５を実行する。ステップＳ５１およびＳ５２は、それぞれ図１１のステップＳ３１およびＳ３２と同じである。すなわち、各レコード毎にフィールドを１つずつ抽出してステップＳ５３〜Ｓ５５を実行するための処理である。ステップＳ５３では、ステップＳ５２において抽出したフィールド番号とユーザによって選択されたフィールド番号とが一致するか否か調べる。一致した場合にはステップＳ５４へ進み、一致しなかった場合にはステップＳ５２に戻って次のフィールドを抽出する。
【００５４】
ステップＳ５４では、ステップＳ５２で抽出したフィールドにおけるデータがユーザインタフェース部２から通知されたフィールド最大値とフィールド最小値との間の値であるか否かを調べる。すなわち、当該レコードのデータが、ユーザによって指定された範囲内であるか否かを調べる。なお、コントロール部５は、全レコードのデータを認識している。この判断の結果、当該レコードのデータが指定された範囲内であれば、ステップＳ５２に戻って次のフィールドを抽出し、範囲外であれば、ステップＳ５１に戻って次のレコードを抽出する。
【００５５】
ステップＳ５２〜Ｓ５４によれば、ユーザによって選択されたすべてのフィールドにおいて当該レコードのデータがユーザによって指定されたデータ範囲内であった場合にのみ、その処理がステップＳ５５へ進むことになる。ステップＳ５５においては、ステップＳ５１で抽出したレコード番号が保持される。
【００５６】
たとえば、図６に示すように、ユーザが「燃費」および「重量」を選択してそれらのフィールドについて範囲を指定した場合には、各レコード毎に「燃費」および「重量」のデータを取り出し、それらのデータがそれぞれユーザにより指定された範囲内に入っているか否かを調べる。そして、各フィールドにおいて各データがそれぞれ指定された範囲内に入っていた場合にのみそのレコードのレコード番号をステップＳ５５において保持する。
【００５７】
すべてのレコードについてステップＳ５２〜Ｓ５５の処理を終了したらば、保持しているレコード番号をエンジン部６に通知してデータマイニングエンジンを起動する。そして、エンジン部６は、ユーザが指定した範囲内のレコードのみを対象としてデータマイニングを実行する。
【００５８】
このように、本実施例では、表示されているグラフを用いて所望のフィールドおよびデータ範囲を指定することにより、その範囲に属するレコードのみを対象としてデータマイニングを実行させることができる。尚、上記構成では、ユーザインタフェース部２およびコントロール部５の連携動作により画面上で指定されたドットデータをエンジン部６が認識できるデータに変換しているが、上記処理をすべてユーザインタフェース部２において実行するようにしてもよい。また、上記構成において、ユーザインタフェース部２は、ユーザが指定するデータマイニング方法をエンジン部６へ通知する機能、および必要に応じてデータマイニング処理で使用する教師値をエンジン部６に通知する機能を備える。
【００５９】
図１７は、データマイニング処理の進行状況を表示する処理を示す図である。ここでは、エンジン部６がデータマイニング処理の進行状況を認識できるものとする。進行状況は、例えば、以下の３つの方法のうちの１つにより検出する。
(1) 予測終了時間に対する現在の実行時間
(2) 予測実行回数（または、最大実行回数）に対する現在の実行回数
(3) 対象データ量に対する現在までの処理データ量
エンジン部６は、定期的にこれらの情報の中の１つを検出し、進行状況データとしてコントロール部５を介して入力変換部３へ転送する。入力変換部３は、ユーザの希望等に応じて進行状況データをパーセント値に変換して、ユーザインタフェース部２に渡す。そして、ユーザインタフェース部２が、その変換された進行状況データをリアルタイムに表示装置８に表示する。
【００６０】
図１８は、表示状態を保存する処理を説明する図である。ユーザインタフェース部２は、自動的にあるいはユーザからの指示に従って、ビジュアルデータマイニングツール自身に設定されている各種情報を不図示のメモリまたはハードディスクに保存することができる。保存すべき各種情報としては、例えば、データの名前、操作日時、各フィールドにおける範囲情報（最大値と最小値）、各フィールドの順番などの情報、フォントやカラー情報などがあげられる。これらの情報を保存しておくことにより、ユーザは、その表示状態を容易に再現できる。
【００６１】
次に、データマイニングの結果を、先に表示されているグラフと同じ形式でそのグラフ上に表示させる処理を説明する。
図１９は、データマイニングの結果を新たなフィールドとしてグラフに追加する実施例を示す図である。
【００６２】
入力されたデータに対する分析結果として、各レコードの属性を出力するようなデータマイニング方法が知られている。たとえば、クラスタリング処理は、各レコードが複数のクラスの中のどのクラスに属するのかを出力する。この場合、データマイニング結果（クラスタリング処理では、クラスタ番号）は、各レコードにとっては、１つのフィールドのデータに相当する。また、クラスタリング処理以外にも、分析結果が各レコードの１つ以上のフィールドデータとなるデータマイニング方法が存在する。
【００６３】
本実施例では、データマイニングの結果を新たな１つ以上のフィールドとして扱う。すなわち、まず、エンジン部６は、対象データに対してデータマイニングを実行して結果を得ると、その対象データと結果データとを対応づけてコントロール部５へ転送する。コントロール部５は、これらのデータを受け取ると、対象データにそのデータマイニングによる結果を１つ以上のフィールドのデータとして組み込む。そして、コントロール部５は、データマイニングの結果が組み込まれたデータを入力変換部３を介してユーザインタフェース部２へ転送する。
【００６４】
ユーザインタフェース部２は、新たなフィールドとして表されているデータマイニング結果を、先に表示されている他のフィールドと同じ形式で表示する。すなわち、ユーザインタフェース部２は、データマイニングの結果に対応する座標軸を必要な数だけ追加して表示し、その座標軸を用いてデータマイニングの結果を表す。各レコードに対応する折れ線は、図１９に示すように、そのデータマイニングの結果を表す座標軸上の対応する点に到達するように描かれる。なお、データマイニング結果に対応する座標軸は、図１９においては右端に設けられているが、ユーザの指示に従って所望に位置に設けることができる。
【００６５】
このように、多次元データをグラフ表示している状態において、その多次元データに関するデータマイニング結果を得た場合、そのデータマイニング結果は、その表示されているグラフと同じ形式で表示される。このため、ユーザは、そのグラフに関する知識を有していれば、データマイニングの結果を容易に理解できる。
【００６６】
なお、上記構成では、エンジン部６からユーザインタフェース部２へデータマイニング結果だけでなくデータマイニング対象データも転送しているが、ユーザインタフェース部２または入力変換部３が記憶装置を備える構成とし、その記憶装置に現在表示されているデータ関する情報を保持するようにすれば、エンジン部６からユーザインタフェース部２へデータマイニング結果のみを送付するだけでデータマイニング結果をグラフに追加表示できる。
【００６７】
図２０は、データマイニング結果に対応する座標軸を追加してそれを利用してデータマイニング結果を表示する処理のフローチャートである。このフローチャートは、ユーザインタフェース部２により実行される。なお、ここでは、複数の座標軸が表示されている状態において、データマイニング結果に対応する座標軸を１本追加する場合を示す。
【００６８】
ステップＳ６１では、ユーザの指示を検出する。ここでは、ユーザが、図２１に示すように、軸番号ｊが割り当てられている座標軸の右隣にデータマイニング結果に対応する座標軸を追加する旨を入力したものとする。なお、軸番号ｊが割り当てられている座標軸は、フィールド番号ｊが割り当てられているフィールドのデータを表すための座標軸である。フィールド番号は、複数のフィールドを識別する番号である。
【００６９】
ステップＳ６２では、図２２に示すように、データを再構成する。即ち、フィールド（ｊ）とフィールド（j+1 ）との間にデータマイニング結果を表すフィールド（new ）を設け、そこにデータマイニング結果を書き込む。ステップＳ６３では、座標軸（ｊ）と座標軸（j+1 ）との間に描かれている各レコードごとの線を消去する。ステップＳ６４では、図２３に示すように、座標軸（ｊ）と座標軸（j+1 ）との間にデータマイニング結果に対応する座標軸（new ）を表示する。このとき、座標軸（ｊ）と座標軸（new ）との間の間隔または座標軸（new ）と座標軸（j+1 ）との間の間隔を適当に確保するために、座標軸（１）〜（ｊ）または座標軸（j+1 ）〜（ｎ）およびそれらの座標軸間に描かれている各レコードの折れ線を移動させるようにしてもよい。
【００７０】
ステップＳ６５では、ステップＳ６４で追加された座標軸（new ）上に各レコード毎のデータマイニング結果を設定する。ステップＳ６６では、レコードごとに、座標軸（ｊ）と座標軸（new ）との間および座標軸（new ）座標軸（j+1 ）との間の線を描画する。
【００７１】
上述のようにして、データマイニングの結果が先に表示されているグラフと同じ形式で表示される。なお、データマイニングの結果として複数のフィールドを追加する場合には、図２０に示す処理を繰り返せばよい。
【００７２】
なお、図１１または図１３を参照しながらデータ形式を変換して出力する処理を説明したが、データマイニングの結果を表示するための座標軸が追加されている状態でこれらの変換処理を実行すれば、データマイニングの結果も帳票形式またはＣＳＶ形式で出力される。また、図１９を参照しながら表示状態を保存する処理を説明したが、データマイニングの結果を表示するための座標軸が追加されている状態でこの保存処理を実行すれば、データマイニングに結果も同時に保存される。
【００７３】
多次元データにおいては、同じ概念のフィールドが複数存在する場合がある。そして、同じ概念に属する複数のフィールド間には、互いに階層的な関係が存在する場合がある。例えば、自動車に関する多次元データにおいて、「価格」と「価格帯」とは、同じ概念に属する。この場合、「価格」は「価格帯」の下位層フィールドとなっている。以下では、同じ概念のフィールドが複数存在する場合における多次元データの表示方法について説明する。
【００７４】
図２４は、階層情報を付加する処理を説明する図である。この処理はコントロール部５により実行される。コントロール部５は、多次元データを受け取ると、同じ概念に複数のフィールドが属する場合があるか否かを調べる。存在する場合には、その階層関係を調べる。階層関係は、多次元データの一部として予め指定しておく。あるいは、様々な「言葉」についての階層関係を定義した辞書を予め用意しておき、コントロール部５がその辞書を参照して判断するようにしてもよい。
【００７５】
コントロール部５は、多次元データに階層情報を付加する。階層情報は、フィールド群番号および階層番号から構成される。フィールド群番号は、同じ概念に属する複数のフィールドに対して１ずつ割り当てられる。図２４の例では、「メーカー」と「国」とが同じフィールド群に属し、フィールド番号として「１」が割り当てられ、また、「価格帯」と「価格」とが同じフィールド群に属し、フィールド番号として「２」が割り当てられている。
【００７６】
階層番号は、各フィールド群内におけるフィールド間の上下関係を表す。図２４に示す例では、「メーカー」が「国」の下位階層であるため、階層番号としては、「国」に「１」が割り当てられると共に、「メーカー」に「２」が割り当てられている。同様に、「価格帯」に「１」が割り当てられると共に、「価格」に「２」が割り当てられている。このように、階層番号が小さいほど上位の階層を表し、対象データの範囲が広くなる。フィールド番号と階層番号とは、互いにハイフォンで結ばれる。なお、同じ概念に属するフィールドが他に存在しない場合には、階層情報の欄は空白となる。
【００７７】
上記階層情報が付加された多次元データは、入力変換部３を介してユーザインタフェース部２に渡される。ユーザインタフェース部２は、階層情報を利用しながらその多次元データをグラフとして表示装置８に表示する。
【００７８】
図２５は、階層切替を示す図である。同じ概念に属するフィールドが複数存在する場合、ユーザインタフェース部２は、その中の１つのフィールドを選択して表示する。図２５の左部に示す例では、同じ概念に属する「国」および「メーカー」にうちで「国」のみが表示されている。
【００７９】
表示される階層を切り替えたい場合には、ユーザは、階層を切り替えたいフィールドに対応する座標軸をマウス等を用いて選択し、かつ上位側の階層あるいは下位側の階層のいずれを表示させたいのかを入力する。なお、グラフ上で直接指示を入力する構成の他にも、たとえば、階層切替の指示を入力させるためのメニュー画面を用意しておく構成であってもよい。
【００８０】
ユーザインタフェース部２は、上記指示を検出すると、その指示に従って表示を切り替える。図２５では、「国」を選択してその下位階層である「メーカー」を表示させる例を示している。
【００８１】
図２６は、表示されているフィールドの階層を切り替える処理のフローチャートである。このフローチャートの処理は、ユーザインタフェース部２により実行される。なお、ここでは、ユーザがフィールド群番号が「Ｘ」である座標軸を選択したものとする。また、「up」および「down」は、それぞれ上位階層を表示させるための指示および下位階層を表示させるための指示である。
【００８２】
ステップＳ７１は、各フィールドを１ずつ抽出してステップＳ７２以降の処理を実行させるための処理である。ステップＳ７２では、ステップＳ７１で抽出したフィールドに対して階層情報として付加されているフィールド群番号を検出して、そのフィールド群番号とユーザにより選択された座標軸に対応するフィールド群番号とが一致するか否かを調べる。一致すればステップＳ７３へ進み、一致しなければステップＳ７１に戻って次のフィールドを抽出する。
【００８３】
ステップＳ７３では、ユーザの指示が「up」であるか否かを調べる。「up」であれば、ステップＳ７４へ進み、「up」でなければ、「down」であると見なしてステップＳ７５へ進む。ステップＳ７４では、ステップＳ７１で抽出したフィールドに付加されている階層情報の階層番号をデクリメントできるか否か調べ、可能であればデクリメントし、可能でなければステップＳ７１に戻る。一方、ステップＳ７５では、ステップＳ７１で抽出したフィールドに付加されている階層情報の階層番号をインクリメントできるか否かを調べ、可能であればインクリメントし、可能でなければステップＳ７１に戻る。ステップＳ７６では、ユーザにより選択された座標軸上に、ステップＳ７４またはＳ７５において更新された階層番号を有するフィールドのデータを表示する。
【００８４】
図２４〜図２５に示した例を上記フローチャートに当てはめて説明する。すなわち、ユーザが「国」を選択してその下位階層を表示させる場合を説明する。ユーザインタフェース部２は、まず、図２４の下部に示される多次元データを参照し、ユーザが選択した座標軸に対応するフィールド群番号が「１」であることを検出する（ステップＳ７１〜Ｓ７２）。続いて、ユーザインタフェース部２は、ユーザの指示が「down」であることを認識すると、「国」に対して付加されている階層情報の階層番号をインクリメントして「１−２」を得る（ステップＳ７３〜Ｓ７５）。そして、ユーザインタフェース部２は、階層情報が「１−２」であるフィールドとして「メーカー」を抽出し、ユーザが選択した座標軸を「国」から「メーカー」に切り替える。
【００８５】
次に、データマイニング方法の１つである相関分析の結果を表示する例を説明する。図２７の上部は、エンジン部６による相関分析の結果の例である。この例では、ある「条件」が満たされたときに予め想定した「結果」が得られる確率などを算出している。たとえば、上段のレコードでは、パンおよびバターを買った人と牛乳およびジャムを買った人との相関関係を表すデータとして、「サポート値」および「確信度」を求めている。
【００８６】
本実施例では、コントロール部５は、エンジン部６から上記相関分析の結果を受け取ると、その分析結果をグラフ形式で表示するための新しいフィールドとして「ルール番号」を追加する。ここで、「ルール」とは、相関分析において使用されている「条件」と「結果」との組合せに相当し、各レコードがそれぞれ１つのルールに対応する。図２７に示す例では、上段のレコードにルール番号「１」を割り当て、下段のレコードに「２」を割り当てている。また、各ルールの条件部もしくは結果部に複数の要素（相関分析ではアイテムといわれる）が存在する場合には、コントロール部５は、それらを分解して複数のレコードに展開する。１つのルールから展開された各レコードは、互いに同じルール番号付される。コントロール部５の出力を図２７に下部に示す。
【００８７】
図２８は、相関分析の結果をグラフ表示するために実行されるデータ変換処理のフローチャートである。このフローチャートは、コントロール部５により実行される。
【００８８】
ステップＳ８１は、分析結果のレコードを１つずつ抽出してステップＳ８２以降を実行させる処理である。ステップＳ８２は、ステップＳ８１で抽出したレコードの条件部からアイテムを１つずつ抽出してステップＳ８３以降を実行させる処理である。ステップＳ８３は、ステップＳ８１で抽出したレコードの結果部からアイテムを１つずつ抽出してステップＳ８４を実行させる処理である。ステップＳ８４では、ステップＳ８２およびＳ８３で抽出した各アイテム、ステップＳ８１で抽出したレコードにおける後続の内容、およびステップＳ８１で抽出したレコードのレコード番号を出力する。
【００８９】
図２７に示す例を採り上げて図２８のフローチャートを説明する。まず、ステップＳ８１において上段のレコードが抽出され、ステップＳ８２においてそのレコードの条件部から１つ目のアイテムとして「パン」が抽出され、ステップＳ８３においてそのレコードの結果部から１つ目のアイテムとして「牛乳」が抽出される。そして、ステップＳ８４において、それらのアイテムと共に、「サポート値＝０．４０」、「確信度＝０．５０」、および「レコード番号＝１」が出力される。このレコード番号がルール番号である。
【００９０】
図２９は、相関分析の結果をグラフ形式で表示した例である。このグラフは、ユーザインタフェース部２がコントロール部５の出力に基づいて表示したものである。図２９に示すように、相関分析の結果を表すグラフには、コントロール部５において付与されたルール番号に対応する座標軸が設けられており、各レコード毎の線がそれぞれそのレコードに対応するルール番号を通過している。また、各ルールがアイテム毎に展開されて表示されている。なお、ここでは、相関分析の結果としてサポート値および確信度を採り上げているが、相関分析では、この他にも情報量（エントロビー）などを求めることができ、その場合、サポート値や確信度と共に情報量を同時にグラフ表示することがである。
【００９１】
図３０〜図３１は、ある特定のフィールドにおいて所定の値を有するレコードをハイライト表示させる処理を説明する図である。本実施例のグラフ表示においては、各フィールドは座標軸として表され、また、各フィールド内における値は座標軸上の点として表される。即ち、特定のフィールドにおける所定の値は、グラフの座標軸上の点として表される。したがって、ある特定のフィールドにおける所定の値を選択するためには、そのフィールドに対応する座標軸上においてその所定値に対応する点を指定すればよい。あるいは、画面上の所望の点を入力させるためのメニューを用意しておき、それを利用するようにしてもよい。
【００９２】
図３０は、ユーザがグラフの座標軸上の所定の点を選択した際のユーザインタフェース部２の処理手順を示す図である。ユーザインタフェース部２は、まず、表示されている座標軸上の任意の点がユーザにより選択されたことを検出する。即ち、ユーザインタフェース部２は、ユーザにより選択されたフィールドおよびそのフィールドにおける値を検出する。ここで、ユーザインタフェース部２は、図５〜図６を参照しながら説明したように、各レコードを構成するデータを座標軸上に配置するためのマップを有している。ユーザインタフェース部２は、このマップを利用し、ユーザにより選択された点を通過するレコードを抽出する。そして、ユーザインタフェース部２は、抽出した各レコードをそれぞれハイライト表示する。
【００９３】
ハイライト表示の例を図３２〜図３３に示す。図中、ハイライト表示されているレコードは、太い線で表されている。該当するレコードをハイライト表示させる場合には、例えば、そのレコードを表す線の色や明度を他のレコードを表す線と異なるようにする。図３２は、ユーザが、「条件」に対応する座標軸上で「パン」を指定した場合のハイライト表示の例である。また、図３３は、ユーザが、「ルール番号」に対応する座標軸上で「１」を指定した場合のハイライト表示の例である。
【００９４】
このような表示方法を導入することにより、特定の要素（図３２は、商品）や特定のルール番号を有するレコードを他のレコードと区別して表示することが可能となるので、レコード間の関係を要素に基づいて分析したり、各レコードの特徴を要素に基づいて分析する際の助けとなる。このような表示は、特に、相関分析結果の解析に役立つ。
【００９５】
図３１は、図３０に示した手順を詳細に説明するフローチャートである。このフローチャートは、ユーザがグラフの座標軸上の所望の点を選択した後のユーザインタフェース部２の処理である。
【００９６】
ステップＳ９１では、ユーザの選択指示を検出する。すなわち、選択された座標軸の番号（フィールド番号）ｉ、および選択されたアイテム名ｎ（あるいは、データ値）を検出する。ステップＳ９２は、グラフとして表示されているレコードを１つずつ抽出してステップＳ９３以降を実行させる処理である。ステップＳ９３では、ステップＳ９２で抽出したレコードにおけるフィールドｉのデータがステップＳ９１で検出したアイテム名ｎと一致するか否かを調べる。一致した場合には、ステップＳ９４において、そのレコードをハイライト表示する。一方、一致しなかった場合には、ステップＳ９２に戻って次のレコードを抽出する。
【００９７】
図３４は、データマイニング方法の１つであるクラスタリングの結果の表示例である。クラスタリングにおいては、指定されたクラス値（教師値）に従って対象レコードが２つ以上のクラスに分けられる。図３４に示す例では、６つのレコードが２つのクラスに分けられている。なお、右端の座標軸（クラスタ１）は、クラスタリングの結果を表す軸として追加されてものである。座標軸を追加する処理は、図１９〜図２３において説明した通りである。
【００９８】
本実施例では、クラスタリング等のデータマイニング結果に基づいて各レコードを表す線の色を変化させることができる。この場合、ユーザは、図３４に示すように「クラスタ１」の座標軸を選択して、色分け表示を行いたい旨の指示を入力する。各レコードを表す線がクラスタリングの結果に従って色分け表示された例を図３５に示す。図３５では、実線および点線を用いて互いに色が異なっていることを表している。
【００９９】
図３６は、色分け表示の処理を説明するフローチャートである。このフローチャートは、ユーザインタフェース部２により実行される。また、このフローチャートは、クラスタリングの結果が表示されている状態においてユーザが所望の座標軸を選択した後の処理である。
【０１００】
ステップＳ１０１では、ユーザにより選択された座標軸を検出する。ステップＳ１０２では、ステップＳ１０１で検出した座標軸上の要素の数を検出する。検出された要素の数をＮとする。各要素に対して要素番号（１〜Ｎ）を付与する。ステップＳ１０３は、レコードを１つずつ抽出してステップＳ１０４以降を実行させる処理である。ステップＳ１０４では、抽出したレコードを表示するための色を決定する。ここでは、色を表す３要素（Ｈ：色相、Ｓ：彩度、Ｉ：明度）のうちの色相を調整する。すなわち、第ｉ番目の要素を含むレコードを表示する際の色合いを、「２πｉ／Ｎ」とする。なお、彩度と明度は最大値に設定する。ステップＳ１０５では、ステップＳ１０４により決定したＨＳＩ値に従って当該レコードを表示する。上述のようにして各レコードの色を決定すると、異なるクラスに属するレコードが互いに類似しない色で表示されるので、クラスタリング結果を色分け表示する場合、全体のクラスタの分布が理解しやすい。
【０１０１】
図３４〜図３５に示す例を採り上げて上記フローチャートを説明する。図３４に示す状態で「クラスタ１」が選択されると、ステップＳ１０２において、要素数として「２」を検出する。そして、ステップＳ１０４において、クラス１に属するレコードに対して（Ｈ，Ｓ，Ｉ）＝（π，１，１）が設定され、クラス２に属するレコードに対して（Ｈ，Ｓ，Ｉ）＝（２π，１，１）が設定される。各レコードを表す線をこれらのＨＳＩ値に基づいて描画することにより、レコードがクラスに従って色分け表示される。
【０１０２】
なお、上記実施例では、クラスタリングの結果に基づいてレコードを表す線を色分け表示しているが、他のフィールドの要素に基づいて色分け表示を行ってもよい。たとえば、「国名」を選択した場合には、全レコードを表示するために６つの色が使用され、各レコードを表す線は互いに異なる色で表示される。また、上記実施例では、クラスタリングの結果に基づいてレコードを色分け表示しているが、他のデータマイニング方法による分析結果に基づいてレコードを色分け表示することも可能である。
【０１０３】
本実施例では、データマイニング結果として得られる要素を選択することにより、その選択された要素を有するレコードを他のレコードと区別して表示させることができる。例えば、図３５に示す表示状態において、ユーザが、「クラスタ１」の座標軸上の「クラス１」を選択した場合、クラス１に属するレコード以外のレコードは、その明度または彩度が低く変化させられて暗い線として表示される。クラス１を選択して場合の表示例を図３７に示す。なお、図３７において、実線は通常の明るさのを表し、点線は実線を比べて暗く表示されている線を表している。
【０１０４】
図３８は、選択された要素に従ってレコードを識別表示する処理のフローチャートである。このフローチャートは、ユーザインタフェース部２により実行される。また、このフローチャートは、クラスタリングの結果が表示されている状態においてユーザが所望の要素を選択した後の処理である。
【０１０５】
ステップＳ１１１では、ユーザが選択した要素（クラスタリング処理では、クラスタ）を検出する。ステップＳ１１２は、レコードを１つずつ抽出してステップＳ１１３以降を実行させる処理である。ステップＳ１１３では、抽出したレコードがユーザの選択した要素を含むか否かを調べる。含む場合には、ステップＳ１１４において、ＨＳＩ値を変化させることなくそのまま設定する。含まない場合には、ステップＳ１１５において、明度または彩度の値を半分に低下させる。ここでは、明度値に０．５を乗算している。ステップＳ１１６では、ステップＳ１１４またはステップＳ１１５により決定されたＨＳＩ値に従って当該レコードを表示する。
【０１０６】
上述の処理により、選択された要素を含むレコードがハイライト表示されているように見える。このような表示は、クラスタリング結果を表示している状態において特定のクラスタに注目する場合に特に有効である。
【０１０７】
なお、上記実施例では、レコードがクラス毎に色分けされている状態において特定の要素を選択した場合を示しているが、本発明は、必ずしも予めクラス毎に色分けされている状態を前提とするわけではない。また、実施例では、クラスタリングを採り上げているが、他のデータマイニングの結果に対して適用することも可能である。
【０１０８】
データマイニングの中には、クラスタリング処理のように、階層が異なる複数の結果が得られるものがある。クラスタリング処理では、樹状図としてその結果を表すことができる。図３９に示す樹状図では、横方向にレコード番号を並べ、複数レコードをまとめた場合のばらつきの度合い（例えば、分散値）を縦軸方向に表している。すなわち、この樹状図は、レコードをクラスタとしてグループ化する際のばらつき具合いの変化を表している。
【０１０９】
この樹状図上で、ばらつきの度合いの閾値を適当に指定することで、所望の数のクラスタを得ることができる。図３９の中段の中央部に示す例では、２つのクラスタ（左側の４つのレコード、および右側の７つのレコード）が得られ、図３９の右部に示す例では、３つのクラスタ（左側の４つのレコード、中央部の３つのレコード、および右側の４つのレコード）が得られている。
【０１１０】
本実施例のコントロール部５は、上述したように、データマイニングの結果をそれぞれ１つのフィールドとして多次元データに追加する。また、コントロール部５は、互いに階層が異なる複数のデータマイニング結果が得られた場合には、データマイニングの対象となった多次元データに階層情報を付与する。この階層情報は、図２４〜図２６を参照しながら説明したものと同じである。
【０１１１】
コントロール部５の出力を図３９の下部に示す。ここでは、最上位の階層および最上位から２番目の階層におけるクラスタリング結果がそれぞれ１つのフィールドとして多次元データに追加されている。最上位の階層は、全レコードを２つのクラスタに分類した結果であり、最上位から２番目の階層は、全レコードを３つのクラスタに分類した結果である。なお、図３９では、２つの階層のみを示しているが、更に下位の階層の結果を得ることも可能である。これらの各階層は、それぞれ１つのフィールドとして多次元データに追加されている。コントロール部５の出力は、上述した通り、入力変換部３を介してユーザインタフェース部２へ転送される。ユーザインタフェース部２は、受信したデータに従ってクラスタリングの結果を表示装置８に表示する。
【０１１２】
図４０は、階層の異なるクラスタリング結果を切替表示させる例を示す図である。上段は、上位階層の結果を表示した例であり、下段は、下位階層の結果を表示した例である。図４０の上段に示す状態において、「クラスタ１」を選択してその下位階層を表示させる指示を入力すると、図４０の下段に示す表示に切り替わる。反対に、図４０の下段に示す状態において、「クラスタ２」を選択してその上位階層を表示させる指示を入力すると、図４０の上段に示す表示に切り替わる。
【０１１３】
図４１は、階層の異なるクラスタリング結果を切替表示させる処理のフローチャートである。この処理は、基本的に図２６に示した処理と同じであり、ユーザインタフェース部２により実行される。ただし、図４１においては、クラスタリング結果として現在表示されている座標軸がユーザにより選択されている。
【０１１４】
クラスタリング処理では、一般に、多次元データの特徴が現れるようなクラスタ数を決めるためには試行錯誤が必要であり、また、クラスタ数の変化に応じたクラスタの分離または統合の様子を調べたい場合も多い。本実施例によれば、異なる階層のクラスタリング結果をビジュアルデータマイニングツール内に保持しておき、ユーザの指示に従ってそれらを切り換えて表示するようにしたので、クラスタ数を変化させたときの各レコードの属性などを即座に表示させることができる。このため、ユーザは、所望の分析結果に素早く到達できる。
【０１１５】
図３９〜図４１に示した実施例の応用例を図４２〜図４３に示す。図４２〜図４３に示す実施例では、クラスタリング結果としての樹状図が表示装置８に表示され、ユーザがその画面上でクラスタ数を決定するための閾値を設定できる。そして、ユーザがマウス等を用いて閾値を変化させることによってクラスタ構成が変化した場合には、その変化に連動して多次元データのグラフ表示をダイナミックに変化させる。
【０１１６】
図４３は、樹状図上に対して設定する閾値の変化と連動させてグラフ表示を変化させる処理のフローチャートである。このフローチャートは、ユーザインタフェース部２により実行される。
【０１１７】
ステップＳ１２１は、データマイニングの結果を表すための座標軸を追加する処理であり、図１９〜図２３において説明した通りである。ステップＳ１２２以降の処理は、表示装置８に表示されている樹状図に対して設定する閾値を変化させることにより、クラスタ構成が変わった場合に実行される。
【０１１８】
ステップＳ１２２では、新たなクラスタ構成に対応するクラスタフィールドを作成する。このフィールドは、ステップＳ１２１で追加された座標軸上に表現される。また、その新たなクラスタ構成に属する各クラスタに対応する点をその座標軸上に設ける。各クラスタには、クラスタ番号を付与される。ステップＳ１２３では、各クラスタに属するレコード毎に表示色を決定する。色計算の処理は、図３４〜図３６を参照しながら説明した通りである。ステップＳ１２４では、ステップＳ１２３で計算した色情報に基づいて各レコードを描画する。
【０１１９】
上記実施例によれば、画面上に表示されるクラスタリング結果としての樹状図の閾値を所望の値を変化させることにより、図４０に示すような表示切替を簡単に行うことができる。すなわち、たとえば、図４２において、閾値を下方に変化させると、クラスタは次第に分裂していくので、最初同じ色で表示されていたレコード群が２つに分かれる様子などをダイナミックに見ることができる。このように、多次元データと樹状図との関係を詳細に知ることができる。
【０１２０】
次に、データマイニングの１つであるＭＢＲによる結果をグラフ表示する例を説明する。ＭＢＲ（Memory Based Reasoning）は、クラス値のわからない未知事例のクラス値を推測する分析方法の１つであり、先に分析されている既知事例の中からその未知事例と類似するｋ個の事例を抽出し、それら抽出した事例のクラス値に基づいて上記未知事例のクラス値を判断するものである。このとき、抽出されたｋ個の既知事例は、上記未知事例のクラス値を判断のための材料（理由）として出力される。ＭＢＲの一般的な処理手順を図４４に示す。抽出したｋ個の既知事例から未知事例のクラス値を判断する際には、たとえば、多数決器が使用される。
【０１２１】
図４５〜図４７は、ＭＢＲの結果をグラフ表示する処理を説明する図である。ビジュアルデータマイニングツール上でＭＢＲの結果を表示する場合は、まず、図４５に示すように、既知事例のレコードを予め表示しておく。
【０１２２】
未知事例は、ここでは、「燃費」〜「年式」がわかっているが「国（または地域）」が不明であるものとする。この場合、「国」が図４４に示した「クラス」に相当する。未知事例が与えられると、その未知事例の「燃費」〜「年式」のデータに基づいて、先に分析されている既知事例の中からその未知事例に近いレコードをｋ個抽出する。また、抽出したｋ個の既知事例の「国」を取り出し、多数決器を用いて「国」として最も確からしいデータを求める。ここでは、多数決の結果が「ヨーロッパ」であったものとする。上記処理は、エンジン部６により実行される。エンジン部６は、これらの結果をコントロール部５を介してビジュアルデータマイニングツール１に転送する。
【０１２３】
ユーザインタフェース部２は、エンジン部６からＭＢＲによる分析結果を受け取ると、図４６に示すように、抽出されたｋ個の既知事例を、他の既知事例から区別して表示（図中、太い線）する。また、ユーザインタフェース部２は、図４７に示すように、未知事例の「国」がエンジン部６で判断されたデータ（すなわち、ヨーロッパ）であるものとして、その未知事例のレコードをグラフ上に描画する。この未知事例は、他の事例から識別可能なように例えば異なる色で表示（図中、点線）される。
【０１２４】
本実施例によれば、ＭＢＲの結果をビジュアルデータマイニングツール上で統一的に表示することができる。また、未知事例のクラスを判断する際に利用した材料も合わせて表示されるので、判断のプロセスおよび理由が得られる。
【０１２５】
次に、データマイニング方法の１つである決定木分析の結果を表示する例を説明する。決定木分析においては、図４８の上部に示すように、１つのノードを分岐点とするような多分木か、あるいは、それをまとめて「if〜then」のような形式で表した複数の「ルール」が得られる。本実施例では、決定木分析の結果として得られた決定木パス、または１つのルールに基づいて、表示されているグラフ上の特定のエリアを指定することができる。
【０１２６】
決定木分析は、エンジン部６において実行され、その出力はコントロール部５へ渡される。決定木分析の結果は、１つ以上の決定木パスまたはif文形式のルールで表される。ここでは、これらの決定木パスまたはルールの中から１つのパスまたはルールが指定されて出力されたものとする。なお、図４８に示す例では、Ａ〜Ｃはそれぞれ１つのフィールドに相当し、また、「クラス」も１つのフィールドとして扱われる。
【０１２７】
コントロール部５は、決定木分析の結果として、１つのパスまたはルールを受け取ると、それに基づいて多次元データを表すグラフ上の範囲情報を作成する。範囲情報を模式的に表したものを図３７の下部に示す。コントロール部５は、この範囲情報をビジュアルデータマイニングツール１に転送する。
【０１２８】
ユーザインタフェース部２は、範囲情報を受け取ると、その範囲情報を表示装置８の画面上のドットデータに変換する。すなわち、範囲情報によって与えられた範囲を多次元データを表すグラフ上にマッピングする。そして、ユーザインタフェース部２は、図４９に示すように、そのマッピングされた範囲内に存在するレコードを抽出し、その抽出したレコードを他のレコードから区別して表示（図中、太い線）させる。
【０１２９】
このように、この実施例によれば、データマイニングにおいて得られた決定木パスやルールと実際のレコードのデータとの関係を視覚的に表示することができる。
【０１３０】
決定木分析では、上述したように、その結果として複数の決定木パスまたはルールが得られる。本実施例では、これらのパスまたはルールに基づいて決定木の分布をグラフ上に表示する。
【０１３１】
エンジン部６は、決定木分析の結果として、複数の決定木パスまたはルールを出力する際に、図５０に示すように、各決定木パスまたはルールにそれぞれ識別番号（パス番号またはルール番号）を付加する。ここで、決定木パスとルールとは、基本的に同じ対象を異なる形式で表したものである。以下では決定木パスを用いて説明する。
【０１３２】
コントロール部５は、パス番号が付加された分析結果を受け取ると、各レコード毎に該当する決定木パスを求める。すなわち、レコード毎にフィールドＡ〜Ｃのデータを取り出し、そのレコードがどの決定木パスに該当するのかを調べる。そして、コントロール部５は、表示すべき多次元データに「パス番号」に対応すフィールドを追加し、そのフィールドに決定木分析において定義されたパス番号を書き込む。コントロール部５は、パス番号が追加された多次元データをビジュアルデータマイニングツール１に転送する。
【０１３３】
ユーザインタフェース部２は、パス番号が追加された多次元データを受け取ると、図５１に示すように、パス番号に対応する座標軸を生成して表示し、その座標軸を利用して各レコードのパス番号を表示する。このとき、各レコードは、パス番号ごとに互いに異なる色で描かれる。色を調整する方法は、図３６の処理に従う。
【０１３４】
この実施例によれば、データマイニングの結果として得られた決定木の分布を視覚的に見やすく表示することができる。このため、各レコードとそのレコードに対応する決定木パス（または、ルール）との関係を一目で認識できる。
【０１３５】
なお、上記実施例では、平行座標軸を用いて多次元データを表示しているが、他の形式のグラフを利用してもよい。たとえば、図７に示すような放射状に伸びる座標軸を用いる形式であってもよい。この場合、データマイニングの結果を表示するために座標軸を追加する処理、階層的な関係を有するデータを切り換えながら表示する処理は、基本的に、平行座標軸系のグラフにおける処理と同じである。ただし、放射状座標軸系において座標軸を追加する際には、たとえば、５フィールドから構成される多次元データにデータマイニングの結果として新たに１つのフィールドが追加される場合には、座標軸どうしの間の角度が７２度であったものを６０度に変更するような処理が必要となる場合がある。
【０１３６】
図５２は、本実施例の各機能を実現するプログラムが記録された記録媒体を説明する図である。本実施例の各機能は、所定の言語で記述されたプログラムをコンピュータ１０１が実行することによって得られる。このプログラムは、たとえば、可搬型記録媒体１０２に格納されている。可搬型記録媒体１０２は、ＣＤ−ＲＯＭ、フロッピーディスクをはじめ、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク等を含む。また、コンピュータ１０１が備えるＲＡＭまたはハードディスクなどのメモリ１０３に上記プログラムを格納しておき、それを実行するような形態であってもよい。さらに、通信回線１０５を介してコンピュータ１０１に接続される他の装置１０４に上記プログラムを格納しておき、コンピュータ１０１が他の装置１０４からそのプログラムをダウンロードして実行するような形態であってもよい。
【０１３７】
図５３は、本実施例の各機能を実現するプログラムを実行するコンピュータの構成図である。可搬型記録媒体用ドライバ１１１は、可搬性記録媒体１０２に格納されているプログラムやデータを読み出したり、あるいは可搬性記録媒体１０２にデータを書き込む装置である。通信制御部１１２は、ネットワークとの間でのデータの授受を制御するユニットである。図５２に示した他の装置（プログラム提供者）１０４からプログラムを受信する際にはこの通信制御装置１１２が起動される。
【０１３８】
ＣＰＵ１１３は、メモリ１０３または可搬性記録媒体１０２からプログラム等をメモリ１１４にロードして実行する。なお、メモリ１０３に記録するプログラム等は、コンピュータ１０１の出荷時にプレインストールしておいてもよいし、可搬性記録媒体１０２に格納されていたものを書き込んでもよいし、通信回線１０５などを介してネットワーク上の他の機器１０４から受信して格納するようにしてもよい。また、ＣＰＵ１１３は、ネットワーク上に設けられた他の記憶装置に格納されているプログラムおよびデータ等を通信回線などを介して使用するようにしてもよい。
【０１３９】
【発明の効果】
対話的なビジュアルツールとデータマイニングエンジンとを連携させ、所定の形式で表されたグラフを利用して所望のデータマイニングエンジンを起動できるので、専門的な知識を持たなくても複数種類のデータマイニングエンジンを利用することができる。
【０１４０】
また、様々な種類のデータマイニングによる結果を同一の表示方法で表示するので、専門的知識がなくても複数データマイニングエンジンの結果を容易に理解することができる。
【０１４１】
このように、対話的な手順で、データのグラフ表示、データマイニングエンジンの起動、およびデータマイニングの結果の表示までを統一的に扱うことが可能となる。このことにより、期待する分析結果を得るための作業の付加が軽減される。
【図面の簡単な説明】
【図１】本発明の原理図である。
【図２】データマイニングエンジンとの連携を示す基本構成図である。
【図３】出力形式の変換を示す基本構成図である。
【図４】データ表示ツールの全体フローチャートである。
【図５】データマイニングの対象となるデータの一例である。
【図６】多次元データを平行座標軸を用いてグラフ表示した例である。
【図７】多次元データを放射状座標軸を用いてグラフ表示した例である。
【図８】データマイニング処理の依頼から表示までの処理の流れを示す図である。
【図９】ビジュアルデータマイニングツールとコントロール部との間で授受されるデータの内容を示す図である。
【図１０】グラフを帳票形式に変換した出力の例である。
【図１１】多次元データを帳票形式に変換して出力する処理を説明するフローチャートである。
【図１２】グラフをＣＳＶ形式に変換した出力の例である。
【図１３】多次元データをＣＳＶ形式に変換して出力する処理を説明するフローチャートである。
【図１４】指定されたデータに対してデータマイニングを行わせる処理の概念を説明する図である。
【図１５】画面上のドットデータから各フィールド毎のデータ値への変換を説明する図である。
【図１６】ユーザにより指定されたデータ範囲に含まれるレコードを抽出する処理を説明する図である。
【図１７】データマイニング処理の進行状況を表示する処理を示す図である。
【図１８】表示状態等を保存する処理を説明する図である。
【図１９】データマイニングの結果を新たなフィールドとしてグラフに追加する実施例を示す図である。
【図２０】データマイニング結果に対応する座標軸を追加してそれを利用してデータマイニング結果を表示する処理のフローチャートである。
【図２１】図２０に示すフローチャートの理解を助けるための図である。
【図２２】図２０に示すフローチャートの理解を助けるための図である。
【図２３】図２０に示すフローチャートの理解を助けるための図である。
【図２４】階層情報を付加したデータ形式を示す図である。
【図２５】階層切替を示す図である。
【図２６】表示されているフィールドの階層を切替える処理のフローチャートである。
【図２７】相関分析の結果をグラフ表示するための変換処理を説明する図である。
【図２８】相関分析の結果をグラフ表示させるために実行されるデータ変換処理のフローチャートである。
【図２９】相関分析の結果をグラフ形式で表示した例である。
【図３０】ある特定のフィールドにおいて所定の値を有するレコードをハイライト表示させる処理の流れを説明する図である。
【図３１】ある特定のフィールドにおいて所定の値を有するレコードをハイライト表示させる処理の流れを詳細に説明する図である。
【図３２】ハイライト表示の例（その１）である。
【図３３】ハイライト表示の例（その２）である。
【図３４】クラスタリング結果の色分け表示の例（その１）である。
【図３５】クラスタリング結果の色分け表示の例（その２）である。
【図３６】クラスタリング結果に基づく色分け表示の処理のフローチャートである。
【図３７】選択された要素に従ってレコードを識別表示した場合の表示例である。
【図３８】選択された要素に基づいてレコードを識別表示する処理のフローチャートである。
【図３９】異なる階層のクラスタリング結果を階層データとして付与する例を説明する図である。
【図４０】複数のクラスタリング結果を切り替えながら表示する例を示す図である。
【図４１】複数のクラスタリング結果を切り替えながら表示する処理のフローチャートである。
【図４２】樹状図上に対して設定する閾値の変化と連動させてグラフ表示を変化させる例を示す図である。
【図４３】樹状図上に対して設定する閾値の変化と連動させてグラフ表示を変化させる処理のフローチャートである。
【図４４】ＭＢＲの処理を説明する図である。
【図４５】ＭＢＲの結果をグラフ表示する処理を説明する図（その１）である。
【図４６】ＭＢＲの結果をグラフ表示する処理を説明する図（その２）である。
【図４７】ＭＢＲの結果をグラフ表示する処理を説明する図（その３）である。
【図４８】決定木分析の結果をグラフ上の範囲情報に変換する処理を模式的に示す図である。
【図４９】決定木分析の結果をグラフ表示した例である。
【図５０】決定木分析の結果にパス番号を付加する処理を説明する図である。
【図５１】決定木の分布を表示する処理を示す図である。
【図５２】本実施例の機能を実現するプログラムが記録された記録媒体について説明する図である。
【図５３】本実施例の機能を実現するプログラムが実行されるコンピュータの構成図である。
【符号の説明】
１ビジュアルデータマイニングツール
２ユーザインタフェース部
３入力変換部
４出力変換部
５コントロール部
６エンジン部
７データベース部
８表示装置
９表示制御部
１０起動部
１０１コンピュータ
１０２可搬型記録媒体
１０３メモリ（ＲＡＭ、ハードディスクなど）
１０４他の装置（プログラム提供者）
１０５回線

Claims

多次元データを所定の形式のグラフを用いて表示装置に表示する際に、複数のデータ項目を含むデータ列を、各データ項目がそれぞれ１本の座標軸に対応づけられておりかつ上記データ列の各データ項目のデータがそれぞれそのデータ項目に対応する座標軸上に表される形式のグラフを用いて表示装置に表示するデータ表示装置であって、
多次元データについてのデータマイニングによる分析結果を受け取り、表示すべき多次元データにその分析結果を組み込む入力変換手段と、
その入力変換手段の出力に基づいて上記分析結果を所定の形式のグラフを用いて上記表示装置に表示する表示制御手段と、
上記データ列についてのデータマイニングによる分析結果に対応する１本以上の座標軸を生成し、その座標軸を上記グラフに追加する座標軸生成手段と、
上記データ列についての相関分析において定義された各ルールに対してルール番号を付与するルール番号付与手段、を有し、
上記座標軸生成手段は、上記相関分析による分析結果に対応する座標軸を生成して上記グラフに追加し、
上記表示制御手段は、上記座標軸生成手段により生成された座標軸上に上記ルール番号を配置し、その座標軸を利用して各データ列を表示する
ことを特徴とするデータ表示装置。
上記グラフは、平行座標軸系または放射状座標軸系である請求項１に記載のデータ表示装置。
上記座標軸生成手段は、上記データ列についてのデータマイニングによる分析結果が互いに階層的な関係を有する複数のデータ項目から構成されている場合、それら階層的な関係を有する複数のデータ項目に対応する座標軸を生成して上記グラフに追加し、
上記表示制御手段は、その座標軸生成手段により生成された座標軸を利用して上記階層的な関係を有する複数のデータ項目の中の１つのデータを表示する
ことを特徴とする請求項１に記載のデータ表示装置。
上記表示制御手段は、ユーザからの切換指示に従って上記座標軸生成手段により生成された座標軸上に上記階層的な関係を有する複数のデータ項目の中の他のデータ項目のデータを表示する請求項３に記載のデータ表示装置。
上記表示制御手段は、表示されている座標軸上のある点が指定されたことを検出すると、その点に対応するデータを有するデータ列をハイライト表示する請求項１に記載のデータ表示装置。
多次元データを所定の形式のグラフを用いて表示装置に表示する際に、複数のデータ項目を含むデータ列を、各データ項目がそれぞれ１本の座標軸に対応づけられておりかつ上記データ列の各データ項目のデータがそれぞれそのデータ項目に対応する座標軸上に表される形式のグラフを用いて表示装置に表示するデータ表示装置であって、
多次元データについてのデータマイニングによる分析結果を受け取り、表示すべき多次元データにその分析結果を組み込む入力変換手段と、
その入力変換手段の出力に基づいて上記分析結果を所定の形式のグラフを用いて上記表示装置に表示する表示制御手段と、
上記データ列についてのデータマイニングによる分析結果に対応する１本以上の座標軸を生成し、その座標軸を上記グラフに追加する座標軸生成手段、を有し、
上記座標軸生成手段は、上記データ列についてのクラスタリングによる分析結果に対応する座標軸を生成して上記グラフに追加し、
上記表示制御手段は、上記座標軸生成手段により生成された座標軸上に上記クラスタリングの結果として得られたクラスタを配置し、その座標軸を利用して各データ列を表示する
ことを特徴とするデータ表示装置。
上記表示制御手段は、クラスタ毎に各データ列を互いに識別可能に表示する請求項６に記載のデータ表示装置。
上記表示制御手段は、特定のクラスタが指定されたことを検出すると、その特定のクラスタに属するデータ列と他のクラスタに属するデータ列とを識別可能に表示する請求項７に記載のデータ表示装置。
上記表示制御手段は、上記クラスタリングによる分析結果が互いに階層的な関係を有する複数のデータ項目から構成されている場合、上記座標軸生成手段により生成された座標軸を利用して上記階層的な関係を有する複数のデータ項目の中の１つのデータを表示する請求項６に記載のデータ表示装置。
上記クラスタリングによる分析結果として得られる樹状図を表示する樹状図表示手段をさらに有し、
上記表示制御手段は、上記樹状図を利用して指定された指示に従って各クラスタの表示状態を動的に変化させる請求項６に記載のデータ表示装置。
複数のデータ項目を含むデータ列を、各データ項目がそれぞれ１本の座標軸に対応づけられておりかつ上記データ列の各データ項目のデータがそれぞれそのデータ項目に対応する座標軸上に表される形式のグラフを用いて表示装置に表示するデータ表示装置であって、
上記データ列についての決定木分析において定義されるルールを表示するための座標軸を生成し、その座標軸を上記グラフに追加する座標軸生成手段と、
上記決定木分析において定義される各ルールに対してルール番号を付与するルール番号付与手段と、
上記座標軸生成手段により生成された座標軸上に上記ルール番号を配置し、その座標軸を利用してルール毎に互いに識別可能に各データ列を表示する表示制御手段と
を有するデータ表示装置。
複数のデータ項目を含むデータ列を、各データ項目がそれぞれ１本の座標軸に対応づけられておりかつ上記データ列の各データ項目のデータがそれぞれそのデータ項目に対応する座標軸上に表される形式のグラフを用いて表示装置に表示するデータ表示装置であって、
上記データ列についての決定木分析において定義される決定木パスを表示するための座標軸を生成し、その座標軸を上記グラフに追加する座標軸生成手段と、
上記決定木分析において定義される各決定木パスに対してパス番号を付与するパス番号付与手段と、
上記座標軸生成手段により生成された座標軸上に上記パス番号を配置し、その座標軸を利用して決定木パス毎に互いに識別可能に各データ列を表示する表示制御手段と
を有するデータ表示装置。