JP4155363B2 - データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体 - Google Patents

データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4155363B2
JP4155363B2 JP16304997A JP16304997A JP4155363B2 JP 4155363 B2 JP4155363 B2 JP 4155363B2 JP 16304997 A JP16304997 A JP 16304997A JP 16304997 A JP16304997 A JP 16304997A JP 4155363 B2 JP4155363 B2 JP 4155363B2
Authority
JP
Japan
Prior art keywords
data
coordinate axis
graph
display device
data mining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP16304997A
Other languages
English (en)
Other versions
JPH1115895A (ja
Inventor
義典 柳沼
達也 進藤
純一 萩原
克彦 田口
和宏 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP16304997A priority Critical patent/JP4155363B2/ja
Publication of JPH1115895A publication Critical patent/JPH1115895A/ja
Priority to US09/922,773 priority patent/US6477538B2/en
Priority to US09/922,772 priority patent/US6470352B2/en
Application granted granted Critical
Publication of JP4155363B2 publication Critical patent/JP4155363B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Generation (AREA)
  • Digital Computer Display Output (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、多次元データを表示する装置および方法に係わり、特に、データマイニングのフロントエンドとしての機能を備えた表示ツールに関する。
【0002】
【従来の技術】
コンピュータやインターネットの発達、および記憶装置の高密度化、低価格化などにより、大量かつ様々な種類の情報を容易に入手・蓄積できるようになっってきた。たとえば、流通業界においては、POS(Point Of Sale )システムにより全国各地の小売店の売上と時間帯との関係に係わる情報、金融業界においては、各顧客のクレジットカードの使用状況に関する情報、保険業界においては、各加入者の個人データと保険の使用状況に関する情報を収集している。
【0003】
このようにして蓄積された大量の情報からビジネス戦略を練る上で有効な情報を抽出するための技術の1つとして、近年、データマイニング技術の研究開発が盛んである。データマイニングとは、収集した大量のデータから、そのデータが示す法則、動向、パターン、規則性、相関関係などを導き出す技術であり、人工知能(AI)、ニューロ技術、統計技術などを基盤にしている場合が多い。
【0004】
データマイニングにおいては、例えば、ニューロ分析、クラスタリング、決定木、MBR(Memory Based Reasoning)、相関分析などの手法が利用される。これらの各分析手法を実現するソフトウェアは、データマイニングエンジンと呼ばれることがある。以下では、これらのソフトウェアのことを、「データマイニングエンジン」、あるいは、単に「エンジン」と呼ぶことがある。
【0005】
ところが、情報抽出の目的や分析対象となる情報の性質により、最適な分析手法が異なり、期待した分析結果を簡単に得られないこともしばしばある。この場合、ユーザは、期待した分析結果が得られるまで試行錯誤を伴った作業をすることになる。
【0006】
【発明が解決しようとする課題】
期待したデータマイニング結果を得るための作業の負担を軽減するためには、各種分析手法による結果を統一された形態で表示することが望ましいと考えられる。ところが、従来は、データマイニング技術においては、分析手法ごとにフロントエンド表示装置(表示用のソフトウェア)が個別に開発されていた。分析手法に応じて作成されたフロントエンド表示装置は、その手法によって分析された結果を明確に表示する点では優れているが、各分析手法ごとにそれぞれ専門的な知識を必要とする場合が多く、複数の分析手法を駆使するには熟練を要する。
【0007】
また、従来は、データマイニングの結果は、通常、表形式で出力されることが多く、データの規則性や相関関係なとがわかりやすく表示されているとは言えなかった。
【0008】
さらに、現在までのところ、各分析手法を連携あるいは統合させる技術は提供されていない。すなわち、ユーザインタフェース部とデータマイニングエンジンとの間のデータの授受方法、データマイニングエンジンの起動方法、データマイニング結果の表示方法等は、それぞれデータマイニングエンジン毎に独立していた。このため、ユーザは、作業内容に応じて各データマイニングツールを使いわける必要があり、予め最適な分析手法がわかっている場合以外は、期待する分析結果を得るための作業負担が大きかった。
【0009】
本発明の課題は、データマイニングによる結果を理解しやすく表示させるデータ表示装置および方法を提供することである。また、本発明の他の課題は、専門的知識がなくても複数のデータマイニングエンジンを統一的に扱えるようにするデータ表示装置および方法を提供することである。
【0010】
【課題を解決するための手段】
本発明のデータ表示装置は、多次元データを所定の形式のグラフを用いて表示装置に表示する構成であって、以下の手段を有する。起動手段は、データマイニング処理を実行するデータマイニングエンジンに対する起動指示を受け付け、その起動指示に従って該データマイニングエンジンを起動する。表示制御手段は、上記データマイニングエンジンによる結果を受け取り、その結果を上記所定の形式のグラフと同じ形式で上記表示装置に表示する。
【0011】
本発明の他の形態のデータ表示装置は、以下の各手段を有する。入力変換手段は、多次元データについてのデータマイニングによる分析結果を受け取り、表示すべき多次元データにその分析結果を組み込む。表示制御手段は、その入力変換手段の出力に基づいて上記分析結果を所定の形式のグラフを用いて上記表示装置に表示する。
【0012】
データマイニングとしては、たとえば、相関分析、クラスタリング、MBR、決定木分析、ニューロ分析などの統計手法が利用されるが、本発明の構成によれば、それらのデータマイニングの結果が上記所定の形式のグラフを用いて表示される。この結果、ユーザは、様々な分析手法による結果を統一的なグラフとして得ることができる。
【0013】
【発明の実施の形態】
本発明のデータ表示ツールは、多次元データをグラフ表示する装置において使用され、データマイニングの結果をそのグラフと同じ形式で表示する。データマイニングの結果は、そのグラフに追加することによりあるいはそのグラフの一部を変化させることにより表示される。また、データマイニングの結果は、通常、分析手法により互いにデータ形式が異なる。本発明のデータ表示ツールは、このような分析手法による差異を吸収してユーザに統一的な表示を提供する。また、本発明のデータ表示ツールは、表示されているグラフを利用して選択されたデータをデータマイニングエンジンに転送することにより、その選択されたデータに対してデータマイニングを実行させることができる。
【0014】
図1は、本発明の原理図である。ビジュアルデータマイニングツール(データマイニング・ビジュアライズ・ツール)1は、ユーザインタフェース部2、入力変換部3、および出力変換部4を備える。
【0015】
ユーザインタフェース部2は、表示制御部9および起動部10を有する。表示制御部9は、データベース7から抽出した多次元データをディスプレイスクリーンなどの表示装置8に表示する。起動部10は、ユーザからの指示に基づいてデータマイニングの対象となる範囲をエンジン部6に通知すると共に、エンジン部6を起動して処理を実行させる。さらに、ユーザインタフェース部2は、ユーザからの指示に基づいて、表示装置8に表示した多次元データあるいはデータマイニングの結果を所定の形式に変換するための指示を出力変換部4に対して出力する。
【0016】
入力変換部3は、コンロトール部5から受け取ったデータを必要に応じて所定の形式に変換してユーザインタフェース部2に渡す。出力変換部4は、表示装置8に表示した多次元データあるいはデータマイニングの結果をユーザインタフェース部2により指示された形式に変換して出力する。
【0017】
コントロール部5は、ユーザインタフェース部2からの要求に従ってデータベース部7からデータを抽出し、そのデータをユーザインタフェース部2に転送する。また、コントロール部5は、ユーザインタフェース部2からの指示に従ってエンジン部6を起動してデータマイニングを実行させる。そして、データマイニングの結果をビジュアルデータマイニングツール1が受け取れる形式に変換して出力する。このとき、コントロール部5は、必要に応じてデータマイニングの結果に所定の付加情報を付加する。さらに、コントロール部5は、エンジン部6における処理の途中経過をビジュアルデータマイニングツール1に通知する。
【0018】
エンジン部6は、コントロール部5により指定されたデータに対してデータマイニングを実行してその結果をコントロール部5へ渡す。エンジン部6は、複数のデータマイニングエンジンを含み、ユーザにより指定されたデータマイニングエンジンを用いて分析処理を実行する。データマイニングエンジンとしては、相関分析用エンジン、決定木用エンジン、クラスタリング用エンジン、MBR用エンジン、およびニューロ分析用エンジンなどを備える。
【0019】
図2〜図4を参照しながら上記構成のデータ表示ツールの動作を簡単に説明する。図2は、ビジュアルデータマイニングツールとデータマイニングエンジンとの連携動作を説明する図であり、図3は、出力変換動作を説明する図である。また、図4は、データ表示ツールの全体フローチャートである。
【0020】
データマイニングを実行するときには、ユーザは、データマイニングの対象とすべきデータ範囲(データ指定)を入力する。ユーザインタフェース部2の起動部10は、ユーザからの指示を検出すると、ステップS1において、データ指定指示およびエンジン実行要求をコントロール部5へ送出する。
【0021】
ステップS2およびS3は、コントロール部5の処理である。コントロール部5は、上記データ指定指示およびエンジン実行要求を受信すると、必要に応じて前処理を実行し、エンジン部6を起動する。このとき、データマイニングの対象とすべきデータ範囲がエンジン部6に通知される。なお、前処理については後述する。
【0022】
エンジン部6は、ステップS4において、データマイニングを実行してその結果を出力する。コントロール部5は、ステップS5において、エンジン部6から受け取ったデータマイニングの結果をビジュアルデータマイニングツール1が処理できる形式に変換して出力する。このとき、コントロール部5は、エンジン部6における処理の進行状況を逐一ビジュアルデータマイニングツール1に報告する。
【0023】
入力変換部3は、ステップS6において、コントロール部5から受け取った結果データを表示形式に変換してユーザインタフェース部2に渡す。そして、ユーザインタフェース部2の表示制御部9は、データマイニング結果を表示装置8にグラフ表示する。
【0024】
表示装置8に表示されているグラフ等を保存する場合には、ユーザインタフェース部2は、ステップS11およびS12において、ユーザからの保存要求を検出した時点でのグラフ等の状態を認識し、それを不図示のメモリまたはハードディスクに書き込む。ここで、グラフ等は、データベース部7から抽出した多次元データおよびデータマイニング結果を含む。
【0025】
表示装置8にグラフとして表示されているデータを他のデータ形式に変換して出力する場合には、ユーザインタフェース部2は、ステップS21において、ユーザにより指定された出力形式を出力変換部4に通知する。出力変換部4は、ステップS22およびS23において、出力すべきデータを指定された形式に変換して出力する。出力変換部4は、データを帳票形式あるいはCSV形式に変換できる。
【0026】
以下、具体的な実施例を説明する。
図5は、データマイニングの対象となるデータの一例である。ここでは、自動車の性能等に関するデータを対象とする。なお、図5に示すデータは、図1に示すデータベース部7から抽出してきたものである。データ構成としては、図5に示すように、車種ごとに1つのレコード(データ列)が割り当てられている。また、データ項目としては、燃費、シリンダ数、馬力、重量、年式、および国が設定されている。各項目を「フィールド」と呼ぶ。このように、各レコードに複数の項目のデータが含まれている場合、そのデータ列を多次元データと呼ぶ。
【0027】
図6〜図7は、図5に示した多次元データの図形表示した例の図である。図6に示す表示方法では、多次元データを複数の平行座標軸を用いて表す。即ち、各フィールド(項目)をそれぞれ1本の座標軸で表す。そして、各レコードのデータは、それらの座標軸上の所定の点を結ぶ折れ線グラフとして表される。図5に示す多次元データを図6に示すグラフに変換して表示する処理は、本実施例ではユーザインタフェース部2で行うが、他の図形表示ツールに実行させてもよい。
上記グラフ表示のための変換処理は、以下の手順を含む。
(1) フィールド数を検出する。図5〜図6の例では、フィールド数は、「6」である。
(2) 上記(1) で検出したフィールド数と同じ数の平行座標軸を表示する。即ち、各フィールドに対応する座標軸を表示する。画面上における各座標軸の上限位置および下限位置を画面上限(gmax)および画面下限(gmin)とする。
(3) 全レコードをサーチし、各フィールドごとに最大値および最小値を求める。
【0028】
たとえば、「燃費」においては、最も燃費の良い自動車の燃費値および最も燃費の悪い自動車の燃費値を検出する。ただし、データを数値で表すことのできないフィールド(例えば、「国」)においては、データの種類の数を検出しておく。
(4) 各フィールドごとにデータと座標軸上の座標とのマップを作成する。マッピング方法の一例としては、上記(3) で求めた各フィールドごとに最大値および最小値をそれぞれ上記(2) で設定した各座標軸の画面上限(gmax)および画面下限(gmin)に対応させる。なお、上記各フィールドごとの最大値および最小値をそれぞれ上記画面上限(gmax)および画面下限(gmin)に対応させるのではなく、マージンを持たせるようにしてもよい。
(5) 各レコード毎に、上記(4) のマップを参照しながらデータを座標軸上に配置する。
(6) 各レコード毎に配置されたデータ点を線で結ぶ。
【0029】
なお、多次元データを上述の形式のグラフとして表示する方法は、たとえば、米国特許5,546,516 に開示されている。なお、米国特許5,546,516 は、データマイニングの結果を表示することは考慮していない。
【0030】
本実施形態のビジュアルデータマイニングツールは、多次元データを表すグラフ上にその多次元データに関連するデータマイニングの結果を表示させるものである。なお、本実施形態において、多次元データをグラフとして表示させる方法は、図6に示す方法に限定されない。すなわち、図6に示した平行座標軸を用いたグラフは、単なる一実施例であり、例えば、図7に示すように、放射状座標軸を利用した表示方法において本実施形態のビジュアルでツールを適用することも可能である。ただし、以下では、平行座標軸を用いたグラフを前提として実施例を説明する。
【0031】
ユーザインタフェース部2は、画面上でユーザにデータ範囲を指定させる機能を備える。たとえば、図6に示すグラフが表示装置8に表示されている状態において、ユーザがマウス等で所望の範囲を指定(図中、指定された範囲をグレーの領域として示している)すると、ユーザインタフェース部2は、その範囲内に含まれるデータを、例えばハイライト表示させるなどして、他のデータから識別させることができる。なお、ユーザは、例えば、各フィールド毎に所望の2点をクリックすることにより、所望のデータ範囲をユーザインタフェース部2に通知する。
【0032】
図8を参照しながら、データマイニングの依頼およびその結果を表示させる処理の概要を説明する。ここでは、表示装置8に多次元データがグラフ表示されている状態において、ユーザが所望のデータマイニング方法および対象とするデータ範囲を指定したときの処理の流れを示す。
【0033】
ビジュアルデータマイニングツール1は、ユーザの指示を認識すると、それをコントロール部5に転送する。このとき転送されるデータを図9に示す。ユーザインタフェース部2は、ユーザが指定したデータ範囲を認識すると、その範囲内に含まれるレコードまたはフィールドを「選択レコード」または「選択フィールド」としてコントロール部5に通知する。また、ユーザインタフェース部2は、ユーザが指定するデータマイニング方法を認識すると、その方法に対応するデータマイニングエンジンの「エンジン名」をコントロール部5に通知する。尚、データマイニングに際して「教師値」などを必要とする場合には、「エンジン名」と共にその値やフィールドをも通知する。
【0034】
エンジン部6は、指定されたデータ範囲に対して指定されたエンジンを用いてデータマイニングを実行し、その結果をコントロール部5に送出する。また、エンジン部6は、データマイニング処理の実行の途中結果を逐一コントロール部5に通知する。
【0035】
コントロール部5は、エンジン部6からデータマイニング結果を受け取ると、必要に応じて付加情報を作成し、結果データと共にその付加情報をビジュアルデータマイニングツール1へ送出する。付加情報としては、データマイニング方法によって異なるが、階層情報、色情報、ルール番号、パス番号、軸追加指示情報などである。付加情報については、後述する各実施例において詳しく説明する。また、コントロール部5は、エンジン部6から受信する途中結果を逐一「進行状況データ」に変換してビジュアルデータマイニングツール1へ送出する。
【0036】
入力変換部3は、コントロール部5から受け取った付加情報を解釈し、ユーザインタフェース部2がデータマイニングの結果をグラフ表示させられるようにデータ形式を変換する。そして、ユーザインタフェース部2は、入力変換部3から受け取ったデータマイニングの結果を、先に表示されているグラフに追加するようにして、あるいはそのグラフの一部を変化させるようにして表示する。このことにより、ユーザによって指定されたデータマイニングの処理結果が、グラフ上に表現される。
【0037】
次に、グラフ形式で表示されている多次元データを他の形式に変換して出力する処理を説明する。以下では、帳票形式に変換して出力する例、およびCSV形式に変換して出力する例を示すが、他の形式に変換することも可能である。
【0038】
図10は、表示されているデータを帳票形式に変換した結果の例である。ユーザは、表示されているグラフを利用して帳票出力する範囲を指定できる。たとえば、特定のフィールドを指定したり、あるいは、図6に示すように、各フィールド毎にデータ範囲を指定することも可能である。後者の場合には、指定された範囲内に属するレコードのみが変換対象として抽出される。なお、図10は、図6に示すグラフにおいて、ユーザが「燃費」、「重量」および「国」を指定した場合の変換結果の例である。
【0039】
図11は、データを帳票形式へ変換する際の処理を説明するフローチャートである。ここでは、ユーザが特定のフィールドを指定した場合を示す。
ステップS31は、変換対象のレコードを1つずつ抽出してステップS32以降を実行させる処理である。ここでは、各レコードのレコード番号を「k」としている。レコード番号の初期値は、「0」であり、以降、その値が全レコード数に達するまで1ずつインクリメントされる。ステップS32は、表示されているフィールドを1つずつ抽出してステップS33以降を実行させる処理である。ここでは、各フィールドのフィールド番号を「i」としている。フィールド番号の初期値は、「0」であり、以降、その値が全フィールド数に達するまで1ずつインクリメントされる。
【0040】
ステップS33では、ステップS32において抽出されたフィールドとユーザにより指定されたフィールドXとが一致するか否かを調べ、一致すればステップS34へ進み、一致しなければステップSステップS32へ戻る。ステップS34では、ステップS31で抽出したレコードのデータとして、ステップS32において抽出したフィールドのデータを出力し、そのデータに続いて改行を表す情報を出力する。
【0041】
このように、全レコードにおいて指定されたフィールド毎にデータを2項に転換することにより、指定されたデータを帳票形式データへと変換する。なお、ユーザが各フィールド毎にデータ範囲を指定(図6では、グレーのエリアで示す)した場合には、その範囲内に属するレコードのみに対して図11の処理が実行される。
【0042】
図12は、表示されているデータをCSV形式に変換した例である。ユーザによるデータ指定については、帳票形式の場合と同じである。図12は、図6に示すグラフにおいて、ユーザが「燃費」、「重量」、「シリンダ数」、「馬力」および「国」を指定した場合の変換結果の例である。
【0043】
図13は、データをCSV形式へ変換する際の処理を説明するフローチャートである。なお、図13において、ステップS31およびステップS32は、図11に示した帳票形式の場合と同じである。
【0044】
ステップS41では、ステップS32において抽出したフィールドが、最終フィールドであるか否か調べ、最終フィールドでなければステップS42へ進み、最終フィールドならばステップS43へ進む。ステップS42では、ステップS32において抽出したフィールドのデータを出力すると共に、そのデータに続いて「,」を出力する。一方、ステップS43では、ステップS32において抽出したフィールドのデータを出力すると共に、そのデータに続いて改行を表す情報を出力する。
【0045】
このように、指定されたフィールド毎にフィールド値とカンマ(,)とを交互に並べて各レコードを展開することにより、指定されたデータをCSV形式へと変換する。
【0046】
次に、表示装置8にグラフとして表示されている多次元データからその一部を選択して、その選択したデータに対してデータマイニングを実行させる処理を説明する。ここでは、表示されているデータのうち、所定のレコードのデータに対してデータマイニングを実行するような場合を想定する。一例としては、図6において、「燃費が13km/l以上であり、かつ重量が1100kg以下であるような車種」を対象としてデータマイニングを行うような場合を想定する。この場合、ユーザは、マウス等を用いて、「燃費」および「重量」に対応する座標軸上において、指定したい範囲の最大値および最小値を入力する。そして、利用したいデータマイニング方法に対応するエンジンを起動するための指示を入力する。
【0047】
図14は、指定されたデータに対してデータマイニングを行わせる処理の概念を説明する図である。ユーザインタフェース部2は、ユーザにより入力されたデータマイニングエンジンの指定、その起動命令、およびデータマイニングの対象とするデータ範囲などを検出すると、それらをコントロール部5を介してエンジン部6に通知する。
【0048】
エンジン部6は、ユーザインタフェース部2からコントロール部5を介して受け取った情報に従い、データベース部7にアクセスする。データベース部7は、要求されたデータを再構成してデータをエンジン部6に送出する。そして、エンジン部6は、その再構成されたデータに対してデータマイニングを実行する。
【0049】
このように、本実施例では、ユーザがグラフ上で所望の範囲を指定し、その指定した範囲に対してデータマイニングを行わせることができる。ここで、表示装置8に表示されるグラフは、画面を構成するドッドデータとして表されている。したがって、ユーザがグラフ上で指定するデータは、ドットデータとしてユーザインタフェース部2に入力される。
【0050】
ところが、エンジン部6は、表示装置8の画面構成を考慮せずに作成されている。このため、エンジン部6は、データマイニングを行う対象として、表示装置8の画面を構成するドットデータで表されたデータ範囲を受け取っても、それを理解できない。たとえば、図6のグラフが表示されている画面上において、ユーザが「燃費」の範囲として、「13km/l以上」を入力した場合、ユーザインタフェース部2には、「第Y1 ドット目から第Y2 ドット目までの範囲」というように入力されるが、この情報をそのままエンジン部6に渡しても、エンジン部6はそれを理解することができない。したがって、ユーザインタフェース部2(あるいは、ユーザインタフェース部2およびコントロール部5)は、そのドットデータとして表された範囲情報をエンジン部6が理解できる値に変換する。以下にこの変換方法を示す。
【0051】
図15は、画面上のドットデータから各フィールド毎のデータ値への変換を説明する図である。表示装置8の画面において、多次元データをグラフとして表示する際、各フィールドに対応する座標軸の上端および下端の位置は、それぞれ画面全体上限値(gmax)および画面全体下限値(gmin)として保持されている。ここで、画面全体上限値および画面全体下限値は、共にドットデータで表される。また、各フィールド毎のデータの最大値(fmax(i) )および最小値(fmin(i) )は、それぞれ画面全体上限値および画面全体下限値に対応付けられている。この対応関係は、たとえば、不図示のメモリ内にテーブルとして設定されている。ドットデータで表される座標軸上の任意の座標点に対応するフィールド毎のデータ値は、上記対応関係に基づく変換比率により算出される。すなわち、座標軸上におけるドットデータがy0 である点に対応するフィールド毎のデータ値x0 は、以下の式で表される。
(gmax−gmini):(y0 −gmini)=(fmax−fmin):(x0 −fmin)
∴ x0 =(y0 −gmini)×{(fmax−fmin)÷(gmax−gmini)}+fmin
たとえば、座標軸の画面全体上限値および画面全体下限値が、それぞれ「100(ドット)」および「900(ドット)」であり、「燃費」の最大値および最小値がそれぞれ「16」および「6」であった場合において、「燃費」の座標軸において第500ドット目に位置するデータxは、下式により得られる。
x=(16−6)×{(500−100)/(900−100)}+6 =11km/l
上記ドットデータをフィールド毎のデータ値に変換する処理は、ユーザインタフェース部2において実行される。すなわち、ユーザがマウス等を用いて各フィールドに対応する座標軸上の所望の点を指定すると、ユーザインタフェース部2は、その指定された点のドットデータを当該フィールドにおけるデータ値に変換することができる。
【0052】
図16は、ユーザにより所望の座標軸が選択されてその座標軸上でデータ範囲が指定された場合に、そのデータ範囲に含まれるレコードを抽出する処理を説明する図である。ここでは、ユーザが、データ範囲の上限値および下限値としてグラフが表示されている画面上で座標軸上の2点を指定したものとする。
【0053】
この場合、ユーザインタフェース部2は、ユーザにより選択された座標軸を識別する情報(軸番号)をコントロール部5に通知する。また、ユーザインタフェース部2は、画面上で指定された上限値および下限値のドットデータをそれぞれフィールド毎のデータ値に変換してフィールド最大値(fmax(i) )およびフィールド最小値(fmin(i) )としてコントロール部5に通知する。
コントロール部5は、上記通知を受けると、ステップS51〜S55を実行する。ステップS51およびS52は、それぞれ図11のステップS31およびS32と同じである。すなわち、各レコード毎にフィールドを1つずつ抽出してステップS53〜S55を実行するための処理である。ステップS53では、ステップS52において抽出したフィールド番号とユーザによって選択されたフィールド番号とが一致するか否か調べる。一致した場合にはステップS54へ進み、一致しなかった場合にはステップS52に戻って次のフィールドを抽出する。
【0054】
ステップS54では、ステップS52で抽出したフィールドにおけるデータがユーザインタフェース部2から通知されたフィールド最大値とフィールド最小値との間の値であるか否かを調べる。すなわち、当該レコードのデータが、ユーザによって指定された範囲内であるか否かを調べる。なお、コントロール部5は、全レコードのデータを認識している。この判断の結果、当該レコードのデータが指定された範囲内であれば、ステップS52に戻って次のフィールドを抽出し、範囲外であれば、ステップS51に戻って次のレコードを抽出する。
【0055】
ステップS52〜S54によれば、ユーザによって選択されたすべてのフィールドにおいて当該レコードのデータがユーザによって指定されたデータ範囲内であった場合にのみ、その処理がステップS55へ進むことになる。ステップS55においては、ステップS51で抽出したレコード番号が保持される。
【0056】
たとえば、図6に示すように、ユーザが「燃費」および「重量」を選択してそれらのフィールドについて範囲を指定した場合には、各レコード毎に「燃費」および「重量」のデータを取り出し、それらのデータがそれぞれユーザにより指定された範囲内に入っているか否かを調べる。そして、各フィールドにおいて各データがそれぞれ指定された範囲内に入っていた場合にのみそのレコードのレコード番号をステップS55において保持する。
【0057】
すべてのレコードについてステップS52〜S55の処理を終了したらば、保持しているレコード番号をエンジン部6に通知してデータマイニングエンジンを起動する。そして、エンジン部6は、ユーザが指定した範囲内のレコードのみを対象としてデータマイニングを実行する。
【0058】
このように、本実施例では、表示されているグラフを用いて所望のフィールドおよびデータ範囲を指定することにより、その範囲に属するレコードのみを対象としてデータマイニングを実行させることができる。尚、上記構成では、ユーザインタフェース部2およびコントロール部5の連携動作により画面上で指定されたドットデータをエンジン部6が認識できるデータに変換しているが、上記処理をすべてユーザインタフェース部2において実行するようにしてもよい。また、上記構成において、ユーザインタフェース部2は、ユーザが指定するデータマイニング方法をエンジン部6へ通知する機能、および必要に応じてデータマイニング処理で使用する教師値をエンジン部6に通知する機能を備える。
【0059】
図17は、データマイニング処理の進行状況を表示する処理を示す図である。ここでは、エンジン部6がデータマイニング処理の進行状況を認識できるものとする。進行状況は、例えば、以下の3つの方法のうちの1つにより検出する。
(1) 予測終了時間に対する現在の実行時間
(2) 予測実行回数(または、最大実行回数)に対する現在の実行回数
(3) 対象データ量に対する現在までの処理データ量
エンジン部6は、定期的にこれらの情報の中の1つを検出し、進行状況データとしてコントロール部5を介して入力変換部3へ転送する。入力変換部3は、ユーザの希望等に応じて進行状況データをパーセント値に変換して、ユーザインタフェース部2に渡す。そして、ユーザインタフェース部2が、その変換された進行状況データをリアルタイムに表示装置8に表示する。
【0060】
図18は、表示状態を保存する処理を説明する図である。ユーザインタフェース部2は、自動的にあるいはユーザからの指示に従って、ビジュアルデータマイニングツール自身に設定されている各種情報を不図示のメモリまたはハードディスクに保存することができる。保存すべき各種情報としては、例えば、データの名前、操作日時、各フィールドにおける範囲情報(最大値と最小値)、各フィールドの順番などの情報、フォントやカラー情報などがあげられる。これらの情報を保存しておくことにより、ユーザは、その表示状態を容易に再現できる。
【0061】
次に、データマイニングの結果を、先に表示されているグラフと同じ形式でそのグラフ上に表示させる処理を説明する。
図19は、データマイニングの結果を新たなフィールドとしてグラフに追加する実施例を示す図である。
【0062】
入力されたデータに対する分析結果として、各レコードの属性を出力するようなデータマイニング方法が知られている。たとえば、クラスタリング処理は、各レコードが複数のクラスの中のどのクラスに属するのかを出力する。この場合、データマイニング結果(クラスタリング処理では、クラスタ番号)は、各レコードにとっては、1つのフィールドのデータに相当する。また、クラスタリング処理以外にも、分析結果が各レコードの1つ以上のフィールドデータとなるデータマイニング方法が存在する。
【0063】
本実施例では、データマイニングの結果を新たな1つ以上のフィールドとして扱う。すなわち、まず、エンジン部6は、対象データに対してデータマイニングを実行して結果を得ると、その対象データと結果データとを対応づけてコントロール部5へ転送する。コントロール部5は、これらのデータを受け取ると、対象データにそのデータマイニングによる結果を1つ以上のフィールドのデータとして組み込む。そして、コントロール部5は、データマイニングの結果が組み込まれたデータを入力変換部3を介してユーザインタフェース部2へ転送する。
【0064】
ユーザインタフェース部2は、新たなフィールドとして表されているデータマイニング結果を、先に表示されている他のフィールドと同じ形式で表示する。すなわち、ユーザインタフェース部2は、データマイニングの結果に対応する座標軸を必要な数だけ追加して表示し、その座標軸を用いてデータマイニングの結果を表す。各レコードに対応する折れ線は、図19に示すように、そのデータマイニングの結果を表す座標軸上の対応する点に到達するように描かれる。なお、データマイニング結果に対応する座標軸は、図19においては右端に設けられているが、ユーザの指示に従って所望に位置に設けることができる。
【0065】
このように、多次元データをグラフ表示している状態において、その多次元データに関するデータマイニング結果を得た場合、そのデータマイニング結果は、その表示されているグラフと同じ形式で表示される。このため、ユーザは、そのグラフに関する知識を有していれば、データマイニングの結果を容易に理解できる。
【0066】
なお、上記構成では、エンジン部6からユーザインタフェース部2へデータマイニング結果だけでなくデータマイニング対象データも転送しているが、ユーザインタフェース部2または入力変換部3が記憶装置を備える構成とし、その記憶装置に現在表示されているデータ関する情報を保持するようにすれば、エンジン部6からユーザインタフェース部2へデータマイニング結果のみを送付するだけでデータマイニング結果をグラフに追加表示できる。
【0067】
図20は、データマイニング結果に対応する座標軸を追加してそれを利用してデータマイニング結果を表示する処理のフローチャートである。このフローチャートは、ユーザインタフェース部2により実行される。なお、ここでは、複数の座標軸が表示されている状態において、データマイニング結果に対応する座標軸を1本追加する場合を示す。
【0068】
ステップS61では、ユーザの指示を検出する。ここでは、ユーザが、図21に示すように、軸番号jが割り当てられている座標軸の右隣にデータマイニング結果に対応する座標軸を追加する旨を入力したものとする。なお、軸番号jが割り当てられている座標軸は、フィールド番号jが割り当てられているフィールドのデータを表すための座標軸である。フィールド番号は、複数のフィールドを識別する番号である。
【0069】
ステップS62では、図22に示すように、データを再構成する。即ち、フィールド(j)とフィールド(j+1 )との間にデータマイニング結果を表すフィールド(new )を設け、そこにデータマイニング結果を書き込む。ステップS63では、座標軸(j)と座標軸(j+1 )との間に描かれている各レコードごとの線を消去する。ステップS64では、図23に示すように、座標軸(j)と座標軸(j+1 )との間にデータマイニング結果に対応する座標軸(new )を表示する。このとき、座標軸(j)と座標軸(new )との間の間隔または座標軸(new )と座標軸(j+1 )との間の間隔を適当に確保するために、座標軸(1)〜(j)または座標軸(j+1 )〜(n)およびそれらの座標軸間に描かれている各レコードの折れ線を移動させるようにしてもよい。
【0070】
ステップS65では、ステップS64で追加された座標軸(new )上に各レコード毎のデータマイニング結果を設定する。ステップS66では、レコードごとに、座標軸(j)と座標軸(new )との間および座標軸(new )座標軸(j+1 )との間の線を描画する。
【0071】
上述のようにして、データマイニングの結果が先に表示されているグラフと同じ形式で表示される。なお、データマイニングの結果として複数のフィールドを追加する場合には、図20に示す処理を繰り返せばよい。
【0072】
なお、図11または図13を参照しながらデータ形式を変換して出力する処理を説明したが、データマイニングの結果を表示するための座標軸が追加されている状態でこれらの変換処理を実行すれば、データマイニングの結果も帳票形式またはCSV形式で出力される。また、図19を参照しながら表示状態を保存する処理を説明したが、データマイニングの結果を表示するための座標軸が追加されている状態でこの保存処理を実行すれば、データマイニングに結果も同時に保存される。
【0073】
多次元データにおいては、同じ概念のフィールドが複数存在する場合がある。そして、同じ概念に属する複数のフィールド間には、互いに階層的な関係が存在する場合がある。例えば、自動車に関する多次元データにおいて、「価格」と「価格帯」とは、同じ概念に属する。この場合、「価格」は「価格帯」の下位層フィールドとなっている。以下では、同じ概念のフィールドが複数存在する場合における多次元データの表示方法について説明する。
【0074】
図24は、階層情報を付加する処理を説明する図である。この処理はコントロール部5により実行される。コントロール部5は、多次元データを受け取ると、同じ概念に複数のフィールドが属する場合があるか否かを調べる。存在する場合には、その階層関係を調べる。階層関係は、多次元データの一部として予め指定しておく。あるいは、様々な「言葉」についての階層関係を定義した辞書を予め用意しておき、コントロール部5がその辞書を参照して判断するようにしてもよい。
【0075】
コントロール部5は、多次元データに階層情報を付加する。階層情報は、フィールド群番号および階層番号から構成される。フィールド群番号は、同じ概念に属する複数のフィールドに対して1ずつ割り当てられる。図24の例では、「メーカー」と「国」とが同じフィールド群に属し、フィールド番号として「1」が割り当てられ、また、「価格帯」と「価格」とが同じフィールド群に属し、フィールド番号として「2」が割り当てられている。
【0076】
階層番号は、各フィールド群内におけるフィールド間の上下関係を表す。図24に示す例では、「メーカー」が「国」の下位階層であるため、階層番号としては、「国」に「1」が割り当てられると共に、「メーカー」に「2」が割り当てられている。同様に、「価格帯」に「1」が割り当てられると共に、「価格」に「2」が割り当てられている。このように、階層番号が小さいほど上位の階層を表し、対象データの範囲が広くなる。フィールド番号と階層番号とは、互いにハイフォンで結ばれる。なお、同じ概念に属するフィールドが他に存在しない場合には、階層情報の欄は空白となる。
【0077】
上記階層情報が付加された多次元データは、入力変換部3を介してユーザインタフェース部2に渡される。ユーザインタフェース部2は、階層情報を利用しながらその多次元データをグラフとして表示装置8に表示する。
【0078】
図25は、階層切替を示す図である。同じ概念に属するフィールドが複数存在する場合、ユーザインタフェース部2は、その中の1つのフィールドを選択して表示する。図25の左部に示す例では、同じ概念に属する「国」および「メーカー」にうちで「国」のみが表示されている。
【0079】
表示される階層を切り替えたい場合には、ユーザは、階層を切り替えたいフィールドに対応する座標軸をマウス等を用いて選択し、かつ上位側の階層あるいは下位側の階層のいずれを表示させたいのかを入力する。なお、グラフ上で直接指示を入力する構成の他にも、たとえば、階層切替の指示を入力させるためのメニュー画面を用意しておく構成であってもよい。
【0080】
ユーザインタフェース部2は、上記指示を検出すると、その指示に従って表示を切り替える。図25では、「国」を選択してその下位階層である「メーカー」を表示させる例を示している。
【0081】
図26は、表示されているフィールドの階層を切り替える処理のフローチャートである。このフローチャートの処理は、ユーザインタフェース部2により実行される。なお、ここでは、ユーザがフィールド群番号が「X」である座標軸を選択したものとする。また、「up」および「down」は、それぞれ上位階層を表示させるための指示および下位階層を表示させるための指示である。
【0082】
ステップS71は、各フィールドを1ずつ抽出してステップS72以降の処理を実行させるための処理である。ステップS72では、ステップS71で抽出したフィールドに対して階層情報として付加されているフィールド群番号を検出して、そのフィールド群番号とユーザにより選択された座標軸に対応するフィールド群番号とが一致するか否かを調べる。一致すればステップS73へ進み、一致しなければステップS71に戻って次のフィールドを抽出する。
【0083】
ステップS73では、ユーザの指示が「up」であるか否かを調べる。「up」であれば、ステップS74へ進み、「up」でなければ、「down」であると見なしてステップS75へ進む。ステップS74では、ステップS71で抽出したフィールドに付加されている階層情報の階層番号をデクリメントできるか否か調べ、可能であればデクリメントし、可能でなければステップS71に戻る。一方、ステップS75では、ステップS71で抽出したフィールドに付加されている階層情報の階層番号をインクリメントできるか否かを調べ、可能であればインクリメントし、可能でなければステップS71に戻る。ステップS76では、ユーザにより選択された座標軸上に、ステップS74またはS75において更新された階層番号を有するフィールドのデータを表示する。
【0084】
図24〜図25に示した例を上記フローチャートに当てはめて説明する。すなわち、ユーザが「国」を選択してその下位階層を表示させる場合を説明する。ユーザインタフェース部2は、まず、図24の下部に示される多次元データを参照し、ユーザが選択した座標軸に対応するフィールド群番号が「1」であることを検出する(ステップS71〜S72)。続いて、ユーザインタフェース部2は、ユーザの指示が「down」であることを認識すると、「国」に対して付加されている階層情報の階層番号をインクリメントして「1−2」を得る(ステップS73〜S75)。そして、ユーザインタフェース部2は、階層情報が「1−2」であるフィールドとして「メーカー」を抽出し、ユーザが選択した座標軸を「国」から「メーカー」に切り替える。
【0085】
次に、データマイニング方法の1つである相関分析の結果を表示する例を説明する。図27の上部は、エンジン部6による相関分析の結果の例である。この例では、ある「条件」が満たされたときに予め想定した「結果」が得られる確率などを算出している。たとえば、上段のレコードでは、パンおよびバターを買った人と牛乳およびジャムを買った人との相関関係を表すデータとして、「サポート値」および「確信度」を求めている。
【0086】
本実施例では、コントロール部5は、エンジン部6から上記相関分析の結果を受け取ると、その分析結果をグラフ形式で表示するための新しいフィールドとして「ルール番号」を追加する。ここで、「ルール」とは、相関分析において使用されている「条件」と「結果」との組合せに相当し、各レコードがそれぞれ1つのルールに対応する。図27に示す例では、上段のレコードにルール番号「1」を割り当て、下段のレコードに「2」を割り当てている。また、各ルールの条件部もしくは結果部に複数の要素(相関分析ではアイテムといわれる)が存在する場合には、コントロール部5は、それらを分解して複数のレコードに展開する。1つのルールから展開された各レコードは、互いに同じルール番号付される。コントロール部5の出力を図27に下部に示す。
【0087】
図28は、相関分析の結果をグラフ表示するために実行されるデータ変換処理のフローチャートである。このフローチャートは、コントロール部5により実行される。
【0088】
ステップS81は、分析結果のレコードを1つずつ抽出してステップS82以降を実行させる処理である。ステップS82は、ステップS81で抽出したレコードの条件部からアイテムを1つずつ抽出してステップS83以降を実行させる処理である。ステップS83は、ステップS81で抽出したレコードの結果部からアイテムを1つずつ抽出してステップS84を実行させる処理である。ステップS84では、ステップS82およびS83で抽出した各アイテム、ステップS81で抽出したレコードにおける後続の内容、およびステップS81で抽出したレコードのレコード番号を出力する。
【0089】
図27に示す例を採り上げて図28のフローチャートを説明する。まず、ステップS81において上段のレコードが抽出され、ステップS82においてそのレコードの条件部から1つ目のアイテムとして「パン」が抽出され、ステップS83においてそのレコードの結果部から1つ目のアイテムとして「牛乳」が抽出される。そして、ステップS84において、それらのアイテムと共に、「サポート値=0.40」、「確信度=0.50」、および「レコード番号=1」が出力される。このレコード番号がルール番号である。
【0090】
図29は、相関分析の結果をグラフ形式で表示した例である。このグラフは、ユーザインタフェース部2がコントロール部5の出力に基づいて表示したものである。図29に示すように、相関分析の結果を表すグラフには、コントロール部5において付与されたルール番号に対応する座標軸が設けられており、各レコード毎の線がそれぞれそのレコードに対応するルール番号を通過している。また、各ルールがアイテム毎に展開されて表示されている。なお、ここでは、相関分析の結果としてサポート値および確信度を採り上げているが、相関分析では、この他にも情報量(エントロビー)などを求めることができ、その場合、サポート値や確信度と共に情報量を同時にグラフ表示することがである。
【0091】
図30〜図31は、ある特定のフィールドにおいて所定の値を有するレコードをハイライト表示させる処理を説明する図である。本実施例のグラフ表示においては、各フィールドは座標軸として表され、また、各フィールド内における値は座標軸上の点として表される。即ち、特定のフィールドにおける所定の値は、グラフの座標軸上の点として表される。したがって、ある特定のフィールドにおける所定の値を選択するためには、そのフィールドに対応する座標軸上においてその所定値に対応する点を指定すればよい。あるいは、画面上の所望の点を入力させるためのメニューを用意しておき、それを利用するようにしてもよい。
【0092】
図30は、ユーザがグラフの座標軸上の所定の点を選択した際のユーザインタフェース部2の処理手順を示す図である。ユーザインタフェース部2は、まず、表示されている座標軸上の任意の点がユーザにより選択されたことを検出する。即ち、ユーザインタフェース部2は、ユーザにより選択されたフィールドおよびそのフィールドにおける値を検出する。ここで、ユーザインタフェース部2は、図5〜図6を参照しながら説明したように、各レコードを構成するデータを座標軸上に配置するためのマップを有している。ユーザインタフェース部2は、このマップを利用し、ユーザにより選択された点を通過するレコードを抽出する。そして、ユーザインタフェース部2は、抽出した各レコードをそれぞれハイライト表示する。
【0093】
ハイライト表示の例を図32〜図33に示す。図中、ハイライト表示されているレコードは、太い線で表されている。該当するレコードをハイライト表示させる場合には、例えば、そのレコードを表す線の色や明度を他のレコードを表す線と異なるようにする。図32は、ユーザが、「条件」に対応する座標軸上で「パン」を指定した場合のハイライト表示の例である。また、図33は、ユーザが、「ルール番号」に対応する座標軸上で「1」を指定した場合のハイライト表示の例である。
【0094】
このような表示方法を導入することにより、特定の要素(図32は、商品)や特定のルール番号を有するレコードを他のレコードと区別して表示することが可能となるので、レコード間の関係を要素に基づいて分析したり、各レコードの特徴を要素に基づいて分析する際の助けとなる。このような表示は、特に、相関分析結果の解析に役立つ。
【0095】
図31は、図30に示した手順を詳細に説明するフローチャートである。このフローチャートは、ユーザがグラフの座標軸上の所望の点を選択した後のユーザインタフェース部2の処理である。
【0096】
ステップS91では、ユーザの選択指示を検出する。すなわち、選択された座標軸の番号(フィールド番号)i、および選択されたアイテム名n(あるいは、データ値)を検出する。ステップS92は、グラフとして表示されているレコードを1つずつ抽出してステップS93以降を実行させる処理である。ステップS93では、ステップS92で抽出したレコードにおけるフィールドiのデータがステップS91で検出したアイテム名nと一致するか否かを調べる。一致した場合には、ステップS94において、そのレコードをハイライト表示する。一方、一致しなかった場合には、ステップS92に戻って次のレコードを抽出する。
【0097】
図34は、データマイニング方法の1つであるクラスタリングの結果の表示例である。クラスタリングにおいては、指定されたクラス値(教師値)に従って対象レコードが2つ以上のクラスに分けられる。図34に示す例では、6つのレコードが2つのクラスに分けられている。なお、右端の座標軸(クラスタ1)は、クラスタリングの結果を表す軸として追加されてものである。座標軸を追加する処理は、図19〜図23において説明した通りである。
【0098】
本実施例では、クラスタリング等のデータマイニング結果に基づいて各レコードを表す線の色を変化させることができる。この場合、ユーザは、図34に示すように「クラスタ1」の座標軸を選択して、色分け表示を行いたい旨の指示を入力する。各レコードを表す線がクラスタリングの結果に従って色分け表示された例を図35に示す。図35では、実線および点線を用いて互いに色が異なっていることを表している。
【0099】
図36は、色分け表示の処理を説明するフローチャートである。このフローチャートは、ユーザインタフェース部2により実行される。また、このフローチャートは、クラスタリングの結果が表示されている状態においてユーザが所望の座標軸を選択した後の処理である。
【0100】
ステップS101では、ユーザにより選択された座標軸を検出する。ステップS102では、ステップS101で検出した座標軸上の要素の数を検出する。検出された要素の数をNとする。各要素に対して要素番号(1〜N)を付与する。ステップS103は、レコードを1つずつ抽出してステップS104以降を実行させる処理である。ステップS104では、抽出したレコードを表示するための色を決定する。ここでは、色を表す3要素(H:色相、S:彩度、I:明度)のうちの色相を調整する。すなわち、第i番目の要素を含むレコードを表示する際の色合いを、「2πi/N」とする。なお、彩度と明度は最大値に設定する。ステップS105では、ステップS104により決定したHSI値に従って当該レコードを表示する。上述のようにして各レコードの色を決定すると、異なるクラスに属するレコードが互いに類似しない色で表示されるので、クラスタリング結果を色分け表示する場合、全体のクラスタの分布が理解しやすい。
【0101】
図34〜図35に示す例を採り上げて上記フローチャートを説明する。図34に示す状態で「クラスタ1」が選択されると、ステップS102において、要素数として「2」を検出する。そして、ステップS104において、クラス1に属するレコードに対して(H,S,I)=(π,1,1)が設定され、クラス2に属するレコードに対して(H,S,I)=(2π,1,1)が設定される。各レコードを表す線をこれらのHSI値に基づいて描画することにより、レコードがクラスに従って色分け表示される。
【0102】
なお、上記実施例では、クラスタリングの結果に基づいてレコードを表す線を色分け表示しているが、他のフィールドの要素に基づいて色分け表示を行ってもよい。たとえば、「国名」を選択した場合には、全レコードを表示するために6つの色が使用され、各レコードを表す線は互いに異なる色で表示される。また、上記実施例では、クラスタリングの結果に基づいてレコードを色分け表示しているが、他のデータマイニング方法による分析結果に基づいてレコードを色分け表示することも可能である。
【0103】
本実施例では、データマイニング結果として得られる要素を選択することにより、その選択された要素を有するレコードを他のレコードと区別して表示させることができる。例えば、図35に示す表示状態において、ユーザが、「クラスタ1」の座標軸上の「クラス1」を選択した場合、クラス1に属するレコード以外のレコードは、その明度または彩度が低く変化させられて暗い線として表示される。クラス1を選択して場合の表示例を図37に示す。なお、図37において、実線は通常の明るさのを表し、点線は実線を比べて暗く表示されている線を表している。
【0104】
図38は、選択された要素に従ってレコードを識別表示する処理のフローチャートである。このフローチャートは、ユーザインタフェース部2により実行される。また、このフローチャートは、クラスタリングの結果が表示されている状態においてユーザが所望の要素を選択した後の処理である。
【0105】
ステップS111では、ユーザが選択した要素(クラスタリング処理では、クラスタ)を検出する。ステップS112は、レコードを1つずつ抽出してステップS113以降を実行させる処理である。ステップS113では、抽出したレコードがユーザの選択した要素を含むか否かを調べる。含む場合には、ステップS114において、HSI値を変化させることなくそのまま設定する。含まない場合には、ステップS115において、明度または彩度の値を半分に低下させる。ここでは、明度値に0.5を乗算している。ステップS116では、ステップS114またはステップS115により決定されたHSI値に従って当該レコードを表示する。
【0106】
上述の処理により、選択された要素を含むレコードがハイライト表示されているように見える。このような表示は、クラスタリング結果を表示している状態において特定のクラスタに注目する場合に特に有効である。
【0107】
なお、上記実施例では、レコードがクラス毎に色分けされている状態において特定の要素を選択した場合を示しているが、本発明は、必ずしも予めクラス毎に色分けされている状態を前提とするわけではない。また、実施例では、クラスタリングを採り上げているが、他のデータマイニングの結果に対して適用することも可能である。
【0108】
データマイニングの中には、クラスタリング処理のように、階層が異なる複数の結果が得られるものがある。クラスタリング処理では、樹状図としてその結果を表すことができる。図39に示す樹状図では、横方向にレコード番号を並べ、複数レコードをまとめた場合のばらつきの度合い(例えば、分散値)を縦軸方向に表している。すなわち、この樹状図は、レコードをクラスタとしてグループ化する際のばらつき具合いの変化を表している。
【0109】
この樹状図上で、ばらつきの度合いの閾値を適当に指定することで、所望の数のクラスタを得ることができる。図39の中段の中央部に示す例では、2つのクラスタ(左側の4つのレコード、および右側の7つのレコード)が得られ、図39の右部に示す例では、3つのクラスタ(左側の4つのレコード、中央部の3つのレコード、および右側の4つのレコード)が得られている。
【0110】
本実施例のコントロール部5は、上述したように、データマイニングの結果をそれぞれ1つのフィールドとして多次元データに追加する。また、コントロール部5は、互いに階層が異なる複数のデータマイニング結果が得られた場合には、データマイニングの対象となった多次元データに階層情報を付与する。この階層情報は、図24〜図26を参照しながら説明したものと同じである。
【0111】
コントロール部5の出力を図39の下部に示す。ここでは、最上位の階層および最上位から2番目の階層におけるクラスタリング結果がそれぞれ1つのフィールドとして多次元データに追加されている。最上位の階層は、全レコードを2つのクラスタに分類した結果であり、最上位から2番目の階層は、全レコードを3つのクラスタに分類した結果である。なお、図39では、2つの階層のみを示しているが、更に下位の階層の結果を得ることも可能である。これらの各階層は、それぞれ1つのフィールドとして多次元データに追加されている。コントロール部5の出力は、上述した通り、入力変換部3を介してユーザインタフェース部2へ転送される。ユーザインタフェース部2は、受信したデータに従ってクラスタリングの結果を表示装置8に表示する。
【0112】
図40は、階層の異なるクラスタリング結果を切替表示させる例を示す図である。上段は、上位階層の結果を表示した例であり、下段は、下位階層の結果を表示した例である。図40の上段に示す状態において、「クラスタ1」を選択してその下位階層を表示させる指示を入力すると、図40の下段に示す表示に切り替わる。反対に、図40の下段に示す状態において、「クラスタ2」を選択してその上位階層を表示させる指示を入力すると、図40の上段に示す表示に切り替わる。
【0113】
図41は、階層の異なるクラスタリング結果を切替表示させる処理のフローチャートである。この処理は、基本的に図26に示した処理と同じであり、ユーザインタフェース部2により実行される。ただし、図41においては、クラスタリング結果として現在表示されている座標軸がユーザにより選択されている。
【0114】
クラスタリング処理では、一般に、多次元データの特徴が現れるようなクラスタ数を決めるためには試行錯誤が必要であり、また、クラスタ数の変化に応じたクラスタの分離または統合の様子を調べたい場合も多い。本実施例によれば、異なる階層のクラスタリング結果をビジュアルデータマイニングツール内に保持しておき、ユーザの指示に従ってそれらを切り換えて表示するようにしたので、クラスタ数を変化させたときの各レコードの属性などを即座に表示させることができる。このため、ユーザは、所望の分析結果に素早く到達できる。
【0115】
図39〜図41に示した実施例の応用例を図42〜図43に示す。図42〜図43に示す実施例では、クラスタリング結果としての樹状図が表示装置8に表示され、ユーザがその画面上でクラスタ数を決定するための閾値を設定できる。そして、ユーザがマウス等を用いて閾値を変化させることによってクラスタ構成が変化した場合には、その変化に連動して多次元データのグラフ表示をダイナミックに変化させる。
【0116】
図43は、樹状図上に対して設定する閾値の変化と連動させてグラフ表示を変化させる処理のフローチャートである。このフローチャートは、ユーザインタフェース部2により実行される。
【0117】
ステップS121は、データマイニングの結果を表すための座標軸を追加する処理であり、図19〜図23において説明した通りである。ステップS122以降の処理は、表示装置8に表示されている樹状図に対して設定する閾値を変化させることにより、クラスタ構成が変わった場合に実行される。
【0118】
ステップS122では、新たなクラスタ構成に対応するクラスタフィールドを作成する。このフィールドは、ステップS121で追加された座標軸上に表現される。また、その新たなクラスタ構成に属する各クラスタに対応する点をその座標軸上に設ける。各クラスタには、クラスタ番号を付与される。ステップS123では、各クラスタに属するレコード毎に表示色を決定する。色計算の処理は、図34〜図36を参照しながら説明した通りである。ステップS124では、ステップS123で計算した色情報に基づいて各レコードを描画する。
【0119】
上記実施例によれば、画面上に表示されるクラスタリング結果としての樹状図の閾値を所望の値を変化させることにより、図40に示すような表示切替を簡単に行うことができる。すなわち、たとえば、図42において、閾値を下方に変化させると、クラスタは次第に分裂していくので、最初同じ色で表示されていたレコード群が2つに分かれる様子などをダイナミックに見ることができる。このように、多次元データと樹状図との関係を詳細に知ることができる。
【0120】
次に、データマイニングの1つであるMBRによる結果をグラフ表示する例を説明する。MBR(Memory Based Reasoning)は、クラス値のわからない未知事例のクラス値を推測する分析方法の1つであり、先に分析されている既知事例の中からその未知事例と類似するk個の事例を抽出し、それら抽出した事例のクラス値に基づいて上記未知事例のクラス値を判断するものである。このとき、抽出されたk個の既知事例は、上記未知事例のクラス値を判断のための材料(理由)として出力される。MBRの一般的な処理手順を図44に示す。抽出したk個の既知事例から未知事例のクラス値を判断する際には、たとえば、多数決器が使用される。
【0121】
図45〜図47は、MBRの結果をグラフ表示する処理を説明する図である。ビジュアルデータマイニングツール上でMBRの結果を表示する場合は、まず、図45に示すように、既知事例のレコードを予め表示しておく。
【0122】
未知事例は、ここでは、「燃費」〜「年式」がわかっているが「国(または地域)」が不明であるものとする。この場合、「国」が図44に示した「クラス」に相当する。未知事例が与えられると、その未知事例の「燃費」〜「年式」のデータに基づいて、先に分析されている既知事例の中からその未知事例に近いレコードをk個抽出する。また、抽出したk個の既知事例の「国」を取り出し、多数決器を用いて「国」として最も確からしいデータを求める。ここでは、多数決の結果が「ヨーロッパ」であったものとする。上記処理は、エンジン部6により実行される。エンジン部6は、これらの結果をコントロール部5を介してビジュアルデータマイニングツール1に転送する。
【0123】
ユーザインタフェース部2は、エンジン部6からMBRによる分析結果を受け取ると、図46に示すように、抽出されたk個の既知事例を、他の既知事例から区別して表示(図中、太い線)する。また、ユーザインタフェース部2は、図47に示すように、未知事例の「国」がエンジン部6で判断されたデータ(すなわち、ヨーロッパ)であるものとして、その未知事例のレコードをグラフ上に描画する。この未知事例は、他の事例から識別可能なように例えば異なる色で表示(図中、点線)される。
【0124】
本実施例によれば、MBRの結果をビジュアルデータマイニングツール上で統一的に表示することができる。また、未知事例のクラスを判断する際に利用した材料も合わせて表示されるので、判断のプロセスおよび理由が得られる。
【0125】
次に、データマイニング方法の1つである決定木分析の結果を表示する例を説明する。決定木分析においては、図48の上部に示すように、1つのノードを分岐点とするような多分木か、あるいは、それをまとめて「if〜then」のような形式で表した複数の「ルール」が得られる。本実施例では、決定木分析の結果として得られた決定木パス、または1つのルールに基づいて、表示されているグラフ上の特定のエリアを指定することができる。
【0126】
決定木分析は、エンジン部6において実行され、その出力はコントロール部5へ渡される。決定木分析の結果は、1つ以上の決定木パスまたはif文形式のルールで表される。ここでは、これらの決定木パスまたはルールの中から1つのパスまたはルールが指定されて出力されたものとする。なお、図48に示す例では、A〜Cはそれぞれ1つのフィールドに相当し、また、「クラス」も1つのフィールドとして扱われる。
【0127】
コントロール部5は、決定木分析の結果として、1つのパスまたはルールを受け取ると、それに基づいて多次元データを表すグラフ上の範囲情報を作成する。範囲情報を模式的に表したものを図37の下部に示す。コントロール部5は、この範囲情報をビジュアルデータマイニングツール1に転送する。
【0128】
ユーザインタフェース部2は、範囲情報を受け取ると、その範囲情報を表示装置8の画面上のドットデータに変換する。すなわち、範囲情報によって与えられた範囲を多次元データを表すグラフ上にマッピングする。そして、ユーザインタフェース部2は、図49に示すように、そのマッピングされた範囲内に存在するレコードを抽出し、その抽出したレコードを他のレコードから区別して表示(図中、太い線)させる。
【0129】
このように、この実施例によれば、データマイニングにおいて得られた決定木パスやルールと実際のレコードのデータとの関係を視覚的に表示することができる。
【0130】
決定木分析では、上述したように、その結果として複数の決定木パスまたはルールが得られる。本実施例では、これらのパスまたはルールに基づいて決定木の分布をグラフ上に表示する。
【0131】
エンジン部6は、決定木分析の結果として、複数の決定木パスまたはルールを出力する際に、図50に示すように、各決定木パスまたはルールにそれぞれ識別番号(パス番号またはルール番号)を付加する。ここで、決定木パスとルールとは、基本的に同じ対象を異なる形式で表したものである。以下では決定木パスを用いて説明する。
【0132】
コントロール部5は、パス番号が付加された分析結果を受け取ると、各レコード毎に該当する決定木パスを求める。すなわち、レコード毎にフィールドA〜Cのデータを取り出し、そのレコードがどの決定木パスに該当するのかを調べる。そして、コントロール部5は、表示すべき多次元データに「パス番号」に対応すフィールドを追加し、そのフィールドに決定木分析において定義されたパス番号を書き込む。コントロール部5は、パス番号が追加された多次元データをビジュアルデータマイニングツール1に転送する。
【0133】
ユーザインタフェース部2は、パス番号が追加された多次元データを受け取ると、図51に示すように、パス番号に対応する座標軸を生成して表示し、その座標軸を利用して各レコードのパス番号を表示する。このとき、各レコードは、パス番号ごとに互いに異なる色で描かれる。色を調整する方法は、図36の処理に従う。
【0134】
この実施例によれば、データマイニングの結果として得られた決定木の分布を視覚的に見やすく表示することができる。このため、各レコードとそのレコードに対応する決定木パス(または、ルール)との関係を一目で認識できる。
【0135】
なお、上記実施例では、平行座標軸を用いて多次元データを表示しているが、他の形式のグラフを利用してもよい。たとえば、図7に示すような放射状に伸びる座標軸を用いる形式であってもよい。この場合、データマイニングの結果を表示するために座標軸を追加する処理、階層的な関係を有するデータを切り換えながら表示する処理は、基本的に、平行座標軸系のグラフにおける処理と同じである。ただし、放射状座標軸系において座標軸を追加する際には、たとえば、5フィールドから構成される多次元データにデータマイニングの結果として新たに1つのフィールドが追加される場合には、座標軸どうしの間の角度が72度であったものを60度に変更するような処理が必要となる場合がある。
【0136】
図52は、本実施例の各機能を実現するプログラムが記録された記録媒体を説明する図である。本実施例の各機能は、所定の言語で記述されたプログラムをコンピュータ101が実行することによって得られる。このプログラムは、たとえば、可搬型記録媒体102に格納されている。可搬型記録媒体102は、CD−ROM、フロッピーディスクをはじめ、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク等を含む。また、コンピュータ101が備えるRAMまたはハードディスクなどのメモリ103に上記プログラムを格納しておき、それを実行するような形態であってもよい。さらに、通信回線105を介してコンピュータ101に接続される他の装置104に上記プログラムを格納しておき、コンピュータ101が他の装置104からそのプログラムをダウンロードして実行するような形態であってもよい。
【0137】
図53は、本実施例の各機能を実現するプログラムを実行するコンピュータの構成図である。可搬型記録媒体用ドライバ111は、可搬性記録媒体102に格納されているプログラムやデータを読み出したり、あるいは可搬性記録媒体102にデータを書き込む装置である。通信制御部112は、ネットワークとの間でのデータの授受を制御するユニットである。図52に示した他の装置(プログラム提供者)104からプログラムを受信する際にはこの通信制御装置112が起動される。
【0138】
CPU113は、メモリ103または可搬性記録媒体102からプログラム等をメモリ114にロードして実行する。なお、メモリ103に記録するプログラム等は、コンピュータ101の出荷時にプレインストールしておいてもよいし、可搬性記録媒体102に格納されていたものを書き込んでもよいし、通信回線105などを介してネットワーク上の他の機器104から受信して格納するようにしてもよい。また、CPU113は、ネットワーク上に設けられた他の記憶装置に格納されているプログラムおよびデータ等を通信回線などを介して使用するようにしてもよい。
【0139】
【発明の効果】
対話的なビジュアルツールとデータマイニングエンジンとを連携させ、所定の形式で表されたグラフを利用して所望のデータマイニングエンジンを起動できるので、専門的な知識を持たなくても複数種類のデータマイニングエンジンを利用することができる。
【0140】
また、様々な種類のデータマイニングによる結果を同一の表示方法で表示するので、専門的知識がなくても複数データマイニングエンジンの結果を容易に理解することができる。
【0141】
このように、対話的な手順で、データのグラフ表示、データマイニングエンジンの起動、およびデータマイニングの結果の表示までを統一的に扱うことが可能となる。このことにより、期待する分析結果を得るための作業の付加が軽減される。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】データマイニングエンジンとの連携を示す基本構成図である。
【図3】出力形式の変換を示す基本構成図である。
【図4】データ表示ツールの全体フローチャートである。
【図5】データマイニングの対象となるデータの一例である。
【図6】多次元データを平行座標軸を用いてグラフ表示した例である。
【図7】多次元データを放射状座標軸を用いてグラフ表示した例である。
【図8】データマイニング処理の依頼から表示までの処理の流れを示す図である。
【図9】ビジュアルデータマイニングツールとコントロール部との間で授受されるデータの内容を示す図である。
【図10】グラフを帳票形式に変換した出力の例である。
【図11】多次元データを帳票形式に変換して出力する処理を説明するフローチャートである。
【図12】グラフをCSV形式に変換した出力の例である。
【図13】多次元データをCSV形式に変換して出力する処理を説明するフローチャートである。
【図14】指定されたデータに対してデータマイニングを行わせる処理の概念を説明する図である。
【図15】画面上のドットデータから各フィールド毎のデータ値への変換を説明する図である。
【図16】ユーザにより指定されたデータ範囲に含まれるレコードを抽出する処理を説明する図である。
【図17】データマイニング処理の進行状況を表示する処理を示す図である。
【図18】表示状態等を保存する処理を説明する図である。
【図19】データマイニングの結果を新たなフィールドとしてグラフに追加する実施例を示す図である。
【図20】データマイニング結果に対応する座標軸を追加してそれを利用してデータマイニング結果を表示する処理のフローチャートである。
【図21】図20に示すフローチャートの理解を助けるための図である。
【図22】図20に示すフローチャートの理解を助けるための図である。
【図23】図20に示すフローチャートの理解を助けるための図である。
【図24】階層情報を付加したデータ形式を示す図である。
【図25】階層切替を示す図である。
【図26】表示されているフィールドの階層を切替える処理のフローチャートである。
【図27】相関分析の結果をグラフ表示するための変換処理を説明する図である。
【図28】相関分析の結果をグラフ表示させるために実行されるデータ変換処理のフローチャートである。
【図29】相関分析の結果をグラフ形式で表示した例である。
【図30】ある特定のフィールドにおいて所定の値を有するレコードをハイライト表示させる処理の流れを説明する図である。
【図31】ある特定のフィールドにおいて所定の値を有するレコードをハイライト表示させる処理の流れを詳細に説明する図である。
【図32】ハイライト表示の例(その1)である。
【図33】ハイライト表示の例(その2)である。
【図34】クラスタリング結果の色分け表示の例(その1)である。
【図35】クラスタリング結果の色分け表示の例(その2)である。
【図36】クラスタリング結果に基づく色分け表示の処理のフローチャートである。
【図37】選択された要素に従ってレコードを識別表示した場合の表示例である。
【図38】選択された要素に基づいてレコードを識別表示する処理のフローチャートである。
【図39】異なる階層のクラスタリング結果を階層データとして付与する例を説明する図である。
【図40】複数のクラスタリング結果を切り替えながら表示する例を示す図である。
【図41】複数のクラスタリング結果を切り替えながら表示する処理のフローチャートである。
【図42】樹状図上に対して設定する閾値の変化と連動させてグラフ表示を変化させる例を示す図である。
【図43】樹状図上に対して設定する閾値の変化と連動させてグラフ表示を変化させる処理のフローチャートである。
【図44】MBRの処理を説明する図である。
【図45】MBRの結果をグラフ表示する処理を説明する図(その1)である。
【図46】MBRの結果をグラフ表示する処理を説明する図(その2)である。
【図47】MBRの結果をグラフ表示する処理を説明する図(その3)である。
【図48】決定木分析の結果をグラフ上の範囲情報に変換する処理を模式的に示す図である。
【図49】決定木分析の結果をグラフ表示した例である。
【図50】決定木分析の結果にパス番号を付加する処理を説明する図である。
【図51】決定木の分布を表示する処理を示す図である。
【図52】本実施例の機能を実現するプログラムが記録された記録媒体について説明する図である。
【図53】本実施例の機能を実現するプログラムが実行されるコンピュータの構成図である。
【符号の説明】
1 ビジュアルデータマイニングツール
2 ユーザインタフェース部
3 入力変換部
4 出力変換部
5 コントロール部
6 エンジン部
7 データベース部
8 表示装置
9 表示制御部
10 起動部
101 コンピュータ
102 可搬型記録媒体
103 メモリ(RAM、ハードディスクなど)
104 他の装置(プログラム提供者)
105 回線

Claims (12)

  1. 多次元データを所定の形式のグラフを用いて表示装置に表示する際に、複数のデータ項目を含むデータ列を、各データ項目がそれぞれ1本の座標軸に対応づけられておりかつ上記データ列の各データ項目のデータがそれぞれそのデータ項目に対応する座標軸上に表される形式のグラフを用いて表示装置に表示するデータ表示装置であって、
    多次元データについてのデータマイニングによる分析結果を受け取り、表示すべき多次元データにその分析結果を組み込む入力変換手段と、
    その入力変換手段の出力に基づいて上記分析結果を所定の形式のグラフを用いて上記表示装置に表示する表示制御手段と、
    上記データ列についてのデータマイニングによる分析結果に対応する1本以上の座標軸を生成し、その座標軸を上記グラフに追加する座標軸生成手段と、
    上記データ列についての相関分析において定義された各ルールに対してルール番号を付与するルール番号付与手段、を有し、
    上記座標軸生成手段は、上記相関分析による分析結果に対応する座標軸を生成して上記グラフに追加し、
    上記表示制御手段は、上記座標軸生成手段により生成された座標軸上に上記ルール番号を配置し、その座標軸を利用して各データ列を表示する
    ことを特徴とするデータ表示装置。
  2. 上記グラフは、平行座標軸系または放射状座標軸系である請求項1に記載のデータ表示装置。
  3. 上記座標軸生成手段は、上記データ列についてのデータマイニングによる分析結果が互いに階層的な関係を有する複数のデータ項目から構成されている場合、それら階層的な関係を有する複数のデータ項目に対応する座標軸を生成して上記グラフに追加し、
    上記表示制御手段は、その座標軸生成手段により生成された座標軸を利用して上記階層的な関係を有する複数のデータ項目の中の1つのデータを表示する
    ことを特徴とする請求項1に記載のデータ表示装置。
  4. 上記表示制御手段は、ユーザからの切換指示に従って上記座標軸生成手段により生成された座標軸上に上記階層的な関係を有する複数のデータ項目の中の他のデータ項目のデータを表示する請求項3に記載のデータ表示装置。
  5. 上記表示制御手段は、表示されている座標軸上のある点が指定されたことを検出すると、その点に対応するデータを有するデータ列をハイライト表示する請求項に記載のデータ表示装置。
  6. 多次元データを所定の形式のグラフを用いて表示装置に表示する際に、複数のデータ項目を含むデータ列を、各データ項目がそれぞれ1本の座標軸に対応づけられておりかつ上記データ列の各データ項目のデータがそれぞれそのデータ項目に対応する座標軸上に表される形式のグラフを用いて表示装置に表示するデータ表示装置であって、
    多次元データについてのデータマイニングによる分析結果を受け取り、表示すべき多次元データにその分析結果を組み込む入力変換手段と、
    その入力変換手段の出力に基づいて上記分析結果を所定の形式のグラフを用いて上記表示装置に表示する表示制御手段と、
    上記データ列についてのデータマイニングによる分析結果に対応する1本以上の座標軸を生成し、その座標軸を上記グラフに追加する座標軸生成手段、を有し、
    上記座標軸生成手段は、上記データ列についてのクラスタリングによる分析結果に対応する座標軸を生成して上記グラフに追加し、
    上記表示制御手段は、上記座標軸生成手段により生成された座標軸上に上記クラスタリングの結果として得られたクラスタを配置し、その座標軸を利用して各データ列を表示する
    ことを特徴とするデータ表示装置。
  7. 上記表示制御手段は、クラスタ毎に各データ列を互いに識別可能に表示する請求項に記載のデータ表示装置。
  8. 上記表示制御手段は、特定のクラスタが指定されたことを検出すると、その特定のクラスタに属するデータ列と他のクラスタに属するデータ列とを識別可能に表示する請求項に記載のデータ表示装置。
  9. 上記表示制御手段は、上記クラスタリングによる分析結果が互いに階層的な関係を有する複数のデータ項目から構成されている場合、上記座標軸生成手段により生成された座標軸を利用して上記階層的な関係を有する複数のデータ項目の中の1つのデータを表示する請求項に記載のデータ表示装置。
  10. 上記クラスタリングによる分析結果として得られる樹状図を表示する樹状図表示手段をさらに有し、
    上記表示制御手段は、上記樹状図を利用して指定された指示に従って各クラスタの表示状態を動的に変化させる請求項に記載のデータ表示装置。
  11. 複数のデータ項目を含むデータ列を、各データ項目がそれぞれ1本の座標軸に対応づけられておりかつ上記データ列の各データ項目のデータがそれぞれそのデータ項目に対応する座標軸上に表される形式のグラフを用いて表示装置に表示するデータ表示装置であって、
    上記データ列についての決定木分析において定義されるルールを表示するための座標軸を生成し、その座標軸を上記グラフに追加する座標軸生成手段と、
    上記決定木分析において定義される各ルールに対してルール番号を付与するルール番号付与手段と、
    上記座標軸生成手段により生成された座標軸上に上記ルール番号を配置し、その座標軸を利用してルール毎に互いに識別可能に各データ列を表示する表示制御手段と
    を有するデータ表示装置。
  12. 複数のデータ項目を含むデータ列を、各データ項目がそれぞれ1本の座標軸に対応づけられておりかつ上記データ列の各データ項目のデータがそれぞれそのデータ項目に対応する座標軸上に表される形式のグラフを用いて表示装置に表示するデータ表示装置であって、
    上記データ列についての決定木分析において定義される決定木パスを表示するための座標軸を生成し、その座標軸を上記グラフに追加する座標軸生成手段と、
    上記決定木分析において定義される各決定木パスに対してパス番号を付与するパス番号付与手段と、
    上記座標軸生成手段により生成された座標軸上に上記パス番号を配置し、その座標軸を利用して決定木パス毎に互いに識別可能に各データ列を表示する表示制御手段と
    を有するデータ表示装置。
JP16304997A 1997-06-19 1997-06-19 データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体 Expired - Fee Related JP4155363B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP16304997A JP4155363B2 (ja) 1997-06-19 1997-06-19 データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体
US09/922,773 US6477538B2 (en) 1997-06-19 2001-08-07 Data display apparatus and method for displaying data mining results as multi-dimensional data
US09/922,772 US6470352B2 (en) 1997-06-19 2001-08-07 Data display apparatus and method for displaying data mining results as multi-dimensional data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16304997A JP4155363B2 (ja) 1997-06-19 1997-06-19 データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPH1115895A JPH1115895A (ja) 1999-01-22
JP4155363B2 true JP4155363B2 (ja) 2008-09-24

Family

ID=15766210

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16304997A Expired - Fee Related JP4155363B2 (ja) 1997-06-19 1997-06-19 データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体

Country Status (2)

Country Link
US (2) US6477538B2 (ja)
JP (1) JP4155363B2 (ja)

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3708724B2 (ja) * 1998-09-25 2005-10-19 日本電信電話株式会社 カテゴライズ利用特徴抽出装置
US6687695B1 (en) * 1998-10-02 2004-02-03 Ncr Corporation SQL-based analytic algorithms
US6326988B1 (en) * 1999-06-08 2001-12-04 Monkey Media, Inc. Method, apparatus and article of manufacture for displaying content in a multi-dimensional topic space
JP3773092B2 (ja) * 2000-03-28 2006-05-10 日立ソフトウエアエンジニアリング株式会社 遺伝子発現パターン表示方法および装置並びに記録媒体
JP3636016B2 (ja) * 1999-12-17 2005-04-06 日本電気株式会社 クラスタ分類装置、クラスタ分類方法及びクラスタ分類用プログラムを記録した記録媒体
US6671680B1 (en) * 2000-01-28 2003-12-30 Fujitsu Limited Data mining apparatus and storage medium storing therein data mining processing program
JP2001318939A (ja) 2000-05-09 2001-11-16 Hitachi Ltd 文書処理方法及び装置並びにその処理プログラムを記憶した媒体
JP3956581B2 (ja) * 2000-05-18 2007-08-08 株式会社日立製作所 事例の類似性に基づいた推論システム
US7266510B1 (en) * 2000-09-01 2007-09-04 International Business Machines Corporation Method for graphically representing clickstream data of a shopping session on a network with a parallel coordinate system
US6996536B1 (en) * 2000-09-01 2006-02-07 International Business Machines Corporation System and method for visually analyzing clickstream data with a parallel coordinate system
US7539677B1 (en) 2000-10-09 2009-05-26 Battelle Memorial Institute Sequential pattern data mining and visualization
US6615211B2 (en) * 2001-03-19 2003-09-02 International Business Machines Corporation System and methods for using continuous optimization for ordering categorical data sets
US7659895B2 (en) * 2001-05-18 2010-02-09 International Business Machines Corporation Multidimensional visualization method
EP1402427A2 (en) * 2001-06-15 2004-03-31 Analog Design Automation Inc. Method and system for design selection by interactive visualization
JP2003178085A (ja) * 2001-12-07 2003-06-27 Fujitsu Ltd 情報収集装置及び方法並びに情報収集プログラム
US6912555B2 (en) * 2002-01-18 2005-06-28 Hewlett-Packard Development Company, L.P. Method for content mining of semi-structured documents
US20030154443A1 (en) * 2002-02-13 2003-08-14 Ncr Corporation Visual discovery tool
JP3823192B2 (ja) * 2002-04-19 2006-09-20 学校法人慶應義塾 診療支援装置、診療支援方法、及び診療支援プログラム
US7447687B2 (en) * 2002-05-10 2008-11-04 International Business Machines Corporation Methods to browse database query information
US7158983B2 (en) 2002-09-23 2007-01-02 Battelle Memorial Institute Text analysis technique
US7716167B2 (en) 2002-12-18 2010-05-11 International Business Machines Corporation System and method for automatically building an OLAP model in a relational database
US7953694B2 (en) * 2003-01-13 2011-05-31 International Business Machines Corporation Method, system, and program for specifying multidimensional calculations for a relational OLAP engine
US7053796B1 (en) * 2003-02-27 2006-05-30 Rockwell Collins, Inc. Multi-dimensional instruments for monitoring engine and system parameters
US7557805B2 (en) * 2003-04-01 2009-07-07 Battelle Memorial Institute Dynamic visualization of data streams
US7895191B2 (en) 2003-04-09 2011-02-22 International Business Machines Corporation Improving performance of database queries
JPWO2004093006A1 (ja) * 2003-04-16 2006-07-06 富士通株式会社 知識発見装置、知識発見プログラムおよび知識発見方法
US7644024B2 (en) * 2003-05-01 2010-01-05 Cognitive Engineering Associates, LLC Financial information display system
US7310780B2 (en) * 2003-08-14 2007-12-18 International Business Machines Corporation Methods, systems and computer program products for visually tethering related graphical objects
US20050144096A1 (en) * 2003-12-26 2005-06-30 Caramanna George S.Ii Financial visualization and analysis systems
JP4418693B2 (ja) * 2004-02-16 2010-02-17 株式会社イー・ファルコン 集団評価装置
US7707143B2 (en) 2004-06-14 2010-04-27 International Business Machines Corporation Systems, methods, and computer program products that automatically discover metadata objects and generate multidimensional models
US7480663B2 (en) 2004-06-22 2009-01-20 International Business Machines Corporation Model based optimization with focus regions
US7694278B2 (en) * 2004-07-09 2010-04-06 Microsoft Corporation Data cube script development and debugging systems and methodologies
US20060010058A1 (en) * 2004-07-09 2006-01-12 Microsoft Corporation Multidimensional database currency conversion systems and methods
US7533348B2 (en) * 2004-07-09 2009-05-12 Microsoft Corporation System that facilitates maintaining business calendars
US7490106B2 (en) * 2004-07-09 2009-02-10 Microsoft Corporation Multidimensional database subcubes
US20060020608A1 (en) * 2004-07-09 2006-01-26 Microsoft Corporation Cube update tool
US7451137B2 (en) * 2004-07-09 2008-11-11 Microsoft Corporation Using a rowset as a query parameter
US7533095B2 (en) * 2005-04-19 2009-05-12 International Business Machines Corporation Data mining within a message handling system
EP1899911A4 (en) * 2005-06-30 2009-08-19 Humana Inc SYSTEM AND METHOD FOR PROVIDING PERSONALIZED INFORMATION PROMOTING HEALTH
US7420561B2 (en) * 2005-07-01 2008-09-02 Honeywell International Inc. Diagnostic visual tools and methods for graphical comparison of data point and historical data density
JP2007073024A (ja) * 2005-08-11 2007-03-22 Nec Corp マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム
US7680631B2 (en) * 2005-12-12 2010-03-16 Bentley System, Inc. Method and system for analyzing linear engineering information
FR2906910B1 (fr) * 2006-10-10 2008-12-26 Criteo Sa Dispositif informatique de correlation propagative
US20080195977A1 (en) * 2007-02-12 2008-08-14 Carroll Robert C Color management system
US8276092B1 (en) * 2008-01-31 2012-09-25 Intuit Inc. Method and system for displaying financial reports
US8947434B2 (en) * 2008-07-24 2015-02-03 Chii Ying Co. Ltd. Process for determining, scaling, providing, comparative information in accurate, useful, easily recognized, and understandable manner
US8495007B2 (en) * 2008-08-28 2013-07-23 Red Hat, Inc. Systems and methods for hierarchical aggregation of multi-dimensional data sources
US8463739B2 (en) * 2008-08-28 2013-06-11 Red Hat, Inc. Systems and methods for generating multi-population statistical measures using middleware
EP2347352B1 (en) * 2008-09-16 2019-11-06 Beckman Coulter, Inc. Interactive tree plot for flow cytometry data
US9020882B2 (en) 2008-11-26 2015-04-28 Red Hat, Inc. Database hosting middleware dimensional transforms
WO2010067647A1 (ja) * 2008-12-11 2010-06-17 インターナショナル・ビジネス・マシーンズ・コーポレーション システムのモデルを変換する方法、コンピュータ・プログラム及びシステムモデル変換装置
US8930487B2 (en) 2009-05-29 2015-01-06 Red Hat, Inc. Object-based modeling using model objects exportable to external modeling tools
US9292485B2 (en) 2009-05-29 2016-03-22 Red Hat, Inc. Extracting data cell transformable to model object
US9292592B2 (en) * 2009-05-29 2016-03-22 Red Hat, Inc. Object-based modeling using composite model object having independently updatable component objects
US8417739B2 (en) * 2009-05-29 2013-04-09 Red Hat, Inc. Systems and methods for object-based modeling using hierarchical model objects
US9105006B2 (en) 2009-05-29 2015-08-11 Red Hat, Inc. Generating floating desktop representation of extracted model object
US8606827B2 (en) * 2009-05-29 2013-12-10 Red Hat, Inc. Systems and methods for extracting database dimensions as data modeling object
US9009006B2 (en) 2009-05-29 2015-04-14 Red Hat, Inc. Generating active links between model objects
TWI435056B (zh) * 2009-06-08 2014-04-21 Wistron Corp 導航優化方法、導航優化裝置及導航裝置
US9152944B2 (en) 2009-08-31 2015-10-06 Red Hat, Inc. Generating rapidly rotatable dimensional view of data objects
US20110054854A1 (en) * 2009-08-31 2011-03-03 Eric Williamson Systems and methods for generating dimensionally altered model objects
US8417734B2 (en) * 2009-08-31 2013-04-09 Red Hat, Inc. Systems and methods for managing sets of model objects via unified management interface
US9152435B2 (en) * 2009-08-31 2015-10-06 Red Hat, Inc. Generating a set of linked rotational views of model objects
US8365195B2 (en) * 2009-08-31 2013-01-29 Red Hat, Inc. Systems and methods for generating sets of model objects having data messaging pipes
US9031987B2 (en) * 2009-09-30 2015-05-12 Red Hat, Inc. Propagation of data changes in distribution operations in hierarchical database
US20110078199A1 (en) * 2009-09-30 2011-03-31 Eric Williamson Systems and methods for the distribution of data in a hierarchical database via placeholder nodes
US8996453B2 (en) * 2009-09-30 2015-03-31 Red Hat, Inc. Distribution of data in a lattice-based database via placeholder nodes
US8909678B2 (en) * 2009-09-30 2014-12-09 Red Hat, Inc. Conditioned distribution of data in a lattice-based database using spreading rules
US8984013B2 (en) * 2009-09-30 2015-03-17 Red Hat, Inc. Conditioning the distribution of data in a hierarchical database
US8396880B2 (en) * 2009-11-30 2013-03-12 Red Hat, Inc. Systems and methods for generating an optimized output range for a data distribution in a hierarchical database
US8589344B2 (en) * 2009-11-30 2013-11-19 Red Hat, Inc. Systems and methods for generating iterated distributions of data in a hierarchical database
US8315174B2 (en) * 2009-12-31 2012-11-20 Red Hat, Inc. Systems and methods for generating a push-up alert of fault conditions in the distribution of data in a hierarchical database
US9342793B2 (en) 2010-08-31 2016-05-17 Red Hat, Inc. Training a self-learning network using interpolated input sets based on a target output
US10353891B2 (en) 2010-08-31 2019-07-16 Red Hat, Inc. Interpolating conformal input sets based on a target output
US9355383B2 (en) 2010-11-22 2016-05-31 Red Hat, Inc. Tracking differential changes in conformal data input sets
US8346817B2 (en) 2010-11-29 2013-01-01 Red Hat, Inc. Systems and methods for embedding interpolated data object in application data file
US10366464B2 (en) 2010-11-29 2019-07-30 Red Hat, Inc. Generating interpolated input data sets using reduced input source objects
US8364687B2 (en) 2010-11-29 2013-01-29 Red Hat, Inc. Systems and methods for binding multiple interpolated data objects
US9489439B2 (en) 2011-02-28 2016-11-08 Red Hat, Inc. Generating portable interpolated data using object-based encoding of interpolation results
US8862638B2 (en) 2011-02-28 2014-10-14 Red Hat, Inc. Interpolation data template to normalize analytic runs
US8768942B2 (en) 2011-02-28 2014-07-01 Red Hat, Inc. Systems and methods for generating interpolated data sets converging to optimized results using iterative overlapping inputs
US8290969B2 (en) 2011-02-28 2012-10-16 Red Hat, Inc. Systems and methods for validating interpolation results using monte carlo simulations on interpolated data inputs
US9361656B2 (en) * 2012-01-09 2016-06-07 W. C. Taylor, III Data mining and logic checking tools
JP5392635B2 (ja) * 2012-02-03 2014-01-22 日本電気株式会社 多次元データ可視化装置、方法およびプログラム
US9582519B2 (en) * 2013-08-15 2017-02-28 Dassault Systemes Simulia Corp. Pattern-enabled data entry and search
US10489266B2 (en) * 2013-12-20 2019-11-26 Micro Focus Llc Generating a visualization of a metric at one or multiple levels of execution of a database workload
US11263600B2 (en) 2015-03-24 2022-03-01 4 S Technologies, LLC Automated trustee payments system
JP6532762B2 (ja) * 2015-06-02 2019-06-19 株式会社東芝 情報生成システム、装置、方法、及びプログラム
US10728109B1 (en) * 2017-03-15 2020-07-28 Illumio, Inc. Hierarchical navigation through network flow data
US10679002B2 (en) * 2017-04-13 2020-06-09 International Business Machines Corporation Text analysis of narrative documents
CN112597236B (zh) * 2020-12-04 2022-10-25 河南大学 一种基于概念格的关联规则的优化方法及可视化展示方法
US11567783B2 (en) * 2021-03-23 2023-01-31 Rockwell Automation Technologies, Inc. Data format transformation for downstream processing in a data pipeline

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675746A (en) 1992-09-30 1997-10-07 Marshall; Paul S. Virtual reality generator for use with financial information
US5884016A (en) 1993-01-11 1999-03-16 Sun Microsystems, Inc. System and method for displaying a selected region of a multi-dimensional data object
JP3282701B2 (ja) 1994-06-14 2002-05-20 日本電信電話株式会社 データベース情報ビジュアル化アプリケーションプログラム開発支援システム
US5546516A (en) 1994-12-14 1996-08-13 International Business Machines Corporation System and method for visually querying a data set exhibited in a parallel coordinate system
JPH0969107A (ja) * 1995-06-20 1997-03-11 Casio Comput Co Ltd レコード検索方法、抽出方法及びレコード抽出装置
US5970482A (en) * 1996-02-12 1999-10-19 Datamind Corporation System for data mining using neuroagents
US5966126A (en) * 1996-12-23 1999-10-12 Szabo; Andrew J. Graphic user interface for database system
US5970493A (en) * 1997-05-29 1999-10-19 Oracle Corporation Method, article of manufacture, and apparatus for generating a multi-dimensional record display
US5937408A (en) 1997-05-29 1999-08-10 Oracle Corporation Method, article of manufacture, and apparatus for generating a multi-dimensional record structure foundation
US6112194A (en) 1997-07-21 2000-08-29 International Business Machines Corporation Method, apparatus and computer program product for data mining having user feedback mechanism for monitoring performance of mining tasks
US5970464A (en) 1997-09-10 1999-10-19 International Business Machines Corporation Data mining based underwriting profitability analysis

Also Published As

Publication number Publication date
US6477538B2 (en) 2002-11-05
JPH1115895A (ja) 1999-01-22
US6470352B2 (en) 2002-10-22
US20010055018A1 (en) 2001-12-27
US20010049678A1 (en) 2001-12-06

Similar Documents

Publication Publication Date Title
JP4155363B2 (ja) データ表示装置、データ表示方法、およびデータ表示用プログラムを記録した記録媒体
JP3475690B2 (ja) 製品情報管理方法および製品情報管理システム
US10459938B1 (en) Punchcard chart visualization for machine data search and analysis system
US20200019549A1 (en) Interactive parallel coordinates visualizations
US6847979B2 (en) Conceptual factoring and unification of graphs representing semantic models
US11037342B1 (en) Visualization modules for use within a framework for displaying interactive visualizations of event data
US5335320A (en) Graphical user interface editing system
US7188091B2 (en) Rule processing system
JP4467583B2 (ja) 設計支援プログラム、設計支援方法および設計支援装置
JP2009508210A (ja) 多次元データベースを自動的に表示するためのコンピュータシステムおよび方法
US7203698B2 (en) Information relevance display method, program, storage medium and apparatus
US20110181597A1 (en) System and method of identifying and visually representing adjustable data
US20100191718A1 (en) Complex relational database extraction system and method with perspective based dynamic data modeling
JP6782858B2 (ja) 文献分類装置
US20100114355A1 (en) Method and system for management of manufacturing information
JPH10124584A (ja) 営業ナビゲーション装置
JPH11175535A (ja) 画像検索方法およびその装置およびこれを利用した検索サービス
JP4886266B2 (ja) 文献調査方法、文献調査システムおよび文献調査プログラム
JP2001282819A (ja) データマイニング装置、データマイニング処理プログラムを格納したコンピュータ可読の記憶媒体、及びデータマイニング処理プログラム
CN114450643A (zh) 用于生成自描述数据模块的方法
JPH07295776A (ja) データ配置構造変換方法およびそのシステム並びにクライアントサーバシステム
JP2000132558A (ja) 分類ルール探求式クラスター分析装置
KR102179290B1 (ko) 워크로드 데이터에 대한 이상징후 판별 방법
JP6924450B2 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
JP2571144B2 (ja) プログラム開発装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040525

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041104

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041215

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080603

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080702

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130718

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees