JP2000029910A - 階層的クラスタリングされた情報を表示するためのコンピュ―タシステムの動作方法 - Google Patents

階層的クラスタリングされた情報を表示するためのコンピュ―タシステムの動作方法

Info

Publication number
JP2000029910A
JP2000029910A JP11178608A JP17860899A JP2000029910A JP 2000029910 A JP2000029910 A JP 2000029910A JP 11178608 A JP11178608 A JP 11178608A JP 17860899 A JP17860899 A JP 17860899A JP 2000029910 A JP2000029910 A JP 2000029910A
Authority
JP
Japan
Prior art keywords
display area
node
data structure
computer system
displaying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11178608A
Other languages
English (en)
Other versions
JP3554676B2 (ja
Inventor
John Wils Graham
ジョン ウィルズ グラハム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JP2000029910A publication Critical patent/JP2000029910A/ja
Application granted granted Critical
Publication of JP3554676B2 publication Critical patent/JP3554676B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • G06F16/287Visualization; Browsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 階層的クラスタリングされたデータのビュー
を生成し表示する技術を改善する。 【解決手段】 コンピュータシステムのメモリに記憶さ
れているツリーのノードをたどり、所定の非類似度を有
するノードに到達するまで、表示領域を再帰的に分割す
る。このような所定の非類似度までの再帰的分割によ
り、データクラスタをよりよく視覚化するツリーマップ
が得られる。その理由は、結果として得られるグルーピ
ング(グループ分け)は、より密接にクラスタの類似性
に関係しているからである。また、従来技術のようにデ
ータ項目のまとめられたグループの表現を表示するだけ
でなく、ツリー内のすべてのデータ項目を記号的に表示
すると有効であることが分かる。この技術は、もとにな
るデータを分析するユーザに、さらに有用な情報を提供
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データ視覚化に関
し、特に、階層的クラスタリングされたデータのビュー
を、コンピュータを用いて生成し表示することに関す
る。
【0002】
【従来の技術】コンピュータ化されたデータ分析におけ
る共通の問題は、項目を記述するいくつかの変数に基づ
いて、類似の項目のグループ(クラスタ)を形成するこ
とである。例えば、ビジネス環境では、精度のよいマー
ケティングのために顧客グループを形成することがしば
しば重要となる。クラスタリングの全般的な目標は、デ
ータを記述する変数を用いてデータをいくつかのクラス
に分け、各クラスは互いに類似した要素を含むとともに
他のクラスの要素とは類似しないようにすることであ
る。クラスタリングを実行するための多くの知られた技
術がある。最も一般的な技術の1つは階層的クラスタリ
ングと呼ばれるものである。
【0003】階層的クラスタリングは、いくつかの従来
技術とは異なり、結果として得られるクラスタの数があ
らかじめ定義されていることを要求しない。代わりに、
階層的クラスタリング法は、もとのデータ項目がリーフ
(葉)となり、内部ノード(節点)が項目のクラスタを
表すような二進ツリー(二分木)を作成する。各内部ノ
ードには、そのノードの子クラスタの2つのセットの間
の非類似性の尺度の表現も格納される。二進ツリーが作
成された後、データを分析するユーザは、クラスタリン
グアルゴリズムを再実行することを必要とせずに、与え
られた非類似性のレベルでツリーを切断して、さまざま
な個数のグループのクラスタリングを作成することがで
きる。このように、クラスタリングアルゴリズムを再実
行することを必要とせずにツリーを切断することができ
ることは、大きいデータセットを調べる際に非常に重要
である。これにより、ユーザは、非常に遅いかもしれな
いアルゴリズムを大きいデータセットに対して一度実行
した後、アルゴリズムを再実行してツリー構造を再作成
することを必要とせずに、作成された構造をさまざまな
方法で調べることができるからである。階層的クラスタ
リングを実行する方法は当業者に周知であるため、ここ
では詳細には説明しない。このような方法は、"Cluster
Analysis", Everitt, B. S., 3rd ed., Halsted Pres
s, NY (1993)、に記載されている。階層的クラスタリン
グを実行するのに用いられる具体的方法は本発明にとっ
て重要ではない。
【0004】適当な階層的クラスタリング方法を用いて
ツリー構造が作成された後、そのツリーを視覚化しなけ
ればならない。すなわち、ツリーの表現を生成し、ユー
ザのためにコンピュータスクリーン上に表示しなければ
ならない。階層的クラスタリングアルゴリズムの結果を
視覚化する1つの技術は、単に、ツリー構造のビューを
生成し表示することである。しかし、この技術は、中程
度のサイズのデータセットの場合でも非常に面倒とな
る。
【0005】さらによい技術は、ツリーマップ(tree-ma
p)を生成し表示することである。これは、スクリーン空
間を最大限に利用するような、ツリーを視覚化する技術
である。基本バージョンは、指定された長方形領域をと
り、ツリー構造に基づいてそれを再帰的に分割してい
く。この方法は、ツリーの第1レベルを見て、ビュー領
域を横にn個の長方形に分割する。ただし、nは、第1
ノードの子の数である。各長方形は、各子ノードの下の
サブツリーのサイズに比例する面積が割り当てられる。
次に、この方法は、ツリーの次のレベルを見て、各ノー
ドに対して、領域を再帰的に縦に分割することを除いて
は同じアルゴリズムを実行する。アルゴリズムは、指定
された最大深さに到達する場合か、または、リーフノー
ドに到達する場合が生じるまで、交互(横と縦)の方向
にこの部分分割を続ける。いずれの場合でも、その後、
そのノードに対する長方形領域が、ユーザ指定の特性
(例えば、色、シェーディング、ラベル)により描画さ
れる。ツリーマップを生成するアルゴリズムは当業者に
周知であり、"Tree Visualization with Tree Maps; a2
D Space-Filling Approach", Schniederman, ACM Trans
actions on Graphics,January 1992、に記載されてい
る。
【0006】
【発明が解決しようとする課題】本発明は、階層的クラ
スタリングされたデータのビューを生成し表示する技術
を改善する。
【0007】
【課題を解決するための手段】具体的には、ツリーマッ
プの生成は、与えられたレベルで非類似性にかかわらず
にツリーを切断する従来技術とは異なり、データクラス
タの非類似性の尺度に基づいて表示グループ分けを生成
することによって、改善される。
【0008】本発明の一実施例によれば、コンピュータ
システムのメモリに記憶されているツリーのノードをた
どり、所定の非類似度を有するノードに到達するまで、
表示領域を再帰的に分割する。このような所定の非類似
度までの再帰的分割により、データクラスタをよりよく
視覚化するツリーマップが得られる。その理由は、結果
として得られるグルーピング(グループ分け)は、より
密接にクラスタの類似性に関係しているからである。こ
のような視覚化により、もとになるデータを分析するユ
ーザに、より有用な情報が伝えられる。
【0009】本発明のもう1つの特徴によれば、従来技
術のようにデータ項目のまとめられたグループの表現を
表示するだけでなく、ツリー内のすべてのデータ項目を
記号的に表示すると有効であることが分かる。この技術
は、もとになるデータを分析するユーザに、さらに有用
な情報を提供する。
【0010】本発明のもう1つの特徴によれば、従来技
術に従ってこれまで行われたように縦横の分割を交互に
行うのではなく、ツリーマップを長方形の長いほうの軸
に沿って再帰的に分割する。長方形の長いほうの軸に沿
って分割することににより、より正方形に近い長方形か
らなるツリーマップが得られる。これは、細長い長方形
が生じがちな従来技術とは異なる。本発明を用いること
により得られる正方形に近い長方形により、ユーザは、
もとになるデータを容易に視覚化することができる。
【0011】本発明のさらにもう1つの特徴によれば、
非類似性のレベルが変更され新しいツリーマップが生成
された場合、データ項目はツリーマップの同じ相対位置
にとどまる。変更されるのは、データ項目の周りのグル
ープ分けの表示のみである。本発明のこの特徴により、
異なる非類似性レベルのグループの比較がうまくできる
ようになる。
【0012】
【発明の実施の形態】本発明は、任意のタイプの周知の
コンピュータシステム上に実現可能である。ここでは、
コンピュータという用語は、データを受け取り、所定の
処理をそのデータに適用し、その処理の結果を生成する
ことが可能な任意の装置あるいはマシンを含む。本発明
の機能は、当業者に周知のタイプの、プログラムされた
ディジタルコンピュータによって実行される。その例を
図1に示す。図1において、コンピュータシステム10
0は、ディスプレイモニタ(ディスプレイ装置、ディス
プレイスクリーン)102、テキスト入力デバイス(例
えばキーボード)104、グラフィカル入力デバイス
(例えばマウス)106、コンピュータプロセッサすな
わちCPU108、メモリユニット110、および不揮
発性記憶装置(外部記憶装置。例えばディスクドライ
ブ)120を有する。メモリユニット110は、例え
ば、コンピュータプログラムコードおよびデータを記憶
する。コンピュータプロセッサ108は、ディスプレイ
モニタ102、メモリユニット110、不揮発性記憶装
置120、キーボード104、およびマウス106に接
続される。外部記憶装置120は、データおよびコンピ
ュータプログラムコードを記憶するために用いられる。
コンピュータプロセッサ108は、メモリユニット11
0に記憶されているコンピュータプログラムコードを実
行する。実行中に、プロセッサは、メモリユニット11
0および不揮発性記憶装置120に記憶されているデー
タにアクセスすることが可能である。コンピュータシス
テム100は、メインフレームコンピュータ、ミニコン
ピュータ、ワークステーション、あるいはパーソナルコ
ンピュータのような当業者に周知の任意のタイプの適当
なものが可能である。もちろん当業者には認識されるよ
うに、コンピュータシステムに含まれるその他の多くの
コンポーネントがあるが、明確化のために図1には図示
しない。さらに、当業者には認識されるように、多くの
変更およびコンポーネント置換を図1のコンピュータシ
ステムに対して行うことが可能である。
【0013】表1に、本発明の説明に用いるサンプルデ
ータを示す。この表は、7種類の動物に関するデータか
らなり、それらの相対サイズと脚の本数を含む。
【表1】
【0014】図2に、表1のデータに階層的クラスタリ
ング方法を適用して得られるツリー200を示す。上記
のように、周知の階層的クラスタリング方法のうちの任
意のものを用いて、図2のツリーのようなツリーを作成
することが可能である。異なる階層的クラスタリング方
法は多少異なるツリーを生成することがあるが、ツリー
の基本構造は同一である。内部ノードA、B、C、D、
E、Fは、データ項目のクラスタを表すクラスタノード
である。例えば、クラスタノードCは、データ項目「ネ
コ」および「イヌ」のクラスタを表す。クラスタノード
Dは、データ項目「ヘビ」およびクラスタノードCのク
ラスタを表す。内部ノードは、子ノード間の非類似度が
付される。例えば、ノードDは非類似度4.5を有し、
ノードBは非類似度2.0を有する。これは、「ヒト」
が「カンガルー」に類似する程度のほうが、「ヘビ」が
「ネコ」−「イヌ」対に類似する程度より類似性が高い
ことを意味する。図2のツリー構造は、周知のデータ表
現技術を用いてコンピュータシステム100のメモリ1
10に記憶される。
【0015】図2のツリーが与えられると、本発明は、
そのクラスタリングを視覚化する改善された技術を提供
する。発明者の認識するところでは、階層的クラスタリ
ングを視覚化する従来のツリーマップ法はいくつかの問
題点を有する。従来のツリーマップ法の問題点の1つ
は、クラスタの非類似度が利用されないことである。ユ
ーザは、異なる深さでツリーを切断することに基づいて
表示グループを作成することができるだけである。例え
ば、図2のツリーを考える。従来技術を用いると、ユー
ザは、深さ2、すなわちノードEおよびAでツリーを切
断すれば、次のようなグループを得ることができる。 D:ネコ−イヌ−ヘビ(Eの左側子ノード) B:カンガルーーヒト(Eの右側子ノード) ウマ(Aの左側子ノード) ウシ(Aの右側子ノード) このグループ分けから得られるツリーマップを図3に示
す。グループ「ウマ」、「ウシ」、D、およびBが示さ
れている。ここで、このグループ分けは、「ウシ」と
「ウマ」を分割しているが、これは好ましくない。その
理由は、これらは互いに非常に類似している(すなわ
ち、これらの非類似度は1.0である)からである。し
かし、従来のツリーマップ法は、非類似度に基づいてグ
ループを作成することができないため、ツリー深さに基
づくグループ分けが、できる最善のことになっている。
【0016】従来のツリーマップのもう1つの問題点
は、ツリーマップが、データ項目のまとめられたグルー
プしか示さないことである。例えば、図3では、ツリー
マップにグループDおよびBが示されているが、これら
のグループDおよびBを構成する個々のデータ項目は示
されていない。発明者が認識するところでは、まとめら
れたグループよりも個々のデータ項目を示すことのほう
が有益である。
【0017】従来のツリーマップのもう1つの問題点
は、縦横の分割を交互にすると、ツリー深さはうまく示
されるが、もとになるツリーがアンバランスのときに非
常に細長い長方形が作成される傾向がある。このことは
図3に見られる。本発明の1つの特徴によれば、縦横の
分割を交互にする代わりに、表示領域は、長方形の長い
ほうの軸に沿って分割され、結果として得られる長方形
が、他方の軸に沿って切る場合よりも正方形に近くなる
ようにする。
【0018】従来のツリーマップに対するこれらの改善
を実現するために本発明を実施する1つの方法を図4〜
図8を参照して以下で説明する。改善された方法は以下
のように記述される。まず、流れ図(ず4)のステップ
について、具体例を参照せずに一般的に説明する。この
説明の目的は、本発明の方法に一般的なコンテクストを
与え、抽象的に実行されるステップを一般的に説明する
ことである。この説明の後に、流れ図のステップについ
て、図2のツリー例の処理に関してさらに詳細に説明す
る。この説明は、本発明の方法の詳細な例を与える。
【0019】プログラムされたコンピュータによって実
行されるステップを示す流れ図を図4に示す。周知のよ
うに、コンピュータによって実行されるステップは、メ
モリ110に記憶されプロセッサ108によって実行さ
れる適当なコンピュータプログラムコードによって実現
することができる。以下の説明が与えられれば、当業者
は、プログラムされたディジタルコンピュータを利用し
て本発明を直ちに実装することができるはずである。
【0020】図4の説明に戻って、ステップ402で、
与えられた表示領域を分割するルーチンが呼び出され
る。分割ルーチンは、呼び出されるときに、いくつかの
変数が渡される。第1に、ノードnが渡される。これ
は、処理されるノードである。最初に呼び出されると
き、ノードnはツリーの最高レベルのルート(根)ノー
ドである。また、長方形の座標も渡される。この長方形
は、最初は、ツリーマップの視覚化が表示されることに
なるディスプレイ装置102の表示領域を定義する。ま
た、ブール変数CLUSTER_DRAWNも渡される。この変数
は、この分割ルーチンの最初の呼出しの前にFalse
(偽、F)に初期化される。最後に、変数CRITICAL_VAL
UEが渡される。この変数は、この方法がグループ分けを
表示する際の非類似性のレベルを示す。
【0021】ステップ404で、CLUSTER_DRAWNが偽で
ありかつノードnの非類似度がCRITICAL_VALUEより小さ
いかどうかを判断する。ステップ404のテストがYe
sである場合、ステップ406で、グループ長方形を現
在定義された長方形の周に沿って描画する。ステップ4
08で、CLUSTER_DRAWNをTrue(真、T)にセットす
る。
【0022】ステップ410で、現在のノードがリーフ
ノードであるかどうかを判断する。リーフノードである
場合、制御はステップ424に移り、ノード(すなわち
データ項目)のグリフ(すなわち記号)が現在の長方形
内に描画され、制御はステップ426に移る。ステップ
410で現在のノードがリーフノードでないと判断され
た場合、ステップ412で、分割比を計算する。このス
テップは、長方形のどこで分割するかを計算する。この
計算は、結果として得られる長方形に、現在のノードの
各子の下のサブツリーのサイズに比例する面積を割り当
てるように行われる。
【0023】ステップ414で、現在の長方形の幅が現
在の長方形の高さより大きいかどうかを判断する。幅が
高さより大きい場合、ステップ418で、縦分割となる
分割を計算する。幅が高さより大きくない場合、ステッ
プ416で、横分割となる分割を計算する。これらのス
テップ414、416、418は、表示領域を長方形の
長いほうの軸に沿って分割するという上記の本発明の特
徴を実現する。これにより、従来技術のように縦軸と横
軸で交互に切る場合よりも長方形が正方形に近くなる。
【0024】ステップ420で、分割ルーチンは現在の
ノードの子ノードa(すなわち左側の子)に対して再帰
的に呼び出される。ステップ422で、分割ルーチンは
現在のノードの子ノードb(すなわち右側の子)に対し
て再帰的に呼び出される。分割ルーチンはステップ42
6で終了する。なお、再帰的サブルーチン呼出しは、サ
ブルーチンが自分自身を呼び出すものである。再帰は、
計算機科学における周知の技術である。
【0025】次に、図4の方法ステップを、図5〜図8
および図2のツリー例とともにさらに詳細に説明する。
図5〜図7は、ツリーの進行中の処理を説明し、表示領
域長方形の再帰的分割を例示する。図8は、処理中の再
帰のレベルを説明する。
【0026】図4と、図2のツリーの説明に戻って、ユ
ーザは、図2のツリーを処理しようとしており、非類似
レベル5でデータをグループ分けしようとしていると仮
定する。分割ルーチンがステップ402で呼び出され、
次のパラメータが渡される。 ・ノードの識別F ・最初の長方形の座標 ・Falseに初期化されたCLUSTER_DRAWN変数 ・所望の非類似性グループ分けレベルを示すCRITICAL_V
ALUE=5 図8に、処理中の再帰のレベルを示す。分割ルーチンが
ノードFで最初に呼び出されると、処理は、ブロック6
02で指定される再帰レベルで行われる。
【0027】図5〜図7は、CLUSTER_DRAWN変数の値
(列504)と、分割ルーチンの各再帰呼出しに対する
表示領域の分割の変化図(列506)を示す。現在処理
されているノードは列502に示す。図4のステップ4
04で、CLUSTER_DRAWN=Falseかつ非類似度<CRITICAL_
VALUEであるかどうかを判断する。CLUSTER_DRAWN=False
であるが、ノードFの非類似度は8.9でありCRITICAL
_VALUE=5より小さくないため、このテストはNoを返
す。
【0028】制御はステップ410に移る。ステップ4
10で、現在のノードFがリーフノードでないと判定さ
れ、ステップ412で、分割比を計算する。分割比は、
子ノードaのデータ項目(すなわちリーフ)の数と、子
ノードbのデータ項目の数の比として計算される。従っ
て、この例では、ノードFを処理すると、比は5:2と
なる。ステップ414で、現在の長方形の幅が高さより
大きいかどうかを判定する。図5の列506に示すよう
に、最初の長方形508は幅が高さより大きいため、ス
テップ414のテストはYesとなり、制御はステップ
418に移る。ステップ418で、長方形分割は縦分割
として計算される。すなわち、最初の長方形を、5:2
の比で縦に分割するように計算される。この長方形51
0を分割線511とともに図5に示す。この行の列50
6は、ノードFの処理を示す。なお、長方形は、これら
の長方形分割が計算のみであることを表すために点線で
示されている。グループ分け長方形の実際の描画は、所
望の非類似レベルに到達するまで実行されない。グルー
プ長方形の実際の描画はステップ406で実行される。
これは、ステップ404のテストが真であるときにのみ
実行される。
【0029】処理ステップの説明に戻って、制御はステ
ップ420に移る。ステップ420で、分割ルーチン
は、現在処理されているノードの子ノードaに対して再
帰的に呼び出される。現在処理されているノードはノー
ドFであり、従って、分割ルーチンはノードEに対して
再帰的に呼び出される。前述のように、分割ルーチンが
呼び出されるときに、いくつかのパラメータを渡さなけ
ればならない。再帰的に呼び出されるときにもこれらの
パラメータは渡される。そこで、今の場合、分割ルーチ
ンは、 ・ノードE。これは、これから処理されるノードであ
る。 ・ノードFの処理中に分割された長方形の左側512の
座標。これは、現在処理されているノードであるノード
Fの子ノードa(すなわちノードE)に対応する長方形
であるからである。 ・ブール変数CLUSTER_DRAWN。この値は今回もFalseであ
る。 ・CRITICAL_VALUE=5。 を渡すことによって呼び出される。
【0030】ノードEの処理中の再帰のレベルは、図8
にレベル604として示されている。ステップ404の
テストは今度も偽である。CLUSTER_DRAWN=Falseである
が、ノードEの非類似度は5.3であり、これはCRITIC
AL_VALUE=5より小さくないからである。制御はステッ
プ410に移る。ステップ410で、ノードEはリーフ
ノードでないと判定され、ステップ412で上記のよう
に分割比3:2が計算される。処理中の長方形512は
幅が高さより大きいため、ステップ418で、分割比
3:2での縦分割が計算される。この計算された分割
は、ノードEに対して、図5の長方形516の分割線5
14として表されている。
【0031】処理ステップの説明に戻って、制御はステ
ップ420に移る。ステップ420で、分割ルーチン
は、現在処理されているノードの子ノードaに対して再
帰的に呼び出される。現在処理されているノードはノー
ドEであり、従って、分割ルーチンはノードDに対して
再帰的に呼び出される。今の場合、分割ルーチンは、以
下のパラメータを渡すことによって呼び出される。 ・ノードD。これは、これから処理されるノードであ
る。 ・ノードEの処理中に分割された長方形の左側518の
座標。これは、現在処理されているノードであるノード
Eの子ノードa(すなわちノードD)に対応する長方形
であるからである。 ・ブール変数CLUSTER_DRAWN。この値は今回もFalseであ
る。 ・CRITICAL_VALUE=5。
【0032】ノードDの処理中の再帰のレベルは、図8
にレベル606として示されている。図4の処理ステッ
プの説明に戻って、ステップ404のテストは今度は真
である。CLUSTER_DRAWN=Falseであり、かつ、ノードD
の非類似度は4.5であって、これはCRITICAL_VALUE=
5より小さいからである。制御はステップ406に移
る。ステップ406で、グループ長方形を現在の長方形
の周に沿って描画する。今の場合、ノードDの処理に関
して図5に示された実線の長方形520によって図示さ
れるように、グループ長方形は長方形518の周に沿っ
て描画される。実線の長方形520は、長方形分割の計
算のみを表す点線と区別して、表示領域における長方形
の実際の描画を表す。なお、グループ長方形を描画する
さまざまな方法が使用可能である。図5〜図7の例で
は、グループ長方形を示すために境界を描画している。
代替法の例として、グループは、そのグループに関する
追加情報を伝えることが可能な色/テクスチャパターン
で長方形の内部をフィルする(塗りつぶす)ことによっ
て指定することも可能である。
【0033】処理はステップ408に進み、変数CLUSTE
R_DRAWNは真にセットされる。この変数値の変化は、図
5の列504でノードDの処理に関してF→Tとしても
表されている。
【0034】処理はステップ410に進む。現在のノー
ドはリーフノードではないため、現在の長方形は、ステ
ップ414〜418に関して前述したように再び分割さ
れる。現在の長方形のこのさらなる分割は、図5では、
長方形518を縦に分割する点線522によって示され
ている。
【0035】ステップ420で、分割ルーチンはノード
Dの子ノードaに対して再帰的に呼び出される。現在処
理されているノードはノードDであり、従って、分割ル
ーチンはリーフノード「ヘビ」に対して再帰的に呼び出
される。今の場合、分割ルーチンは、以下のパラメータ
を渡すことによって呼び出される。 ・ノード「ヘビ」。これは、これから処理されるノード
である。 ・ノードDの処理中に分割された長方形の左側524の
座標。これは、現在処理されているノードであるノード
Dの子ノードa(すなわちノード「ヘビ」)に対応する
長方形であるからである。 ・ブール変数CLUSTER_DRAWN。この値は今回はTrueであ
る。 ・CRITICAL_VALUE=5。
【0036】ノード「ヘビ」の処理中の再帰のレベル
は、図8にレベル608として示されている。図4の処
理ステップの説明に戻って、ステップ404のテストは
今度は偽である。ノード「ヘビ」の非類似度は0であっ
て、これはCRITICAL_VALUE=5より小さいが、CLUSTER_
DRAWN=Trueであるからである。なお、ノード「ヘビ」の
非類似度が0であるのは、定義により、項目は自分自身
との非類似度が0であるためである。制御はステップ4
10に移る。現在のノードがリーフノードであるため、
制御はステップ424に移る。ステップ424で、ノー
ド「ヘビ」のグリフ(snakeのS)が現在の長方形内に
描画される。これは、図5でノード「ヘビ」の処理に関
してグリフ526として示されている。なお、グリフを
描画する任意の方法が使用可能である。例えば、グリフ
は、テキスト名、シンボル、あるいはカラーコード化さ
れた円などの形状として描画することが可能である。ま
た、グリフを、どのグループに含まれるかに応じて異な
るように描画することも可能である。今の例の説明に戻
って、制御は次にステップ426に移り、図8に示すよ
うに、再帰レベル608は終了し、処理は再帰レベル6
06に戻る。再帰レベル606に戻ることにより、制御
はステップ422に移る。ステップ422で、分割ルー
チンがノードDの子ノードbに対して再帰的に呼び出さ
れる。
【0037】分割ルーチンは、以下のパラメータを渡す
ことによってノードCに対して再帰的に呼び出される。 ・ノードC。これは、これから処理されるノードであ
る。 ・ノードDの処理中に分割された長方形528の座標。
これは、現在処理されているノードであるノードDの子
ノードb(すなわちノードC)に対応する長方形である
からである。 ・ブール変数CLUSTER_DRAWN。この値は今回もTrueであ
る。これは、再帰レベル606から渡され、このレベル
は、ノードDを処理し、この値をF→Tと変えたからで
ある。 ・CRITICAL_VALUE=5。
【0038】ノードCの処理中の再帰のレベルは、図8
にレベル610として示されている。図4の処理ステッ
プの説明に戻って、ステップ404のテストは今度は偽
である。ノードCの非類似度は3.0であり、これはCR
ITICAL_VALUE=5より小さいが、CLUSTER_DRAWN=Trueで
あるからである。
【0039】処理はステップ410に進む。現在のノー
ドはリーフノードではないため、現在の長方形は、ステ
ップ414〜418に関して前述したように再び分割さ
れる。現在の長方形のこのさらなる分割は、図6では、
長方形を横に分割する点線530によって示されてい
る。
【0040】ステップ420で、分割ルーチンはノード
Cの子ノードaに対して再帰的に呼び出される。今の場
合、分割ルーチンはリーフノード「ネコ」に対して再帰
的に呼び出される。ここで、分割ルーチンは、以下のパ
ラメータを渡すことによって呼び出される。 ・ノード「ネコ」。これは、これから処理されるノード
である。 ・ノードCの処理中に分割された長方形532の座標。
これは、現在処理されているノードであるノードCの子
ノードa(すなわちノード「ネコ」)に対応する長方形
であるからである。 ・ブール変数CLUSTER_DRAWN。この値は今回はTrueであ
る。 ・CRITICAL_VALUE=5。
【0041】ノード「ネコ」の処理中の再帰のレベル
は、図8にレベル612として示されている。図4の処
理ステップの説明に戻って、ステップ404のテストは
今度は偽である。ノード「ネコ」の非類似度は0であっ
て、これはCRITICAL_VALUE=5より小さいが、CLUSTER_
DRAWN=Trueであるからである。制御はステップ410に
移る。現在のノードがリーフノードであるため、制御は
ステップ424に移る。ステップ424で、ノード「ネ
コ」のグリフ(catのC)が現在の長方形532内に描
画される。これは、図6でノード「ネコ」の処理に関し
てグリフ534として示されている。制御は次にステッ
プ426に移り、図8に示すように、再帰レベル612
は終了し、処理は再帰レベル610に戻る。再帰レベル
610に戻ることにより、制御はステップ422に移
る。ステップ422で、分割ルーチンがノードCの子ノ
ードb(すなわちノード「イヌ」)に対して再帰的に呼
び出される。従って、処理は次に再帰レベル614に入
る。
【0042】分割ルーチンは、以下のパラメータを渡す
ことによって呼び出される。 ・ノード「イヌ」。これは、これから処理されるノード
である。 ・ノードCの処理中に分割された長方形536の座標。
これは、現在処理されているノードであるノードCの子
ノードb(すなわちノード「イヌ」)に対応する長方形
であるからである。 ・ブール変数CLUSTER_DRAWN。この値はTrueである。 ・CRITICAL_VALUE=5。
【0043】ノード「イヌ」の処理中の再帰のレベル
は、図8にレベル614として示されている。図4の処
理ステップの説明に戻って、ステップ404のテストは
今度は偽である。ノード「イヌ」の非類似度は0であっ
て、これはCRITICAL_VALUE=5より小さいが、CLUSTER_
DRAWN=Trueであるからである。制御はステップ410に
移る。現在のノードがリーフノードであるため、制御は
ステップ424に移る。ステップ424で、ノード「イ
ヌ」のグリフ(dogのD)が現在の長方形536内に描
画される。これは、図6でノード「イヌ」の処理に関し
てグリフ538として示されている。制御は次にステッ
プ426に移り、図8に示すように、再帰レベル614
は終了し、処理は再帰レベル610に戻る。再帰レベル
610に戻ることにより、制御はステップ426に移
り、処理は再帰レベル606に戻る。再帰レベル606
に戻ることにより、制御はステップ426に移り、処理
は再帰レベル604に戻る。再帰レベル604に戻るこ
とにより、制御はステップ422に移り、ノードEの子
ノードb(すなわちノードB)の処理が行われる。
【0044】分割ルーチンは、ノードBに対して再帰的
に呼び出される。今の場合、分割ルーチンは、以下のパ
ラメータを渡すことによって呼び出される。 ・ノードB。これは、これから処理されるノードであ
る。 ・ノードEの処理中に分割された長方形540の座標。
これは、現在処理されているノードであるノードEの子
ノードb(すなわちノードB)に対応する長方形である
からである。 ・ブール変数CLUSTER_DRAWN。この値は今回はFalseであ
る。これは、再帰レベル604から渡され、このレベル
は、ノードEを処理し、このレベルではCLUSTER_DRAWN
の値はまだFalseであるからである(図5で、ノードE
の処理に関して列504を参照)。 ・CRITICAL_VALUE=5。
【0045】ノードBの処理中の再帰のレベルは、図8
にレベル616として示されている。図4の処理ステッ
プの説明に戻って、ステップ404のテストは今度は真
である。ノードBの非類似度は2.0であり、これはCR
ITICAL_VALUE=5より小さく、しかも、CLUSTER_DRAWN=
Falseであるからである。制御はステップ406に移
る。ステップ406で、グループ長方形542を現在の
長方形540の周に沿って描画する。この実線の長方形
542は、長方形分割の計算のみを表す点線と区別し
て、表示領域における長方形の実際の描画を表す。
【0046】処理はステップ408に進み、変数CLUSTE
R_DRAWNは真にセットされる。この変数値の変化は、図
6の列504でノードBの処理に関してF→Tとしても
表されている。
【0047】処理はステップ410に進む。現在のノー
ドはリーフノードではないため、現在の長方形は、ステ
ップ414〜418に関して前述したように再び分割さ
れる。現在の長方形のこのさらなる分割は、図6では、
長方形を横に分割する点線544によって示されてい
る。
【0048】ステップ420で、分割ルーチンはノード
Bの子ノードaに対して再帰的に呼び出される。すなわ
ち、分割ルーチンはリーフノード「ヒト」に対して再帰
的に呼び出される。今の場合、分割ルーチンは、以下の
パラメータを渡すことによって呼び出される。 ・ノード「ヒト」。これは、これから処理されるノード
である。 ・ノードBの処理中に分割された長方形の左側546の
座標。これは、現在処理されているノードであるノード
Bの子ノードa(すなわちノード「ヒト」)に対応する
長方形であるからである。 ・ブール変数CLUSTER_DRAWN。この値は今回はTrueであ
る。 ・CRITICAL_VALUE=5。
【0049】ノード「ヒト」の処理中の再帰のレベル
は、図8にレベル618として示されている。図4の処
理ステップの説明に戻って、ステップ404のテストは
今度は偽である。ノード「ヒト」の非類似度は0であっ
て、これはCRITICAL_VALUE=5より小さいが、CLUSTER_
DRAWN=Trueであるからである。制御はステップ410に
移る。現在のノードがリーフノードであるため、制御は
ステップ424に移る。ステップ424で、ノード「ヒ
ト」のグリフ(manのM)が現在の長方形546内に描
画される。これは、図6でノード「ヒト」の処理に関し
てグリフ548として示されている。制御は次にステッ
プ426に移り、図8に示すように、再帰レベル618
は終了し、処理は再帰レベル616に戻る。再帰レベル
616に戻ることにより、制御はステップ422に移
る。ステップ422で、分割ルーチンがノードBの子ノ
ードb(すなわちノード「カンガルー」)に対して再帰
的に呼び出される。従って、処理は次に再帰レベル62
0に入る。
【0050】分割ルーチンは、以下のパラメータを渡す
ことによって呼び出される。 ・ノード「カンガルー」。これは、これから処理される
ノードである。 ・ノードBの処理中に分割された長方形550の座標。
これは、現在処理されているノードであるノードBの子
ノードb(すなわちノード「カンガルー」)に対応する
長方形であるからである。 ・ブール変数CLUSTER_DRAWN。この値はTrueである。 ・CRITICAL_VALUE=5。
【0051】ノード「カンガルー」の処理中の再帰のレ
ベルは、図8にレベル620として示されている。図4
の処理ステップの説明に戻って、ステップ404のテス
トは偽である。ノード「カンガルー」の非類似度は0で
あって、これはCRITICAL_VALUE=5より小さいが、CLUS
TER_DRAWN=Trueであるからである。制御はステップ41
0に移る。現在のノードがリーフノードであるため、制
御はステップ424に移る。ステップ424で、ノード
「カンガルー」のグリフ(kangarooのK)が現在の長方
形550内に描画される。これは、図6でノード「カン
ガルー」の処理に関してグリフ552として示されてい
る。制御は次にステップ426に移り、図8に示すよう
に、再帰レベル620は終了し、処理は再帰レベル61
6に戻る。再帰レベル616に戻ることにより、制御は
ステップ426に移り、処理は再帰レベル604に戻
る。再帰レベル604に戻ることにより、制御はステッ
プ426に移り、処理は再帰レベル602に戻る。再帰
レベル602に戻ることにより、制御はステップ422
に移り、ノードFの子ノードb(すなわちノードA)の
処理が行われる。
【0052】分割ルーチンは、ノードAに対して再帰的
に呼び出される。今の場合、分割ルーチンは、以下のパ
ラメータを渡すことによって呼び出される。 ・ノードA。これは、これから処理されるノードであ
る。 ・ノードFの処理中に分割された長方形554の座標。
これは、現在処理されているノードであるノードFの子
ノードb(すなわちノードA)に対応する長方形である
からである。 ・ブール変数CLUSTER_DRAWN。この値は今回はFalseであ
る。これは、再帰レベル602から渡され、このレベル
は、ノードFを処理し、このレベルではCLUSTER_DRAWN
の値はまだFalseであるからである(図5で、ノードF
の処理に関して列504を参照)。 ・CRITICAL_VALUE=5。
【0053】ノードAの処理中の再帰のレベルは、図8
にレベル622として示されている。図4の処理ステッ
プの説明に戻って、ステップ404のテストは今度は真
である。ノードAの非類似度は1.0であり、これはCR
ITICAL_VALUE=5より小さく、しかも、CLUSTER_DRAWN=
Falseであるからである。制御はステップ406に移
る。ステップ406で、グループ長方形556を現在の
長方形554の周に沿って描画する。この実線の長方形
556は、長方形分割の計算のみを表す点線と区別し
て、表示領域における長方形の実際の描画を表す。
【0054】処理はステップ408に進み、変数CLUSTE
R_DRAWNは真にセットされる。この変数値の変化は、図
7の列504でノードAの処理に関してF→Tとしても
表されている。
【0055】処理はステップ410に進む。現在のノー
ドはリーフノードではないため、現在の長方形は、ステ
ップ414〜418に関して前述したように再び分割さ
れる。現在の長方形のこのさらなる分割は、図7では、
長方形を横に分割する点線558によって示されてい
る。
【0056】ステップ420で、分割ルーチンはノード
Aの子ノードaに対して再帰的に呼び出される。すなわ
ち、分割ルーチンはリーフノード「ウマ」に対して再帰
的に呼び出される。今の場合、分割ルーチンは、以下の
パラメータを渡すことによって呼び出される。 ・ノード「ウマ」。これは、これから処理されるノード
である。 ・ノードAの処理中に分割された長方形の左側560の
座標。これは、現在処理されているノードであるノード
Aの子ノードa(すなわちノード「ウマ」)に対応する
長方形であるからである。 ・ブール変数CLUSTER_DRAWN。この値は今回はTrueであ
る。 ・CRITICAL_VALUE=5。
【0057】ノード「ウマ」の処理中の再帰のレベル
は、図8にレベル624として示されている。図4の処
理ステップの説明に戻って、ステップ404のテストは
今度は偽である。ノード「ウマ」の非類似度は0であっ
て、これはCRITICAL_VALUE=5より小さいが、CLUSTER_
DRAWN=Trueであるからである。制御はステップ410に
移る。現在のノードがリーフノードであるため、制御は
ステップ424に移る。ステップ424で、ノード「ウ
マ」のグリフ(horseのH)が現在の長方形560内に
描画される。これは、図7でノード「ウマ」の処理に関
してグリフ562として示されている。制御は次にステ
ップ426に移り、図8に示すように、再帰レベル62
4は終了し、処理は再帰レベル622に戻る。再帰レベ
ル622に戻ることにより、制御はステップ422に移
る。ステップ422で、分割ルーチンがノードAの子ノ
ードb(すなわちノード「ウシ」)に対して再帰的に呼
び出される。
【0058】分割ルーチンは、以下のパラメータを渡す
ことによって呼び出される。 ・ノード「ウシ」。これは、これから処理されるノード
である。 ・ノードAの処理中に分割された長方形564の座標。
これは、現在処理されているノードであるノードAの子
ノードb(すなわちノード「ウシ」)に対応する長方形
であるからである。 ・ブール変数CLUSTER_DRAWN。この値はTrueである。 ・CRITICAL_VALUE=5。
【0059】ノード「ウシ」の処理中の再帰のレベル
は、図8にレベル626として示されている。図4の処
理ステップの説明に戻って、ステップ404のテストは
偽である。ノード「ウシ」の非類似度は0であって、こ
れはCRITICAL_VALUE=5より小さいが、CLUSTER_DRAWN=
Trueであるからである。制御はステップ410に移る。
現在のノードがリーフノードであるため、制御はステッ
プ424に移る。ステップ424で、ノード「ウシ」の
グリフ(cowのC)が現在の長方形564内に描画され
る。これは、図7でノード「ウシ」の処理に関してグリ
フ566として示されている。制御は次にステップ42
6に移り、図8に示すように、再帰レベル626は終了
し、処理は再帰レベル622に戻る。再帰レベル622
に戻ることにより、制御はステップ426に移り、処理
は再帰レベル602に戻る。再帰レベル602に戻るこ
とにより、制御はステップ426に移り、この再帰的方
法が終了する。
【0060】処理が終了すると、図2のツリーの視覚化
が、選択した非類似度の値5で、図9に示すように、デ
ィスプレイ700として行われる。このディスプレイ7
00は、コンピュータディスプレイスクリーン102
(図1)上に表示される。
【0061】本発明の1つの特徴によれば、分割ルーチ
ンが別のCRITICAL_VALUEで再実行された場合、表示され
るグループ分けは変わるが、個々のデータ項目の相対位
置は同じままとなる。例えば、図9は、CRITICAL_VALUE
が5にセットされたときに結果として得られるディスプ
レイ700を示している。図10は、CRITICAL_VALUEが
2.5にセットされたときに結果として得られるディス
プレイ800を示している。個々のデータ項目はすべ
て、図9と同じ位置に示されていることに注意すべきで
ある。変わっているのは表示グループ分けのみである。
本発明のこの特徴は、異なる非類似レベルをユーザが比
較する際に有益である。
【0062】以上、本発明の実施例について説明した
が、当業者であれば、さまざまな変形例を考えることが
可能である。例えば、本発明を2進ツリーに関して説明
したが、本発明は、他のタイプのツリーを用いても実施
することが可能である。このような実施例では、分割比
計算は必ずしも一対一分割ではなく、各子ノードにおけ
るデータ項目(すなわちリーフ)の個数の比になる。例
えば、1個、2個、5個および9個のデータ項目を含む
4個の子ノードを有する内部ノードは比1:2:5:9
に分割される。さらに、各子ノードごとに1回の呼出し
が必要なので、追加の再帰呼出しが必要になることもあ
る。
【0063】
【発明の効果】以上述べたごとく、本発明によれば、階
層的クラスタリングされたデータのビューを生成し表示
する技術が改善される。具体的には、ツリーマップの生
成は、与えられたレベルで非類似性にかかわらずにツリ
ーを切断する従来技術とは異なり、データクラスタの非
類似性の尺度に基づいて表示グループ分けを生成するこ
とによって、改善される。
【図面の簡単な説明】
【図1】本発明を実現するように構成することが可能な
コンピュータシステムのコンポーネントの概略図であ
る。
【図2】階層的クラスタリング方法の適用により得られ
るツリーの図である。
【図3】ツリーマップ例の図である。
【図4】本発明に従って実行されるステップを示す流れ
図である。
【図5】ツリー例の処理に従って、処理の各段階での進
行中の処理と、結果として得られるツリーマップを示す
図である。
【図6】ツリー例の処理に従って、処理の各段階での進
行中の処理と、結果として得られるツリーマップを示す
図である。
【図7】ツリー例の処理に従って、処理の各段階での進
行中の処理と、結果として得られるツリーマップを示す
図である。
【図8】ツリー例の処理中の再帰のレベルの説明図であ
る。
【図9】本発明により生成されるディスプレイ例の図で
ある。
【図10】本発明により生成されるディスプレイ例の図
である。
【符号の説明】
100 コンピュータシステム 102 ディスプレイモニタ 104 キーボード 106 マウス 108 コンピュータプロセッサ 110 メモリユニット 120 不揮発性記憶装置 200 ツリー 700 ディスプレイ 800 ディスプレイ
───────────────────────────────────────────────────── フロントページの続き (71)出願人 596077259 600 Mountain Avenue, Murray Hill, New Je rsey 07974−0636U.S.A. (72)発明者 グラハム ジョン ウィルズ アメリカ合衆国,60540 イリノイ,ネイ パービル,ハイドゥン スプリング ドラ イブ 1128

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 ディスプレイスクリーンの表示領域内に
    階層的クラスタリングされた情報を表示するためのコン
    ピュータシステムの動作方法において、該方法は、前記
    コンピュータシステムのメモリに記憶されたツリーデー
    タ構造にアクセスするステップを有し、該ツリーデータ
    構造は、 データ項目を表すリーフノードと、 データ項目のクラスタと、子クラスタ間の非類似度とを
    表す内部ノードとを含み、 前記方法はさらに、 前記ツリーデータ構造のノードをたどり、少なくとも第
    1の非類似度を有するノードに到達するまで前記表示領
    域を再帰的に分割することによって、データ項目のグル
    ープ分けを生成するステップと、 前記ディスプレイスクリーンに表示領域のグループ分け
    を表示するステップとを有することを特徴とする、階層
    的クラスタリングされた情報を表示するためのコンピュ
    ータシステムの動作方法。
  2. 【請求項2】 前記ツリーデータ構造の各データ項目ご
    とに、前記表示領域にグリフを生成するステップをさら
    に有することを特徴とする請求項1に記載の方法。
  3. 【請求項3】 前記方法はさらに、 前記ツリーデータ構造のノードをたどり、少なくとも第
    2の非類似度を有するノードに到達するまで前記表示領
    域を再帰的に分割することによって、データ項目の改訂
    グループ分けを生成するステップと、 前記表示領域に前記改訂グループ分けを表示するステッ
    プとを有し、 前記表示領域内のグリフの位置は不変のままであること
    を特徴とする請求項2に記載の方法。
  4. 【請求項4】 前記表示領域は長方形に分割され、 前記再帰的に分割することは、 現在の長方形の長いほうの軸に沿って前記表示領域を再
    帰的に分割するステップを含むことを特徴とする請求項
    1に記載の方法。
  5. 【請求項5】 ディスプレイスクリーンの表示領域内に
    情報を表示するためのコンピュータシステムの動作方法
    において、該方法は、前記コンピュータシステムのメモ
    リに記憶されたツリーデータ構造にアクセスするステッ
    プを有し、該ツリーデータ構造は、 データ項目を表すリーフノードと、 データ項目のクラスタと、子クラスタのセット間の非類
    似度とを表す内部ノードとを含み、 前記方法はさらに、 前記ツリーデータ構造のノードをたどり、少なくとも部
    分的に前記非類似度に基づいて前記表示領域内に表示グ
    ループ分けを生成することによって、表示領域を生成す
    るステップと、 前記ディスプレイスクリーンに前記表示領域を表示する
    ステップとを有することを特徴とする、情報を表示する
    ためのコンピュータシステムの動作方法。
  6. 【請求項6】 前記ツリーデータ構造の各データ項目ご
    とに、前記表示領域にグリフを生成するステップをさら
    に有することを特徴とする請求項5に記載の方法。
  7. 【請求項7】 前記方法はさらに、 前記ツリーデータ構造のノードをたどり、少なくとも部
    分的に改訂非類似度に基づいて前記表示領域内に改訂表
    示領域を生成するステップと、 前記ディスプレイスクリーンに前記改訂表示領域を表示
    するステップとを有し、 前記改訂表示領域においてグリフの位置は不変のままで
    あることを特徴とする請求項6に記載の方法。
  8. 【請求項8】 ディスプレイスクリーンの表示領域内に
    階層的クラスタリングされた情報を表示するコンピュー
    タシステムにおいて、該コンピュータシステムはメモリ
    を有し、該メモリは、 ツリーデータ構造と、 前記コンピュータシステム上で実行するためのコンピュ
    ータプログラム命令とを記憶し、 前記ツリーデータ構造は、 データ項目を表すリーフノードと、 データ項目のクラスタと、子クラスタのセット間の非類
    似度とを表す内部ノードとを含み、 前記コンピュータプログラム命令は、 前記ツリーデータ構造のノードをたどるステップと、 少なくとも所定の非類似度を有するノードに到達するま
    で前記表示領域を再帰的に分割するステップと、 前記ディスプレイスクリーンに前記表示領域を表示する
    ステップとを実行する命令であることを特徴とする、階
    層的クラスタリングされた情報を表示するコンピュータ
    システム。
  9. 【請求項9】 前記コンピュータプログラム命令は、前
    記ツリーデータ構造の各データ項目ごとに、前記表示領
    域にグリフを生成するステップを実行するコンピュータ
    プログラム命令をさらに有することを特徴とする請求項
    8に記載のコンピュータシステム。
  10. 【請求項10】 前記コンピュータプログラム命令は、 前記ツリーデータ構造のノードをたどり、少なくとも第
    2の非類似度を有するノードに到達するまで前記表示領
    域を再帰的に分割することによって、データ項目の改訂
    グループ分けを生成するステップと、 前記表示領域に前記改訂グループ分けを表示するステッ
    プとを実行するコンピュータプログラム命令をさらに有
    し、 前記表示領域内のグリフの位置は不変のままであること
    を特徴とする請求項9に記載のコンピュータシステム。
  11. 【請求項11】 前記表示領域は長方形に分割され、 前記再帰的に分割するステップを実行するコンピュータ
    プログラム命令は、現在の長方形の長いほうの軸に沿っ
    て前記表示領域を再帰的に分割するステップを実行する
    コンピュータプログラム命令を含むことを特徴とする請
    求項8に記載のコンピュータシステム。
  12. 【請求項12】 ディスプレイスクリーンの表示領域内
    に階層的クラスタリングされた情報を表示するためのコ
    ンピュータシステムの動作方法において、該方法は、前
    記コンピュータシステムのメモリに記憶されたツリーデ
    ータ構造にアクセスするステップを有し、該ツリーデー
    タ構造は、 データ項目を表すリーフノードと、 データ項目のクラスタと、子クラスタ間の非類似度とを
    表す内部ノードとを含み、 前記方法はさらに、 前記ツリーデータ構造のノードにアクセスする間に、少
    なくとも第1の非類似度を有するノードに到達するまで
    前記表示領域を再帰的に分割することによって、データ
    項目のグループ分けを生成するステップと、 前記ディスプレイスクリーンに表示領域のグループ分け
    を表示するステップとを有することを特徴とする、階層
    的クラスタリングされた情報を表示するためのコンピュ
    ータシステムの動作方法。
  13. 【請求項13】 前記ツリーデータ構造の各データ項目
    ごとに、前記表示領域にグリフを生成するステップをさ
    らに有することを特徴とする請求項12に記載の方法。
  14. 【請求項14】 前記方法はさらに、 前記ツリーデータ構造のノードにアクセスする間に、少
    なくとも第2の非類似度を有するノードに到達するまで
    前記表示領域を再帰的に分割することによって、データ
    項目の改訂グループ分けを生成するステップと、 前記表示領域に前記改訂グループ分けを表示するステッ
    プとを有し、 前記表示領域内のグリフの位置は不変のままであること
    を特徴とする請求項13に記載の方法。
  15. 【請求項15】 前記表示領域は長方形に分割され、 前記再帰的に分割することは、 現在の長方形の長いほうの軸に沿って前記表示領域を再
    帰的に分割するステップを含むことを特徴とする請求項
    12に記載の方法。
  16. 【請求項16】 ディスプレイスクリーンの表示領域内
    に情報を表示するためのコンピュータシステムの動作方
    法において、該方法は、前記コンピュータシステムのメ
    モリに記憶されたツリーデータ構造にアクセスするステ
    ップを有し、該ツリーデータ構造は、 データ項目を表すリーフノードと、 データ項目のクラスタと、子クラスタのセット間の非類
    似度とを表す内部ノードとを含み、 前記方法はさらに、 少なくとも部分的に前記非類似度に基づいて前記表示領
    域内に表示グループ分けを生成するステップと、 前記ディスプレイスクリーンに前記表示領域を表示する
    ステップとを有することを特徴とする、情報を表示する
    ためのコンピュータシステムの動作方法。
  17. 【請求項17】 前記ツリーデータ構造のノードをたど
    るステップと、 少なくとも第1の非類似度を有するノードに到達するま
    で前記表示領域を再帰的に分割するステップとをさらに
    有することを特徴とする請求項16に記載の方法。
JP17860899A 1998-06-24 1999-06-24 情報を表示するためのコンピュータシステムおよびその動作方法 Expired - Fee Related JP3554676B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/103,921 US6304260B1 (en) 1998-06-24 1998-06-24 Method and apparatus for generating and displaying views of hierarchically clustered data
US09/103921 1998-06-24

Publications (2)

Publication Number Publication Date
JP2000029910A true JP2000029910A (ja) 2000-01-28
JP3554676B2 JP3554676B2 (ja) 2004-08-18

Family

ID=22297718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17860899A Expired - Fee Related JP3554676B2 (ja) 1998-06-24 1999-06-24 情報を表示するためのコンピュータシステムおよびその動作方法

Country Status (4)

Country Link
US (1) US6304260B1 (ja)
EP (1) EP0981098B1 (ja)
JP (1) JP3554676B2 (ja)
DE (1) DE69900213T2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001281244A (ja) * 2000-03-28 2001-10-10 Hitachi Software Eng Co Ltd 遺伝子発現パターン表示方法および装置並びに記録媒体
JP2002352244A (ja) * 2001-05-30 2002-12-06 Hitachi Systems & Services Ltd データ分類装置およびデータ分類方法
JP2006123140A (ja) * 2004-11-01 2006-05-18 Advanced Telecommunication Research Institute International コミュニケーションロボット
JP2009253378A (ja) * 2008-04-01 2009-10-29 Fuji Soft Inc コンテンツ操作方法及びコンテンツ操作プログラム
JP2012248049A (ja) * 2011-05-30 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> 文書情報分析装置、文書情報分析方法、文書情報分析プログラム
WO2015097957A1 (en) * 2013-12-27 2015-07-02 International Business Machines Corporation Condensing hierarchical data

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6493635B1 (en) * 1999-11-01 2002-12-10 3Dgeo Development, Inc. Remote access and automated dialog building for seismic processing
WO2002031697A1 (en) * 2000-10-13 2002-04-18 Kent Ridge Digital Labs A method of visualizing clusters of large collections of text documents
US6693633B2 (en) * 2001-05-04 2004-02-17 Sas Institute Inc. Computer-implemented node spreader
US7246102B2 (en) * 2001-12-21 2007-07-17 Agere Systems Inc. Method of improving the lookup performance of three-type knowledge base searches
US20040168115A1 (en) * 2003-02-21 2004-08-26 Bauernschmidt Bill G. Method and system for visualizing data from multiple, cached data sources with user defined treemap reports
US20040169654A1 (en) * 2003-02-27 2004-09-02 Teracruz, Inc. System and method for tree map visualization for database performance data
US7605813B2 (en) * 2003-04-22 2009-10-20 International Business Machines Corporation Displaying arbitrary relationships in a tree-map visualization
US7427987B2 (en) * 2003-04-22 2008-09-23 International Business Machines Corporation Displaying multi-ownership in a tree-map visualization
US7587409B2 (en) * 2004-09-24 2009-09-08 Sas Institute Inc. Computer-implemented system and method for handling node-link representations
US7506274B2 (en) * 2005-05-18 2009-03-17 Microsoft Corporation System and method for interactively displaying multi-dimensional data
US7373606B2 (en) * 2005-05-26 2008-05-13 International Business Machines Corporation Method for visualizing weblog social network communities
US7657848B2 (en) * 2006-01-09 2010-02-02 Sas Institute Inc. Computer-implemented node-link processing systems and methods
US8683314B2 (en) * 2006-01-13 2014-03-25 Ricoh Co., Ltd. Tree pruning of icon trees via subtree selection using tree functionals
US7603351B2 (en) * 2006-04-19 2009-10-13 Apple Inc. Semantic reconstruction
JP4921103B2 (ja) * 2006-10-13 2012-04-25 インターナショナル・ビジネス・マシーンズ・コーポレーション ブール式を可視化するための装置、方法およびプログラム
US8117486B2 (en) * 2007-04-10 2012-02-14 Xerox Corporation Method and system for detecting an anomalous networked device
US20100199223A1 (en) * 2009-02-03 2010-08-05 Oracle International Corporation Hierarchy display
US8972899B2 (en) * 2009-02-10 2015-03-03 Ayasdi, Inc. Systems and methods for visualization of data analysis
JP4846012B2 (ja) * 2009-10-05 2011-12-28 株式会社日立製作所 業務フロー検索システム、業務フロー検索方法、および業務フロー検索プログラム
US9342569B2 (en) * 2010-12-15 2016-05-17 Sap Se System and method of adding user interface element groups
WO2013128974A1 (ja) * 2012-03-02 2013-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーション データ表示装置、データ表示方法およびプログラム
US9460402B2 (en) 2013-12-27 2016-10-04 International Business Machines Corporation Condensing hierarchical data
US20170308836A1 (en) * 2016-04-22 2017-10-26 Accenture Global Solutions Limited Hierarchical visualization for decision review systems

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05205063A (ja) * 1992-01-28 1993-08-13 Sony Corp 階層構造情報の表示方法
JPH08255173A (ja) * 1995-03-16 1996-10-01 Fuji Xerox Co Ltd クラスタリング装置
JPH09297770A (ja) * 1996-05-08 1997-11-18 Nec Corp 階層構造視覚化装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5581797A (en) * 1993-10-22 1996-12-03 Lucent Technologies Inc. Method and apparatus for displaying hierarchical information of a large software system
US5821945A (en) * 1995-02-03 1998-10-13 The Trustees Of Princeton University Method and apparatus for video browsing based on content and structure
WO1998046998A1 (en) 1997-04-11 1998-10-22 Clark Robert D An optimal dissimilarity method for choosing distinctive items of information from a large body of information
JP2000512787A (ja) * 1997-04-18 2000-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ノードの魚眼表示を通じて、端部で相互接続されたノードに基づいて階層情報構造を2次元スクリーン上で視覚化するための方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05205063A (ja) * 1992-01-28 1993-08-13 Sony Corp 階層構造情報の表示方法
JPH08255173A (ja) * 1995-03-16 1996-10-01 Fuji Xerox Co Ltd クラスタリング装置
JPH09297770A (ja) * 1996-05-08 1997-11-18 Nec Corp 階層構造視覚化装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001281244A (ja) * 2000-03-28 2001-10-10 Hitachi Software Eng Co Ltd 遺伝子発現パターン表示方法および装置並びに記録媒体
JP2002352244A (ja) * 2001-05-30 2002-12-06 Hitachi Systems & Services Ltd データ分類装置およびデータ分類方法
JP4682339B2 (ja) * 2001-05-30 2011-05-11 株式会社日立ソリューションズ データ分類装置およびデータ分類方法
JP2006123140A (ja) * 2004-11-01 2006-05-18 Advanced Telecommunication Research Institute International コミュニケーションロボット
JP2009253378A (ja) * 2008-04-01 2009-10-29 Fuji Soft Inc コンテンツ操作方法及びコンテンツ操作プログラム
JP2012248049A (ja) * 2011-05-30 2012-12-13 Nippon Telegr & Teleph Corp <Ntt> 文書情報分析装置、文書情報分析方法、文書情報分析プログラム
WO2015097957A1 (en) * 2013-12-27 2015-07-02 International Business Machines Corporation Condensing hierarchical data

Also Published As

Publication number Publication date
EP0981098A1 (en) 2000-02-23
DE69900213T2 (de) 2002-06-13
DE69900213D1 (de) 2001-09-13
JP3554676B2 (ja) 2004-08-18
US6304260B1 (en) 2001-10-16
EP0981098B1 (en) 2001-08-08

Similar Documents

Publication Publication Date Title
JP3554676B2 (ja) 情報を表示するためのコンピュータシステムおよびその動作方法
US12001807B2 (en) Applied artificial intelligence technology for narrative generation using an invocable analysis service
US10872446B2 (en) Systems and methods for high dimensional 3D data visualization
US6195664B1 (en) Method and system for controlling the conversion of a file from an input format to an output format
JP2837815B2 (ja) 対話型ルール・ベース・コンピュータ・システム
EP0532740B1 (en) Computer apparatus and method for finite element identification in interactive modeling
JP4382526B2 (ja) 文章分類装置および方法
KR101773574B1 (ko) 데이터 테이블의 차트 시각화 방법
JPH08227349A (ja) 表示装置
Voinea et al. Multiscale and multivariate visualizations of software evolution
Chen et al. Ordered small multiple treemaps for visualizing time-varying hierarchical pesticide residue data
US5581634A (en) Recognition system with an automated development tool
Johnson et al. Distribution-driven visualization of volume data
CN114297535A (zh) 查询条件的页面展示方法、装置、设备及存储介质
Soares et al. Visualizing multidimensional data in treemaps with adaptive glyphs
Marszałkowski et al. Fast algorithms for online construction of web tag clouds
AlTarawneh et al. CluE: An algorithm for expanding clustered graphs
JP7450187B2 (ja) プログラム、情報処理方法、及び情報処理装置
US7240050B2 (en) Methods and apparatus for generating automated graphics using stored graphics examples
Kokash et al. Template-based treemaps to preserve spatial constraints
JP2000029677A (ja) 画面構成自動生成装置
Feng et al. Balanced-partitioning treemapping method for digital hierarchical dataset
JP3323130B2 (ja) 設計情報解析装置および記録媒体
JP2020149498A (ja) データ処理装置、表示制御システム、データ処理方法およびプログラム
Velázquez-Iturbide et al. Recursion-based visualizations of search algorithms in state-spaces

Legal Events

Date Code Title Description
A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040204

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040414

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040510

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees