JPH08255173A - クラスタリング装置 - Google Patents

クラスタリング装置

Info

Publication number
JPH08255173A
JPH08255173A JP7083535A JP8353595A JPH08255173A JP H08255173 A JPH08255173 A JP H08255173A JP 7083535 A JP7083535 A JP 7083535A JP 8353595 A JP8353595 A JP 8353595A JP H08255173 A JPH08255173 A JP H08255173A
Authority
JP
Japan
Prior art keywords
coordinate position
elements
similarity
coordinate
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7083535A
Other languages
English (en)
Inventor
Yukifumi Takeda
幸史 竹田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP7083535A priority Critical patent/JPH08255173A/ja
Publication of JPH08255173A publication Critical patent/JPH08255173A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 クラスタ内の状態を容易に把握でき、クラス
タを形成する過程を表示することのできるクラスタリン
グ装置を提供する。 【構成】 クラスタリングの対象とする全ての要素の位
置を可算個の座標軸上の1点として記憶する要素座標位
置記憶手段と、要素の間の予め与えられている類似度を
保持する要素間類似度保持手段と、クラスタリングの対
象とする全ての要素を座標系の1点として配置し、各要
素の座標位置を要素座標位置記憶手段に保持させる初期
要素座標位置決定手段と、要素座標位置記憶手段に保持
されている各要素の座標位置をもとに、要素間類似度保
持手段に保持されている各要素間の類似度が大きいもの
は互いに近づくように新たな座標位置を計算し、その計
算結果の各要素の位置を再び要素座標位置記憶手段に格
納する次要素座標位置計算手段と、要素座標位置記憶手
段に保持されている各要素の座標位置を順次に表示し、
クラスタが形成される過程または形成された結果とし
て、出力するクラスタリング結果出力手段とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、分類対象のデータ要素
を類似度に応じて分類し、類似度が明確になるような表
示形態で表示するクラスタリング装置に関する。
【0002】
【従来の技術】従来、データを分類する一般的なクラス
タリング手法としては、例えば、最も類似度が高い要素
をまとめて、一つのクラスタとし、そのクラスタと他の
要素との類似度を計算し、更に、その中で最も類似度が
高い要素をまとめて、一つのクラスタとし、そのクラス
タと他の要素との類似度を計算するという作業を逐次的
に繰り返して行く方法が知られている。このようなクラ
スタ分析の手法に関する公知文献としては、例えば、文
献『鷲尾泰俊,大橋靖雄著「多次元データの解析(シリ
ーズ入門 統計的方法3)」,1989年2月21日,
株式会社岩波書店発行,第232頁〜第249頁』が参
照できる。
【0003】ここでのクラスタリング手法では、生成さ
れたクラスタと他の要素との類似度を計算する方法にい
くつかのバリエーションが存在する。これらの類似度を
計算する方法は、それぞれ一長一短があり、いずれも必
然性にかけるため、しばしば人の直感とは違ったクラス
タを生成することがある。
【0004】また、従来からのクラスタリングの結果の
表示手法の一つとして、デンドログラムが用いられてい
る。デンドログラムは、図18に示すように、クラスタ
リングされる対象の要素A〜要素Hを横方向に並べ、各
要素の間の距離を縦方向に記述して、クラスタリングの
結果を表示する。このため、クラスタ間の距離の近い要
素から組を作り、その組から横方向を並ベて、その組の
クラスタ間の距離を縦方向で表示することになるので、
横方向の並ベられるそれぞれの要素A〜要素Hについて
は、任意の要素の間のクラスタ間の距離が、直感的に把
握しづらい。
【0005】
【発明が解決しようとする課題】このように、デンドロ
グラムでは、類似度が高いものが必ずしも近くに並べら
れるとは限られず、近くに配置されない要素またはクラ
スタの間の類似度が、直感的に把握しづらい。このた
め、正確に分類されたクラスタの状態を把握することは
困難であるという問題点がある。
【0006】本発明は、このような問題を解決するため
になされたものであり、本発明の目的は、クラスタ内の
状態を容易に把握できるようにすると共に、更に、ユー
ザの意図を反映させて、クラスタを形成する過程を表示
することのできるクラスタリング装置を提供することに
ある。
【0007】
【課題を解決するための手段】上記のような目的を達成
するため、本発明において、第1の特徴とするクラスタ
リング装置は、クラスタリングの対象とする全ての要素
の位置を可算個の座標軸上の点として記憶する要素座標
位置記憶手段(11)と、要素の間の予め与えられてい
る類似度を保持する要素間類似度保持手段(12)と、
クラスタリングの対象とする全ての要素を座標系の点と
して配置し、各要素の座標位置を要素座標位置記憶手段
に保持する初期要素座標位置決定手段(13)と、要素
座標位置記憶手段に保持されている各要素の座標位置を
もとに、要素間類似度保持手段に保持されている各要素
間の類似度が大きいものは互いに近づくように新たな各
要素の座標位置を計算し、その計算結果の座標位置を再
び要素座標位置記憶手段に格納する次要素座標位置計算
手段(14)と、要素座標位置記憶手段に保持されてい
る各要素の座標位置を順次に表示し、クラスタが形成さ
れる過程または形成された結果として、出力するクラス
タリング結果出力手段(15)とを備えることを特徴と
する。
【0008】また、本発明の第2の特徴とするクラスタ
リング装置は、更に、上記の構成に加えて、クラスタの
生成過程または生成された後に、要素またはクラスタを
選択する要素指定手段(16)と、要素指定手段によっ
て選択された要素またはクラスタをユーザが指定する位
置まで強制的に移動させる要素移動手段(17)と備え
ることを特徴とする。
【0009】
【作用】本発明の第1の特徴とするクラスタリング装置
においては、要素座標位置記憶手段(11)が、クラス
タリングの対象とする全ての要素の位置を可算個の座標
軸上の点として記憶し、要素間類似度保持手段(12)
が、要素の間に予め与えられている類似度を保持する。
初期要素座標位置決定手段(13)が、クラスタリング
の対象とする全ての要素を座標系の点として配置し、各
要素の座標位置を要素座標位置記憶手段に保持する。
【0010】そして、次要素座標位置計算手段(14)
が、初期の要素の座標位置から、要素座標位置記憶手段
により保持されている各要素の座標位置をもとに、要素
間類似度保持手段に保持されている各要素間の類似度が
大きいものは互いに近づくように、新たな各要素の座標
位置を計算し、その計算結果の座標位置を再び要素座標
位置記憶手段に格納する。このようにして、計算された
結果の各要素の座標位置を、クラスタリング結果出力手
段(15)により表示することにより、要素座標位置記
憶手段に保持されている各要素の座標位置を順次に表示
し、クラスタが形成される過程または形成された結果を
出力する。
【0011】また、この場合、本発明の第2の特徴とす
るクラスタリング装置においては、更に、要素指定手段
(16)が、クラスタの生成過程または生成された後に
要素またはクラスタを選択すると、要素移動手段(1
7)が、要素指定手段により選択された要素またはクラ
スタをユーザが指定する位置まで強制的に移動させる。
これにより、強制的に移動させた位置を各要素の初期の
座標位置として、クラスタリングの対象となる要素の初
期の座標位置から、要素間類似度保持手段に保持されて
いる要素間の類似度をもとに、要素間の類似度が高いも
のは互いに近づくように、次要素座標位置計算手段によ
り、新たな要素の座標位置を決め、要素座標位置記憶手
段にその計算結果の座標位置を保持する。
【0012】この結果、要素間の類似度が高いものは互
いに近づくように、次要素座標位置計算手段(14)に
より新たな要素の座標位置が決められ、要素座標位置記
憶手段にその結果を保持する作業が繰り返される。これ
により、ユーザの意図が反映された位置から、類似度が
高いものは互いに近くに集まり、早期にクラスタを形成
するようになる。そして、クラスタリング結果出力手段
(15)により、クラスタを形成する過程または形成さ
れた結果が、ユーザに対して提示される。
【0013】これにより、クラスタの形成は、ユーザの
意図が直感的に反映される形で、その要素の位置からク
ラスタの形成が行われるようになる。また、このように
して得られた要素の座標位置をもとに要素間の距離を計
算し、要素間の距離をもとに通常のクラスタ分析を行
い、その結果を出力することができる。
【0014】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。図1は、本発明の一実施例にかかるクラス
タリング装置の要部の構成を示すブロック図である。図
1において、11は要素座標位置記憶装置、12は要素
間類似度保持装置、13は初期要素座標位置決定置、1
4は次要素座標位置計算装置、15はクラスタリング結
果出力装置、16は要素指定装置、17は要素移動装
置、18クラスタ分析装置である。
【0015】要素座標位置記憶装置11は、クラスタリ
ングの対象となる全ての要素の位置を可算個の座標軸上
の点として表現し、全ての要素の位置を各座標の値とし
て記憶する。要素間類似度保持装置12には、各要素の
間に予め与えられている類似度が保持される。ここでの
類似度としては、各要素が持つ属性より計算される類似
度を保持するようにしてもよい。また、初期要素座標位
置決定装置13が、クラスタリングの対象とする全ての
要素を、その可算個の座標系の点として配置する。各要
素の初期の座標位置の決定は、それぞれの要素の初期位
置をランダムに配置を計算し、またはユーザの意図を反
映するように配置を決定する。
【0016】初期要素座標位置決定装置13により決め
られた各要素の初期の座標位置は、要素座標位置記憶装
置11に保持される。次要素座標位置計算装置14が、
要素座標位置記憶装置11に保持された各要素の座標位
置を読み込み、その座標位置から計算を開始し、要素間
類似度保持装置12に保持されている各要素間の類似度
が大きいものは互いに近づくように新たな各要素の座標
位置を計算する。計算された座標位置の結果は、要素座
標位置記憶装置11に保持する。そして、再び、要素座
標位置記憶装置11により保持されている各要素の座標
位置をもとに、要素間類似度保持装置12に保持されて
いる各要素間の類似度が大きいものは互いに近づくよう
に、更に新たな座標位置を再計算して、その計算結果の
座標位置を、要素座標位置記憶装置11に保持する。こ
のような計算処理を繰り返し行うことにより、各要素の
座標位置は、各要素間の類似度が大きいものは互いに近
づくように移動する。
【0017】クラスタリング結果出力装置15は、要素
座標位置記憶装置11に格納されている計算結果の各要
素の座標位置を表示画面に表示する。これにより、各要
素のクラスタリングの様子が、クラスタを形成する過程
として、また、その形成されたクラスタの結果が、直感
的に理解できるような形態で表示される。この場合、計
算結果の座標位置を表示する出力処理においては、要素
座標位置記憶装置11における座標軸の数(座標の次元
数)が“4”を越えており、図示または直感的に理解す
ることが困難な場合には、次元を縮約する処理を行い、
各要素を2次元または3次元上の点として表示する。こ
のため、クラスタが形成される過程、または形成された
結果が、より直感的に容易に判別可能な表示形態で出力
される。
【0018】要素指定装置16は、例えば、ポインティ
ングデバイスまたはキーボードのカーソルキーと表示画
面上のカーソルポインタによるユーザインタフェースに
より構成されており、要素のIDが直接に指定されるこ
とにより、1つの要素または複数の要素(クラスタ)を
選択する。そして、要素移動装置17によって、要素指
定装置16により選択指定した要素またはクラスタをユ
ーザの指示操作により指定された位置まで移動させる。
これらの要素指定装置16および要素移動装置17を用
いることにより、次要素座標位置計算装置14によるク
ラスタの形成過程において、また、クラスタの形成後に
おいて、ユーザの意図により要素指定装置16で指定さ
れた要素の位置を変更し、次要素座標位置計算装置14
によるクラスタの形成に影響を与えて、最終的にクラス
タ形成を早めるようにできる。
【0019】また、ここでは、更にクラスタ分析装置1
8が設けられており、クラスタ分析装置18を用いて従
来から公知のクラスタ分析の手法に従い、上述のように
計算された各要素間の距離をもとに、類似度を計算して
既存のクラスタ分析を行うことができ、また、その結果
を出力結果に反映させることもできる。
【0020】これらのシステム要素による本実施例のク
ラスタリング装置の動作の概略を説明すると、まず、初
期要素座標位置決定装置13において、決定された(計
算された)各要素の初期座標を要素座標位置記憶装置1
1に記憶し、次に、要素間類似度保持装置12に記憶さ
れている要素間の類似度を基にして、次要素座標位置計
算装置14によって、要素座標位置記憶装置11に記憶
されている各要素の座標位置を、類似度が高い要素が互
いに近づくように各要素の座標位置を計算する。そし
て、要素座標位置記憶装置11に記憶されている各要素
の座標位置を更新する。次要素座標位置計算装置14に
よる各要素の座標位置を計算し、更新する処理は順次に
繰り返し行い、その計算結果の各要素の座標位置は、ク
ラスタリング結果出力装置15を用いて出力する。
【0021】図2は、要素間類似度保持装置に保持され
る各要素の間の類似度を示す要素間類似度テーブルの一
例を示す図である。図2に示すように、要素間類似度テ
ーブル21には、クラスタリングを行うためのデータと
して、各要素の間の類似度が保持される。つまり、図2
に示す例では、要素A〜要素Hの8個の各要素の間の類
似度が予め数値データとして設定されている。また、こ
こでの類似度として、各要素が持つさまざまな属性から
例えば主成分分析のような統計的手法を用いることによ
り要素間の類似度を計算して、その類似度を設定すよう
にしても良い。図2に示す要素間類似度テーブル21で
は、例えば、要素Aと要素Bの間の類似度が、“0.
6”と設定されているが、この類似度は、“0”以上で
あり、かつ“1”以下の数値データで表現され、“1”
に近づくほど、より似通っていることを表している。
【0022】図3は、要素座標位置記憶装置に記憶され
る各要素の座標位置を示す要素座標位置テーブルの一例
を示す図である。図3に示すように、要素座標位置テー
ブル30は、要素名フィールド31,X座標フィールド
32,およびY座標フィールド33から構成されてお
り、各要素名のエントリに対して、その対応の座標位置
の(X座標値,Y座標値)が記憶される。
【0023】前述したように、要素座標位置記憶装置1
1に記憶される要素座標位置テーブル30の各要素の座
標位置(X座標値,Y座標値)に対して、要素間類似度
保持装置12に記憶されている要素間の類似度を基にし
て、類似度が高い要素が互いに近づくように、次要素座
標位置計算装置14は、次の各要素の座標位置を計算す
る。そして、要素座標位置テーブル30の各要素の座標
位置(X座標値,Y座標値)を更新する。
【0024】図4は本発明の実施例のクラスタリング処
理の全体の処理の流れを説明するフローチャートであ
る。図4を参照して、クラスタリング処理の流れを説明
する。処理を開始すると、まず、ステップ41におい
て、各要素の間の類似度を設定する。つまり、クラスタ
リングに必要な要素間の類似度を要素間類似度保持装置
12に入力する。
【0025】次に、ステップ42において、各要素の初
期の座標位置を決定する。例えば、先に各要素の間の類
似度が設定された要素A〜要素Hについて、その初期座
標位置を初期要素座標位置決定装置13により決定し、
要素座標位置テーブル30の各要素の座標位置(X座標
値,Y座標値)に格納する。ここでは、説明の理解を容
易なものとするため、座標系として2次元の平面座標を
用いる場合で説明しているが、更に高い次元数の座標系
を用いても構わない。4次元以上の座標系を用いる場合
には、クラスタリングされた結果の出力の際、出力結果
を直感的に理解しやすくするため、次元を縮約して表示
するなどの工夫が必要である。
【0026】ステップ42の各要素の初期座標位置の決
定では、初期の座標位置の決定方法として、例えば、乱
数を用いてランダムに配置する方法を用いる。または、
予め要素A,要素D,要素Hは一つのクラスタに属する
はずであるということが予めわかっていれば、要素A,
要素D,要素Hが初めから近くに配置されるように決定
してもよい。このようにして決定された各要素の初期の
座標位置は、要素座標位置テーブル30に格納される。
【0027】これにより、初期化処理が終了したので、
次に、ステップ43において、各要素の座標位置を表示
し、次にステップ44において、要素間の影響(度合)
の計算処理を行い、続いて、ステップ45において、次
の要素の位置の計算処理を行う。そして、次のステップ
46において、終了の条件を満たすか否かを判定し、終
了の条件を満たさない場合には、ステップ43に戻り、
ステップ43からの処理を繰り返し行う。ここでの終了
の条件としては、ユーザからの停止要求が入力された場
合を判定することにしているが、例えば、要素の移動距
離の合計が一定値以下になった場合、全ての要素の間の
距離が第1の所定値以下もしくは第2の所定値以上にな
った場合などを判定して、終了の条件とすることもでき
る。また、ステップ46の判定において、終了の条件を
満たす場合には、ステップ47に進み、ステップ47に
おいて、最終の各要素の座標位置を表示して、ここでの
一連の処理を終了する。
【0028】このようにして、前述したステップ43〜
ステップ45における各々の処理が繰り返し行われる
と、各要素の座標位置について、各要素間の類似度が大
きいものは互いに近づくように、新たな各要素の座標位
置が計算されて、その座標位置で各要素が表示される。
このため、クラスタリングの過程が、各要素の座標位置
の移動として、クラスタリング結果出力装置15の表示
画面によって、直感的に理解容易に表示される。そし
て、最終的に移動が終了した座標位置が、それぞれの要
素についてクラスタリングされた結果として表示され
る。
【0029】次に、各要素のクラスタリングされる過程
について、各要素の表示形態の説明と共に、ここで用い
るクラスタリング処理のアルゴリズムの一例について説
明する。図5は、各要素の座標位置をクラスタリング結
果出力装置により表示画面に表示出力した例を示す図で
ある。図5に示すように、クラスタリング結果出力装置
15の表示画面51には、初期の座標位置が決定された
段階で、要素座標位置記憶装置11に記憶されている各
要素の座標位置(要素座標位置テーブル30の各要素の
座標位置)が表示出力される。つまり、クラスタリング
結果出力装置15では、要素座標位置記憶装置11に記
憶されている各要素の座標位置から、各要素名とその座
標位置を2次元座標上にプロットして表示する。
【0030】また、ここでのクラスタリング結果出力装
置15の表示画面51に表示される各々の座標位置の各
要素に対して、クラスタ分析装置18により、既存のク
ラスタ分析を行う。例えば、最短距離法によるクラスタ
分析を行い、その分析結果により作成されたクラスタ
を、ここでのクラスタリング結果出力装置15の表示画
面51に重ねて表示するようにもできる。図6に示すよ
うに、各要素の座標位置を表示している表示画面52に
おいて、例えば、各要素の座標位置の表示に重ねて、分
析結果により作成されたクラスタを同心円的な閉曲線の
表現形態として表示するようにする。
【0031】また、図7に示すように、各要素の座標位
置を表示している表示画面53において、分析結果によ
り作成されたクラスタを各要素の座標位置の表示に重ね
て、デンドログラムの表現形態で表現するようにしても
よい。本実施例の以下の説明では、クラスタリング結果
出力装置15により、各要素の座標位置が表示される場
合、表示画面に重ねて表示されるクラスタ分析装置18
による分析結果のクラスタの表現形態は、図7に示すよ
うなデンドログラムの表現形態で結果の出力を行うもの
とする。
【0032】ここでのクラスタリング処理では、各要素
間の類似度をもとにして各要素の座標位置を計算して、
次の要素の座標位置を求める計算処理を行うが、その場
合、まず、要素間の影響の計算を行う(ステップ4
4)。つまり、初期要素座標位置決定装置13により、
各要素の初期座標位置をランダムに配置する計算を行い
決定した後、各要素間の類似度をもとに次要素座標位置
計算装置14により、類似度が高いものが近くに集まる
ように、各要素の新しい座標位置を計算する。この計算
方法には、モデル化するアルゴリズムの種類に応じて、
いくつかのバリエーションがある。
【0033】例えば、各要素が力学的な性質を備えてい
るとしてモデル化する場合、類似度が高い要素の間には
引力が働くような系をモデルとして想定する。この場
合、要素e1と要素e2の間に働く力F12を F12=S12/r1212:要素e1と要素e2の類似度、 r12:要素e1と要素e2の間の距離 として、ある要素eiはその他の要素から受ける力の合
力GFにより、運動するとしてモデル化する。つまり、
【数1】 として、モデル化するが、この場合、力学系のモデルの
精度にもよるが、一般に計算は複雑になる。
【0034】したがって、ここでは、類似度が高い要素
が互いに集まっていくという機構を実現するため、いく
ぶん単純化された計算方法を用いる。例えば、要素ei
が要素ejに与える影響Dijを、次の3つの場合に分け
て定義する。すなわち、
【数2】 ここで、OPiはある時点での要素の位置であり、影響
ij,位置OPjの変数はベクトル値を取る。また、r
ijは要素eiと要素ejの間の距離であり、Sijは要素e
iと要素ejの間の類似度であり、k,R,E,Cは定数
である。
【0035】要素の間の距離がC以下である場合には、
第1番目の(1)式となる。また、要素の間の距離がC
以上であり、かつE以下である場合には、第2番目の
(2)式となる。第2番目の(2)式では、要素ei
要素ejの間の距離rijが、分母にあるため、要素ei
要素ejに与える影響Dijは、要素の間の距離が小さい
ほど大きくなる。また、(Sij−R)が、分子にあるた
め、類似度Sijが所定の閾値R以上であれば、正の影響
を与え、また、類似度Sijが所定の閾値R以下であれ
ば、負の影響を与えることになる。(2)式における
{(OPj−OPi)/rij}の項は、要素eiの位置から要素
jの位置への単位ベクトルを表しているので、結果と
して、影響Dijは、類似度が高い場合には大きくなり
(正の影響)、低い場合には小さくなる(負の影響)。
しかも、その影響Dijの大きさは、要素の間の距離rij
に反比例するような要素eiの位置から要素ejへのベク
トルになる。
【0036】ここでの影響Dijの大きさは、要素の間の
距離に反比例させると、類似度が高い要素の間の距離が
非常に小さくなった時、影響Dijが大きくなってしまう
ことがある。この場合、双方の要素が、共に近づこうと
して、逆に大きく離れてしまうことがあるので、このよ
うな場合を回避するため、ここでは、(1)式によっ
て、要素の間の距離がある値C以下なら、距離の2乗に
比例させることにより、影響Dijが大きくなりすぎない
ようにしている。
【0037】また、逆に要素の間の類似度が低くて、離
れて行く場合には、距離に反比例するようしているの
で、影響Dijは小さくなる。ここでは、その計算量を小
さくするため、第3番目の(3)式によって、ある一定
値E以上に距離が離れれば、要素の間の影響Dijはなく
なるとしている(Dij=0)。
【0038】また、第1番目の式、第2番目の式に現れ
るkは定数であり、この定数kに設定する値により、各
要素が移動する量をコントロールできる。R,E.C
は、ここでは定数としたが、状況により変化するように
しても良い。例えば、閾値Rを距離の関数にすることに
より、要素が互いに近づく程度をコントロールできるよ
うにしてもよい。例えば、R=0.5, C=1,E=1
0,k=3として、影響Dijを求めると、図8に示すよ
うに、各要素の間の影響の度合が求められる。
【0039】このようにして、各要素の間の影響Dij
求められると、次に、各要素について、次の要素の位置
の計算処理を行う(ステップ45)。つまり、以上のよ
うにして、求められた影響Dijを基にして、各要素の新
しい座標位置を決める。ここでは、要素eiのある時点
の位置をOPiとした時、要素eiの次の座標位置NPi
は次のように定義する。
【数3】 なお、ここでは、Dii=0とする。このようにして計算
された次の座標位置NPiは、要素座標位置記憶装置1
1の要素座標位置記憶テーブルに保持する。
【0040】図9に示す要素座標位置記憶テーブル90
の各要素の座標位置データは、図3に示す要素座標位置
記憶テーブル30の各要素の座標位置データから計算を
始めて、第1回の次要素座標位置の計算処理を行った結
果の座標位置データの一例を示している。同様にして、
このような次要素座標位置の計算処理を続け、10回の
次要素座標位置の計算処理を行うと、その結果の座標位
置データは、図10に示すように、要素座標位置記憶テ
ーブル100の各要素の座標位置データとして変化す
る。また、これらの各回の次要素座標位置の計算処理を
行った結果の座標位置は、クラスタリング結果出力装置
15において、それぞれに計算の度に表示されるので、
各要素がクラスタリングされる過程における各要素の座
標位置に変化が、表示画面上で直感的に理解できるよう
になる。
【0041】図11は、次要素座標位置の計算処理を1
0回繰り返した時の各要素の座標位置をクラスタリング
結果出力装置により出力した場合の表示画面の一例を示
す図である。図11に示ように、各要素の座標位置が、
クラスタリング結果出力装置15により表示される場
合、表示画面110に重ねて表示されるクラスタ分析装
置18による分析結果のクラスタの表現形態が、前述の
場合と同様に、ここではデンドログラムの表現形態で表
示出力されておる。この表示画面110から明らかなよ
うに、各要素間の類似度が大きいものは互いに近づくよ
うに新たな座標位置が計算されて、各要素の座標位置が
移動させられるので、このようにして得られた各要素の
間の移動させた結果は、表示画面110において表示さ
れている各要素の間の距離が、そのまま要素の近さにな
っており、直感的に理解しやすいものになっている。
【0042】ところで、このような各要素について、類
似度に基づく次の要素の座標位置の計算処理は、初期に
設定した要素の座標位置から計算を行うが、この場合、
それぞれの次の要素の座標位置の計算結果が、各要素の
移動として、クラスタリング結果出力装置15で表示画
面にクラスタリングの様子が表示される。このため、そ
れぞれの回の計算処理の途中において、ユーザが各要素
の移動のクラスタリングの様子を見ながら、その座標位
置を強制的に変化させるようにしてもよい。
【0043】すなわち、クラスタリング過程またはクラ
スタリング終了後において、ユーザが要素を指定して、
所望の位置に移動させることにより、ユーザの意図を反
映して、クラスタを生成することができ、また、クラス
タの生成を早めることができる。この場合、クラスタリ
ング処理の中で要素指定装置16および要素移動装置1
7を用いることになる。ここでは、要素指定装置16と
して、ポインティングデバイスのマウスを用いる場合に
ついて説明するが、勿論、マウスに替えて、他のポイン
ティングデバイスを用いても構わない。また、要素を番
号,記号などで指定し、その移動先の座標位置をキーボ
ードなどから直接に数値データとして入力するようにし
てもよい。このような場合の一連のクラスタリング処理
の処理フローの一例を、図12に示している。
【0044】図12は、本発明の別の実施例のクラスタ
リング処理の全体の処理の流れを説明するフローチャー
トである。図12を参照して、この実施例のクラスタリ
ング処理の流れを説明する。この処理では、基本的な処
理の流れは、図4により前述した処理の流れと同様であ
るが、ユーザの意図(操作)による要素の指定処理と要
素の移動処理が加えられたものとなっている。
【0045】処理を開始すると、まず、ステップ121
において、各要素の間の類似度を設定する。ここで、ク
ラスタリングに必要な要素間の類似度(距離)を要素間
類似度保持装置12に入力する。次に、ステップ122
において、各要素の初期の座標位置を決定する。例え
ば、先に各要素の間の類似度が設定された要素A〜要素
Hについて、その初期座標位置を初期要素座標位置決定
装置13で決定し、要素座標位置テーブル30の各要素
の座標位置(X座標値,Y座標値)に格納する。
【0046】次に、ステップ123において、各要素の
座標位置を表示し、次に、ステップ124において、要
素の指定があるか否を判定する。要素の指定があると、
次にステップ125に進み、ユーザの操作の指示に従っ
て、指定された要素の移動処理を行う。そして、再び、
ステップ123に戻り、移動された要素を含めて、各要
素の座標位置を表示する処理を行う。
【0047】また、各要素の座標位置を表示し、次のス
テップ124において、要素の指定があるか否を判定
し、要素の指定がないと判定されると、次に、ステップ
126に進み、前述の場合と同様にして、各要素の間の
影響の計算処理を行い、続いて、ステップ127におい
て、次の要素の位置の計算処理を行う。そして、次のス
テップ128において、終了の条件を満たすか否かを判
定し、終了の条件を満たさない場合には、ステップ12
3に戻り、ステップ123からの処理を繰り返し行う。
ここでの終了の条件としては、前述の場合と同様に、ユ
ーザからの停止要求が入力された場合を判定することに
している。また、ステップ126の判定において、終了
の条件を満たす場合には、ステップ127に進み、ステ
ップ127において、最終の各要素の座標位置を表示し
て、ここでの一連の処理を終了する。
【0048】次に、図12示す処理フローによるクラス
タリング処理の具体例について、図を参照した操作例に
より説明する。図13は、要素Bを表示画面上で移動す
る操作例を説明する図であり、また、図14は、移動さ
れた後の要素座標位置記憶テーブルのそれぞれの要素の
座標位置データを示す図である。ユーザがクラスタリン
グ対象の要素を指定して移動する場合、図13に示すよ
うに、各要素の状態が表示されている表示画面130に
おいて、マウスポインタ131により、移動対象の要素
を指定し、マウスのドラック操作によって、例えば、移
動対象の要素Bを移動する。これにより、図14に示す
ように、例えば、要素座標位置記憶テーブル140にお
いては、移動対象の要素Bの座標位置の数値データが
(32,32)から(21,23)に変更される。
【0049】つまり、各要素の表示が終了した時点で、
要素が指定されていると、指定された要素の移動を行う
ので(ステップ124〜125)、図13に示すよう
に、要素Bをマウスで指定し、この状態からマウスのド
ラッグ操作を行うことにより、要素Bを座標位置(2
1,25)まで移動させる。この場合、要素Bを移動さ
せる方法としては、マウスのドラッグ操作に替えて、要
素座標位置記憶装置11に直接に座標の値を入力し、要
素座標位置記憶テーブルの各要素の座標位置データを移
動先の座標の値に入れ替える方法や、他の要素への影響
を計算しつつ、徐々に移動させていく方法や、要素の移
動のアルゴリズムとして力学的な運動のモデルを用いて
いる場合については移動先にたどり着くまで移動先方向
に力を加えつづけるなどの方法を用いるようにしてもよ
い。
【0050】ここでは、直接要素座標位置記憶装置11
に、キーボードの操作により直接に移動対象の要素の指
定を行い、その移動先の座標の値を入力する方法をとっ
ている。この結果、要素Bを指定し、更にその移動先の
座標値データを入力して、要素Bの移動を行うと、要素
座標位置記憶テーブル140の各要素の座標位置データ
は、図14に示すように、要素Bのエントリ141の座
標位置データ142のみが更新される。この時の要素座
標位置記憶テーブル140の各要素の座標位置データか
ら、再び、前述したように、各要素の間の類似度に基づ
いて、各要素の移動の処理を行う。
【0051】要素Bを移動した後のクラスタリング対象
の各要素の座標位置データに基づいて、各要素の位置を
表示画面上に表示すると、図15に示すように、要素B
のみが強制的に移動させられ、その他の要素の位置は前
のままの状態の画面150が表示される。この場合にお
いても要素Bが指定の位置に移動した状態において、前
述のように、クラスタリング結果出力装置15により表
示されている表示画面150の各要素の間係は、クラス
タ分析装置18により、各要素の間の距離が求められて
デンドログラムの形態により表示される。
【0052】このようにして要素Bを移動した後、更に
10回の次要素座標位置の計算処理を行い、各要素の座
標位置のデータを更新すると、図16に示すように、要
素座標位置記憶テーブル160の各要素の座標位置デー
タが得られる。この各要素の座標位置データに基づい
て、それぞれの要素を表示画面に表示すると、図17に
示すように、クラスタリング結果出力装置により出力し
た場合の表示画面170において、最終的に各要素がク
ラスタリングされた結果の状態の各要素の位置関係が得
られる。図17を参照すると明らかなように、強制的に
移動した要素Bについては、その各要素の間の類似度の
関係に基づいて、早急に要素A,要素D,および要素H
に近づくように移動し、最終的なクラスタ分析の結果が
得られる。
【0053】このようにして、ユーザの意図が反映され
た形で要素を移動させ、類似度に基づいて近いもの早急
にその要素が近づくようにして、新たなクラスタを形成
させることできる。また、ここでは、ユーザが強制的に
動させる要素を1つとして説明したが、移動させる要素
の数は、単一の要素だけではなく、複数の要素を同時に
移動させても構わない。もし、ユーザが類似していない
要素同士を近くに配置したとしても、このような手法に
より要素の移動を行うと、何回か各要素の移動を行う計
算処理を繰り返すことにより、非類似の要素は離れてい
くので、要素間の類似度に応じたクラスタを形成するこ
とが可能である。
【0054】
【発明の効果】以上に説明したように、本発明のクラス
タリング装置によれば、要素間の距離を実際の距離に対
応させることにより、直感的にクラスタの状態をわから
せることが可能になり、また、要素をユーザが直接的に
移動させることにより、ユーザの意図に応じたクラスタ
を形成させることが可能になる。
【図面の簡単な説明】
【図1】 図1は本発明の一実施例にかかるクラスタリ
ング装置の要部の構成を示すブロック図、
【図2】 図2は要素間類似度保持装置に保持される各
要素の間の類似度を示す要素間類似度テーブルの一例を
示す図、
【図3】 図3は要素座標位置記憶装置に記憶される各
要素の座標位置を示す要素座標位置テーブルの一例を示
す図、
【図4】 図4は本発明の第1の実施例のクラスタリン
グ処理の全体の処理の流れを説明するフローチャート、
【図5】 図5は各要素の座標位置をクラスタリング結
果出力装置により表示画面に表示出力した例を示す図、
【図6】 図6は各要素の座標位置の表示に重ねてクラ
スタを同心円的な閉曲線の表現形態として表示するクラ
スタリング結果出力装置の表示画面の一例を示す図、
【図7】 図7は各要素の座標位置の表示に重ねてクラ
スタをデンドログラムの表現形態として表示するクラス
タリング結果出力装置の表示画面の一例を示す図、
【図8】 図8は計算結果の各要素の間の影響の度合を
示す影響度テーブルの一例を示す図、
【図9】 図9は図3に示す要素座標位置記憶テーブル
30の各要素の座標位置データから始めて1回の次要素
座標位置の計算処理を行った結果の座標位置データの一
例を示す図、
【図10】 図10は同じく図3に示す要素座標位置記
憶テーブルの各要素の座標位置データから始めて10回
の次要素座標位置の計算処理を行った結果の座標位置デ
ータの一例を示す図、
【図11】 図11は次要素座標位置の計算処理を10
回繰り返した時の各要素の座標位置をクラスタリング結
果出力装置により出力した場合の表示画面の一例を示す
図、
【図12】 図12は本発明の別の実施例のクラスタリ
ング処理の全体の処理の流れを説明するフローチャー
ト、
【図13】 図13は要素Bを表示画面上で移動する操
作例を説明する図、
【図14】 図14は移動された後の要素座標位置記憶
テーブルのそれぞれの要素の座標位置データを示す図、
【図15】 図15は要素Bを表示画面上で移動した時
の各要素の座標位置をクラスタリング結果出力装置によ
り出力した場合の表示画面の一例を示す図、
【図16】 図16は要素Bを移動した後に更に10回
の次要素座標位置の計算処理を行った結果の座標位置デ
ータの一例を示す図、
【図17】 図17は要素Bを移動した後に更に10回
の次要素座標位置の計算処理を行った結果の各要素の座
標位置をクラスタリング結果出力装置により出力した場
合の表示画面の一例を示す図、
【図18】 図18は従来のクラスタリング結果の表示
手法の一つのデンドログラムを説明する図である。
【符号の説明】
11…要素座標位置記憶装置、12…要素間類似度保持
装置、13…初期要素座標位置決定置、14…次要素座
標位置計算装置、15…クラスタリング結果出力装置、
16…要素指定装置、17…要素移動装置、18クラス
タ分析装置、21…要素間類似度保持テーブル、30…
要素座標位置テーブル、31…要素名フィールド、32
…X座標フィールド、33…Y座標フィールド、51〜
53…クラスタリング結果出力装置の表示画面、80…
影響度テーブル、90…1回の計算結果の要素座標位置
テーブル、100…10回の計算結果の要素座標位置テ
ーブル、110…表示画面、130…表示画面、131
…マウスポインタ、140…要素座標位置テーブル、1
41…要素Bのエントリ、142…座標位置データ、1
50…表示画面、160…要素座標位置テーブル、17
0…表示画面。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 クラスタリングの対象とする全ての要素
    の位置を可算個の座標軸上の点として記憶する要素座標
    位置記憶手段と、 要素の間の予め与えられている類似度を保持する要素間
    類似度保持手段と、 クラスタリングの対象とする全ての要素を座標系の点と
    して配置し、各要素の座標位置を要素座標位置記憶手段
    に保持させる初期要素座標位置決定手段と、 要素座標位置記憶手段に保持されている各要素の座標位
    置をもとに、要素間類似度保持手段に保持されている各
    要素間の類似度が大きいものは互いに近づくように新た
    な座標位置を計算し、その計算結果の各要素の位置を再
    び要素座標位置記憶手段に格納する次要素座標位置計算
    手段と、 要素座標位置記憶手段に保持されている各要素の座標位
    置を順次に表示し、クラスタが形成される過程または形
    成された結果として、出力するクラスタリング結果出力
    手段とを具備することを特徴とするクラスタリング装
    置。
  2. 【請求項2】 請求項1に記載のクラスタリング装置に
    おいて、更に、 クラスタの生成過程または生成された後に、要素または
    クラスタを選択する要素指定手段と、 要素指定手段によって選択された要素またはクラスタを
    ユーザが指定する位置まで強制的に移動させる要素移動
    手段とを具備することを特徴とするクラスタリング装
    置。
JP7083535A 1995-03-16 1995-03-16 クラスタリング装置 Pending JPH08255173A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7083535A JPH08255173A (ja) 1995-03-16 1995-03-16 クラスタリング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7083535A JPH08255173A (ja) 1995-03-16 1995-03-16 クラスタリング装置

Publications (1)

Publication Number Publication Date
JPH08255173A true JPH08255173A (ja) 1996-10-01

Family

ID=13805203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7083535A Pending JPH08255173A (ja) 1995-03-16 1995-03-16 クラスタリング装置

Country Status (1)

Country Link
JP (1) JPH08255173A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029910A (ja) * 1998-06-24 2000-01-28 Lucent Technol Inc 階層的クラスタリングされた情報を表示するためのコンピュ―タシステムの動作方法
JP2000305945A (ja) * 1999-04-26 2000-11-02 Canon Inc 情報検索方法及び装置並びに記憶媒体
JP2002532786A (ja) * 1998-12-09 2002-10-02 インターナショナル・ビジネス・マシーンズ・コーポレーション イメージ・オブジェクトのセットから、相関のあるイメージ・オブジェクトのサブセットを識別する方法及び装置
JP2006190235A (ja) * 2004-12-09 2006-07-20 Shin Etsu Polymer Co Ltd 文書分類方法、文書分類プログラム及び文書分類装置
JP2006309390A (ja) * 2005-04-27 2006-11-09 Hitachi Ltd 品目分類支援システムおよび品目分類支援プログラム
WO2008108064A1 (ja) * 2007-03-07 2008-09-12 Panasonic Corporation 特許情報検索装置、特許情報検索方法、特許情報検索プログラム及び特許情報検索プログラムを記録した記録媒体
WO2024069729A1 (ja) * 2022-09-27 2024-04-04 日本電気株式会社 クラスタリング支援システム、方法およびプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000029910A (ja) * 1998-06-24 2000-01-28 Lucent Technol Inc 階層的クラスタリングされた情報を表示するためのコンピュ―タシステムの動作方法
JP2002532786A (ja) * 1998-12-09 2002-10-02 インターナショナル・ビジネス・マシーンズ・コーポレーション イメージ・オブジェクトのセットから、相関のあるイメージ・オブジェクトのサブセットを識別する方法及び装置
JP2000305945A (ja) * 1999-04-26 2000-11-02 Canon Inc 情報検索方法及び装置並びに記憶媒体
JP2006190235A (ja) * 2004-12-09 2006-07-20 Shin Etsu Polymer Co Ltd 文書分類方法、文書分類プログラム及び文書分類装置
JP2006309390A (ja) * 2005-04-27 2006-11-09 Hitachi Ltd 品目分類支援システムおよび品目分類支援プログラム
JP4490863B2 (ja) * 2005-04-27 2010-06-30 株式会社 日立東日本ソリューションズ 品目分類支援システムおよび品目分類支援プログラム
WO2008108064A1 (ja) * 2007-03-07 2008-09-12 Panasonic Corporation 特許情報検索装置、特許情報検索方法、特許情報検索プログラム及び特許情報検索プログラムを記録した記録媒体
WO2024069729A1 (ja) * 2022-09-27 2024-04-04 日本電気株式会社 クラスタリング支援システム、方法およびプログラム

Similar Documents

Publication Publication Date Title
Bourdot et al. VR–CAD integration: Multimodal immersive interaction and advanced haptic paradigms for implicit edition of CAD models
US5010500A (en) Gesture-modified diagram for retrieval of image resembling diagram, with parts selectable for further interactive retrieval
US7420556B2 (en) Information processing method and information processing apparatus
US5850206A (en) System for retrieving and displaying attribute information of an object based on importance degree of the object
JP2000298685A (ja) 選択ナビゲータ
CN102779202B (zh) 用于选择对象的操纵器的方法和装置
JP7241462B2 (ja) 3次元シーンにおけるオブジェクトの高速操作
US5513310A (en) Method for selecting a constructed element of a drawing to generate similar elements
JPH06110992A (ja) Cadシステムにおける形状変形入力操作方法
US6867771B2 (en) Controlled face dragging in solid models
JP3567015B2 (ja) Cadシステムにおいて幾何図形対象に関するブール演算を実行するための方法
JPH05346957A (ja) 形状特徴量提示装置および方法
JPH08255173A (ja) クラスタリング装置
JP4046370B2 (ja) 3次元形状の作図方法
US5649081A (en) Method and apparatus for pattern data processing
JP3559913B2 (ja) 三次元形状モデル変形方法及び装置
US11176759B2 (en) Computer-implemented method of displaying a subset of a digitally modeled assembly of objects
US10838400B2 (en) Toolpath generation by demonstration for computer aided manufacturing
JPH06103362A (ja) 3次元図形処理装置
JPH1166351A (ja) 3次元仮想空間内部におけるオブジェクト動作制御方法および装置とオブジェクト動作制御プログラムを記録した記録媒体
EP3842911B1 (en) A 3d interface with an improved object selection
JPH10111879A (ja) Cad/cae装置、解析モデル生成方法
JP2786098B2 (ja) 図形拡大編集方法
JP2723058B2 (ja) 線対称図形入力装置
JPH05266145A (ja) 画像表示装置および表示方法