JP3478967B2 - 2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体 - Google Patents

2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体

Info

Publication number
JP3478967B2
JP3478967B2 JP05234098A JP5234098A JP3478967B2 JP 3478967 B2 JP3478967 B2 JP 3478967B2 JP 05234098 A JP05234098 A JP 05234098A JP 5234098 A JP5234098 A JP 5234098A JP 3478967 B2 JP3478967 B2 JP 3478967B2
Authority
JP
Japan
Prior art keywords
cluster
data
initial
kernel
aggregated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP05234098A
Other languages
English (en)
Other versions
JPH11250094A (ja
Inventor
猛 丸山
成二 磯部
寿子 塩原
哲也 飯塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP05234098A priority Critical patent/JP3478967B2/ja
Publication of JPH11250094A publication Critical patent/JPH11250094A/ja
Application granted granted Critical
Publication of JP3478967B2 publication Critical patent/JP3478967B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、大量の件数のデー
タから多次元のデータ空間内の関係が近いデータを所望
の集約クラスタ数に集約したクラスタを生成する2相デ
ータクラスタ方法および装置に関し、更に詳しくは、デ
ータ空間内に存在するデータの分布状況をすべてのデー
タからそのデータの件数より少ない指定された個数のデ
ータに集約し判別する統計的データ集約の実現方法に有
効であるとともに、記憶装置内の情報を図形の集まりと
して表示装置に2次元表示する際に表示装置に表示され
る図形同士の重なりの排除を実現し得る2相データクラ
スタ方法および装置と2相データクラスタプログラムを
記録した記録媒体に関する。
【0002】
【従来の技術】従来のデータ集約手法として、初期クラ
スタ核と呼ばれるものをデータ空間内にランダムに指定
数分だけ設定し、各クラスタ核とデータとの距離が最小
になるようにクラスタ核を移動して、データを集約する
方法がある。ランダムに初期クラスタ核を設定した場合
では、初期クラスタ核がデータ空間内に任意に設定され
るので、データ空間内にあるデータの固まり1つ1つを
集約することができない場合がある。
【0003】これを解消するために、最近重心ソート法
などの既存の統計的推測により初期クラスタ核を指定数
分だけ設定する方法がある。この手法では、前者のラン
ダムな設定と比べ、データの固まり1つ1つに初期クラ
スタ核が対応する処理が行われる。以降、データ空間に
あるデータの距離関係によって生成されるデータの固ま
りを1つ1つ分割し、それらを各々に集約できることを
最適とする。
【0004】簡易な場合で従来技術の適用結果を示す。
図9および図10はデータ空間が2次元の場合を示す。
図9に示すようなデータ空間内に黒丸「●」で示すよう
に存在するデータを指定数4として集約する場合につい
て以下に説明する。
【0005】図10は、ランダムに初期クラスタ核を設
定し、既存の集約手法であるK−平均法を適用した結果
を示している。なお、図10において、黒丸「●」がデ
ータであり、白三角「△」がランダムに設定された初期
クラスタ核であり、黒三角「▲」が集約処理後のクラス
タ核であり、白枠で囲った円形エリアが核クラスタの集
約したデータの範囲を示し、矢印は集約処理後のクラス
タ核の移動を示している。上述したように、データの固
まり1つ1つに初期クラスタ核が設定されないので、最
適にデータを集約できない。
【0006】図11は、統計的推定を利用した初期クラ
スタ核を設定し、既存の集約手法であるK−平均法を適
用した結果を示している。なお、図11において、黒丸
「●」がデータであり、白三角「△」が統計的推測によ
り設定された初期クラスタ核であり、黒三角「▲」が集
約処理後のクラスタ核であり、白枠で囲った円形エリア
が核クラスタの集約したデータの範囲を示し、矢印は集
約処理後のクラスタ核の移動を示している。
【0007】図11に示す手法では、図10に示したラ
ンダム設定の場合に比較して、データの固まり1つ1つ
に対し、初期クラスタ核が設定され、最適に近い集約結
果が出力されている。しかしながら、集約結果のC2お
よびC4の結果を観察すると、データ3,19,2はC
4に集約されたほうが最適であるが、結果はC2に集約
されているため、この部分においては、この手法が最適
ではない。
【0008】上記の2つの問題は、初期クラスタ点の配
置位置に大きく依存している。統計的推測により初期ク
ラスタ核を設定し、集約処理を行った結果の図11に示
すC2の部分は、データ3,19,12,2を1つの固
まりと推測したために、そのデータに距離が近い点に初
期クラスタ核が設定されたことが原因である。これによ
り、この初期クラスタ核C2は、データ8,10をデー
タ3,19,2とともに集約するように移動し、図10
に示す結果が生じている。
【0009】
【発明が解決しようとする課題】上述したように、初期
クラスタ核をデータ空間内にランダムにまたは統計的推
測だけにより設定すると、データの固まりが領域内にあ
る本来の固まりとは異なって計算され、データ空間に存
在するデータの固まりとは異なるデータの固まりとし
て、集約結果が出力されることがあるという問題があ
る。
【0010】また、上述した従来の集約方式を実現した
装置が記憶装置内の情報を図形の集まりとして表示する
装置の前処理装置として適用された場合、上述した従来
の問題により、表示装置に表示された図形によって生じ
る重なりを排除し、元の図形の配置位置の傾向を残し
て、表示結果が出力されないという問題がある。
【0011】本発明は、上記に鑑みてなされたもので、
その目的とするところは、データ空間内のデータの固ま
りを指定数分に集約するために初期クラスタ核の位置を
決定し、データ空間内のデータを最適に集約し、大量の
データの分布傾向を容易に把握し得る2相データクラス
タ方法および装置と2相データクラスタプログラムを記
録した記録媒体を提供することにある。
【0012】
【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の本発明は、大量の件数のデータから
多次元のデータ空間内の関係が近いデータを所望の集約
クラスタ数に集約したクラスタを生成する2相データク
ラスタ方法であって、集約するクラスタ数、集約処理の
重み付けをクラスタ核間距離かクラスタ内のデータの広
がりの程度のどちらで行うかを0から1の範囲で指定す
る重み付けパラメータα、初期核クラスタ数を集約クラ
スタ数から決定するための初期核クラスタ数決定パラメ
ータKを指定し、この指定された初期核クラスタ数を条
件として集約処理の初期値となる初期クラスタ核を各次
元の最大および最小の範囲内でランダムにまたは統計的
推定により設定し、K−平均法を含むクラスタ手法を集
約処理に適用し、クラスタ核と各データ間の距離を各次
元について計算し、総合的に距離の近いデータを同一ク
ラスタに集約し、クラスタ核を抽出するための指標とし
て重み付けパラメータαを1に近付けるとクラスタ核間
距離に関するウェイトが高く設定され、重み付けパラメ
ータαを0に近付けると各クラスタ内のデータの分散割
合に関する量のウェイトが高く設定されるための次に示
す評価関数Ci :
【数4】Ci =(重み付けパラメータα)*(クラスタ
核間の距離行列に関する量)+(1−重み付けパラメー
タα)*(クラスタ核iに集約された各データとクラス
タ核との距離に関する量) の値が低い順に初期クラスタ核を並べ、上位から指定し
た集約クラスタ核の数だけを再集約処理のための初期ク
ラスタ核として抽出し、この抽出されたクラスタ核を再
集約処理の初期クラスタ核として使用して集約処理を行
い、ユーザの指定した数のクラスタを生成することを要
旨とする。
【0013】また、請求項2記載の本発明は、大量の件
数のデータから多次元のデータ空間内の関係が近いデー
タを所望の集約クラスタ数に集約したクラスタを生成す
る2相データクラスタ方法であって、集約するクラスタ
数、初期クラスタ核数決定パラメータおよび集約処理対
象データを指定し、設定した集約数、初期クラスタ核数
決定パラメータと集約処理を行うデータの次元数および
各次元の最大および最小値を検出し、その範囲で初期ク
ラスタ核をランダムに設定するかまたは集約処理対象デ
ータから統計的手法を用いて初期クラスタ核を設定し、
設定された初期クラスタ核と指定したデータで集約処理
を行い、処理結果後のクラスタ核の多次元データでの位
置を生成し、生成された集約処理結果のクラスタ核か
ら、評価関数の重み付けパラメータαをもって、ユーザ
が希望する集約方法でクラスタ核を指定数分抽出し、優
先的に抽出されたクラスタ核と指定した元データをもと
に集約処理を行い、最終的なクラスタ核のデータ空間で
の位置を出力し、生成された最終的なクラスタ核のデー
タを図形の集まりとして表示するために図形の情報にデ
ータを変換生成し、生成された図形の表示情報を表示装
置に出力することを要旨とする。
【0014】更に、請求項3記載の本発明は、大量の件
数のデータから多次元のデータ空間内の関係が近いデー
タを所望の集約クラスタ数に集約したクラスタを生成す
る2相データクラスタ装置であって、集約するクラスタ
数、集約処理の重み付けをクラスタ核間距離かクラスタ
内のデータの広がりの程度のどちらで行うかを0から1
の範囲で指定する重み付けパラメータα、初期核クラス
タ数を集約クラスタ数から決定するための初期核クラス
タ数決定パラメータKを指定する集約パラメータ指定手
段と、該集約パラメータ指定手段より指定された初期核
クラスタ数を条件として集約処理の初期値となる初期ク
ラスタ核を各次元の最大および最小の範囲内でランダム
にまたは統計的推定により設定する初期クラスタ核設定
手段と、K−平均法を含むクラスタ手法を集約処理に適
用し、クラスタ核と各データ間の距離を各次元について
計算し、総合的に距離の近いデータを同一クラスタに集
約する集約処理手段と、クラスタ核を抽出するための指
標として重み付けパラメータαを1に近付けるとクラス
タ核間距離に関するウェイトが高く設定され、重み付け
パラメータαを0に近付けると各クラスタ内のデータの
分散割合に関する量のウェイトが高く設定されるための
次に示す評価関数Ci :
【数5】Ci =(重み付けパラメータα)*(クラスタ
核間の距離行列に関する量)+(1−重み付けパラメー
タα)*(クラスタ核iに集約された各データとクラス
タ核との距離に関する量) の値が低い順に初期クラスタ核を並べ、上位から指定し
た集約クラスタ核の数だけを再集約処理のための初期ク
ラスタ核として抽出する優先クラスタ核抽出手段と、該
優先クラスタ核抽出手段より抽出されたクラスタ核を再
集約処理の初期クラスタ核として使用して集約処理を行
い、ユーザの指定した数のクラスタを生成する集約処理
再実行手段とを有することを要旨とする。
【0015】請求項4記載の本発明は、大量の件数のデ
ータから多次元のデータ空間内の関係が近いデータを所
望の集約クラスタ数に集約したクラスタを生成する2相
データクラスタ装置であって、集約するクラスタ数、初
期クラスタ核数決定パラメータおよび集約処理対象デー
タを指定する集約パラメータ指定手段と、設定した集約
数、初期クラスタ核数決定パラメータと集約処理を行う
データの次元数および各次元の最大および最小値を検出
し、その範囲で初期クラスタ核をランダムに設定するか
または集約処理対象データから統計的手法を用いて初期
クラスタ核を設定する初期クラスタ核設定手段と、設定
された初期クラスタ核と指定したデータで集約処理を行
い、処理結果後のクラスタ核の多次元データでの位置を
生成する集約処理手段と、生成された集約処理結果のク
ラスタ核から、評価関数の重み付けパラメータαをもっ
て、ユーザが希望する集約方法でクラスタ核を指定数分
抽出する優先クラスタ核抽出手段と、優先的に抽出され
たクラスタ核と指定した元データをもとに集約処理を行
い、最終的なクラスタ核のデータ空間での位置を出力す
る集約処理再実行手段と、生成された最終的なクラスタ
核のデータを図形の集まりとして表示するために図形の
情報にデータを変換生成する表示情報生成手段と、生成
された図形の表示情報を表示装置に出力する図形情報表
示装置とを有することを要旨とする。
【0016】請求項1乃至4記載の本発明にあっては、
大量のデータが存在するデータ空間においてデータ間の
距離が近いものによって表現されるデータの固まりをデ
ータの分布の傾向を損なわないように指定された数に集
約する際、初期クラスタ核をランダムにまたは統計定推
測によりデータ空間内にユーザ指定数のK倍だけ設定
し、データと初期クラスタ核をもってK−平均法を含む
集約処理を行い、処理結果のクラスタ核の位置を出力
し、評価関数Ci をもって処理結果のクラスタ核から最
適な集約処理を行うことができるクラスタ核を抽出し、
このクラスタ核を初期クラスタ核として設定し、再度集
約処理を行うことにより、1回目の集約処理においてデ
ータの固まりに近いクラスタ核が生成され、その中から
クラスタ核を抽出し、集約処理を行うため、データ空間
内のデータの固まりを1つ1つに分けて集約することが
できる。
【0017】前記評価関数の作用について説明する。評
価関数の第1項はクラスタ核間の距離に関係する量を示
している。最大クラスタ核間距離から各クラスタ核間の
距離の差分をとっているので、この値が小さいほどその
クラスタ核は他のクラスタ核と離れていることがわか
る。第2項はクラスタ核とそれに集約されるデータとの
距離に関係する量を示している。この量は集約された各
データとクラスタ核との距離をとっているので、この値
が小さいクラスタ核はクラスタ自体が密集しているデー
タで構成されていると見なすことができる。以上のこと
から、評価関数の値が小さいクラスタ核は、データが密
集していて、他のクラスタ核と離れているという最適な
条件を満たすことになる。
【0018】また、重み付けパラメータαの値を0から
1の間の数で任意に指定することで、重み付けパラメー
タαが0に近いときには第1項の値が評価関数に大きく
影響し、重み付けパラメータαが1に近いときには第2
項の値が評価関数に大きく影響する。つまり、重み付け
パラメータαを0に近い値として設定すれば、優先クラ
スタ核の候補の中でデータが密集しているクラスタ核が
抽出される。同様に、重み付けパラメータαを1に近い
値として設定すれば、優先クラスタ核の中で他のクラス
タ核と離れているクラスタ核が抽出される。この重み付
けパラメータαを任意に指定することにより、様々な分
布のデータに対応した集約処理が行える。従って、従来
検出することが不可能だったよく密集しているデータの
固まりを1つ1つ分割して集約するためには重み付けパ
ラメータαを適当に設定し、この第1項と第2項の総和
が小さいクラスタ核を候補として集約処理を行うことに
より、評価関数が小さいクラスタ核を優先的に指定され
た数だけ抽出するため、データ空間内のデータの固まり
を1つ1つに分けて集約することができる。
【0019】また、請求項5記載の本発明は、大量の件
数のデータから多次元のデータ空間内の関係が近いデー
タを所望の集約クラスタ数に集約したクラスタを生成す
る2相データクラスタプログラムを記録した記録媒体で
あって、集約するクラスタ数、集約処理の重み付けをク
ラスタ核間距離かクラスタ内のデータの広がりの程度の
どちらで行うかを0から1の範囲で指定する重み付けパ
ラメータα、初期核クラスタ数を集約クラスタ数から決
定するための初期核クラスタ数決定パラメータKを指定
し、この指定された初期核クラスタ数を条件として集約
処理の初期値となる初期クラスタ核を各次元の最大およ
び最小の範囲内でランダムにまたは統計的推定により設
定し、K−平均法を含むクラスタ手法を集約処理に適用
し、クラスタ核と各データ間の距離を各次元について計
算し、総合的に距離の近いデータを同一クラスタに集約
し、クラスタ核を抽出するための指標として重み付けパ
ラメータαを1に近付けるとクラスタ核間距離に関する
ウェイトが高く設定され、重み付けパラメータαを0に
近付けると各クラスタ内のデータの分散割合に関する量
のウェイトが高く設定されるための次に示す評価関数C
i :
【数6】Ci =(重み付けパラメータα)*(クラスタ
核間の距離行列に関する量)+(1−重み付けパラメー
タα)*(クラスタ核iに集約された各データとクラス
タ核との距離に関する量) の値が低い順に初期クラスタ核を並べ、上位から指定し
た集約クラスタ核の数だけを再集約処理のための初期ク
ラスタ核として抽出し、この抽出されたクラスタ核を再
集約処理の初期クラスタ核として使用して集約処理を行
い、ユーザの指定した数のクラスタを生成する2相デー
タクラスタプログラムを記録媒体に記録することを要旨
とする。
【0020】請求項5記載の本発明にあっては、大量の
データが存在するデータ空間においてデータ間の距離が
近いものによって表現されるデータの固まりをデータの
分布の傾向を損なわないように指定された数に集約する
際、初期クラスタ核をランダムにまたは統計的推測によ
りデータ空間内にユーザ指定数のK倍だけ設定し、デー
タと初期クラスタ核をもって集約処理を行い、処理結果
のクラスタ核の位置を出力し、評価関数Ci をもって処
理結果のクラスタ核から最適な集約処理を行うことがで
きるクラスタ核を抽出し、このクラスタ核を初期クラス
タ核として設定し、再度集約処理を行うことにより、1
回目の集約処理においてデータの固まりに近いクラスタ
核が生成され、その中からクラスタ核を抽出して集約処
理を行う2相データクラスタプログラムを記録媒体に記
録しているため、該記録媒体を用いて、その流通性を高
めることができる。
【0021】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態について説明する。図1は、本発明の一実施形態
に係る2相データクラスタ装置の構成を示すブロック図
である。
【0022】図1に示す本実施形態の2相データクラス
タ装置は、集約対象データを格納する情報格納装置40
1と、ユーザが集約条件(集約対象データ、集約数、重
み付けパラメータα)を設定条件設定処理表示装置40
2−1にあるGUI(Graphical User Interface)部品
402−2を利用して、外部入力装置406から入力す
る集約条件入力装置402と、該集約条件入力装置40
2から入力された集約条件をもとに集約処理を行う集約
データ生成装置403と、前記集約条件のもとにユーザ
が意図した配置方法で集約データを図形の集まりとして
表示させるための表示情報の生成、変換、合成を行う表
示情報生成装置404と、表示情報生成装置404で生
成、変換、合成された表示情報を表示装置405−1に
表示する図形情報変換表示装置405とを有する。
【0023】また、集約データ生成装置403は、集約
条件入力装置402で指定された集約数より多くの初期
クラスタ核を集約対象データが存在するデータ空間にラ
ンダムにまたは統計的推定によって設定する1相目初期
点設定装置403−1と、該1相目初期点設定装置40
3−1で設定された初期クラスタ核と集約対象となるデ
ータに関して集約処理を行い、処理後のクラスタ核を生
成する1相目集約処理装置403−2と、この1相目の
集約処理結果から出力された2相目初期クラスタ核候補
から前記評価関数Ci をもとに指定した集約数の初期ク
ラスタ核を抽出する2相目初期点抽出装置403−3
と、この2相目初期点抽出装置403−3で抽出された
初期クラスタ核と集約条件装置で指定した情報格納装置
401内のデータに関して集約処理を行う2相目集約処
理装置403−4とから構成されている。更に、集約条
件入力装置402は、GUI部品402−2、設定条件
設定処理表示装置402−1、GUI部402−3、設
定画面制御装置402−4から構成されている。
【0024】集約処理に必要な情報を設定する集約条件
入力装置402は集約パラメータ指定手段を構成し、集
約データ生成装置403の1相目初期点設定装置403
−1は初期クラスタ核設定手段を構成し、1相目集約処
理装置403−2は集約処理手段を構成し、2相目初期
点抽出装置403−3は優先クラスタ核抽出手段を構成
し、2相目集約処理装置403−4は集約処理再度実行
手段を構成し、表示情報生成装置404は表示情報生成
手段を構成し、図形情報表示装置405は図形情報表示
手段を構成している。
【0025】集約条件入力装置402を構成する集約パ
ラメータ指定手段は、集約するクラスタ数、集約処理の
重み付けをクラスタ核間距離かクラスタ内のデータの広
がりの程度のどちらで行うかを0から1の範囲で指定す
る重み付けパラメータα、初期核クラスタ数を集約クラ
スタ数から決定するための初期核クラスタ数決定パラメ
ータKを指定する。また、1相目初期点設定装置403
−1を構成する初期クラスタ核設定手段は、集約パラメ
ータ指定手段で指定された集約数および初期核クラスタ
数決定パラメータKの積の数だけ、多次元のデータ空間
に1回目の集約処理に必要な初期クラスタ核をデータ空
間内に各次元の最大および最小の範囲内でランダムにま
たは統計的推測により設定する。
【0026】1相目集約処理装置403−2を構成する
集約処理手段は、初期クラスタ核設定手段で設定された
クラスタ核と各データとの距離をもって、1回目集約処
理を行う。2相目初期点抽出装置403−3を構成する
優先クラスタ核抽出手段は、集約処理によって初期時点
から移動したクラスタ核から、
【数7】 {ここにおいて、N’=K×(指定集約数)、rikは集
約処理によって移動したクラスタ核i(i=1,…,
N’)とその他のクラスタ核j(j=1,…,N’)と
の距離を示し、rMax は集約処理によって移動したクラ
スタ核とその他のクラスタ核との距離の最大値を示し、
ここで距離とはユークリッド距離を表し、Mi はクラス
タ核i(i=1,…,N’)に集約されたデータの数を
示し、r’ikはクラスタ核i(i=1,…,N’)とそ
れに集約されたMi 個のデータとの距離を示し、αは重
み付けパラメータであって、0から1の間の実数であ
る。}なる評価関数Ci の値の低い順から指定数だけク
ラスタ核を抽出するものであって、前記評価関数Ci に
ある重み付けパラメータαを0から1の間で任意に決定
することにより、評価関数Ci の値を決定するのが、第
1項から第2項の値で自由に決められ、重み付けパラメ
ータαが0に近いと第2項の重みが大きくなり、各クラ
スタ内に集約されたデータの密集度合いの高いクラスタ
核が抽出され、重み付けパラメータαが1に近いと第1
項の重みが大きくなり、その他のクラスタとの距離が離
れているクラスタ核が抽出されるというようにクラスタ
核の抽出方法を変更することができる。
【0027】2相目集約処理装置403−4を構成する
集約処理再度実行手段は、優先クラスタ核抽出手段で抽
出されたクラスタ核を初期クラスタ核として再度各デー
タとの距離をもって集約処理を行う。
【0028】このように構成される2相データクラスタ
装置では、ユーザは情報格納装置401内のデータおよ
び集約数、重み付けパラメータαをGUI部品402−
2から外部入力装置406を利用して入力する。これら
の指定された条件はGUI部402−3を経由して適当
な数値の媒介変数として設定画面制御装置402−4に
受け渡される。受け渡された数値情報で集約数より多い
初期クラスタ核を1相目初期点設定装置403−1によ
って設定し、情報格納装置401内のデータと初期クラ
スタ核をもって、1相目集約処理装置403−2で集約
処理計算を行う。
【0029】1相目集約処理装置403−2から計算さ
れたクラスタ核を2相目初期点抽出装置403−3に投
入し、評価関数Ci に基づいて、抽出する初期点を決定
する。この決定された2相目初期クラスタ核と集約条件
入力装置402から入力された集約対象データをもって
2相目集約処理装置403−4内で集約処理を行い、集
約処理されたクラスタ核を表示情報生成装置404に受
け渡す。
【0030】この受け渡された結果をもとにユーザが意
図した配置方法で情報を図形の集まりとして表示させる
ための表示情報の生成、変換、合成を表示情報生成装置
404が行う。この生成、変換、合成された表示情報
は、図形情報表示装置405に送り出され、表示装置4
05−1上に表示される。
【0031】上述したように、本実施形態では、集約処
理に伴う処理方式の2相化および1相目集約処理によっ
て計算されたクラスタ核から2相目集約処理の初期クラ
スタ核を抽出する集約処理を実現している。
【0032】次に、図6〜図8に示すフローチャートを
参照して、上述したように構成される本実施形態の2相
データクラスタ装置の作用について説明する。
【0033】図6においては、まず集約条件入力装置4
02からなる集約パラメータ指定手段により集約処理対
象データ、集約数N、抽出パラメータである重み付けパ
ラメータα、初期核クラスタ数決定パラメータK等を指
定し(ステップS11,S12,S13)、それから1
相目初期点設定装置403−1からなる初期クラスタ核
指定手段により集約数より多い初期クラスタ核である1
相目初期点を生成し(ステップS15,S16)、この
初期クラスタ核をもって1相目集約処理装置403−2
からなる集約処理手段により1相目集約処理を行って、
1相目クラスタ核を生成する(ステップS19,S2
1)。
【0034】次に、2相目初期点抽出装置403−3か
らなる優先クラスタ核抽出手段により1相目集約処理の
結果として出力された2相目処理クラスタ核候補から前
記評価関数に基づいて指定集約数の初期クラスタ核を抽
出し(ステップS23,S25)、それから2相目集約
処理装置403−4からなる集約処理再実行手段により
2相目集約処理を行って、集約されたクラスタ核である
2相目クラスタ核を生成する(ステップS27,S2
9)。
【0035】次に、図7に示すフローチャートを参照し
て、1相目初期点設定装置403−1による1相目初期
点生成処理について説明する。図7においては、まず
N’=(初期核クラスタ数決定パラメータK)*(指定
集約数N)を計算し、各次元の最大値と最小値を獲得
し、パラメータIを1に設定する(ステップS41,S
42,S43)。そして、処理点を設定し(ステップS
45)、各次元毎に最小値と最大値との間の値である乱
数を発生し(ステップS47)、この発生させた乱数を
結合する(ステップS51)。それから、パラメータI
を+1インクリメントし、該パラメータIがN’になる
までのすべてについて初期点設定処理を繰り返し行う
(ステップS53)。
【0036】次に、図8に示すフローチャートを参照し
て、2相目初期点抽出装置403−3による2相目初期
点抽出処理について説明する。図8においては、まず各
クラスタ核に番号を付け(ステップS61)、それから
一方において各クラスタ核間の距離rijを計算し(ステ
ップS63)、他方においてはクラスタ内の距離を計算
し(ステップS65)、それからクラスタ核iに集約さ
れた元データとクラスタ核との距離r’ijを計算し(ス
テップS67)、更にパラメータiがN’になるまでク
ラスタ内距離を計算する(ステップS69)。
【0037】それから、評価関数Ci を計算し(ステッ
プS71)、この評価関数Ci の値が高い順から2相目
初期点として設定する(ステップS73)。
【0038】次に、図2〜図4を参照して、本実施形態
の効果について説明する。ここでは簡単のため、従来の
技術で説明した2次元データ空間のデータに適用させた
例について説明する。まず、図2に示す対象となるデー
タ空間のデータを上述した場合と同様に4つのクラスタ
に集約する。この例で利用するパラメータKは2、すな
わち1回目の集約処理時の初期クラスタ核の個数は2倍
の8個とする。
【0039】図3は1回目の集約処理後の状態を示して
いる。1回目の集約処理で利用する初期クラスタ核の設
定に関しては既存の最近重心ソート法を利用している。
図3には、データ空間内に8(=4×2)つのクラスタ
核が存在する。このクラスタ核およびデータとの関係を
上述した評価関数を用いて計算し、再度集約処理を行う
ときの初期クラスタ核を抽出する。この計算処理過程を
次に示す表1,2,3,4に示す。
【0040】
【表1】 表1は、評価関数Ci の第1項の計算に必要なクラスタ
核間の距離を示した行列である。例えば、クラスタ核1
とクラスタ核2との距離は、2.132と計算されてい
る。
【0041】
【表2】 表2は、評価関数Ci の第2項で必要となるデータとク
ラスタ核間の関係および距離を示している。例えば、デ
ータ1はクラスタ核7に集約され、そのクラスタ核との
距離は0.249と計算されている(その他も同様)。
この2式から評価関数Ci の各項を計算し、重み付けパ
ラメータαを0から1に0.1ずつ増加し、評価値を出
力した結果を表3に示す。
【0042】
【表3】 各重み付けパラメータで評価値が小さいクラスタ核が異
なっている。そのため、表2に抽出される優先クラスタ
核、つまり評価値が小さいクラスタ核を示す。
【表4】 表4の結果に従って、重み付けパラメータαが0.5の
ときを例としてあげ、クラスタ核を抽出し、初期クラス
タ核として設定し、再度集約処理を行った結果を図4に
示す。この結果からわかるように、既存の技術では不可
能だったC4およびC2の分割および集約が最適に行わ
れている。表5で具体的な数値で最適性を示す。
【0043】
【表5】 表5は、既存の手法としてK−平均法を上述のデータに
適用させた場合と本方式を適用させた場合のクラスタ核
間の距離の平均および各クラスタに集約されたデータと
クラスタ核との距離の平均を示している。一例としてあ
げた式に対する前者の数値は、クラスタが1つ1つに分
割されているかということを示す指標であり、小さいほ
どよい。後者の数値は各クラスタに集約されているデー
タが密集しているかどうかを示す指標であり、小さいほ
どよい。数値に見られるように本方式の方が既存手法よ
り適した結果が出力されている。
【0044】なお、上記はあるデータに限定した集約処
理結果であるが、本方式は、重み付けパラメータαの値
を変化させることで、表4に見られるような抽出される
クラスタ核を変化させることができる。上述した例で説
明すると、重み付けパラメータαが0.1のときと0.
9のときでは図3で出力されているクラスタ核C2,C
4,C5,C6のどれを抽出するかが異なっている。こ
のようなクラスタに集約されるデータは既存手法にも見
られるようにクラスタの作り方の方針によって集約され
るクラスタが変わっていく。一方、重み付けパラメータ
αが0.1でも0.9でも抽出されるクラスタ核C1,
C8はデータ間の距離からでもいつでも独立して抽出さ
れるべきであり、本方式ではそれを実現している。それ
以外の、集約処理において、どのクラスタに入るかどう
かわからない、いわば不安定と考えられるデータを集約
処理でどのクラスタに入れるかということを重み付けパ
ラメータαを0から1の間の値で任意に変化させること
で実現している。この手法は、従来の1回の集約処理を
行う方式では実現できない。
【0045】図5は、上述した本実施形態の2相データ
クラスタ装置の結果例を示している。図5(a)は本実
施形態の2相データクラスタ装置を通さなかった結果の
イメージ図であり、図5(b)は図5(a)の結果が出
力されるデータに対し、本実施形態の2相データクラス
タ装置を適用した場合の結果のイメージ図である。本実
施形態の2相データクラスタ装置を適用させると、各図
形に対応しているデータ空間内のデータを集約し、各集
約結果で出力されたクラスタ核の位置を図形に変換し、
出力する。例えば、図5(a)の中央付近にある小型の
三角形の集合とそれより大きな三角形の集合が集約され
る。この部分だけに限定すると、三角形の大きさに対応
しているデータの大小を検証して、大きい図形に対応し
ているデータおよび小さい図形に対応しているデータで
各々集約が行われている。これは、既存の方式では実現
することができないデータの傾向を保持したままの集約
処理が行えることを示している。
【0046】
【発明の効果】以上説明したように、本発明によれば、
大量のデータが存在するデータ空間においてデータ間の
距離が近いものによって表現されるデータの固まりをデ
ータの分布の傾向を損なわないように指定された数に集
約する際、初期クラスタ核をランダムにまたは統計的推
測によりデータ空間内にユーザ指定数のK倍だけ設定
し、データと初期クラスタ核をもって集約処理を行い、
処理結果のクラスタ核の位置を出力し、評価関数をもっ
て処理結果のクラスタ核から最適な集約処理を行うこと
ができるクラスタ核を抽出し、このクラスタ核を初期ク
ラスタ核として設定し、再度集約処理を行うことによ
り、1回目の集約処理においてデータの固まりに近いク
ラスタ核が生成され、その中からクラスタ核を抽出し、
集約処理を行うので、データ空間内のデータの固まりを
1つ1つに分けて集約することができる。
【0047】また、本発明によれば、データ空間内に存
在するデータ間の距離によって形成されるデータの固ま
りの集約を最適に行うことが可能となり、大量のデータ
の分布傾向を容易に把握することができる。
【0048】更に、本発明によれば、記憶装置に格納さ
れた大量の件数のデータを集約し、そのクラスタ結果を
図形の集まりとして表示画面に表示することで、図形の
重なりのない結果を出力することが可能である。
【0049】また、本発明によれば、集約処理が最適に
行われるように初期クラスタ核を設定しており、従来の
ようにランダムにまたは統計的推測により初期クラスタ
核を設定して集約処理を行わずに、指定数より多くのク
ラスタ核をまずランダムにまたは統計的推測により設定
し、1回集約処理を行い、この処理されたクラスタ核か
ら2回目の集約処理で必要な初期クラスタ核を抽出し
て、集約処理を行っている。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る2相データクラスタ
装置の構成を示すブロック図である。
【図2】本実施形態が適用される前のデータ空間を示す
図である。
【図3】図2に示すデータ空間に対して本実施形態の1
回目の集約処理を適用した結果を示す図である。
【図4】指定集約数より多いクラスタ核から再度集約処
理を実行するために評価関数を用いて優先クラスタ核を
抽出した後の集約処理結果であって、図3に示す1回目
の集約処理結果に対して再度集約処理を実行した結果を
示す図である。
【図5】本実施形態の2相データクラスタ装置の結果例
であって、同図(a)は本実施形態の2相データクラス
タ装置を通さなかった結果のイメージ図であり、同図
(b)は同図(a)の結果が出力されるデータに対し、
本実施形態の2相データクラスタ装置を適用した場合の
結果のイメージ図である。
【図6】図1に示す実施形態の2相データクラスタ装置
の作用を示すフローチャートである。
【図7】図1に示す実施形態に使用されている1相目初
期点設定装置による1相目初期点生成処理を示すフロー
チャートである。
【図8】図1に示す実施形態に使用されている2相目初
期点抽出装置による2相目初期点抽出処理を示すフロー
チャートである。
【図9】従来の処理を説明するための適用前のデータ空
間を示す図である。
【図10】図9のデータ空間に対してランダムに初期ク
ラスタ核を設定し、既存の集約手法であるK−平均法を
適用した結果を示す図である。
【図11】図9のデータ空間に対して統計的推定を利用
した初期クラスタ核を設定し、既存の集約手法であるK
−平均法を適用した結果を示す図である。
【符号の説明】
401 情報格納装置 402 集約条件入力装置 403 集約データ生成装置 403−1 1相目初期点設定装置 403−2 1相目集約処理装置 403−3 2相目初期点抽出装置 403−4 2相目集約処理装置 404 表示情報生成装置 405 図形情報変換表示装置 405−1 表示装置 406 外部入力装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 飯塚 哲也 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (56)参考文献 原田洋子 他,カラー画像セグメンテ ーションのためのファジイ・クラスタリ ング手法,日本ファジイ学会誌,日本, 日本ファジイ学会,1994年10月15日,第 6巻 第5号,第1021頁乃至第1036頁 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 大量の件数のデータから多次元のデータ
    空間内の関係が近いデータを所望の集約クラスタ数に集
    約したクラスタを生成する2相データクラスタ方法であ
    って、 集約するクラスタ数、集約処理の重み付けをクラスタ核
    間距離かクラスタ内のデータの広がりの程度のどちらで
    行うかを0から1の範囲で指定する重み付けパラメータ
    α、初期核クラスタ数を集約クラスタ数から決定するた
    めの初期核クラスタ数決定パラメータKを指定し、 この指定された初期核クラスタ数を条件として集約処理
    の初期値となる初期クラスタ核を各次元の最大および最
    小の範囲内でランダムにまたは統計的推定により設定
    し、 K−平均法を含むクラスタ手法を集約処理に適用し、ク
    ラスタ核と各データ間の距離を各次元について計算し、
    総合的に距離の近いデータを同一クラスタに集約し、 クラスタ核を抽出するための指標として重み付けパラメ
    ータαを1に近付けるとクラスタ核間距離に関するウェ
    イトが高く設定され、重み付けパラメータαを0に近付
    けると各クラスタ内のデータの分散割合に関する量のウ
    ェイトが高く設定されるための次に示す評価関数Ci : 【数1】Ci =(重み付けパラメータα)*(クラスタ
    核間の距離行列に関する量)+(1−重み付けパラメー
    タα)*(クラスタ核iに集約された各データとクラス
    タ核との距離に関する量) の値が低い順に初期クラスタ核を並べ、上位から指定し
    た集約クラスタ核の数だけを再集約処理のための初期ク
    ラスタ核として抽出し、 この抽出されたクラスタ核を再集約処理の初期クラスタ
    核として使用して集約処理を行い、ユーザの指定した数
    のクラスタを生成することを特徴とする2相データクラ
    スタ方法。
  2. 【請求項2】 大量の件数のデータから多次元のデータ
    空間内の関係が近いデータを所望の集約クラスタ数に集
    約したクラスタを生成する2相データクラスタ方法であ
    って、 集約するクラスタ数、初期クラスタ核数決定パラメータ
    および集約処理対象データを指定し、 設定した集約数、初期クラスタ核数決定パラメータと集
    約処理を行うデータの次元数および各次元の最大および
    最小値を検出し、その範囲で初期クラスタ核をランダム
    に設定するかまたは集約処理対象データから統計的手法
    を用いて初期クラスタ核を設定し、 設定された初期クラスタ核と指定したデータで集約処理
    を行い、処理結果後のクラスタ核の多次元データでの位
    置を生成し、 生成された集約処理結果のクラスタ核から、評価関数の
    重み付けパラメータαをもって、ユーザが希望する集約
    方法でクラスタ核を指定数分抽出し、 優先的に抽出されたクラスタ核と指定した元データをも
    とに集約処理を行い、最終的なクラスタ核のデータ空間
    での位置を出力し、 生成された最終的なクラスタ核のデータを図形の集まり
    として表示するために図形の情報にデータを変換生成
    し、 生成された図形の表示情報を表示装置に出力することを
    特徴とする2相データクラスタ方法。
  3. 【請求項3】 大量の件数のデータから多次元のデータ
    空間内の関係が近いデータを所望の集約クラスタ数に集
    約したクラスタを生成する2相データクラスタ装置であ
    って、 集約するクラスタ数、集約処理の重み付けをクラスタ核
    間距離かクラスタ内のデータの広がりの程度のどちらで
    行うかを0から1の範囲で指定する重み付けパラメータ
    α、初期核クラスタ数を集約クラスタ数から決定するた
    めの初期核クラスタ数決定パラメータKを指定する集約
    パラメータ指定手段と、 該集約パラメータ指定手段より指定された初期核クラス
    タ数を条件として集約処理の初期値となる初期クラスタ
    核を各次元の最大および最小の範囲内でランダムにまた
    は統計的推定により設定する初期クラスタ核設定手段
    と、 K−平均法を含むクラスタ手法を集約処理に適用し、ク
    ラスタ核と各データ間の距離を各次元について計算し、
    総合的に距離の近いデータを同一クラスタに集約する集
    約処理手段と、 クラスタ核を抽出するための指標として重み付けパラメ
    ータαを1に近付けるとクラスタ核間距離に関するウェ
    イトが高く設定され、重み付けパラメータαを0に近付
    けると各クラスタ内のデータの分散割合に関する量のウ
    ェイトが高く設定されるための次に示す評価関数Ci : 【数2】Ci =(重み付けパラメータα)*(クラスタ
    核間の距離行列に関する量)+(1−重み付けパラメー
    タα)*(クラスタ核iに集約された各データとクラス
    タ核との距離に関する量) の値が低い順に初期クラスタ核を並べ、上位から指定し
    た集約クラスタ核の数だけを再集約処理のための初期ク
    ラスタ核として抽出する優先クラスタ核抽出手段と、 該優先クラスタ核抽出手段より抽出されたクラスタ核を
    再集約処理の初期クラスタ核として使用して集約処理を
    行い、ユーザの指定した数のクラスタを生成する集約処
    理再実行手段とを有することを特徴とする2相データク
    ラスタ装置。
  4. 【請求項4】 大量の件数のデータから多次元のデータ
    空間内の関係が近いデータを所望の集約クラスタ数に集
    約したクラスタを生成する2相データクラスタ装置であ
    って、 集約するクラスタ数、初期クラスタ核数決定パラメータ
    および集約処理対象データを指定する集約パラメータ指
    定手段と、 設定した集約数、初期クラスタ核数決定パラメータと集
    約処理を行うデータの次元数および各次元の最大および
    最小値を検出し、その範囲で初期クラスタ核をランダム
    に設定するかまたは集約処理対象データから統計的手法
    を用いて初期クラスタ核を設定する初期クラスタ核設定
    手段と、 設定された初期クラスタ核と指定したデータで集約処理
    を行い、処理結果後のクラスタ核の多次元データでの位
    置を生成する集約処理手段と、 生成された集約処理結果のクラスタ核から、評価関数の
    重み付けパラメータαをもって、ユーザが希望する集約
    方法でクラスタ核を指定数分抽出する優先クラスタ核抽
    出手段と、 優先的に抽出されたクラスタ核と指定した元データをも
    とに集約処理を行い、最終的なクラスタ核のデータ空間
    での位置を出力する集約処理再実行手段と、 生成された最終的なクラスタ核のデータを図形の集まり
    として表示するために図形の情報にデータを変換生成す
    る表示情報生成手段と、 生成された図形の表示情報を表示装置に出力する図形情
    報表示装置とを有することを特徴とする2相データクラ
    スタ装置。
  5. 【請求項5】 大量の件数のデータから多次元のデータ
    空間内の関係が近いデータを所望の集約クラスタ数に集
    約したクラスタを生成する2相データクラスタプログラ
    ムを記録した記録媒体であって、 集約するクラスタ数、集約処理の重み付けをクラスタ核
    間距離かクラスタ内のデータの広がりの程度のどちらで
    行うかを0から1の範囲で指定する重み付けパラメータ
    α、初期核クラスタ数を集約クラスタ数から決定するた
    めの初期核クラスタ数決定パラメータKを指定し、 この指定された初期核クラスタ数を条件として集約処理
    の初期値となる初期クラスタ核を各次元の最大および最
    小の範囲内でランダムにまたは統計的推定により設定
    し、 K−平均法を含むクラスタ手法を集約処理に適用し、ク
    ラスタ核と各データ間の距離を各次元について計算し、
    総合的に距離の近いデータを同一クラスタに集約し、 クラスタ核を抽出するための指標として重み付けパラメ
    ータαを1に近付けるとクラスタ核間距離に関するウェ
    イトが高く設定され、重み付けパラメータαを0に近付
    けると各クラスタ内のデータの分散割合に関する量のウ
    ェイトが高く設定されるための次に示す評価関数Ci : 【数3】Ci =(重み付けパラメータα)*(クラスタ
    核間の距離行列に関する量)+(1−重み付けパラメー
    タα)*(クラスタ核iに集約された各データとクラス
    タ核との距離に関する量) の値が低い順に初期クラスタ核を並べ、上位から指定し
    た集約クラスタ核の数だけを再集約処理のための初期ク
    ラスタ核として抽出し、 この抽出されたクラスタ核を再集約処理の初期クラスタ
    核として使用して集約処理を行い、ユーザの指定した数
    のクラスタを生成することを特徴とする2相データクラ
    スタプログラムを記録した記録媒体。
JP05234098A 1998-03-04 1998-03-04 2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体 Expired - Lifetime JP3478967B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05234098A JP3478967B2 (ja) 1998-03-04 1998-03-04 2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05234098A JP3478967B2 (ja) 1998-03-04 1998-03-04 2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPH11250094A JPH11250094A (ja) 1999-09-17
JP3478967B2 true JP3478967B2 (ja) 2003-12-15

Family

ID=12912078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05234098A Expired - Lifetime JP3478967B2 (ja) 1998-03-04 1998-03-04 2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3478967B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430539B1 (en) 1999-05-06 2002-08-06 Hnc Software Predictive modeling of consumer financial behavior
JP3650572B2 (ja) * 2000-07-07 2005-05-18 日本電信電話株式会社 時系列データの分類装置
JP3636682B2 (ja) * 2001-09-03 2005-04-06 時彦 丹羽 データ分析装置およびその方法
JP5153677B2 (ja) * 2009-02-10 2013-02-27 日本電信電話株式会社 逐次クラスタリング装置とその方法及びプログラム
CN104050162B (zh) * 2013-03-11 2017-10-13 富士通株式会社 数据处理方法和数据处理装置
JP6160445B2 (ja) * 2013-10-30 2017-07-12 富士通株式会社 分析装置、分析方法および分析プログラム
JP6707946B2 (ja) * 2015-06-03 2020-06-10 富士通株式会社 データクラスタリング方法、情報処理装置およびデータクラスタリングプログラム
JP6148370B1 (ja) * 2016-03-29 2017-06-14 西日本電信電話株式会社 グループ化装置、グループ化方法及びコンピュータプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
原田洋子 他,カラー画像セグメンテーションのためのファジイ・クラスタリング手法,日本ファジイ学会誌,日本,日本ファジイ学会,1994年10月15日,第6巻 第5号,第1021頁乃至第1036頁

Also Published As

Publication number Publication date
JPH11250094A (ja) 1999-09-17

Similar Documents

Publication Publication Date Title
US10872446B2 (en) Systems and methods for high dimensional 3D data visualization
Peng et al. A mixed bag of emotions: Model, predict, and transfer emotion distributions
Choo et al. Customizing computational methods for visual analytics with big data
Dang et al. Transforming scagnostics to reveal hidden features
CN103177265B (zh) 基于核函数与稀疏编码的高清图像分类方法
CN108805054A (zh) 一种人脸图像分类方法、系统、设备及计算机存储介质
WO2021164550A1 (zh) 图像分类方法及装置
JP3478967B2 (ja) 2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体
CN105956570B (zh) 基于唇部特征和深度学习的笑脸识别方法
Li et al. Improved generative adversarial networks with reconstruction loss
CN111127316A (zh) 一种基于sngan网络的单幅人脸图像超分辨方法及系统
CN110136067A (zh) 一种针对超分辨率b超影像的实时影像生成方法
Oyedotun et al. Structured compression of deep neural networks with debiased elastic group lasso
JP2018206292A (ja) 要約映像生成装置及びプログラム
CN112802048A (zh) 具有不对称结构的图层生成对抗网络生成方法及装置
Binder et al. Analyzing and validating neural networks predictions
CN111680566A (zh) 一种基于滑动分块生成对抗网络的小样本人脸识别方法
CN108268478A (zh) 一种基于ur-CAIM算法的不平衡数据集特征选择方法及装置
Li et al. Towards Diverse Anime Face Generation: Active Label Completion and Style Feature Network.
CN110020597A (zh) 一种用于头晕/眩晕辅诊的眼部视频处理方法及系统
CN114639166A (zh) 一种基于动作识别的考场异常行为识别方法
Luo et al. Frontal face reconstruction based on detail identification, variable scale self-attention and flexible skip connection
CN110942087A (zh) 一种基于分离求解的矩阵型图像数据分类方法
Wu et al. Energy-relaxed Wasserstein gans (energywgan): towards more stable and high resolution image generation
Loizides et al. The empathic visualisation algorithm (EVA)-An automatic mapping from abstract data to naturalistic visual structure

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081003

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091003

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101003

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111003

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121003

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131003

Year of fee payment: 10

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term