JP2001175640A - Cluster classification device and method, and recording medium recorded with program for cluster classification - Google Patents

Cluster classification device and method, and recording medium recorded with program for cluster classification

Info

Publication number
JP2001175640A
JP2001175640A JP35970899A JP35970899A JP2001175640A JP 2001175640 A JP2001175640 A JP 2001175640A JP 35970899 A JP35970899 A JP 35970899A JP 35970899 A JP35970899 A JP 35970899A JP 2001175640 A JP2001175640 A JP 2001175640A
Authority
JP
Japan
Prior art keywords
data
cluster
clustering
clusters
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP35970899A
Other languages
Japanese (ja)
Other versions
JP3636016B2 (en
Inventor
Nobukatsu Kitajima
伸克 北島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP35970899A priority Critical patent/JP3636016B2/en
Publication of JP2001175640A publication Critical patent/JP2001175640A/en
Application granted granted Critical
Publication of JP3636016B2 publication Critical patent/JP3636016B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a cluster classifying device which is improved in performance by performing classification and analysis by taking a subset (area) of featured data from actual property data which have overlaps between different classes and are used for, e.g. credit examination, marketing, etc. SOLUTION: Past property data are stored in a past property data storage part 21, property data stored in the storage part 21 are received, and a cluster number determination part 31 determines the number of clusters corresponding to the received property data; and the number of clusters and the property data are received from the decision part 31 and clustered by a clustering part 32, the clustering result is received from the clustering part 32, and a result analysis part 33 analyzes the result.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、クラスタ分類装
置、クラスタ分類方法及びクラスタ分類用プログラムを
記録した記録媒体に関し、特に、性質の異なる少なくと
も2種以上のデータを含むデータ集合(データ空間)か
ら、特徴的なデータの部分集合(データ領域)を取り出す
ことによって対象データの分類、分析を目的とするクラ
スタ分類装置、クラスタ分類方法及びクラスタ分類用プ
ログラムを記録した記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a cluster classification device, a cluster classification method, and a recording medium storing a cluster classification program, and more particularly, to a data set (data space) including at least two or more types of data having different properties. The present invention relates to a cluster classification apparatus, a cluster classification method, and a recording medium that records a cluster classification program for extracting and classifying target data by extracting a subset (data area) of characteristic data.

【0002】[0002]

【従来の技術】大量の顧客データや商品データのような
属性データを利用して、与信審査、マーケティング等を
行う場合、対象データの分類を行う必要が生じる。
2. Description of the Related Art When performing credit screening, marketing, and the like using a large amount of attribute data such as customer data and product data, it is necessary to classify target data.

【0003】例えば、与信審査では新規顧客が返済可能
であるか否かを判定するために顧客データの分類が必要
である。
For example, in credit screening, it is necessary to classify customer data in order to determine whether a new customer can be repaid.

【0004】また、マーケティングにおいては、顧客を
購買傾向や興味を持ちそうな製品毎に分類できると非常
に有用な情報が得られる。
[0004] In marketing, very useful information can be obtained if customers can be classified according to purchase tendency or products that are likely to be of interest.

【0005】以下では、与信審査を例にデータ分類につ
いて説明する。このようなデータ分類においては、従来
より、各種方法や装置が提案されているが、その多く
は、対象データ空間中に、分類境界面を構築するクラス
分類を行うものである。
[0005] The data classification will be described below by taking a credit check as an example. Conventionally, various methods and apparatuses have been proposed for such data classification, and most of them perform class classification for constructing a classification boundary surface in a target data space.

【0006】ところが、現実の属性データの分類では、
異なるクラス間の重なりが大きく、データ空間内に境界
面を構築して分類する方法では、どのように境界面を構
築してたとしても、分類性能に限界が生じることが頻繁
に起こりうる。例えば、与信審査で、ローンを返却でき
ない顧客データ(不良データ)の一部は、遅れ等がなく正
常に返済した顧客のデータ(正常データ)と属性が重なる
場合がある。
However, in the classification of actual attribute data,
There is a large overlap between different classes, and in the method of constructing and classifying a boundary surface in the data space, no matter how the boundary surface is constructed, a limit may often occur in the classification performance. For example, in the credit check, a part of the customer data (defective data) for which the loan cannot be returned may have the same attribute as the data (normal data) of the customer who normally repaid without delay.

【0007】また、無理やり境界面を構築する分類方法
では、意味のある特徴を持つデータも単なる正分類、誤
分類として認識されるのみである場合が多い。例えば、
与信審査において、過去の事例では幸運にもローンの返
済が出来たが、確率的にはローンの返済が難しい属性を
持つ顧客は、返済可能性が困難な顧客として認識される
べきであるが、分類境界面を構築するような手法では、
このような認識は難しい。
In the classification method for forcibly constructing a boundary surface, data having meaningful characteristics is often recognized only as a correct classification or a misclassification. For example,
In credit screening, in the past cases, fortunately, loans were repaid, but customers with attributes that make it difficult to repay loans should be recognized as those who have difficulty in repayment, Techniques such as constructing classification boundaries,
Such recognition is difficult.

【0008】上記のような問題を解決する方法として、
データ空間を境界面で分離するのではなく、データ空間
中から特徴的な領域を取り出す方法が知られている。
As a method for solving the above problems,
There is known a method of extracting a characteristic region from a data space instead of separating the data space at a boundary surface.

【0009】例えば、ローン与信の顧客データ空間中か
ら「正常顧客の多い領域」、「不良顧客の多い領域」、
「正常、不良顧客が混在している領域」という特徴的な
領域を取り出すことによって、過去の顧客データの詳し
い分析が可能になる。
[0009] For example, from the customer data space of the loan credit, "the area with many normal customers", "the area with many bad customers",
By extracting a characteristic area "area where both normal and defective customers are mixed", detailed analysis of past customer data becomes possible.

【0010】さらに、新規の顧客に対しても、単に「正
常」、「不良」の判定を行うだけでなく、「正常である
可能性が高い」等の判定を、過去の事例をもとにした確
率値とともに示すことが出来る。
[0010] Further, for a new customer, not only the determination of “normal” and “bad” is made, but also the determination of “likely to be normal” is made based on past cases. It can be shown together with the probability value.

【0011】また、過去の事例から該当する新規顧客に
属性が近い顧客リストを取り出すことも可能である。
It is also possible to extract a customer list whose attributes are close to the new customer concerned from past cases.

【0012】上記の要件を満たす技術は、クラス分類と
いうよりも、むしろクラスタリングの技術といえる。つ
まり、前述の例に示すような、「正常顧客の多い領
域」、「不良顧客の多い領域」、「正常、不良顧客が混
在している領域」という特徴領域をクラスタとして取り
出して、分類、分析を行うのである。
A technique satisfying the above requirements can be said to be a clustering technique rather than a class classification. That is, as shown in the above-described example, the characteristic regions “region with many normal customers”, “region with many bad customers”, and “region where normal and bad customers are mixed” are extracted as clusters, and classified and analyzed. It does.

【0013】クラスタリングの代表的手法としては、最
尤推定法、K-means法、LBG法、階層的方法等が挙げられ
る。
Typical clustering methods include a maximum likelihood estimation method, a K-means method, an LBG method, and a hierarchical method.

【0014】このうち、最尤推定法、K-means法、LBG法
は、クラスタ数、位置、データの分布形状を仮定して、
分類、分析を実行する手法である。ところが、現実のデ
ータを扱う場合には、分類前にはクラスタ数、位置、デ
ータの分布形状は未知であることがほとんどであるた
め、仮定を間違えたり、適切な初期値を設定できない可
能性がある。このような場合には、これらのクラスタリ
ング手法(最尤推定法、K-means法、LBG法、階層的方法
等)では、優れた性能は期待できない。
Among them, the maximum likelihood estimation method, the K-means method, and the LBG method assume the number of clusters, the position, and the distribution shape of data,
This is a method for performing classification and analysis. However, when dealing with actual data, the number of clusters, the position, and the distribution shape of the data are often unknown before classification, so there is a possibility that mistakes may be made or appropriate initial values cannot be set. is there. In such a case, excellent performance cannot be expected with these clustering methods (such as the maximum likelihood estimation method, the K-means method, the LBG method, and the hierarchical method).

【0015】また、階層的方法は、ユーザが定義したデ
ータ間、クラスタ間の距離を基に、データを逐次的に統
合、分割してクラスタリングを行う手法であるが、分
割、統合処理の手順やアルゴリズムの初期状態の設定に
よって結果が大きく変化するという問題点を有してい
る。
The hierarchical method is a method of sequentially integrating and dividing data and performing clustering based on a distance between data and a cluster defined by a user. There is a problem that the result greatly changes depending on the setting of the initial state of the algorithm.

【0016】上記の問題点を解決する方法として、自己
組織化特徴写像(Self-Organizing Map, 「SOM」とい
う)が知られている。
As a method for solving the above problem, a self-organizing feature map (SOM) is known.

【0017】SOMは、分類前にクラスタ数や位置、デ
ータの分布形状を仮定する必要なしに、クラスタリング
を行うことが可能である。
The SOM can perform clustering without having to assume the number of clusters, the position, and the distribution shape of data before classification.

【0018】このSOMについて以下に説明する。図1
0は、SOMを説明するための図である。図10を参照
すると、SOMは、入力層51、競合層52からなる、
2層のニューラルネットワークである。入力層51のユ
ニット数は、対象ベクトルデータの次元数に等しい。競
合層52では、競合層ユニットが、2次元に配置されて
おり、各競合層ユニットは、入力層ユニットと全結合し
ている。
This SOM will be described below. FIG.
0 is a diagram for explaining SOM. Referring to FIG. 10, the SOM includes an input layer 51 and a competition layer 52.
This is a two-layer neural network. The number of units in the input layer 51 is equal to the number of dimensions of the target vector data. In the competitive layer 52, the competitive layer units are two-dimensionally arranged, and each competitive layer unit is fully connected to the input layer unit.

【0019】SOMを使ってクラスタリングを行うと、
最終的に1個以上の競合層ユニットが1個のクラスタに
対応することになる。
When clustering is performed using SOM,
Finally, one or more competitive layer units correspond to one cluster.

【0020】つまり、各クラスタに属する過去のデータ
は、各クラスタに対応する競合層ユニットのいずれかに
割当てられる。
That is, past data belonging to each cluster is assigned to one of the competitive layer units corresponding to each cluster.

【0021】SOMによるクラスタリング処理を説明す
る。SOMでは、 1)入力データに対する競合層ユニットによる競合、及
び、 2)競合に勝った競合層ユニット及び勝った競合層ユニッ
トに競合層上で近傍であるユニットの結合の重みベクト
ルの更新、という2段階でクラスタリング処理を行う。
The clustering process by SOM will be described. In SOM, 1) a competition by a competition layer unit for input data, and 2) an update of a weight vector of a combination of a competition layer unit that has won the competition and a unit that is close to the competition layer unit on the competition layer. The clustering process is performed at the stage.

【0022】競合層ユニット数が、M個の場合、各競合
層ユニットには、番号i = 1、...、Mが付与されてい
る。第i競合層ユニットの入力層との間の結合の重みベ
クトルをwiとする。
When the number of competitive layer units is M, each competitive layer unit is given a number i = 1,..., M. Let wi be the weight vector of the connection between the i-th competitive layer unit and the input layer.

【0023】過去のデータxを入力した場合、データ空
間中で、xに最近接となる競合層の重みベクトルwcを見
つける。
When past data x is input, a weight vector wc of a competitive layer closest to x is found in the data space.

【0024】つまり、 That is,

【0025】である。このwcが競合で勝利した競合層ユ
ニットである。
## EQU1 ## This wc is the competitor unit that won the competition.

【0026】このとき、各競合層ユニットの重みベクト
ルに対して、以下の更新を施す。
At this time, the following update is performed on the weight vector of each competitive layer unit.

【0027】 [0027]

【0028】ここで、Ncは第c競合層ユニットの近傍、
α(t)は学習係数、tは時刻を表す。
Here, Nc is in the vicinity of the c-th competitive layer unit,
α (t) represents a learning coefficient, and t represents time.

【0029】更新を繰り返しながら、Ncとα(t)は徐々
に小さくする。
While repeating the update, Nc and α (t) are gradually reduced.

【0030】以上の処理によって、競合層ユニットの結
合の重みベクトルは、対象データ空間を代表するベクト
ルとなる。そして、各競合層ユニットの結合の重みベク
トルは、その重みベクトルを最近接とする部分空間の代
表データとなる。
By the above processing, the weight vector of the combination of the competitive layer units becomes a vector representing the target data space. Then, the weight vector of the combination of the respective competitive layer units becomes representative data of the subspace in which the weight vector is closest.

【0031】さらに、各重みベクトルを最近接とする過
去の顧客データは、各重みベクトルに対応する競合層ユ
ニットに割当てられて、クラスタリングが実現できるこ
とになる。
Further, past customer data with each weight vector being closest is assigned to a competitive layer unit corresponding to each weight vector, and clustering can be realized.

【0032】SOMについては、例えばT. Kohonenによ
る文献(“Self-Organizing Map”, Proc. IEEE,Vol.
78, No. 9, pp. 1464-1480 (1990年))(「文献1」と
いう)に詳しい。
SOM is described in, for example, a document by T. Kohonen (“Self-Organizing Map”, Proc. IEEE, Vol.
78, No. 9, pp. 1464-1480 (1990)) (referred to as “Reference 1”).

【0033】[0033]

【発明が解決しようとする課題】上記のSOMの性質を
クラスタリングに利用した方法は、これまでも提案され
ているが、前述した特徴的領域を効果的に取り出すため
には、競合層ユニット数がデータに適応している必要が
ある。
Although a method using the above-mentioned SOM property for clustering has been proposed, the number of competing layer units must be reduced in order to effectively extract the above-mentioned characteristic region. Must adapt to data.

【0034】また例えば特開平10-283336号公報、特開
平8-36557号公報、特開平7-64948号公報、特開平2-2115
76号公報等に記載される方法は、競合層ユニット数を初
期的に与えて単純にSOMを利用しているだけであるた
め、異なるクラス間に重なりが存在するデータ集合から
必ずしも適当な特徴領域を取り出せない。
Further, for example, JP-A-10-283336, JP-A-8-36557, JP-A-7-64948, JP-A 2-2115
The method described in Japanese Patent Publication No. 76, etc. merely uses the SOM simply by giving the number of competitive layer units at the initial stage. Therefore, an appropriate feature area is not necessarily obtained from a data set in which overlap exists between different classes. Can not be taken out.

【0035】また、例えば特開平5-205058号公報に記載
されるクラスタリング方法では、最適なクラスタを得る
ために、競合層ユニット数数を順次変化させて、それぞ
れの場合を調べる方法を用いているが、対象データに依
らず機械的にクラスタ数が1個の場合から、あらかじめ
データに対する事前知識なしに決めた最大クラスタ数ま
でクラスタリングを繰り返すため、無駄な処理が多い。
In the clustering method described in, for example, Japanese Patent Application Laid-Open No. 5-205058, in order to obtain an optimal cluster, a method is employed in which the number of units in the competitive layer is sequentially changed and each case is examined. However, since the clustering is repeated from a case where the number of clusters is one mechanically irrespective of the target data to a predetermined maximum number of clusters without prior knowledge of the data, there are many useless processes.

【0036】さらに、各クラスタ数を調べた後で行う評
価は、各クラスタごとの各データと代表データの間の距
離の平均値、及びクラスタ内のデータの平均値をもとに
しているため、やはり本質的に異なるクラス間に重なり
のあるデータを取扱うには不適切である。
Further, since the evaluation performed after checking the number of each cluster is based on the average value of the distance between each data and the representative data of each cluster and the average value of the data in the cluster, It is still unsuitable for dealing with overlapping data between disparate classes.

【0037】そして上記各特許公開公報に記載されてい
る装置等では、SOMのオリジナルアルゴリズムをその
まま用いているだけであり、SOMアルゴリズム特有の
性質により、一部のクラスタにのみデータが集中し、各
クラスタの傾向が明確に取り出せない場合がある。
In the devices and the like described in the above patent publications, only the original algorithm of SOM is used as it is, and data is concentrated only in some clusters due to the characteristic of the SOM algorithm. In some cases, cluster trends cannot be clearly identified.

【0038】このように、例えば与信審査、マーケティ
ング等で分類対象とする属性データはクラス間に重なり
が発生することが多いのにもかかわらず、従来より、提
案されている、多くのクラス分類及びクラスタリング手
法ではクラス間の重なりを考慮しないでむりやり分類し
ているだけであり、適切に対応できていない。
As described above, although attribute data to be classified in, for example, credit screening, marketing, and the like often overlaps between classes, there have been many conventionally proposed class classifications and classifications. In the clustering method, the classification is simply performed without considering the overlap between the classes, and it cannot be appropriately handled.

【0039】したがって、本発明は、上記問題点に鑑み
て創案されたものであって、その目的は、異なるクラス
間に重なりが存在する、例えば与信審査、マーケティン
グ等で用いられている現実の属性データから、特徴的な
データの部分集合(領域)を取り出すことにより分類、分
析を行い、分類精度及び性能を向上する装置及び方法並
びに記録媒体を提供することにある。これ以外の本発明
の目的、利点、特徴等は、以下の説明から、当業者に
は、直ちに明らかとされるであろう。
Accordingly, the present invention has been made in view of the above-mentioned problems, and has as its object to provide an overlap between different classes, for example, a real attribute used in credit screening, marketing and the like. It is an object of the present invention to provide an apparatus and a method and a recording medium that perform classification and analysis by extracting a subset (region) of characteristic data from data to improve classification accuracy and performance. Other objects, advantages, features, etc. of the present invention will be readily apparent to those skilled in the art from the following description.

【0040】[0040]

【課題を解決するための手段】前記目的を達成する本発
明に係る装置は、過去における属性データを記憶する過
去属性データ記憶手段と、前記過去属性データ記憶手段
に記憶されている属性データを受け取り、その属性デー
タに対応したクラスタ数を決定するクラスタ数決定手段
と、前記クラスタ数決定手段から、クラスタ数及び属性
データを受け取り、クラスタリングを行うクラスタリン
グ手段と、前記クラスタリング手段から、クラスタリン
グ結果を受け取り、結果の解析を行う結果解析手段とを
備えている。
According to a first aspect of the present invention, there is provided an apparatus for receiving past attribute data storing means for storing attribute data in the past, and receiving attribute data stored in the past attribute data storing means. Cluster number determining means for determining the number of clusters corresponding to the attribute data; cluster number and attribute data from the cluster number determining means; clustering means for performing clustering; and clustering results from the clustering means, And a result analyzing means for analyzing the result.

【0041】また本発明に係る装置においては、結果の
出力を行う出力手段と、クラスタ数の指定を行うための
入力手段とを備え、前記結果解析手段の解析結果を見な
がら前記クラスタ数決定手段を用いて、最適なクラスタ
数をユーザが指定することが可能としている。
The apparatus according to the present invention further comprises an output means for outputting a result, and an input means for designating the number of clusters, wherein the number of clusters is determined while observing the analysis result of the result analyzing means. , The user can specify the optimal number of clusters.

【0042】本発明に係る装置においては、前記クラス
タ数決定手段が、対象データのクラス比をもとにクラス
タ数を決定する。また、本発明に係る装置においては、
前記結果解析手段が、各クラスタのクラス比、代表デー
タ及びクラスタ内のデータ間の類似性を解析する。前記
属性データは、顧客データであることを特徴とする。
In the apparatus according to the present invention, the number-of-clusters determining means determines the number of clusters based on the class ratio of the target data. In the device according to the present invention,
The result analysis unit analyzes the class ratio of each cluster, the representative data, and the similarity between the data in the cluster. The attribute data is customer data.

【0043】また本発明に係る方法は、過去における属
性データを記憶手段に格納するステップと、前記記憶手
段に格納された属性データに対応したクラスタ数を決定
するステップと、前記決定されたクラスタ数と属性デー
タを受け取ってクラスタリングを行うステップと、クラ
スタリング結果の解析を行うステップと、を含む。
The method according to the present invention further comprises the steps of: storing attribute data in the past in a storage means; determining the number of clusters corresponding to the attribute data stored in the storage means; Receiving the attribute data and performing the clustering, and analyzing the clustering result.

【0044】本発明に係る方法においては、前記解析結
果に基づき、最適なクラスタ数をユーザが指定して、対
象データの分析を可能としている。また、本発明に係る
方法においては、前記クラスタ数を決定するステップに
おいて、対象データのクラス比をもとに、クラスタ数を
決定する。さらに、本発明に係る方法においては、前記
クラスタリング結果の解析を行うステップにおいて、各
クラスタのクラス比、代表データ、及び、クラスタ内の
データ間の類似性を解析することもその特徴の一つとし
ている。
In the method according to the present invention, the user can specify the optimum number of clusters based on the analysis result, and can analyze the target data. In the method according to the present invention, in the step of determining the number of clusters, the number of clusters is determined based on a class ratio of the target data. Further, in the method according to the present invention, in the step of analyzing the clustering result, analyzing the class ratio of each cluster, representative data, and the similarity between the data in the cluster is one of the features. I have.

【0045】本発明は、与信審査において新規顧客が返
済可能であるか否かを判定するための顧客データの分類
のための顧客データ分類、マーケティングにおいて顧客
を購買傾向や興味を持ちそうな製品毎に分類するための
データ分類等のビジネスに用いて好適とされる。
According to the present invention, a customer data classification for classifying customer data for judging whether or not a new customer can be repaid in a credit check, and a customer in a marketing for each product which is likely to have a purchasing tendency or interest. It is suitable for use in business such as data classification for classifying into.

【0046】[0046]

【発明の実施の形態】本発明の実施の形態について以下
に説明する。本発明のクラスタ分類装置は、その好まし
い一実施の形態において、過去における属性データを過
去属性データ記憶手段(21)に記憶し、過去属性デー
タ記憶手段(21)に記憶されている属性データを受け
取り、クラスタ数決定手段(31)で、受け取った属性
データに対応したクラスタ数を決定し、クラスタ数決定
手段(31)からクラスタ数及び属性データを受け取っ
てクラスタリング手段(32)でクラスタリングを行
い、クラスタリング手段(32)からのクラスタリング
結果を受け取り、結果解析手段(33)で結果の解析を
行う。
Embodiments of the present invention will be described below. In a preferred embodiment, the cluster classification device of the present invention stores attribute data in the past in past attribute data storage means (21), and receives attribute data stored in past attribute data storage means (21). The number of clusters corresponding to the received attribute data is determined by the number-of-clusters determining means (31), the number of clusters and the attribute data are received from the number-of-clusters determining means (31), and clustering is performed by the clustering means (32). The clustering result is received from the means (32), and the result is analyzed by the result analyzing means (33).

【0047】クラスタリング手段(32)では、分類前
にデータの分布等を仮定する必要なく、クラスタリング
を行うことで、データ空間中の特徴領域を抽出する。
The clustering means (32) extracts a characteristic region in the data space by performing clustering without assuming data distribution or the like before classification.

【0048】結果解析手段(33)で各クラスタについ
て解析し、解析結果を基に、クラスタ数決定手段(3
1)を用いて、対象データに適合したクラスタ数を決定
することが出来る。
The result analysis means (33) analyzes each cluster, and based on the analysis result, determines the number of clusters (3).
Using 1), the number of clusters suitable for the target data can be determined.

【0049】さらに、クラス間の重なりがある領域と重
なりがない領域を抽出できるまで、クラスタ数決定手段
(31)、クラスタリング手段(32)、結果解析手段
(33)の処理を繰り返すことによって、特徴的データ
領域を抽出し、各特徴データ集合を分析することによっ
て、高精度なデータ分類及び新規データの分類判定が可
能になる。
Further, the processing of the number-of-clusters determining means (31), the clustering means (32), and the result analyzing means (33) is repeated until an area having an overlap between classes and an area having no overlap can be extracted. By extracting an objective data area and analyzing each feature data set, highly accurate data classification and classification determination of new data become possible.

【0050】本発明の方法は、その好ましい一実施の形
態において、(a)過去における属性データを記憶手段
に格納するステップと、(b)前記記憶手段に格納され
た属性データに対応したクラスタ数を決定するステップ
と、(c)前記決定されたクラスタ数と属性データを受
け取ってクラスタリングを行うステップと、(d)クラ
スタリング結果の解析を行うステップと、を含む。
In a preferred embodiment of the method of the present invention, (a) storing attribute data in the past in a storage means; and (b) the number of clusters corresponding to the attribute data stored in the storage means. (C) receiving the determined number of clusters and attribute data and performing clustering, and (d) analyzing the clustering result.

【0051】本発明によれば、解析結果に基づき、最適
なクラスタ数をユーザが指定して、対象データの分析を
可能としている。
According to the present invention, the user can specify the optimum number of clusters on the basis of the analysis result and analyze the target data.

【0052】本発明においては、対象データのクラス比
を基にクラスタ数を決定している。
In the present invention, the number of clusters is determined based on the class ratio of the target data.

【0053】本発明においては、前記結果解析が、各ク
ラスタのクラス比、代表データ及びクラスタ内のデータ
間の類似性を解析する。
In the present invention, the result analysis analyzes the similarity between the class ratio of each cluster, the representative data, and the data in the cluster.

【0054】本発明において、コンピュータ等のデータ
処理装置で実行されるプログラムは、(a)過去におけ
る属性データを過去属性データ記憶部に記憶する処理
と、(b)過去属性データ記憶部に記憶されている属性
データを受け取り、前記属性データに対応したクラスタ
数を決定するクラスタ数決定処理と、(c)クラスタ数
決定処理から、クラスタ数及び属性データを受け取り、
クラスタリングを行うクラスタリング処理と、(d)前
記クラスタリング処理から、クラスタリング結果を受け
取り、結果の解析を行う結果解析処理と、を含み、前記
(a)乃至(d)の各処理をコンピュータで実行させる
ためのプログラムを記録した記録媒体、あるいは該プロ
グラムを担持する無線・有線通信媒体から、該プログラ
ムをデータ処理装置に読み出して実行することで本発明
を実施することができる。
In the present invention, a program executed by a data processing device such as a computer includes (a) a process of storing attribute data in the past in a past attribute data storage unit, and (b) a process of storing attribute data in the past in a past attribute data storage unit. Receiving the attribute data, and determining the number of clusters corresponding to the attribute data; and (c) receiving the cluster number and the attribute data from the cluster number determining process.
A clustering process for performing clustering; and (d) a result analysis process for receiving a clustering result from the clustering process and analyzing the result, and causing the computer to execute each of the processes (a) to (d). The present invention can be implemented by reading out the program from a recording medium storing the program or a wireless / wired communication medium carrying the program into a data processing device and executing the program.

【0055】[0055]

【実施例】上記した本発明の実施の形態についてさらに
詳細に説明するため、本発明の実施例について図面を参
照して以下に説明する。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing an embodiment of the present invention;

【0056】図1は、本発明の一実施例の構成を示す図
である。図1を参照すると、本発明の一実施例は、キー
ボード等の入力装置1と、情報を記憶する記憶装置2
と、プログラム制御により動作するデータ処理装置3
と、ディスプレイ装置や印刷装置等の出力装置4と、を
備えている。
FIG. 1 is a diagram showing the configuration of one embodiment of the present invention. Referring to FIG. 1, an embodiment of the present invention includes an input device 1 such as a keyboard and a storage device 2 for storing information.
And a data processing device 3 operating under program control
And an output device 4 such as a display device or a printing device.

【0057】データ処理装置3は、クラスタ数決定部3
1と、クラスタリング部32と、結果解析部33と、を
備えている。
The data processing device 3 includes a cluster number determining unit 3
1, a clustering unit 32, and a result analysis unit 33.

【0058】記憶装置2は、入力装置1から入力された
過去における属性データを記憶する過去属性データ記憶
部21を備えている。
The storage device 2 includes a past attribute data storage section 21 for storing past attribute data input from the input device 1.

【0059】クラスタ数決定部31は、過去属性データ
記憶部21に記憶されている過去の属性データを読み出
し、該属性データをクラスタリングが可能な形態に整形
し、集計する。
The number-of-clusters determining unit 31 reads out past attribute data stored in the past attribute data storage unit 21, shapes the attribute data into a form that can be clustered, and totals.

【0060】クラスタ数決定部31は、過去属性データ
記憶部21に記憶されている属性データを集計した結果
から、初期クラスタ数を設定する。
The number-of-clusters determining unit 31 sets the initial number of clusters based on the result of the aggregation of the attribute data stored in the past attribute data storage unit 21.

【0061】クラスタリング部32は、クラスタ数決定
部31でクラスタリング可能な形態に整形し、集計され
た属性データを受け取り、SOMのアルゴリズムに従っ
て、クラスタリングを行う。SOMのアルゴリズムにつ
いては、前述した、例えばT.Kohonenの文献1の記載が
参照される。
The clustering section 32 receives the attribute data that has been formed into a form that can be clustered by the cluster number determining section 31, and performs clustering according to the SOM algorithm. For the SOM algorithm, reference is made to the description of the above-mentioned document 1 of, for example, T. Kohonen.

【0062】クラスタリング部32において、SOMの
オリジナルアルゴリズムを用いた場合、SOMアルゴリ
ズム特有の性質により、一部のクラスタにのみ競合の勝
利が集中することによって、競合層全体で対象データ全
体の傾向が把握できなくなり、各クラスタの傾向が明確
に取り出せない場合がある。
When the original algorithm of the SOM is used in the clustering unit 32, the victory of the competition is concentrated on only a part of the clusters due to the characteristic characteristic of the SOM algorithm. In some cases, it is not possible to clearly extract the tendency of each cluster.

【0063】このような場合には、良心メカニズムアル
ゴリズムを用いて、補正を行うことで、上記の状況が回
避される。良心メカニズムアルゴリズムとは、クラスタ
リング処理過程の競合の勝利履歴を基にして、競合に補
正を行うことによって、競合層全体で、対象データ全体
の傾向を把握することを可能にするアルゴリズムであ
る。SOMのオリジナルアルゴリズムに発生し得る上記
の問題点、及び、良心メカニズムアルゴリズムについて
は、D. DeSienoによる文献(“Adding a Conscience to
Competitive Learning,”Proc. Int. Conf. on Neural
Networks, I, pp. 117-124 (1988))(「文献2」とい
う)等の記載が参照される。
In such a case, the above situation is avoided by performing correction using a conscience mechanism algorithm. The conscience mechanism algorithm is an algorithm that makes it possible to comprehend the competition based on the victory history of the competition in the clustering process and thereby grasp the tendency of the entire target data in the entire competition layer. For the above-mentioned problems that may occur in the original algorithm of SOM and the conscience mechanism algorithm, see the document by D. DeSieno (“Adding a Conscience to
Competitive Learning, ”Proc. Int. Conf. On Neural
Networks, I, pp. 117-124 (1988)) (referred to as “Reference 2”) and the like.

【0064】結果解析部33は、クラスタリング部32
から、クラスタリング結果を受け取り、結果を出力装置
4に表示して処理を終了するか、あるいは、再度クラス
タ数を変更してクラスタリングを行うかを判定するため
の解析を行う。
The result analyzing unit 33 includes the clustering unit 32
Then, an analysis is performed to determine whether to receive the clustering result and display the result on the output device 4 to end the processing, or to change the number of clusters again to perform clustering.

【0065】結果解析の結果、各クラスタの傾向が明確
化できなかった場合には、傾向が明確化するまで、クラ
スタ数を変更して、上記したクラスタリング処理と結果
解析を繰り返す。
As a result of the result analysis, when the tendency of each cluster cannot be clarified, the number of clusters is changed and the above-described clustering process and result analysis are repeated until the tendency is clarified.

【0066】上記処理によって、対象データ空間中の特
徴的データ領域を、クラスタとして取り出すことが可能
となり、その結果を用いて、クラス間に重なりのあるデ
ータでも分類を行うことが可能になる。例えば、あるデ
ータが、あるクラスのデータが多く属するクラスタに割
当てられた場合、当該データは、そのクラスに属する可
能性が高い。
By the above processing, a characteristic data area in the target data space can be extracted as a cluster, and the result can be used to classify even data having an overlap between classes. For example, when certain data is assigned to a cluster to which many data of a certain class belongs, there is a high possibility that the data belongs to the class.

【0067】また、あるデータが複数クラスのデータが
属するクラスタに割当てられた場合には、当該データ
が、確実に特定クラスに属する確率は低くなる。さら
に、その確率を過去データの集計によって概算すること
も可能になる。
When certain data is assigned to a cluster to which a plurality of classes of data belong, the probability that the data belongs to a specific class is reduced. Further, the probability can be estimated by summing up the past data.

【0068】図2は、本発明の一実施例の動作を説明す
るためのフローチャートである。以下では、図3に示す
顧客データ(属性、年齢、性別、年収、職業、業種、婚
姻、返済状況等)を用いて金融機関における与信審査を
行う場合を例に、本発明の一実施例の動作について説明
する。
FIG. 2 is a flowchart for explaining the operation of one embodiment of the present invention. In the following, an example of performing a credit check at a financial institution using the customer data (attribute, age, gender, annual income, occupation, industry, marriage, repayment status, etc.) shown in FIG. The operation will be described.

【0069】動作を開始すると(図2のステップ10
1)、クラスタ数決定部31において、クラスタリング
に用いる属性データの整形、集計を行い、初期クラスタ
数の設定を行う(図2のステップ102)。
When the operation is started (step 10 in FIG. 2)
1) The cluster number determination unit 31 shapes and totals the attribute data used for clustering, and sets the initial cluster number (step 102 in FIG. 2).

【0070】属性データの整形は、例えば、図4のよう
なテーブルを利用して行う。図5は、図3に示した顧客
データについて属性データを整形した例を示す図であ
る。
The shaping of the attribute data is performed using, for example, a table as shown in FIG. FIG. 5 is a diagram showing an example in which the attribute data is shaped for the customer data shown in FIG.

【0071】図2のステップ102における初期クラス
タ数の設定は、例えば次のように行う。返済遅れ等なく
正常に返済が出来た顧客のデータ(正常データ)と、返済
遅れ等の異常が発生した顧客のデータ(不良データ)の個
数比を調べる。多くの場合、特殊なデータ(この例で
は、不良データ)は個数が少ない。
The setting of the initial number of clusters in step 102 of FIG. 2 is performed, for example, as follows. The number ratio of customer data that has been normally repaid without repayment delays (normal data) and customer data that has an abnormal occurrence such as repayment delays (defective data) is checked. In many cases, the number of special data (defective data in this example) is small.

【0072】良心メカニズムアルゴリズムを利用して、
各クラスタに同数のデータが割当てられることを想定し
た場合、不良データのみのクラスタと、正常データのみ
のクラスタが生成できれば理想的である。
Using the conscience mechanism algorithm,
Assuming that the same number of data is allocated to each cluster, it is ideal if a cluster with only bad data and a cluster with only normal data can be generated.

【0073】したがって、初期クラスタ数の一例は、デ
ータ全体数を不良データ数で割った値に近い整数値とす
るものである。例えば、正常データが900個、不良デー
タが100個のデータについてクラスタリングを行う場合
は、初期クラスタ数は10個とする。
Accordingly, an example of the initial cluster number is an integer value close to a value obtained by dividing the total number of data by the number of defective data. For example, when clustering is performed on data having 900 normal data and 100 defective data, the initial number of clusters is assumed to be 10.

【0074】クラスタ数決定部31は、クラスタリング
用のデータと初期クラスタ数をクラスタリング部32に
渡す。
The number-of-clusters determining unit 31 passes the data for clustering and the initial number of clusters to the clustering unit 32.

【0075】次に、クラスタリング部32において、ク
ラスタ数決定部31から受け取った初期クラスタ数で、
SOMのアルゴリズムに従ってクラスタリングを行う
(図2のステップ103)。
Next, in the clustering unit 32, the initial cluster number received from the cluster number determination unit 31
Perform clustering according to SOM algorithm
(Step 103 in FIG. 2).

【0076】SOMのアルゴリズムについては、例えば
前述したT. Kohonenによる文献1の記載が参照される。
For the SOM algorithm, for example, the description of the above-mentioned document 1 by T. Kohonen is referred to.

【0077】クラスタリング部32は、クラスタリング
結果を結果解析部33に送る。
The clustering section 32 sends the clustering result to the result analyzing section 33.

【0078】結果解析部33は、クラスタリング部32
からクラスタリング結果を受け取り、解析する(図2の
ステップ104)。
The result analyzing unit 33 includes the clustering unit 32
Receives and analyzes the clustering result (step 104 in FIG. 2).

【0079】結果解析部33は、解析結果を出力装置4
に渡し、出力装置4は、受け取った結果を表示する(図
2のステップ105)。
The result analyzer 33 outputs the analysis result to the output device 4
And the output device 4 displays the received result (step 105 in FIG. 2).

【0080】結果解析部33で行われる解析として、例
えば、クラスタリングの結果、各クラスタに属するデー
タの正常/不良比を求める。各クラスタに属するデータ
の正常/不良比を調べた結果、「属するデータのほとん
どが正常データであるクラスタ」、「属するデータのほ
とんどが不良データであるクラスタ」、「属するデータ
のほぼ半数が正常、ほぼ半数が不良であるクラスタ」等
が求まっており、ユーザが顧客データの傾向を把握でき
れば、ユーザの判断で(図2のステップ106)、クラス
タリングを終了する(図2のステップ108)。
As an analysis performed by the result analysis unit 33, for example, a normal / defective ratio of data belonging to each cluster is obtained as a result of clustering. As a result of examining the normal / defective ratio of the data belonging to each cluster, "a cluster where most of the belonging data is normal data", "a cluster where most of the belonging data is bad data", "almost half of the belonging data are normal, Clusters with almost half of which are defective, etc. are obtained. If the user can grasp the tendency of the customer data, the user's judgment (step 106 in FIG. 2) ends the clustering (step 108 in FIG. 2).

【0081】結果解析部33が、出力装置4に上記の正
常/不良比を送る場合には、図3に示すようなグラフィ
カルデータも併せて送ることによってユーザの理解をさ
らに助けることができるようになる。
When the result analyzer 33 sends the above-mentioned normal / defective ratio to the output device 4, the graphical data as shown in FIG. 3 is also sent so that the user's understanding can be further assisted. Become.

【0082】図6は、SOMの競合層を図式化したもの
であり、前述した通り、各競合層ユニットがそれぞれ別
々のクラスタに対応する。
FIG. 6 is a schematic diagram of a competitive layer of the SOM. As described above, each competitive layer unit corresponds to a separate cluster.

【0083】図6は、各クラスタに属する顧客データの
正常/不良比を円グラフ表示している。図6に示す例で
は、 ・競合層ユニット1が「属するデータのほとんどが正常
データであるクラスタ」、 ・競合層ユニット4が「属するデータのほとんどが不良
データであるクラスタ」、 ・競合層ユニット2及び競合層ユニット3が「正常、不
良データが混在するクラスタ」であることがわかる。
FIG. 6 is a pie chart showing the normal / defective ratio of customer data belonging to each cluster. In the example shown in FIG. 6, the competitive layer unit 1 is “a cluster in which most of the data to which the data belongs is normal data”; the competitive layer unit 4 is a “cluster in which most of the data to which the data belongs is bad data”; Further, it can be seen that the competitive layer unit 3 is a “cluster in which normal and defective data are mixed”.

【0084】また、各競合層ユニット(クラスタ)をクリ
ックすることによって、図7に示すように、各クラスタ
に属する顧客データを表示することで、各クラスタに属
する顧客データを詳細に分析することが出来る。
By clicking each competitive layer unit (cluster) to display the customer data belonging to each cluster as shown in FIG. 7, it is possible to analyze the customer data belonging to each cluster in detail. I can do it.

【0085】図7において、「代表データ」とは、競合
層ユニットの重みベクトルの値に対応する最も近い属性
値である。
In FIG. 7, “representative data” is the closest attribute value corresponding to the value of the weight vector of the competitive layer unit.

【0086】ここで、各クラスタに属するデータを代表
データにユークリッド距離等の距離が近い順で整列させ
ることも可能である。
Here, it is also possible to arrange the data belonging to each cluster to the representative data in ascending order of distance such as Euclidean distance.

【0087】未だ傾向が明確化していない等の理由で、
ユーザがさらに分析を行うと判断した場合(図2のステ
ップ106)、クラスタ数決定部32に対して、ユーザ
の指示によって、クラスタ数を変更し(図2のステップ
107)、再度クラスタリングを行い(図2のステップ1
03)、ユーザが満足できる結果が得られるまで上記の
処理を繰り返す。
For the reason that the tendency has not been clarified yet,
If the user determines that further analysis is to be performed (step 106 in FIG. 2), the number of clusters is changed by the user's instruction to the cluster number determination unit 32 (step 107 in FIG. 2), and clustering is performed again (step 106 in FIG. 2). Step 1 of FIG.
03), The above processing is repeated until a satisfactory result is obtained by the user.

【0088】クラスタ数の変更は、例えば、上記したよ
うに、10個のクラスタで傾向が明確化しなかった場合
は、より細かくクラスタ分割を行うことによって、傾向
が出る可能性があるので、各クラスタに、50個ずつデ
ータが割当てられることを想定して、クラスタ数を20
個に増加させる。
For example, as described above, if the tendency is not clarified in ten clusters as described above, there is a possibility that the tendency may appear by performing finer cluster division. The number of clusters is assumed to be 20
Increase to pieces.

【0089】ユーザが満足できるクラスタリング結果が
得られた後には、新規の顧客の判定を行うことができ
る。その方法について、以下に説明する。
After a satisfactory clustering result is obtained for the user, a new customer can be determined. The method will be described below.

【0090】新規の顧客データが入力装置1から入力さ
れると、クラスタリング部32は、新規の顧客データに
最も近い重みを持つ競合層ユニット、すなわちクラスタ
を発見し、結果を結果解析部33に渡す。
When new customer data is input from the input device 1, the clustering unit 32 finds a competitive layer unit having a weight closest to the new customer data, that is, a cluster, and passes the result to the result analysis unit 33. .

【0091】最近接と判断されたクラスタ内に属するデ
ータのクラスを集計することによって新規顧客データの
判定を行うことが出来る。
New customer data can be determined by counting the classes of data belonging to the cluster determined to be closest.

【0092】結果解析部34は、解析した結果を出力装
置4に渡し、出力装置4では、その結果を表示する。図
8は、その表示例を示す図である。図8において、新規
入力顧客データが属する競合層ユニット、すなわち競合
層ユニット4に対応するクラスタが画面上で光り、光っ
たクラスタをマウス等でクリックした際に、入力した新
規データ及び、その新規データに近い過去の顧客データ
が整列されて、表示されている。
The result analyzing section 34 passes the analyzed result to the output device 4, and the output device 4 displays the result. FIG. 8 shows an example of the display. In FIG. 8, the cluster corresponding to the competitive layer unit to which the newly input customer data belongs, that is, the cluster corresponding to the competitive layer unit 4 shines on the screen, and when the lit cluster is clicked with a mouse or the like, the new data input and the new data are input. Past customer data close to is arranged and displayed.

【0093】図8に示す例では、新規顧客に最近接のク
ラスタは不良データが多数属するクラスタであるため、
新規顧客データは返済遅れ等が発生する可能性が高いと
判定できる。もちろん、クラスタに属する過去のデータ
数から、新規データが不良である確率を計算することも
出来る。
In the example shown in FIG. 8, the cluster closest to the new customer is a cluster to which many defective data belong.
The new customer data can be determined to have a high possibility of repayment delay or the like. Of course, it is also possible to calculate the probability that the new data is defective from the number of past data belonging to the cluster.

【0094】なお、前記実施例において、過去属性デー
タ記憶部21は、例えば、磁気ディスク装置、半導体メ
モリ記憶装置等の書き込み及び読み出し可能な記憶装置
が用いられる。
In the above embodiment, the past attribute data storage unit 21 is a writable and readable storage device such as a magnetic disk device and a semiconductor memory storage device.

【0095】また、クラスタ数決定部31、クラスタリ
ング部32、結果解析部33を含む、プログラム制御さ
れるデータ処理装置3はパーソナルコンピュータやワー
クステーション等の情報処理装置からなる。
The program-controlled data processing device 3 including the number-of-clusters determining unit 31, the clustering unit 32, and the result analyzing unit 33 comprises an information processing device such as a personal computer or a workstation.

【0096】さらに、入力装置1は、キーボード、マウ
ス等の入力装置、出力装置4は、CRTディスプレイあ
るりは液晶ディスプレイ等よりなる。
Further, the input device 1 comprises an input device such as a keyboard and a mouse, and the output device 4 comprises a CRT display or a liquid crystal display.

【0097】次に、本発明の第2実施例について説明す
る。図2は、本発明の第2の実施例の構成を示す図であ
る。
Next, a second embodiment of the present invention will be described. FIG. 2 is a diagram showing the configuration of the second embodiment of the present invention.

【0098】図9は、本発明の第2実施形態によるクラ
スタ分類装置の構成を示すブロック図である。図9にお
いて、図1と同一又は同等の要素には同一の参照符号が
付されている。図9を参照すると、本発明の第2の実施
例は、前記実施例の構成に加えて、クラスタ分類プログ
ラムを記録した、磁気ディスク、半導体メモリその他の
記録媒体からなる記録媒体5を備えている。クラスタ分
類プログラムは、データ処理装置3上で、前記したクラ
スタ数決定部31、クラスタリング部32、結果解析部
33の機能・処理を実現する。記録媒体5から読み出し
装置(不図示)を介してデータ処理装置3に読み込ま
れ、実行形式のプログラムがデータ処理装置3の主記憶
にロードされ、データ処理装置3のCPUで該プログラ
ムを実行することで、本発明を実施することができる。
FIG. 9 is a block diagram showing the configuration of the cluster classification device according to the second embodiment of the present invention. In FIG. 9, the same or equivalent elements as those in FIG. 1 are denoted by the same reference numerals. Referring to FIG. 9, the second embodiment of the present invention includes, in addition to the configuration of the above-described embodiment, a recording medium 5 on which a cluster classification program is recorded, which is composed of a magnetic disk, a semiconductor memory, or another recording medium. . The cluster classification program implements the functions and processes of the above-described cluster number determination unit 31, clustering unit 32, and result analysis unit 33 on the data processing device 3. The program is read from the recording medium 5 into the data processing device 3 via a reading device (not shown), and an executable program is loaded into the main memory of the data processing device 3 and the CPU of the data processing device 3 executes the program. Thus, the present invention can be implemented.

【0099】[0099]

【発明の効果】以上説明したように、本発明によれば、
データの分類に際して、各クラスのデータが主として存
在するデータ領域や複数クラスのデータが混在するデー
タ領域を取り出すことが出来る、という効果を奏する。
As described above, according to the present invention,
In classifying the data, it is possible to extract a data area in which data of each class mainly exists or a data area in which data of a plurality of classes are mixed.

【0100】その理由は、例えば金融機関などの与信審
査、マーケティング等で分類対象とする属性データが一
般的に持っている性質である、異なるクラス間に存在す
る重なりに対処するために、本発明においては、対象デ
ータの分析を行いながらSOMによるクラスタリングを
繰り返す構成としているためである。
The reason is that, for example, in order to deal with the overlap existing between different classes, which is a property that attribute data to be classified in credit screening and marketing of financial institutions and the like generally has, the present invention In this case, the clustering by SOM is repeated while analyzing the target data.

【0101】本発明によれば、分類の結果得られたデー
タ領域を利用することによって、データの分類を高い性
能で行うことができるだけでなく、対象データの性質を
詳しく解析することが可能になる、という効果を奏す
る。
According to the present invention, by using the data area obtained as a result of the classification, not only can the data be classified with high performance, but also the characteristics of the target data can be analyzed in detail. The effect is as follows.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例をなすクラスタ分類装置の構
成を示す図である。
FIG. 1 is a diagram illustrating a configuration of a cluster classification device according to an embodiment of the present invention.

【図2】本発明の一実施例の動作を説明するためのフロ
ーチャートである。
FIG. 2 is a flowchart for explaining the operation of one embodiment of the present invention.

【図3】本発明の一実施例を具体的の説明するための図
であり、属性データの一例を示す図である。
FIG. 3 is a diagram for specifically describing one embodiment of the present invention, and is a diagram illustrating an example of attribute data.

【図4】本発明の一実施例における属性データの数値へ
の変換の一例を示す図である。
FIG. 4 is a diagram illustrating an example of conversion of attribute data into numerical values according to an embodiment of the present invention.

【図5】本発明の一実施例における属性データの数値化
例を示す図である。
FIG. 5 is a diagram illustrating an example of digitizing attribute data according to an embodiment of the present invention.

【図6】本発明の一実施例におけるクラスタリング結果
の表示例を模式的に示す図である。
FIG. 6 is a diagram schematically illustrating a display example of a clustering result according to an embodiment of the present invention.

【図7】本発明の一実施例におけるクラスタリング結果
の詳細表示例を模式的に示す図である。
FIG. 7 is a diagram schematically showing a detailed display example of a clustering result in one embodiment of the present invention.

【図8】本発明の一実施例において新規顧客データ適用
時の判定結果の表示例を模式的に示す図である。
FIG. 8 is a diagram schematically illustrating a display example of a determination result when new customer data is applied in one embodiment of the present invention.

【図9】本発明の他の実施例の構成を示す図である。FIG. 9 is a diagram showing a configuration of another embodiment of the present invention.

【図10】SOMの構成を模式的に示す図である。FIG. 10 is a diagram schematically showing a configuration of an SOM.

【符号の説明】[Explanation of symbols]

1 入力装置 2 記憶装置 3 データ処理装置 4 出力装置 5 記録媒体 21 過去属性データ記憶部 31 クラスタ数決定部 32 クラスタリング部 33 結果解析部 REFERENCE SIGNS LIST 1 input device 2 storage device 3 data processing device 4 output device 5 recording medium 21 past attribute data storage unit 31 cluster number determination unit 32 clustering unit 33 result analysis unit

Claims (29)

【特許請求の範囲】[Claims] 【請求項1】過去における属性データを記憶する記憶手
段と、 前記記憶手段に記憶されている属性データから前記属性
データに対応したクラスタ数を決定するクラスタ数決定
手段と、 前記クラスタ数決定手段で決定されたクラスタ数及び前
記属性データを受け取りクラスタリングを行うクラスタ
リング手段と、 前記クラスタリング手段から出力されるクラスタリング
結果を受け取り、前記クラスタリング結果の解析を行う
結果解析手段と、 を備える、ことを特徴とするクラスタ分類装置。
A storage means for storing attribute data in the past; a cluster number determination means for determining a cluster number corresponding to the attribute data from the attribute data stored in the storage means; A clustering unit that receives the determined number of clusters and the attribute data and performs clustering; and a result analysis unit that receives a clustering result output from the clustering unit and analyzes the clustering result. Cluster classifier.
【請求項2】結果の出力を行う出力手段と、 クラスタ数の指定を行うための入力手段と、を備え、 前記結果解析手段の解析結果に基づき、前記クラスタ数
決定手段に対して、最適なクラスタ数を設定可能とし
た、ことを特徴とする請求項1記載のクラスタ分類装
置。
An output means for outputting a result; and an input means for designating the number of clusters, wherein an optimum value is provided to the number-of-clusters determining means based on an analysis result of the result analyzing means. 2. The cluster classification device according to claim 1, wherein the number of clusters can be set.
【請求項3】前記クラスタ数決定手段が、対象データの
クラス比をもとにクラスタ数を決定する、ことを特徴と
する請求項1又は2記載のクラスタ分類装置。
3. The cluster classification apparatus according to claim 1, wherein said cluster number determination means determines the number of clusters based on a class ratio of the target data.
【請求項4】前記結果解析手段が、各クラスタのクラス
比、代表データ、及び、クラスタ内のデータ間の類似性
を解析する、ことを特徴とする請求項1乃至3のいずれ
か一に記載のクラスタ分類装置。
4. The method according to claim 1, wherein said result analyzing means analyzes a class ratio of each cluster, representative data, and similarity between data in the cluster. Cluster classifier.
【請求項5】前記属性データが、顧客データであること
を特徴とする請求項1乃至4のいずれか一に記載のクラ
スタ分類装置。
5. The cluster classification device according to claim 1, wherein the attribute data is customer data.
【請求項6】与信審査において新規顧客が返済可能であ
るか否かを判定するための顧客データの分類のための顧
客データ分類装置が、請求項5に記載のクラスタ分類装
置よりなる与信審査向けのクラスタ分類装置。
6. A customer data classification device for classifying customer data for judging whether a new customer can be repaid in a credit screening is provided for a credit screening system comprising the cluster classification device according to claim 5. Cluster classifier.
【請求項7】マーケティングにおいて顧客を購買傾向や
興味を持ちそうな製品毎に分類するための顧客データ分
類装置が、請求項5に記載のクラスタ分類装置よりなる
マーケティング向け顧客のクラスタ分類装置。
7. A cluster classification device for marketing customers, comprising a cluster classification device according to claim 5, wherein a customer data classification device for classifying customers into products that are likely to be purchased or interested in marketing.
【請求項8】過去における属性データを記憶手段に格納
するステップと、 前記記憶手段に格納された属性データに対応したクラス
タ数を決定するステップと、 前記決定されたクラスタ数と属性データを受け取ってク
ラスタリングを行うステップと、 クラスタリング結果の解析を行うステップと、 を含む、ことを特徴とするクラスタ分類方法。
8. A step of storing attribute data in the past in storage means, a step of determining the number of clusters corresponding to the attribute data stored in the storage means, and receiving the determined number of clusters and attribute data. A cluster classification method, comprising: performing a clustering; and analyzing a clustering result.
【請求項9】前記解析結果に基づき、最適なクラスタ数
をユーザが指定して、対象データの分析を可能としてい
る、ことを特徴とする請求項8記載のクラスタ分類方
法。
9. The cluster classification method according to claim 8, wherein a user designates an optimal number of clusters based on the analysis result, thereby enabling analysis of the target data.
【請求項10】前記クラスタ数を決定するステップにお
いて、対象データのクラス比をもとにクラスタ数を決定
する、ことを特徴とする請求項8又は9記載のクラスタ
分類方法。
10. The cluster classification method according to claim 8, wherein in the step of determining the number of clusters, the number of clusters is determined based on a class ratio of the target data.
【請求項11】前記クラスタリング結果の解析を行うス
テップにおいて、各クラスタのクラス比、代表データ、
及び、クラスタ内のデータ間の類似性を解析する、こと
を特徴とする請求項8乃至10のいずれか一に記載のク
ラスタ分類方法。
11. In the step of analyzing the clustering result, the class ratio of each cluster, representative data,
The cluster classification method according to any one of claims 8 to 10, wherein similarity between data in the cluster is analyzed.
【請求項12】前記属性データが、顧客データである、
ことを特徴とする請求項8乃至11のいずれか一に記載
のクラスタ分類方法。
12. The attribute data is customer data.
The cluster classification method according to any one of claims 8 to 11, wherein:
【請求項13】与信審査において新規顧客が返済可能で
あるか否かを判定するための顧客データの分類のための
顧客のデータの分類方法として、請求項12記載のクラ
スタ分類方法を用いたことを特徴とするクラスタ分類方
法。
13. The cluster classification method according to claim 12, wherein the cluster classification method according to claim 12 is used as a classification method of customer data for classifying customer data for determining whether a new customer can be repaid in a credit check. A cluster classification method characterized by the following.
【請求項14】マーケティングにおいて顧客を購買傾向
や興味を持ちそうな製品毎に分類するための顧客データ
の分類方法として、請求項12に記載のクラスタ分類方
法を用いたことを特徴とするクラスタ分類方法。
14. A cluster classification method using the cluster classification method according to claim 12 as a method of classifying customer data for classifying customers into products that are likely to be purchased or interested in marketing. Method.
【請求項15】(a)過去における属性データを記憶部
に記憶する処理と、 (b)前記記憶部に記憶されている属性データを受け取
り、前記属性データに対応したクラスタ数を決定するク
ラスタ数決定処理と、 (c)前記クラスタ数決定処理から、クラスタ数及び属
性データを受け取り、クラスタリングを行うクラスタリ
ング処理と、 (d)前記クラスタリング処理から、クラスタリング結
果を受け取り、結果の解析を行う結果解析処理と、 の前記(a)乃至(d)の各処理をコンピュータで実行
させるためのプログラムを記録した記録媒体。
15. A process for storing (a) past attribute data in a storage unit; and (b) a cluster number for receiving attribute data stored in the storage unit and determining a cluster number corresponding to the attribute data. A determination process; (c) a clustering process of receiving the number of clusters and attribute data from the cluster number determination process and performing clustering; and (d) a result analysis process of receiving a clustering result from the clustering process and analyzing the result. And a recording medium on which a program for causing a computer to execute each of the processes (a) to (d) is recorded.
【請求項16】請求項15記載の記録媒体において、前
記解析結果を見ながら最適なクラスタ数をユーザが指定
して対象データの分析が可能とするために、 (f)解析結果の出力を行う出力処理と、 (g)クラスタ数の指定を行うための入力処理と、を前
記コンピュータで実行させるためのプログラムを記録し
た記録媒体。
16. The recording medium according to claim 15, wherein: (f) outputting the analysis result so that the user can specify the optimum number of clusters while observing the analysis result and analyze the target data. A recording medium storing a program for causing the computer to execute an output process and (g) an input process for designating the number of clusters.
【請求項17】請求項15又は16記載の記録媒体にお
いて、前記クラスタ数決定処理が、対象データのクラス
比をもとにクラスタ数を決定するものであり、前記クラ
スタ数決定処理を前記コンピュータで実行させるための
プログラムを記録した記録媒体。
17. The recording medium according to claim 15, wherein said number-of-clusters determining process determines the number of clusters based on a class ratio of target data. A recording medium on which a program to be executed is recorded.
【請求項18】請求項15乃至17のいずれか一に記載
の記録媒体において、前記結果解析処理が、各クラスタ
のクラス比、代表データ、及び、クラスタ内のデータ間
の類似性を解析するものであり、前記結果解析処理を、
前記コンピュータで実行させるためのプログラムを記録
した記録媒体。
18. The recording medium according to claim 15, wherein the result analysis process analyzes a class ratio of each cluster, representative data, and similarity between data in the cluster. And the result analysis processing is
A recording medium recording a program to be executed by the computer.
【請求項19】請求項15乃至18のいずれか一に記載
の記録媒体において、前記属性データが顧客データであ
る記録媒体。
19. The recording medium according to claim 15, wherein said attribute data is customer data.
【請求項20】(a)記憶部に記憶されている属性デー
タについて、クラスタリングに用いる属性データの整
形、及び属性データの集計を行い、クラスタ数を決定す
るステップと、 (b)前記クラスタ数で、前記属性データのクラスタリ
ングを行うステップと、 (c)クラスタリング結果を解析し、解析結果を表示装
置に表示出力するステップと、 (d)前記結果の表示出力から、各クラスタに属するデ
ータについてデータの傾向を把握でき分類を終了する場
合にクラスタリングを終了ステップと、 (e)前記結果の表示出力から、データの傾向が明確化
していないため、さらに分析を行う場合、クラスタ数を
変更し、変更したクラスタ数で、前記ステップ(b)に
戻り再度クラスタリングを行うステップと、 を含むことを特徴とするクラスタ分類方法。
20. (a) for the attribute data stored in the storage unit, shaping the attribute data used for clustering and totalizing the attribute data to determine the number of clusters; and (b) determining the number of clusters. Performing the clustering of the attribute data; (c) analyzing the clustering result and displaying and outputting the analysis result on a display device; and (d) calculating the data of the data belonging to each cluster from the display output of the result. A step of ending clustering when the tendency is grasped and the classification is completed; and (e) the number of clusters is changed and changed when further analysis is performed because the data tendency is not clarified from the display output of the result. Returning to step (b) and performing clustering again with the number of clusters. Star classification method.
【請求項21】前記(a)のステップのクラスタの決定
において、対象データのクラス比をもとにクラスタ数を
決定する、ことを特徴とする請求項20記載のクラスタ
分類方法。
21. The cluster classification method according to claim 20, wherein, in determining the cluster in the step (a), the number of clusters is determined based on the class ratio of the target data.
【請求項22】前記(c)のステップの解析において、
各クラスタに属するデータの正常と不良の比を求める、
ことを特徴とする請求項20記載のクラスタ分類方法。
22. In the analysis of the step (c),
Find the ratio of normal to bad data belonging to each cluster.
21. The cluster classification method according to claim 20, wherein:
【請求項23】前記(d)のステップでは、前記解析結
果に基づき、ほとんどが正常データであるクラスタ、ほ
とんどが不良データであるクラスタ、正常データとデー
タが混在するクラスタという具合に、ユーザが一目で理
解可能な表示形式で前記表示装置に表示する、ことを特
徴とする請求項20記載のクラスタ分類方法。
23. In the step (d), based on the analysis result, the user can see at a glance that a cluster is mostly normal data, a cluster is mostly defective data, and a cluster is a mixture of normal data and data. 21. The cluster classification method according to claim 20, wherein the information is displayed on the display device in a display format understandable by (1).
【請求項24】前記(b)のクラスタリングのステップ
において、SOM(Self OrganizingMap)アルゴリズ
ム、又はSOMアルゴリズムと良心アルゴリズムを用い
てクラスタリングを行う、ことを特徴とする請求項20
記載のクラスタ分類方法。
24. The method according to claim 20, wherein in the clustering step (b), clustering is performed using an SOM (Self Organizing Map) algorithm or an SOM algorithm and a conscience algorithm.
The described cluster classification method.
【請求項25】前記(b)のクラスタリングのステップ
において、SOMアルゴリズム、又はSOMアルゴリズ
ムと良心アルゴリズムを用いてクラスタリングを行い、 前記(d)のステップでは、前記解析結果に基づき、S
OMの競合層のそれぞれについて、ほどんどが正常デー
タであるクラスタ、ほどんどが不良データであるクラス
タ、正常データとデータが混在するクラスタのようにユ
ーザが一目で理解可能な表示形式で前記表示装置に表示
し、さらにクリック操作により指定されたクラスタに属
する属性データを前記表示装置に表示出力する、ことを
特徴とする請求項20記載のクラスタ分類方法。
25. In the clustering step (b), clustering is performed using an SOM algorithm or an SOM algorithm and a conscience algorithm. In the step (d), S
For each of the competitive layers of the OM, the display device is displayed in a display format that can be understood by the user at a glance, such as a cluster where most of the data is normal data, a cluster where most of the data is bad, and a cluster where normal data and data are mixed. 21. The cluster classification method according to claim 20, further comprising displaying the attribute data belonging to a cluster designated by a click operation on the display device.
【請求項26】前記(c)のステップにおいて、各クラ
スタのクラス比、代表データ、及びクラスタ内のデータ
間の類似性を解析する、ことを特徴とする請求項20記
載のクラスタ分類方法。
26. The cluster classification method according to claim 20, wherein in the step (c), a class ratio of each cluster, representative data, and similarity between data in the cluster are analyzed.
【請求項27】新たな属性データが入力されると、新た
な属性データに最も近い重みを持つクラスタを検出し、
最近接と判断されたクラスタ内に属するデータのクラス
を集計することによって新た属性データの分類、分析を
行う、ことを特徴とする請求項20記載のクラスタ分類
方法。
27. When new attribute data is input, a cluster having a weight closest to the new attribute data is detected,
21. The cluster classification method according to claim 20, wherein the classification and analysis of the new attribute data are performed by totalizing the classes of the data belonging to the cluster determined to be closest.
【請求項28】属性データを記憶する記憶部と、 前記記憶部から属性データを読み出し、クラスタリング
に用いる属性データの整形、及び属性データの集計を行
い、クラスタ数を決定する手段と、 前記クラスタ数で、前記属性データのクラスタリングを
行う手段と、 前記クラスタリング結果を解析して表示出力する手段
と、 前記結果の表示出力から、データの傾向が明確化してい
ないため、さらに分析を行う場合、クラスタ数を変更
し、変更したクラスタ数で再度クラスタリングを行うよ
うに制御する手段と、 を含むことを特徴とするクラスタ分類装置。
28. A storage unit for storing attribute data, means for reading attribute data from the storage unit, shaping attribute data used for clustering and totalizing attribute data to determine the number of clusters, and Means for clustering the attribute data, means for analyzing and displaying the clustering result, and display of the result. From the display output of the result, the number of clusters is determined when further analysis is to be performed. And a means for controlling to perform clustering again with the changed number of clusters.
【請求項29】前記記憶部に記憶されていない新たな属
性データが入力されると、新たな属性データに最も近い
重みを持つクラスタを検出し、最近接と判断されたクラ
スタ内に属するデータのクラスを集計することによって
新た属性データの分類、分析を行う、ことを特徴とする
請求項28記載のクラスタ分類装置。
29. When new attribute data that is not stored in the storage unit is input, a cluster having a weight closest to the new attribute data is detected, and data of the data belonging to the cluster determined to be the closest is detected. 29. The cluster classification apparatus according to claim 28, wherein new attribute data is classified and analyzed by totalizing the classes.
JP35970899A 1999-12-17 1999-12-17 Cluster classification apparatus, cluster classification method, and recording medium recording cluster classification program Expired - Fee Related JP3636016B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35970899A JP3636016B2 (en) 1999-12-17 1999-12-17 Cluster classification apparatus, cluster classification method, and recording medium recording cluster classification program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35970899A JP3636016B2 (en) 1999-12-17 1999-12-17 Cluster classification apparatus, cluster classification method, and recording medium recording cluster classification program

Publications (2)

Publication Number Publication Date
JP2001175640A true JP2001175640A (en) 2001-06-29
JP3636016B2 JP3636016B2 (en) 2005-04-06

Family

ID=18465900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35970899A Expired - Fee Related JP3636016B2 (en) 1999-12-17 1999-12-17 Cluster classification apparatus, cluster classification method, and recording medium recording cluster classification program

Country Status (1)

Country Link
JP (1) JP3636016B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019221008A (en) * 2018-06-15 2019-12-26 株式会社日立製作所 System cross-section data management device and method
JP2020160546A (en) * 2019-03-25 2020-10-01 株式会社日立製作所 Extraction support system of case of erroneous work and extraction support method of case of erroneous work
JP2021068171A (en) * 2019-10-23 2021-04-30 デフィデ株式会社 Financial information management analysis system

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0765168A (en) * 1993-08-31 1995-03-10 Hitachi Ltd Device and method for function approximation
JPH07234854A (en) * 1994-02-23 1995-09-05 Olympus Optical Co Ltd Cluster classification device
JPH0877184A (en) * 1994-07-06 1996-03-22 Omron Corp Device and method for retrieving data base, direct mail issuance supporting system with data base retrieving device, device and method for evaluating customer, and direct mail issuance supporting system with customer evaluating device
JPH09106458A (en) * 1995-10-12 1997-04-22 Dainippon Printing Co Ltd Image processing method
JPH09265529A (en) * 1996-03-28 1997-10-07 Nippon Telegr & Teleph Corp <Ntt> Method and device for cluster classification
JPH09288656A (en) * 1996-04-19 1997-11-04 Nec Corp Data sorting device and method therefor
JPH09325890A (en) * 1996-06-04 1997-12-16 Toshiba Corp Method and device for detecting pattern
JPH1115895A (en) * 1997-06-19 1999-01-22 Fujitsu Ltd Data display device, its method and recording medium recording program recording program for displaying data

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0765168A (en) * 1993-08-31 1995-03-10 Hitachi Ltd Device and method for function approximation
JPH07234854A (en) * 1994-02-23 1995-09-05 Olympus Optical Co Ltd Cluster classification device
JPH0877184A (en) * 1994-07-06 1996-03-22 Omron Corp Device and method for retrieving data base, direct mail issuance supporting system with data base retrieving device, device and method for evaluating customer, and direct mail issuance supporting system with customer evaluating device
JPH09106458A (en) * 1995-10-12 1997-04-22 Dainippon Printing Co Ltd Image processing method
JPH09265529A (en) * 1996-03-28 1997-10-07 Nippon Telegr & Teleph Corp <Ntt> Method and device for cluster classification
JPH09288656A (en) * 1996-04-19 1997-11-04 Nec Corp Data sorting device and method therefor
JPH09325890A (en) * 1996-06-04 1997-12-16 Toshiba Corp Method and device for detecting pattern
JPH1115895A (en) * 1997-06-19 1999-01-22 Fujitsu Ltd Data display device, its method and recording medium recording program recording program for displaying data

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019221008A (en) * 2018-06-15 2019-12-26 株式会社日立製作所 System cross-section data management device and method
JP6995701B2 (en) 2018-06-15 2022-01-17 株式会社日立製作所 System cross-section data management device and method
JP2020160546A (en) * 2019-03-25 2020-10-01 株式会社日立製作所 Extraction support system of case of erroneous work and extraction support method of case of erroneous work
JP7171482B2 (en) 2019-03-25 2022-11-15 株式会社日立製作所 Business Exceptional Case Extraction Support System and Business Exceptional Case Extraction Support Method
JP2021068171A (en) * 2019-10-23 2021-04-30 デフィデ株式会社 Financial information management analysis system
JP7440017B2 (en) 2019-10-23 2024-02-28 デフィデ株式会社 Financial information management analysis system

Also Published As

Publication number Publication date
JP3636016B2 (en) 2005-04-06

Similar Documents

Publication Publication Date Title
CN108564286B (en) Artificial intelligent financial wind-control credit assessment method and system based on big data credit investigation
Tsiptsis et al. Data mining techniques in CRM: inside customer segmentation
CN111340086A (en) Method, system, medium and terminal for processing label-free data
CN113159461A (en) Small and medium-sized micro-enterprise credit evaluation method based on sample transfer learning
JP5391637B2 (en) Data similarity calculation system, data similarity calculation method, and data similarity calculation program
JP4772377B2 (en) Abnormal equipment estimation device, abnormal equipment estimation method, abnormal equipment estimation program, and recording medium
CN107133862A (en) Dynamic produces the method and system of the detailed transaction payment experience of enhancing credit evaluation
JPH06119309A (en) Purchase prospect degree predicting method and customer management system
Bier et al. Variable-length multivariate time series classification using ROCKET: A case study of incident detection
Zaky et al. Predicting banking customer churn based on artificial neural network
Kim et al. Predicting corporate defaults using machine learning with geometric-lag variables
CN115689407A (en) Account abnormity detection method and device and terminal equipment
Priscilla et al. Baseline modeling for early prediction of loan approval system
US20210117828A1 (en) Information processing apparatus, information processing method, and program
JP3636016B2 (en) Cluster classification apparatus, cluster classification method, and recording medium recording cluster classification program
US11935075B2 (en) Card inactivity modeling
JP2000132558A (en) Classification rule search-type cluster analysis device
CN114757495A (en) Membership value quantitative evaluation method based on logistic regression
US11042837B2 (en) System and method for predicting average inventory with new items
WO2021029835A1 (en) A method and system for clustering performance evaluation and increment
WO2023181244A1 (en) Model analysis device, model analysis method, and recording medium
Deshmukh et al. Risky business: Predicting cancellations in imbalanced multi-classification settings
Prasad et al. Machine Learning Based Cost prediction for Acquiring New Customers
US20230385664A1 (en) A computer-implemented method for deriving a data processing and inference pipeline
Zimal et al. Customer churn prediction using machine learning

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041227

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100114

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110114

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110114

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120114

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130114

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130114

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees