JP4292293B2 - k−means法を用いるクラスタ分析装置、クラスタ分析方法、クラスタ分析プログラム、及びそのプログラムを記録した記録媒体 - Google Patents
k−means法を用いるクラスタ分析装置、クラスタ分析方法、クラスタ分析プログラム、及びそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP4292293B2 JP4292293B2 JP2004026764A JP2004026764A JP4292293B2 JP 4292293 B2 JP4292293 B2 JP 4292293B2 JP 2004026764 A JP2004026764 A JP 2004026764A JP 2004026764 A JP2004026764 A JP 2004026764A JP 4292293 B2 JP4292293 B2 JP 4292293B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- small lattice
- lattice space
- cluster
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 78
- 238000007621 cluster analysis Methods 0.000 title claims description 53
- 238000004364 calculation method Methods 0.000 claims description 48
- 238000004458 analytical method Methods 0.000 claims description 45
- 239000013598 vector Substances 0.000 claims description 39
- 238000001514 detection method Methods 0.000 claims description 12
- 230000005484 gravity Effects 0.000 claims description 12
- 230000001174 ascending effect Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 description 15
- 230000008707 rearrangement Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000036982 action potential Effects 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 6
- 239000010432 diamond Substances 0.000 description 4
- 238000004141 dimensional analysis Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 229910003460 diamond Inorganic materials 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 230000008035 nerve activity Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013383 initial experiment Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
- Complex Calculations (AREA)
Description
を分割幅として決定する機能と、前記並べ替える機能、前記要素間距離を計算する機能、および前記分割幅を決定する機能が、異なる前記特定パラメータの全てについて実行されたされた後、複数の前記パラメータに対応する軸を有する解析空間を、前記分割幅を使用して該パラメータに対応する前記軸を等間隔に分割することによって、小格子空間に分割する機能と、前記小格子空間の中から最大個数の前記データを含む最大小格子空間を検出し、該最大小格子空間及び該最大小格子空間の周囲の小格子空間を使用してクラスタ中心初期位置を計算する機能と、前記クラスタ中心初期位置を使用してk−means法によるクラスタ分析を実行する機能とを実現させ、前記最大小格子空間の検出において、既に検出された前記最大小格子空間から所定範囲内に含まれる前記小格子空間を除いた前記解析空間を検出の対象とし、前記クラスタ中心初期位置の計算を繰り返し実行させることを特徴としている。
中心の初期位置を計算することができる。
ら新たな番号を付与する。順番が変更されたデータをpk1(i)(i=1〜Np)とする
。
i)=pk1(i+1)−pk1(i)を算出する。ここで、dk1(i)≧0である。図4は、図3に示した2次元パラメータの場合に、横軸に対応するパラメータP1について要素
間距離dk1(i)とデータpk1(i)との関係を示す図である。
ステップS6において、データの集合を異なるクラスタに分類する境界である分節点の候補である仮の分節点を求める。即ち、分割幅算出部3が、全てのデータpk1(i)(i=1〜Np)の中から、dk1(m)>T(k1)を満たすmに対応するデータpk1(m)
を選択し、これを要素とする新たなデータ集合を生成する。このとき、上記の条件を満たさないデータpk1(i)は新たな集合には含まれない。従って、新たなデータ集合の要素をpk1(i)で表すとiについて連続番号とならないので、連続番号となるように新たに番号を付け直したデータをcpk1(j)で表す。データpk1(m)=cpk1(j)が仮の分節点データである。
=cpk1(j)とpk1(i2)=cpk1(j+1)との間にNc個以上のデータpk1(i
)が存在する条件であり、ここでは、この条件を満たすデータpk1(i1)=cpk1(j
)を分節点データとする。図5は、図4に示したデータに対して、P1軸に対応するパラ
メータについて分割幅wk1を求める処理を説明する図である。図5は、折れ線グラフ(dk1(i))の内、水平の破線(閾値T(k1))を超えるdk1(i)が選択され、それらに対応する元のデータの差から分割幅wk1が決定されることを表している(ここで、k1=1である)。
w2,・・,an×wn)とする。ak1(k1=1〜n)は、パラメータPk1に対応する座
標成分を、分割幅wk1を単位として整数値で表したものである。
を持つ格子空間を決定する。ここで、Gmaxは、最大の要素数を持つ小格子空間の代表ベ
クトルである。最大の要素数を持つ複数の小格子空間が存在する場合には、その中の最初
に検出した小格子空間を最大の要素数を持つ小格子空間として決定する。
空間及びそれに隣接する小格子空間の代表ベクトルGjについて加算することを表し、N0はそれら小格子空間の総数である。例えば、2次元の場合N0=32=9であり、n次元
の場合N0=3nである。ここで、重心ベクトルの計算では、走査フラグの値の如何に依らず、最大の要素数を持つ小格子空間の周囲の小格子空間を全て使用する。一例として、図7に、2次元解析空間に関して、小格子空間及び重心ベクトルの位置関係について示す。図7では、各小格子空間の中央に、その中に含まれる要素数を記載しており、9個の小格子空間の内、中央の小格子空間の要素数が20で最大である。白丸で表したCdef(k2
)は、周囲の小格子空間を含んだ9個の小格子空間の代表ベクトルから計算された重心位置(重心ベクトルの終点)を表している。
整数)が全て求められる。
)をクラスタ中心の初期位置として使用して、通常のk−means法によるクラスタ分析を行う。まず、分析対象の全てのデータについて、各々のクラスタ中心の初期位置Cdef(k2)との距離(非類似度)を計算し、各々のデータを最短距離の初期クラスタ中心
に分類、即ち各クラスタの要素とする。ここで、距離に関しては、様々な定義が使用でき、例えばユークリッド平方距離を用いる。次に、各々のクラスタの要素を用いて各々のクラスタ中心を計算し、この中心を新しいクラスタ中心とする。再び、新しく生成されたクラスタ中心と全ての要素とのユークリッド平方距離を計算し、最短距離のクラスタ中心に各データを再分類する。以降同様の処理を、クラスタ中心位置が収束するまで繰り返す。例えば、j回目に計算されたクラスタ中心(Ck2,j)の座標と、これを用いてデータを分
類し、再計算して得られるクラスタ中心(Ck2,j+1)の座標との距離が、全てのクラスタ(全てのk2)について所定値以下になるまで繰り返す。クラスタ中心位置が収束した後、分析実行部6は、外部の解析結果出力ユニット(例えば、表示装置、印刷装置など)に、分析結果を出力する。
子点から所定のオフセットベクトル分だけずれたベクトルを使用してもよい。その場合、オフセットベクトルをベクトル(g1,g2,・・,gn)とすると、各小格子空間の代表
ベクトルGは、G=(a1×w1+g1,a2×w2+g2,・・,an×wn+gn)で表され
、これを使用してステップS13での重心ベクトルの計算を行えばよい。
閾値を越えるデータを白色の正方形(□)で表示している。ここで、白色の正方形(□)には、図2のステップS6の説明で使用した符合cp1〜cp8を付している。
p5を使用して分節点間の距離を求め、その中の最小値をこのパラメータに対する分割幅
w1として決定した。
ステップS10の処理を行った。その結果、振幅及び減衰時間を軸として形成される2次元空間の8.5〜38.7μV×0.05〜1.6ミリ秒の領域を、25×30の小格子空間に分割した。さらに、ステップS11〜S16の処理を行うことによって、クラスタ中心の初期位置を決定した。続いて、クラスタ中心の初期位置を用いてk−means法によるクラスタ分析を実行した。
2 距離算出部
3 分割幅算出部
4 空間分割部
5 中心算出部
6 分析実行部
7 記録部
Claims (10)
- 複数のパラメータを成分とする、複数の多次元ベクトルデータを、k−means法を用いてクラスタ分析するクラスタ分析装置であって、
複数の前記パラメータの中から1つのパラメータを特定パラメータとして選択し、該特定パラメータに対応する複数のデータを、値の大きさに応じて昇順若しくは降順に並べ替える並べ替え手段と、
並び替えられた前記データについて、隣接するデータ間の差である要素間距離を計算する距離算出手段と、
前記要素間距離から分割幅を決定する分割幅算出手段と、
前記並べ替え手段による並べ替え、前記距離算出手段による前記要素間距離の計算、および前記分割幅算出手段による前記分割幅の決定が、異なる前記特定パラメータの全てについて実行された後、複数の前記パラメータの各々に対応する軸を有する解析空間を、前記分割幅を使用して該分割幅に対応する前記軸を等間隔に分割することによって、小格子空間に分割する空間分割手段と、
前記小格子空間の中から最大個数の前記多次元ベクトルデータを含む最大小格子空間を検出し、該最大小格子空間及び該最大小格子空間の周囲の小格子空間を使用してクラスタ中心初期位置を計算する中心算出手段と、
前記クラスタ中心初期位置を使用してk−means法によるクラスタ分析を実行する分析実行手段とを備え、
前記分割幅算出手段が、
並べ替えられた前記データの中から、前記要素間距離が所定の閾値よりも大きいデータを仮分節点データとして選択し、
前記仮分節点データの中から、各々の前記仮分節点データと隣接する前記仮分節点データとの間に所定個数以上の前記データが存在する仮分節点データを分節点データとして選択し、
隣接する前記分節点データの差の中の最小値を前記分割幅として決定し、
前記中心算出手段が、
前記最大小格子空間の検出において、既に検出された前記最大小格子空間から所定範囲内に含まれる前記小格子空間を除いた前記解析空間を検出の対象とし、
前記最大小格子空間の検出及び前記クラスタ中心初期位置の計算を繰り返し実行することを特徴とするk−means法を用いるクラスタ分析装置。 - 前記閾値が、前記要素間距離の平均値及び標準偏差の和であることを特徴とする請求項
1に記載のk−means法を用いるクラスタ分析装置。 - 前記クラスタ中心初期位置が、前記小格子空間に含まれる前記データの個数を重みとし、前記小格子空間の代表ベクトルから計算される重心位置であることを特徴とする請求項1又は2に記載のk−means法を用いるクラスタ分析装置。
- 複数のパラメータを成分とする、複数の多次元ベクトルデータを、k−means法を用いてクラスタ分析する方法であって、
複数の前記パラメータの中から1つのパラメータを特定パラメータとして選択し、該特定パラメータに対応する複数のデータを、値の大きさに応じて昇順若しくは降順に並べ替える並べ替えステップと、
並び替えられた前記データについて、隣接するデータ間の差である要素間距離を計算する距離算出ステップと、
並べ替えられた前記データの中から、前記要素間距離が所定の閾値よりも大きいデータを仮分節点データとして選択し、前記仮分節点データの中から、各々の前記仮分節点データと隣接する前記仮分節点データとの間に所定個数以上の前記データが存在する仮分節点データを分節点データとして選択し、隣接する前記分節点データの差の中の最小値を分割幅として決定する分割幅算出ステップと、
前記並べ替えステップ、前記距離算出ステップ、および前記分割幅算出ステップが、異なる前記特定パラメータの全てについて実行されたされた後、複数の前記パラメータの各々に対応する軸を有する解析空間を、前記分割幅を使用して該分割幅に対応する前記軸を等間隔に分割することによって、小格子空間に分割する空間分割ステップと、
前記小格子空間の中から最大個数の前記データを含む最大小格子空間を検出し、該最大小格子空間及び該最大小格子空間の周囲の小格子空間を使用してクラスタ中心初期位置を計算する中心算出ステップと、
前記クラスタ中心初期位置を使用してk−means法によるクラスタ分析を実行する分析実行ステップとを含み、
前記最大小格子空間の検出において、既に検出された前記最大小格子空間から所定範囲内に含まれる前記小格子空間を除いた前記解析空間を検出の対象とし、前記中心算出ステップを繰り返し実行することを特徴とするk−means法を用いるクラスタ分析方法。 - 前記閾値が、前記要素間距離の平均値及び標準偏差の和であることを特徴とする請求項4に記載のk−means法を用いるクラスタ分析方法。
- 前記クラスタ中心初期位置が、前記小格子空間に含まれる前記データの個数を重みとし、前記小格子空間の代表ベクトルから計算される重心位置であることを特徴とする請求項4又は5に記載のk−means法を用いるクラスタ分析方法。
- 記録手段を備えたコンピュータに、複数のパラメータを成分とする、複数の多次元ベクトルデータを、k−means法を用いてクラスタ分析させるプログラムであって、
前記コンピュータに、
複数の前記パラメータの中から選択された1つのパラメータである特定パラメータに対応する複数のデータを前記記録手段から読み出して、値の大きさに応じて昇順若しくは降順に並べ替える機能と、
並び替えられた前記データについて、隣接するデータ間の差である要素間距離を計算する機能と、
並べ替えられた前記データの中から、前記要素間距離が所定の閾値よりも大きいデータを仮分節点データとして選択し、前記仮分節点データの中から、各々の前記仮分節点データと隣接する前記仮分節点データとの間に所定個数以上の前記データが存在する仮分節点データを分節点データとして選択し、隣接する前記分節点データの差の中の最小値を分割
幅として決定する機能と、
前記並べ替える機能、前記要素間距離を計算する機能、および前記分割幅を決定する機能が、異なる前記特定パラメータの全てについて実行されたされた後、複数の前記パラメータに対応する軸を有する解析空間を、前記分割幅を使用して該パラメータに対応する前記軸を等間隔に分割することによって、小格子空間に分割する機能と、
前記小格子空間の中から最大個数の前記データを含む最大小格子空間を検出し、該最大小格子空間及び該最大小格子空間の周囲の小格子空間を使用してクラスタ中心初期位置を計算する機能と、
前記クラスタ中心初期位置を使用してk−means法によるクラスタ分析を実行する機能とを実現させ、
前記最大小格子空間の検出において、既に検出された前記最大小格子空間から所定範囲内に含まれる前記小格子空間を除いた前記解析空間を検出の対象とし、前記クラスタ中心初期位置の計算を繰り返し実行させることを特徴とするk−means法を用いるクラスタ分析プログラム。 - 前記閾値が、前記要素間距離の平均値及び標準偏差の和であることを特徴とする請求項7に記載のk−means法を用いるクラスタ分析プログラム。
- 前記クラスタ中心初期位置が、前記小格子空間に含まれる前記データの個数を重みとし、前記小格子空間の代表ベクトルから計算される重心位置であることを特徴とする請求項7又は8に記載のk−means法を用いるクラスタ分析プログラム。
- 請求項7〜9の何れかの項に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004026764A JP4292293B2 (ja) | 2004-02-03 | 2004-02-03 | k−means法を用いるクラスタ分析装置、クラスタ分析方法、クラスタ分析プログラム、及びそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004026764A JP4292293B2 (ja) | 2004-02-03 | 2004-02-03 | k−means法を用いるクラスタ分析装置、クラスタ分析方法、クラスタ分析プログラム、及びそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005222138A JP2005222138A (ja) | 2005-08-18 |
JP4292293B2 true JP4292293B2 (ja) | 2009-07-08 |
Family
ID=34997736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004026764A Expired - Lifetime JP4292293B2 (ja) | 2004-02-03 | 2004-02-03 | k−means法を用いるクラスタ分析装置、クラスタ分析方法、クラスタ分析プログラム、及びそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4292293B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108345908A (zh) * | 2018-02-10 | 2018-07-31 | 武汉轻工大学 | 电网数据的分类方法、分类设备及存储介质 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1916624B1 (en) * | 2006-10-25 | 2016-11-23 | Agfa HealthCare NV | Method for segmenting a digital medical image. |
KR101688871B1 (ko) * | 2015-07-07 | 2016-12-22 | 한국지질자원연구원 | 감마선을 이용한 물리검층자료의 분석 장치 및 방법 |
CN109685767A (zh) * | 2018-11-26 | 2019-04-26 | 西北工业大学 | 一种基于聚类融合算法的双模态脑肿瘤mri分割方法 |
JP6937359B2 (ja) * | 2019-12-25 | 2021-09-22 | 株式会社 日立産業制御ソリューションズ | クラスタ分割評価装置、クラスタ分割評価方法及びクラスタ分割評価プログラム |
JP7460949B2 (ja) | 2020-03-11 | 2024-04-03 | 公立大学法人会津大学 | カテゴリ識別プログラム、カテゴリ識別装置及びカテゴリ識別方法 |
CN112561129B (zh) * | 2020-11-27 | 2022-09-02 | 广东电网有限责任公司肇庆供电局 | 一种基于配电线路故障信息的抢修物资调配方法 |
-
2004
- 2004-02-03 JP JP2004026764A patent/JP4292293B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108345908A (zh) * | 2018-02-10 | 2018-07-31 | 武汉轻工大学 | 电网数据的分类方法、分类设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2005222138A (ja) | 2005-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0796474B1 (en) | Method for avoiding redundant identification (caused by artifacts in images of bacterial colonies) | |
EP2617006B1 (en) | Image processing apparatus and image processing method | |
EP0310069A2 (en) | Method of generating discretization grid for finite-difference simulation | |
CN101615217B (zh) | 对类似特性的不同设计形状进行分类/显示的装置和方法 | |
EP1246124B1 (en) | Image space display method and apparatus | |
JP4292293B2 (ja) | k−means法を用いるクラスタ分析装置、クラスタ分析方法、クラスタ分析プログラム、及びそのプログラムを記録した記録媒体 | |
CN108074025A (zh) | 基于表面缺陷分布特征的钢卷表面缺陷判定方法 | |
JP2009133843A (ja) | 表面欠陥の分布形態解析装置、方法、及びプログラム | |
WO2018142816A1 (ja) | 支援装置および支援方法 | |
JP2017156251A (ja) | 地形変化点抽出システム、及び地形変化点抽出方法 | |
Mike et al. | Nonlandmark classification in paleobiology: computational geometry as a tool for species discrimination | |
JP2005301789A (ja) | クラスタ解析装置、クラスタ解析方法、及びクラスタ解析プログラム | |
US20060004552A1 (en) | Boundary element analytic method and a boundary element analytic program | |
JP7252591B2 (ja) | 幾何学形状のマッチングによる画像処理方法及び画像処理装置 | |
US11182413B2 (en) | Analysis system | |
JP2018101347A (ja) | 加工プログラム解析装置、加工プログラム解析プログラムおよび加工プログラム解析方法 | |
CN111723174A (zh) | 栅格数据快速区域统计方法和系统 | |
JP6746851B2 (ja) | 地形分類システム、及び地形分類方法 | |
US20030140276A1 (en) | Method and apparatus for identifying clusters of fail bits in a bitmap | |
JP7283756B2 (ja) | 情報処理装置、及びプログラム | |
CN112949699B (zh) | 一种遥感图像分类模型建立与验证方法、系统及电子设备 | |
CN111540018B (zh) | 相机对称布局模式的得分计算方法及相关设备 | |
RU2137188C1 (ru) | Способ и устройство для определения зоны в объекте, отражающей наивысший уровень структурной организации | |
JP2006323780A (ja) | 画像処理装置、画像処理方法 | |
JPH06340199A (ja) | ペンプロッタ作画制御方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090310 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4292293 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |