JP2009276913A - Clustering analysis device, clustering analysis method, and clustering analysis program - Google Patents

Clustering analysis device, clustering analysis method, and clustering analysis program Download PDF

Info

Publication number
JP2009276913A
JP2009276913A JP2008126143A JP2008126143A JP2009276913A JP 2009276913 A JP2009276913 A JP 2009276913A JP 2008126143 A JP2008126143 A JP 2008126143A JP 2008126143 A JP2008126143 A JP 2008126143A JP 2009276913 A JP2009276913 A JP 2009276913A
Authority
JP
Japan
Prior art keywords
analysis
dendrogram
clustering
clustering analysis
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008126143A
Other languages
Japanese (ja)
Inventor
Toshiaki Sato
俊明 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pasco Corp
Original Assignee
Pasco Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pasco Corp filed Critical Pasco Corp
Priority to JP2008126143A priority Critical patent/JP2009276913A/en
Publication of JP2009276913A publication Critical patent/JP2009276913A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram

Abstract

<P>PROBLEM TO BE SOLVED: To solve the problem that it is difficult to understand the behavior of multivariate data by static display with the position of a leaf or the like fixed therefor when displaying the result of hierarchical clustering analysis by a dendrogram. <P>SOLUTION: In a clustering analysis method, multivariate data associated with an analytic object are successively obtained according to time series (S30) to execute hierarchical clustering analysis concerning prescribed analytic object data among the multivariate data (S32). On the basis of the result of this analysis, a three-dimensional dendrogram is constructed on a basic surface, and a projection image thereof is generated. The basic face is defined by associating prescribed coordinate data among the multivariate data with a coordinate axis in a three-dimensional space, and an analytic object is arranged as a leaf at a position corresponding to the coordinate data on the basic surface, and a branch corresponding to each leaf is erected on the basic surface to obtain a three-dimensional dendrogram. The processing is repeated according to a time series, so that the analytic result of hierarchical clustering analysis can be presented as the image of a dynamic three-dimensional dendrogram. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、クラスター分析を行い、その分析結果をデンドログラムとして画像表示するクラスタリング解析装置、クラスタリング解析方法、及びクラスタリング解析プログラムに関する。   The present invention relates to a clustering analysis apparatus, a clustering analysis method, and a clustering analysis program for performing cluster analysis and displaying an image of the analysis result as a dendrogram.

近年、携帯電話に搭載されたGPS機能や無線LANを用いた測位技術が普及してきている。そのような技術によれば、対象物の位置を同時、大量に得ることが可能になっている。これに伴い、例えば、システムの管理者等に多数の対象物の情報を画像上で理解容易な形式で提示することが必要となり得る。しかし、対象物の数が多い場合、個々の対象物を例えば、点などの1つのオブジェクトで表示した画像は、対象物相互間に存在する大局的な情報を把握することが難しい。   In recent years, positioning technology using a GPS function or a wireless LAN mounted on a mobile phone has become widespread. According to such a technique, it is possible to obtain a large number of positions of the object at the same time. Accordingly, for example, it may be necessary to present information on a large number of objects on an image in an easily understandable format to a system administrator or the like. However, when the number of objects is large, it is difficult to grasp global information existing between objects in an image in which each object is displayed as one object such as a point.

このような多数の対象物を大局的に把握することを可能とする方法として、クラスタリング解析が存在する。その1つである階層的クラスタリングでは、複数の分析対象相互の類似度をそれら分析対象に対応付けられる多変量データに関するユークリッド距離などに基づいて求め、当該類似度に基づいて分析対象をグループ化する。この階層的クラスタリングの結果を表示する手法としてデンドログラムが知られている。   Clustering analysis exists as a method that enables such a large number of objects to be grasped globally. In hierarchical clustering, which is one of them, the similarity between a plurality of analysis objects is obtained based on the Euclidean distance related to multivariate data associated with the analysis objects, and the analysis objects are grouped based on the similarity. . A dendrogram is known as a method for displaying the result of this hierarchical clustering.

デンドログラムは、クラスタ間の距離をウォード法や最近隣法などの定義式を用いて計算し距離が小さい、すなわち類似度が高いクラスタを順次まとめていく樹状図(トーナメント図)である。図8は、デンドログラムの一例を示す図である。樹形図のリーフ(終端ノード)となる分析対象S01〜S08が図の水平方向に沿って配置される。図の縦軸はクラスタ間の距離を表す。なお、ここでは、各分析対象は、1個の分析対象からなるクラスタであるとする。各クラスタから上方にブランチ(枝)2が伸ばされる。他のクラスタよりも互いの距離が近いクラスタ同士のブランチが、当該距離に相当する高さで接続され、ノード(非終端ノード)4を形成する。このノード4で結合されたクラスタ同士が新たな1つのクラスタを形成し、当該ノード4から上へブランチ2が伸びる。例えば、図8において、S01及びS02がノードN01で結合されて1つ上位の階層のクラスタC01を形成し、このクラスタC01は次に、S03及びS04が結合されたクラスタC02とノードN02にて結合されてさらに上位階層のクラスタC03を形成する。 The dendrogram is a dendrogram (tournament diagram) in which distances between clusters are calculated using definition formulas such as the Ward method and nearest neighbor method, and clusters with small distances, that is, clusters with high similarity are sequentially collected. FIG. 8 is a diagram illustrating an example of a dendrogram. Analysis objects S 01 to S 08 which are leaves (terminal nodes) of the tree diagram are arranged along the horizontal direction of the figure. The vertical axis in the figure represents the distance between clusters. Here, it is assumed that each analysis target is a cluster composed of one analysis target. A branch (branch) 2 is extended upward from each cluster. Branches of clusters closer to each other than other clusters are connected at a height corresponding to the distance to form a node (non-terminal node) 4. The clusters joined at the node 4 form a new cluster, and the branch 2 extends upward from the node 4. Cluster example, in FIG. 8, S 01 and S 02 are coupled at node N 01 form a cluster C 01 of one level higher in the hierarchy, the cluster C 01 then the S 03 and S 04 are coupled C 02 and node N 02 are combined to form a higher layer cluster C 03 .

デンドログラムは一般には図8に示すように二次元的な構造で表されるが、特許文献1に示すように三次元的な構造として表現することも考えられる。
特開2006−163894号公報
The dendrogram is generally represented by a two-dimensional structure as shown in FIG. 8, but it can also be expressed as a three-dimensional structure as shown in Patent Document 1.
JP 2006-163894 A

従来の階層的クラスタリングの手法は静的データに対して用いられ、その分析結果を表示するデンドログラムも静止画であった。そのため、移動体の測位データなど時系列で得られる多変量データの挙動を把握することが困難であるという問題点があった。   The conventional hierarchical clustering method is used for static data, and the dendrogram for displaying the analysis result is a still image. Therefore, there is a problem that it is difficult to grasp the behavior of multivariate data obtained in time series such as positioning data of a moving body.

本発明は上記問題点を解決するためになされたものであり、時系列で得られるデータが対応付けられた分析対象についての階層的クラスタリングの分析結果を、直感的に理解しやすい形態でユーザに提示可能なクラスタリング解析装置、クラスタリング解析方法、及びクラスタリング解析プログラムを提供することを目的とする。   The present invention has been made to solve the above-described problems, and the analysis result of the hierarchical clustering for the analysis target associated with the data obtained in time series can be intuitively understood by the user. It is an object to provide a clustering analysis device, a clustering analysis method, and a clustering analysis program that can be presented.

本発明に係るクラスタリング解析装置は、時系列で表される複数種類の要素データが対応付けられた複数の分析対象について、前記要素データのうちの所定の分析目的データに関する前記分析対象間の類似度に基づき、各時刻毎の階層的クラスタリング分析を前記時系列に従って順次行う分析部と、三次元空間内にて、前記要素データのうちの所定の座標データに応じた位置に前記分析対象が対応付けられる基礎面を定義し、前記基礎面に配置される前記分析対象それぞれをリーフとし当該各リーフに対するブランチが前記基礎面に立設される三次元的なデンドログラムを前記階層的クラスタリング分析の分析結果に基づいて求め、前記時系列に従って変化する当該デンドログラムの投影画像を生成するデンドログラム画像生成部と、を有するものである。   The clustering analysis apparatus according to the present invention relates to a plurality of analysis objects associated with a plurality of types of element data represented in time series, and the similarity between the analysis objects with respect to predetermined analysis object data among the element data And the analysis unit that sequentially performs hierarchical clustering analysis at each time according to the time series, and the analysis target is associated with a position corresponding to predetermined coordinate data in the element data in a three-dimensional space The analysis result of the hierarchical clustering analysis is a three-dimensional dendrogram in which each of the analysis objects arranged on the base surface is defined as a leaf and a branch for each leaf is erected on the base surface. And a dendrogram image generation unit that generates a projection image of the dendrogram that changes in accordance with the time series. It is intended.

本発明の好適な態様は、前記座標データがその一部に前記分析目的データを含むクラスタリング解析装置である。   A preferred aspect of the present invention is a clustering analysis apparatus in which the coordinate data includes the analysis object data as a part thereof.

本発明の他の好適な態様においては、前記デンドログラム画像生成部が、設定されるクラスタリング閾値でクラスタを定義した場合の前記投影画像として、前記デンドログラムのうち前記クラスタに対応する部分の構造を、当該クラスタに接続されるブランチの延長線で置き換えた画像を生成する。   In another preferred aspect of the present invention, the projection image when the dendrogram image generation unit defines a cluster with a set clustering threshold value has a structure of a portion corresponding to the cluster in the dendrogram. Then, an image replaced with an extension line of a branch connected to the cluster is generated.

本発明のさらに他の好適な態様においては、前記デンドログラム画像生成部が、前記基礎面上における前記クラスタに対応する位置に、当該クラスタに含まれる前記分析対象の数に応じた大きさの三次元オブジェクトを画像表示する。この態様において、前記三次元オブジェクトは、半球とすることができる。また、前記三次元オブジェクトは所定大きさの要素オブジェクトを前記クラスタに含まれる前記分析対象の数に応じた数、前記基礎面から積み上げたものとすることができる。   In still another preferred aspect of the present invention, the dendrogram image generation unit is a tertiary having a size corresponding to the number of the analysis objects included in the cluster at a position corresponding to the cluster on the basic surface. The original object is displayed as an image. In this aspect, the three-dimensional object can be a hemisphere. In addition, the three-dimensional object may be formed by stacking element objects having a predetermined size from the base surface in a number corresponding to the number of analysis objects included in the cluster.

本発明に係るクラスタリング解析方法は、時系列で表される複数種類の要素データが対応付けられた複数の分析対象について、前記要素データのうちの所定の分析目的データに関する前記分析対象間の類似度に基づき、階層的クラスタリング分析を行う分析ステップと、三次元空間内にて、前記要素データのうちの所定の座標データに応じた位置に前記分析対象が対応付けられる基礎面を定義し、前記基礎面に配置される前記分析対象それぞれをリーフとし当該各リーフに対するブランチが前記基礎面に立設される三次元的なデンドログラムを前記階層的クラスタリング分析の分析結果に基づいて求め、当該デンドログラムの投影画像を生成するデンドログラム画像生成ステップと、を前記時系列に従って順次行って前記デンドログラムの動画像を生成する。   In the clustering analysis method according to the present invention, for a plurality of analysis objects associated with a plurality of types of element data represented in time series, the similarity between the analysis objects related to predetermined analysis object data among the element data An analysis step for performing a hierarchical clustering analysis, and defining a basic plane in which the analysis target is associated with a position corresponding to predetermined coordinate data of the element data in a three-dimensional space, and A three-dimensional dendrogram in which each analysis object arranged on a plane is a leaf and a branch for each leaf is erected on the base plane is obtained based on the analysis result of the hierarchical clustering analysis, and the dendrogram A dendrogram image generating step for generating a projection image, and sequentially performing the dendrogram motion according to the time series. To generate the image.

また、本発明に係るクラスタリング解析プログラムは、時系列で表される複数種類の要素データが対応付けられた複数の分析対象について、前記要素データのうちの所定の分析目的データに関する前記分析対象間の類似度に基づき、階層的クラスタリング分析を行う分析ステップと、三次元空間内にて、前記要素データのうちの所定の座標データに応じた位置に前記分析対象が対応付けられる基礎面を定義し、前記基礎面に配置される前記分析対象それぞれをリーフとし当該各リーフに対するブランチが前記基礎面に立設される三次元的なデンドログラムを前記階層的クラスタリング分析の分析結果に基づいて求め、当該デンドログラムの投影画像を生成するデンドログラム画像生成ステップと、を前記時系列に従って順次、コンピュータに実行させ、前記デンドログラムの動画像を生成するものである。   Further, the clustering analysis program according to the present invention provides a plurality of analysis objects associated with a plurality of types of element data represented in time series, between the analysis objects related to predetermined analysis object data among the element data. Based on the similarity, an analysis step for performing a hierarchical clustering analysis, and in the three-dimensional space, define a basic plane in which the analysis target is associated with a position according to predetermined coordinate data of the element data, A three-dimensional dendrogram in which each analysis object arranged on the base plane is a leaf and a branch for each leaf is erected on the base plane is obtained based on the analysis result of the hierarchical clustering analysis. A dendrogram image generation step for generating a projected image of the gram, and sequentially in a computer according to the time series Is the line, and generates a moving image of the dendrogram.

本発明によれば、測位データ等、時系列で表される要素データが対応付けられた分析対象についての階層的クラスタリングの分析結果が、動的かつ三次元的なデンドログラムとして画像表示される。多変量データを構成する要素データのうちの一部を座標データとして基礎面上の位置として表示することで、ユーザの直感的な理解しやすさが向上する。特に、座標データが分析目的データである場合には、基礎面上での距離によりクラスタ間の類似度を直感的に理解することが可能となる。   According to the present invention, the analysis result of the hierarchical clustering with respect to the analysis target associated with the element data represented in time series such as positioning data is displayed as an image as a dynamic and three-dimensional dendrogram. By displaying a part of the element data constituting the multivariate data as the position on the basic surface as the coordinate data, the user's intuitive understanding is improved. In particular, when the coordinate data is analysis target data, it is possible to intuitively understand the similarity between clusters based on the distance on the basic surface.

以下、本発明の実施の形態(以下実施形態という)について、図面に基づいて説明する。   Hereinafter, embodiments of the present invention (hereinafter referred to as embodiments) will be described with reference to the drawings.

図1は、実施形態に係るクラスタリング解析装置10の概略のブロック図である。クラスタリング解析装置10は、処理部12、表示部14、記憶部16及び操作部18を含んで構成される。処理部12は、分析部20及びデンドログラム画像生成部22を含んで構成される。例えば、クラスタリング解析装置10は、コンピュータを用いて構成することができ、そのCPUが処理部12を構成し、分析部20及びデンドログラム画像生成部22は当該CPUにより実行されるプログラムによって実現できる。また、記憶部16は、コンピュータに内蔵されるハードディスクなどで構成され、表示部14は液晶モニタ等の画像表示装置であり、操作部18はキーボードやマウスなどで構成される。   FIG. 1 is a schematic block diagram of a clustering analysis apparatus 10 according to the embodiment. The clustering analysis apparatus 10 includes a processing unit 12, a display unit 14, a storage unit 16, and an operation unit 18. The processing unit 12 includes an analysis unit 20 and a dendrogram image generation unit 22. For example, the clustering analysis apparatus 10 can be configured using a computer, the CPU configures the processing unit 12, and the analysis unit 20 and the dendrogram image generation unit 22 can be realized by a program executed by the CPU. The storage unit 16 includes a hard disk built in the computer, the display unit 14 includes an image display device such as a liquid crystal monitor, and the operation unit 18 includes a keyboard and a mouse.

クラスタリング解析装置10は、例えば、分析対象とする移動体に関係付けられる多変量データのうち分析の目的とするデータ(分析目的データ)を時系列に従って階層的クラスタリング処理し、三次元的なデンドログラムの画像をアニメーション表示する。処理部12は、リアルタイムで観測される分析目的データをオンライン処理してもよいし、記憶部16に格納された分析目的データをオフライン処理することもできる。   The clustering analysis apparatus 10 performs, for example, hierarchical clustering processing on analysis target data (analysis target data) among multivariate data related to a mobile object to be analyzed according to a time series, thereby obtaining a three-dimensional dendrogram. Animate the image. The processing unit 12 may perform online processing on the analysis purpose data observed in real time, and may perform off-line processing on the analysis purpose data stored in the storage unit 16.

分析部20は、分析対象間の類似度を分析目的データに関する距離に基づいて求め、当該距離に基づき分析対象について階層的クラスタリング分析を行う。分析部20は、時系列を構成する各時刻毎に、階層的クラスタリングを行う。   The analysis unit 20 obtains the similarity between the analysis targets based on the distance regarding the analysis target data, and performs hierarchical clustering analysis on the analysis target based on the distance. The analysis unit 20 performs hierarchical clustering for each time constituting the time series.

デンドログラム画像生成部22は、仮想的な三次元空間内にて、基礎面を定義すると共に、当該基礎面上に配置されるデンドログラムの構造を分析部20の分析結果及び後述する表示パラメータに基づいて求める。そして、例えば、ユーザが指定する視線方向に応じて、基礎面及びデンドログラムが構築された三次元空間を投影変換し、投影画像の画像データを生成する。   The dendrogram image generation unit 22 defines a base plane in a virtual three-dimensional space, and uses the structure of the dendrogram arranged on the base plane as an analysis result of the analysis unit 20 and a display parameter to be described later. Ask based. Then, for example, according to the line-of-sight direction specified by the user, the three-dimensional space in which the base plane and the dendrogram are constructed is projected and converted to generate image data of the projected image.

表示部14は、デンドログラム画像生成部22が時系列に従って順次生成する画像のデータを入力され、三次元デンドログラムが表された投影画像を動画表示する。   The display unit 14 receives image data sequentially generated by the dendrogram image generation unit 22 in time series, and displays a projected image on which a three-dimensional dendrogram is displayed as a moving image.

操作部18は、ユーザによる表示パラメータ等の設定、変更を可能とする。例えば、ユーザは表示パラメータとして、並行投影や透視投影といった投影変換の種類や視線方向、デンドログラムのクラスタリング閾値、クラスタを表すオブジェクトの種類等を操作できる。   The operation unit 18 allows the user to set and change display parameters and the like. For example, the user can manipulate the types of projection transformation such as parallel projection and perspective projection, the line-of-sight direction, the dendrogram clustering threshold, the type of object representing the cluster, and the like as display parameters.

図2は、実施形態に係るクラスタリング解析装置の処理部12の概略の動作を示すフロー図である。処理部12は分析部20による処理として、時系列T(kは整数であり、任意のkについてTk+1>Tである。)のうちの時刻Tにて観測され入力される多変量データ、又は記憶部16に予め格納された時刻Tの多変量データを取得し(S30)、取得した多変量データについて階層的クラスタリング分析を行う(S32)。クラスタリング分析により、互いに結合されて1階層上位のクラスタを形成する下位クラスタの組及び、それら下位クラスタ間の距離dが求められる。 FIG. 2 is a flowchart showing a schematic operation of the processing unit 12 of the clustering analysis apparatus according to the embodiment. Processing unit 12 as a processing by the analyzing unit 20, the time series T k (k is an integer and T k + 1> T k for any k.) Multivariate that observed input at time T n of the Data or multivariate data at time T n stored in advance in the storage unit 16 is acquired (S30), and hierarchical clustering analysis is performed on the acquired multivariate data (S32). By the clustering analysis, a set of lower clusters that are combined with each other to form an upper cluster and a distance d between the lower clusters are obtained.

デンドログラム画像生成部22は、この分析結果に基づいて三次元デンドログラムの投影画像を生成する(S34)。その際、デンドログラム画像生成部22は、設定された表示パラメータを参照して画像生成を行う。生成された画像データは表示部14へ出力される。三次元デンドログラムの画像生成については後述する。   The dendrogram image generation unit 22 generates a projection image of a three-dimensional dendrogram based on the analysis result (S34). At that time, the dendrogram image generation unit 22 generates an image with reference to the set display parameter. The generated image data is output to the display unit 14. The generation of the three-dimensional dendrogram image will be described later.

時刻Tのデンドログラムの画像生成が終わると(S34)、時系列の次の時刻Tn+1の多変量データが取得され(S30)、上述の処理S32,S34が繰り返される。このように、処理すべき多変量データがある限り(S36)基本的に、クラスタリング処理S32及びデンドログラム画像生成処理S34が繰り返され、表示部14には、生成された画像が順次表示されることにより、三次元的なデンドログラムが動的に表示される。 When the image generation of the dendrogram time T n is completed (S34), the time series of multivariate data next time T n + 1 is acquired (S30), the above processing S32, S34 are repeated. Thus, as long as there is multivariate data to be processed (S36), the clustering process S32 and the dendrogram image generation process S34 are basically repeated, and the generated images are sequentially displayed on the display unit 14. Thus, a three-dimensional dendrogram is dynamically displayed.

なお、処理すべき多変量データがなくなった場合には(S36)、処理部12はクラスタリング処理S32及びデンドログラム画像生成処理S34を終了する。   When there is no more multivariate data to be processed (S36), the processing unit 12 ends the clustering process S32 and the dendrogram image generation process S34.

次に三次元デンドログラムの投影画像の生成について説明する。投影画像の生成に際し、基礎面に対するデンドログラムの各ノード(終端ノード及び非終端ノード)の座標が求められる。図3、図4は、デンドログラムの各ノードの座標の決定方法を説明するための模式図である。これらの図は、三次元デンドログラムの最下層部分を示しており、便宜上、例えば、基礎面がz=0となる直交座標系xyzを定義し、ブランチの伸びる方向を基礎面に垂直方向(z軸方向)に設定している。   Next, generation of a projection image of a three-dimensional dendrogram will be described. When generating the projection image, the coordinates of each node (terminal node and non-terminal node) of the dendrogram with respect to the base plane are obtained. 3 and 4 are schematic diagrams for explaining a method of determining coordinates of each node of the dendrogram. These drawings show the lowermost layer portion of the three-dimensional dendrogram. For convenience, for example, an orthogonal coordinate system xyz in which the base plane is z = 0 is defined, and the direction in which the branch extends is perpendicular to the base plane (z Axis direction).

デンドログラム画像生成部22は基本的なデンドログラムとして、基礎面に配置される末端のノード(終端ノード)NT1,NT2がリーフ、すなわち単独の分析対象であるものを生成する。図3はこの場合を説明する図である。上述のようにNT1,NT2は基礎面に配置されるのでそれらのz座標はz=0となる。一方、NT1,NT2それぞれのx,y座標は当該分析対象の多変量データのうち座標データとして定められる所定の要素データeC1,eC2に応じて設定される。NT1,NT2に接続されるブランチB,Bは、NT1に配置される分析対象Sと、NT2に配置される分析対象Sとの距離dに相当する高さまで伸びる。S,Sはこの高さdで結合され、1つ階層が上のクラスタCを形成する。Cに対応するノードNは非終端ノードであり、ブランチB,Bの上端PU1,PU2間に設定される。具体的にはNのz座標はd、またx,y座標はNT1,NT2(又はPU1,PU2)の中点に設定される。Cに接続されるブランチBは、Nから、Cと結合される相手クラスタとの距離に相当する高さdまで伸びる。このようにして、順次、上位階層のノードの座標が定められる。なお、図3に示す例では、クラスタCは2つの分析対象のみを含むので、Cに対応するノードNのx,y座標はそれら分析対象に対応する2つのNT1,NT2の中点としたが、より多数の分析対象を含むクラスタに対応するノードNのx,y座標は当該クラスタに含まれる分析対象の座標の重心点とするのが好適である。 The dendrogram image generation unit 22 generates, as basic dendrograms, terminal nodes (terminal nodes) N T1 and N T2 arranged on the base plane are leaves, that is, a single analysis target. FIG. 3 is a diagram for explaining this case. As described above, NT1 and NT2 are arranged on the base plane, so their z coordinate is z = 0. On the other hand, the x and y coordinates of N T1 and N T2 are set according to predetermined element data e C1 and e C2 defined as coordinate data among the multivariate data to be analyzed. The branches B 1 and B 2 connected to N T1 and N T2 extend to a height corresponding to the distance d 1 between the analysis target S 1 arranged at N T1 and the analysis target S 2 arranged at N T2. . S 1 and S 2 are combined at this height d 1 , and one layer forms the upper cluster C 1 . Node N M corresponding to C 1 is non-terminal node is set between the upper end P U1, P U2 branch B 1, B 2. Specifically d 1 is the z coordinate of N M, also x, y coordinates are set at the midpoint of the N T1, N T2 (or P U1, P U2). Branch B is connected to C 1 3 extends from N M, up to a height d 2 corresponding to the distance between the mating cluster combined with C 1. In this way, the coordinates of the upper layer nodes are sequentially determined. In the example shown in FIG. 3, since the cluster C 1 contains only two analytes, the node N M corresponding to C 1 x, y coordinate two corresponding to their analyte of N T1, N T2 and the midpoint, but more numerous analyzes of the node N M corresponding to the cluster including the target x, the y-coordinate is preferred to the center of gravity of the analyte of coordinates included in the cluster.

また、デンドログラム画像生成部22は、分析対象間の距離が、設定されたクラスタリング閾値γ以下である場合に1つのクラスタとしてクラスタリングされた様子を示すデンドログラムを生成することができる。図4はこの場合を説明する図であり、図3に示す例において、d<γ<dなるγを設定した場合を示している。この場合には、γ以下の構造が1本のブランチBに縮約されたデンドログラムが生成され、これによりクラスタリングされた状態を表現する。Bは、高さγにて存在するクラスタCに接続されるブランチBをノードNから基礎面まで延長したものである。すなわち、Cの下位の構造は、Bの延長線であるBに置き換えられ、Bと基礎面とが接する点に、クラスタCの位置を代表する終端ノードNT3が設定される。 In addition, the dendrogram image generation unit 22 can generate a dendrogram showing a clustered state as one cluster when the distance between the analysis objects is equal to or less than the set clustering threshold γ. FIG. 4 is a diagram for explaining this case, and shows a case where γ satisfying d 1 <γ <d 2 is set in the example shown in FIG. In this case, gamma following structure abridged dendrogram is generated one branch B R, thereby representing a state of being clustered. B R is a branch B 3 which are connected to the cluster C 1 present at the level γ that extends from the node N M to basal plane. In other words, the lower structure of C 1 is replaced by B R is an extension of the B 3, in that the B 3 and the base surface is in contact, terminal node N T3 representative of the position of the cluster C 1 is set .

以上のように、各ノード及びブランチが求められ、これに基づいて三次元空間内でのデンドログラムが定義される。デンドログラム画像生成部22は、視線ベクトルや、投影の種類に応じて座標変換を行い、xyz座標系で表されたデンドログラム等の画像表示対象を、例えば、視線方向をZ軸とし、画面縦方向をY軸、横方向をX軸としたXYZ座標系で表す。このXYZ空間をZ軸方向に投影して、表示部14の画面に表示される画像データが生成される。   As described above, each node and branch is obtained, and a dendrogram in the three-dimensional space is defined based on this. The dendrogram image generation unit 22 performs coordinate conversion according to the line-of-sight vector and the type of projection, and displays an image display target such as a dendrogram represented in the xyz coordinate system, for example, with the line-of-sight direction as the Z axis and the screen vertical This is expressed in an XYZ coordinate system in which the direction is the Y axis and the horizontal direction is the X axis. Image data to be displayed on the screen of the display unit 14 is generated by projecting the XYZ space in the Z-axis direction.

図5は、三次元デンドログラムの画像例を示す模式図である。この画像40は、基礎面42の斜め上方に視点を設定した透視投影画像であり、矩形に設定される基礎面42の幅が視線方向の奥に行くほど狭まるように表示されている。この基礎面42の上に立設される三次元的なデンドログラム44が画像表示される。   FIG. 5 is a schematic diagram illustrating an example of an image of a three-dimensional dendrogram. This image 40 is a perspective projection image in which the viewpoint is set obliquely above the base surface 42, and is displayed so that the width of the base surface 42 set to a rectangle narrows toward the back in the line-of-sight direction. A three-dimensional dendrogram 44 standing on the base surface 42 is displayed as an image.

簡単な具体例として、分析目的データが分析対象Sの座標データeC1,eC2である場合を説明する。この場合、クラスタ間の類似度は、基礎面上でのクラスタの距離に関係付けられるので、例えば、図5に示した三次元デンドログラムの終端ノードNの相互間の距離から、類似度を直感的に理解することが可能となる。 As a simple specific example, a case where the analysis object data is the coordinate data e C1 and e C2 of the analysis object S will be described. In this case, since the similarity between clusters is related to the distance of the clusters on the base plane, for example, the similarity is calculated from the distance between the end nodes NT of the three-dimensional dendrogram shown in FIG. It becomes possible to understand intuitively.

例えば、座標データeC1,eC2は、分析対象である移動体の地表面上での位置である。この場合、地表面の航空写真やCG画像を基礎面42にテクスチャマッピングすることができる。これにより、分析対象の移動やクラスタ相互の位置関係などを把握することが容易となり、デンドログラムが表すクラスタリング分析結果を理解し易くなる。表示部14には、分析対象が地上にて移動する様子が動画表示される。閾値γを設定してクラスタリングした結果を表示する場合には、分析対象の移動に伴ってクラスタが結合したり分離したりする様子が、基礎面に立つブランチ同士が接近し、1つのブランチに縮約されたり、逆に分離したりする様子として表される。 For example, the coordinate data e C1 and e C2 are the positions on the ground surface of the moving object to be analyzed. In this case, an aerial photograph or CG image of the ground surface can be texture-mapped on the base surface 42. This makes it easy to grasp the movement of the analysis target and the positional relationship between the clusters, and makes it easy to understand the clustering analysis result represented by the dendrogram. The display unit 14 displays a moving image of how the analysis target moves on the ground. When displaying the result of clustering by setting the threshold value γ, the state of clusters joining and separating with the movement of the analysis target is close to the branches standing on the base plane and reduced to one branch. It is expressed as being contracted or conversely separated.

また、デンドログラム画像生成部22は、基礎面42上におけるクラスタに対応する位置に、当該クラスタに含まれる分析対象Sの数に応じた大きさの三次元オブジェクトを画像表示するように構成することもできる。   Further, the dendrogram image generation unit 22 is configured to display an image of a three-dimensional object having a size corresponding to the number of analysis targets S included in the cluster at a position corresponding to the cluster on the base surface 42. You can also.

図6は、三次元オブジェクトとして半球を表示した三次元デンドログラムの画像例を示す模式図である。この画像50は、図5と同じく、基礎面42上に形成されるデンドログラムの透視投影画像である。基礎面42に配置されたデンドログラム54の終端ノードNに半球56が表示される。半球56は、例えば、その中心が終端ノードNに一致し、半径、基礎面42上の面積、又は体積がクラスタに含まれる分析対象Sの数(クラスタの大きさ、サイズ)に比例して変化するように設定される。また、クラスタに含まれる分析対象Sの基礎面42上での分布範囲の大きさに応じて,半球56のサイズを設定してもよい。 FIG. 6 is a schematic diagram illustrating an image example of a three-dimensional dendrogram displaying a hemisphere as a three-dimensional object. This image 50 is a perspective projection image of a dendrogram formed on the base surface 42 as in FIG. A hemisphere 56 is displayed at the terminal node NT of the dendrogram 54 arranged on the base surface 42. The hemisphere 56 is, for example, proportional to the number of analysis objects S (cluster size, size) whose center coincides with the end node NT and whose radius, area on the base surface 42, or volume is included in the cluster. Set to change. Further, the size of the hemisphere 56 may be set according to the size of the distribution range on the basic surface 42 of the analysis target S included in the cluster.

さらに、クラスタのサイズに連動して、半球56の色を漸次変化させてもよく、これにより、例えば、透視投影により遠近表示されるクラスタ相互のサイズの比較が容易となり得る。   Furthermore, the color of the hemisphere 56 may be gradually changed in conjunction with the size of the cluster, and this makes it easy to compare the sizes of clusters displayed in perspective by perspective projection, for example.

図7は、三次元オブジェクトとして所定形状・大きさの要素オブジェクトを基礎面42上に積み上げた三次元デンドログラムの画像例を示す模式図である。この画像60は、図5と同じく、基礎面42上に形成されるデンドログラムの透視投影画像である。基礎面42に配置されたデンドログラム64の終端ノードNからブランチ65に沿って、要素オブジェクトとして球66が積み上げられる。積み上げる球66の個数がクラスタのサイズに応じて定められる。 FIG. 7 is a schematic diagram illustrating an example of a three-dimensional dendrogram image in which element objects having a predetermined shape and size are stacked on the base surface 42 as a three-dimensional object. This image 60 is a perspective projection image of a dendrogram formed on the base surface 42 as in FIG. A sphere 66 is stacked as an element object along the branch 65 from the terminal node NT of the dendrogram 64 arranged on the base surface 42. The number of balls 66 to be stacked is determined according to the size of the cluster.

分析目的データが座標データ以外のものを含む場合には、基礎面42上での距離が必ずしもクラスタ間の距離に対応しない。そこで、例えば、三次元オブジェクトの色の属性(色相、彩度、明度)に、クラスタ間の距離を反映させることで、三次元デンドログラムの画像にてクラスタ間の距離の直感的な理解を容易とすることができる。   When the analysis purpose data includes data other than coordinate data, the distance on the base surface 42 does not necessarily correspond to the distance between clusters. Therefore, for example, by reflecting the distance between clusters in the color attributes (hue, saturation, brightness) of a three-dimensional object, it is easy to intuitively understand the distance between clusters in a three-dimensional dendrogram image. It can be.

また、本クラスタリング解析装置10は上述のように、閾値γでクラスタリングした結果を、閾値以下の構造を縮約させた形式で表示可能である。そこで、画像に表示されている三次元デンドログラムがクラスタリングされた結果を表示しているのか否か、及び閾値γがどのレベルに設定されているのかを、三次元オブジェクトで表示してもよい。例えば、そのための三次元オブジェクトとして、ブランチに沿って伸びるシリンダを用いることができ、当該シリンダの有無で閾値γの設定の有無を示すと共に、そのシリンダの高さで閾値γの大きさを表示することができる。   Further, as described above, the clustering analysis apparatus 10 can display the result of clustering with the threshold value γ in a form in which the structure below the threshold value is reduced. Therefore, it may be displayed as a three-dimensional object whether the result of clustering the three-dimensional dendrogram displayed in the image is displayed and what level the threshold value γ is set to. For example, a cylinder extending along a branch can be used as a three-dimensional object for that purpose. The presence / absence of the cylinder indicates whether the threshold γ is set, and the height of the cylinder indicates the size of the threshold γ. be able to.

また、クラスタリングした結果を表示する場合に、各クラスタに包含される分析対象Sの基礎面42上での分布範囲を、当該範囲に広がる三次元オブジェクトや、基礎面42上の色分けなどで表示してもよい。   Further, when displaying the clustered result, the distribution range of the analysis target S included in each cluster on the basic surface 42 is displayed by a three-dimensional object extending in the range, color coding on the basic surface 42, or the like. May be.

また、分析過程における閾値γの設定や分析対象の移動状況によっては、複数の分析対象が1つにクラスタリングされたり、あるいは分析対象そのものが一時的に1つになる場合が考えられる。この場合には、クラスタに含まれている1または複数の分析対象の数に応じた半径や基礎面上の面積、体積を有する半球を表示したり、あるいは対応する数だけ玉を積み上げて表示し、複数のクラスタに分離した時点でデンドログラムを表示するようにしてもよい。   Further, depending on the setting of the threshold value γ in the analysis process and the movement status of the analysis target, a plurality of analysis targets may be clustered into one, or the analysis target itself may temporarily become one. In this case, a hemisphere having a radius, an area on the base surface, and a volume corresponding to the number of one or more analysis objects included in the cluster is displayed, or a corresponding number of balls are stacked and displayed. The dendrogram may be displayed at the time of separation into a plurality of clusters.

なお、上述の具体例では専ら、分析目的データが座標データeC1,eC2である場合を説明したが、分析目的データは座標データとそれ以外のものとの組み合わせであってもよいし、座標データ以外のもののみであってもよい。 In the above-described specific example, the case where the analysis target data is the coordinate data e C1 and e C2 has been described. However, the analysis target data may be a combination of coordinate data and other data, Only data other than data may be used.

本発明の実施形態に係るクラスタリング解析装置の概略のブロック図である。1 is a schematic block diagram of a clustering analysis apparatus according to an embodiment of the present invention. 本発明の実施形態に係るクラスタリング解析装置の処理部の概略の動作を示すフロー図である。It is a flowchart which shows the operation | movement of the outline | summary of the process part of the clustering analyzer which concerns on embodiment of this invention. 基本的な三次元デンドログラムの最下層部分を示す模式図である。It is a schematic diagram which shows the lowest layer part of a basic three-dimensional dendrogram. クラスタリングされた結果を示す場合における三次元デンドログラムの最下層部分を示す模式図である。It is a schematic diagram which shows the lowest layer part of the three-dimensional dendrogram in the case of showing the result clustered. 三次元デンドログラムの画像例を示す模式図である。It is a schematic diagram which shows the example of an image of a three-dimensional dendrogram. 三次元オブジェクトとして半球を表示した三次元デンドログラムの画像例を示す模式図である。It is a schematic diagram which shows the image example of the three-dimensional dendrogram which displayed the hemisphere as a three-dimensional object. 三次元オブジェクトとして所定形状・大きさの要素オブジェクトを基礎面42上に積み上げた三次元デンドログラムの画像例を示す模式図である。FIG. 6 is a schematic diagram illustrating an example of a three-dimensional dendrogram image in which element objects having a predetermined shape and size are stacked on a basic surface as three-dimensional objects. 従来の一般的なデンドログラムの一例を示す図である。It is a figure which shows an example of the conventional general dendrogram.

符号の説明Explanation of symbols

10 クラスタリング解析装置、12 処理部、14 表示部、16 記憶部、18 操作部、20 分析部、22 デンドログラム画像生成部、42 基礎面、44,54,64 三次元デンドログラム。   DESCRIPTION OF SYMBOLS 10 Clustering analyzer, 12 processing part, 14 display part, 16 memory | storage part, 18 operation part, 20 analysis part, 22 dendrogram image generation part, 42 base plane, 44,54,64 three-dimensional dendrogram.

Claims (8)

時系列で表される複数種類の要素データが対応付けられた複数の分析対象について、前記要素データのうちの所定の分析目的データに関する前記分析対象間の類似度に基づき、各時刻毎の階層的クラスタリング分析を前記時系列に従って順次行う分析部と、
三次元空間内にて、前記要素データのうちの所定の座標データに応じた位置に前記分析対象が対応付けられる基礎面を定義し、前記基礎面に配置される前記分析対象それぞれをリーフとし当該各リーフに対するブランチが前記基礎面に立設される三次元的なデンドログラムを前記階層的クラスタリング分析の分析結果に基づいて求め、前記時系列に従って変化する当該デンドログラムの投影画像を生成するデンドログラム画像生成部と、
を有することを特徴とするクラスタリング解析装置。
For a plurality of analysis objects associated with a plurality of types of element data represented in time series, based on the similarity between the analysis objects with respect to predetermined analysis object data of the element data, the hierarchical structure for each time An analysis unit that sequentially performs clustering analysis according to the time series;
In a three-dimensional space, a base plane is defined in which the analysis target is associated with a position according to predetermined coordinate data of the element data, and each analysis target placed on the base plane is defined as a leaf. A dendrogram for obtaining a three-dimensional dendrogram in which a branch for each leaf is erected on the base plane based on the analysis result of the hierarchical clustering analysis, and generating a projection image of the dendrogram that changes according to the time series An image generator;
A clustering analysis apparatus characterized by comprising:
請求項1に記載のクラスタリング解析装置において、
前記座標データは、その一部に前記分析目的データを含むこと、を特徴とするクラスタリング解析装置。
The clustering analysis apparatus according to claim 1,
A clustering analysis apparatus characterized in that the coordinate data includes the analysis object data in a part thereof.
請求項1又は請求項2に記載のクラスタリング解析装置において、
前記デンドログラム画像生成部は、設定されるクラスタリング閾値でクラスタを定義した場合の前記投影画像として、前記デンドログラムのうち前記クラスタに対応する部分の構造を、当該クラスタに接続されるブランチの延長線で置き換えた画像を生成すること、を特徴とするクラスタリング解析装置。
In the clustering analysis apparatus according to claim 1 or 2,
The dendrogram image generation unit, as the projection image when a cluster is defined with a set clustering threshold, the structure of a portion corresponding to the cluster in the dendrogram, an extension line of a branch connected to the cluster A clustering analysis device characterized by generating an image replaced with.
請求項3に記載のクラスタリング解析装置において、
前記デンドログラム画像生成部は、前記基礎面上における前記クラスタに対応する位置に、当該クラスタに含まれる前記分析対象の数に応じた大きさの三次元オブジェクトを画像表示すること、を特徴とするクラスタリング解析装置。
In the clustering analysis apparatus according to claim 3,
The dendrogram image generation unit displays a three-dimensional object having a size corresponding to the number of the analysis targets included in the cluster at a position corresponding to the cluster on the basic surface. Clustering analyzer.
請求項4に記載のクラスタリング解析装置において、
前記三次元オブジェクトは半球であること、を特徴とするクラスタリング解析装置。
In the clustering analysis apparatus according to claim 4,
A clustering analysis apparatus, wherein the three-dimensional object is a hemisphere.
請求項4に記載のクラスタリング解析装置において、
前記三次元オブジェクトは所定大きさの要素オブジェクトを前記クラスタに含まれる前記分析対象の数に応じた数、前記基礎面から積み上げたものであること、を特徴とするクラスタリング解析装置。
In the clustering analysis apparatus according to claim 4,
The three-dimensional object is a clustering analysis apparatus characterized in that element objects having a predetermined size are stacked from the base plane in a number corresponding to the number of analysis objects included in the cluster.
時系列で表される複数種類の要素データが対応付けられた複数の分析対象について、
前記要素データのうちの所定の分析目的データに関する前記分析対象間の類似度に基づき、階層的クラスタリング分析を行う分析ステップと、
三次元空間内にて、前記要素データのうちの所定の座標データに応じた位置に前記分析対象が対応付けられる基礎面を定義し、前記基礎面に配置される前記分析対象それぞれをリーフとし当該各リーフに対するブランチが前記基礎面に立設される三次元的なデンドログラムを前記階層的クラスタリング分析の分析結果に基づいて求め、当該デンドログラムの投影画像を生成するデンドログラム画像生成ステップと、
を前記時系列に従って順次行って前記デンドログラムの動画像を生成することを特徴とするクラスタリング解析方法。
For multiple analysis targets that are associated with multiple types of element data represented in time series,
An analysis step of performing a hierarchical clustering analysis based on the similarity between the analysis objects with respect to predetermined analysis object data of the element data;
In a three-dimensional space, a base plane is defined in which the analysis target is associated with a position according to predetermined coordinate data of the element data, and each analysis target placed on the base plane is defined as a leaf. A dendrogram image generation step of obtaining a three-dimensional dendrogram in which a branch for each leaf is erected on the base plane based on the analysis result of the hierarchical clustering analysis, and generating a projection image of the dendrogram;
The clustering analysis method is characterized in that the dynamic image of the dendrogram is generated in order according to the time series.
時系列で表される複数種類の要素データが対応付けられた複数の分析対象について、
前記要素データのうちの所定の分析目的データに関する前記分析対象間の類似度に基づき、階層的クラスタリング分析を行う分析ステップと、
三次元空間内にて、前記要素データのうちの所定の座標データに応じた位置に前記分析対象が対応付けられる基礎面を定義し、前記基礎面に配置される前記分析対象それぞれをリーフとし当該各リーフに対するブランチが前記基礎面に立設される三次元的なデンドログラムを前記階層的クラスタリング分析の分析結果に基づいて求め、当該デンドログラムの投影画像を生成するデンドログラム画像生成ステップと、
を前記時系列に従って順次、コンピュータに実行させ、前記デンドログラムの動画像を生成することを特徴とするクラスタリング解析プログラム。
For multiple analysis targets that are associated with multiple types of element data represented in time series,
An analysis step of performing a hierarchical clustering analysis based on the similarity between the analysis objects with respect to predetermined analysis object data of the element data;
In a three-dimensional space, a base plane is defined in which the analysis target is associated with a position according to predetermined coordinate data of the element data, and each analysis target placed on the base plane is defined as a leaf. A dendrogram image generation step of obtaining a three-dimensional dendrogram in which a branch for each leaf is erected on the base plane based on the analysis result of the hierarchical clustering analysis, and generating a projection image of the dendrogram;
A clustering analysis program that causes a computer to sequentially execute in accordance with the time series to generate a moving image of the dendrogram.
JP2008126143A 2008-05-13 2008-05-13 Clustering analysis device, clustering analysis method, and clustering analysis program Pending JP2009276913A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008126143A JP2009276913A (en) 2008-05-13 2008-05-13 Clustering analysis device, clustering analysis method, and clustering analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008126143A JP2009276913A (en) 2008-05-13 2008-05-13 Clustering analysis device, clustering analysis method, and clustering analysis program

Publications (1)

Publication Number Publication Date
JP2009276913A true JP2009276913A (en) 2009-11-26

Family

ID=41442310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008126143A Pending JP2009276913A (en) 2008-05-13 2008-05-13 Clustering analysis device, clustering analysis method, and clustering analysis program

Country Status (1)

Country Link
JP (1) JP2009276913A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015137968A (en) * 2014-01-23 2015-07-30 日立Geニュークリア・エナジー株式会社 System and method for detecting position of underwater vehicle
US10482130B2 (en) * 2018-03-19 2019-11-19 Capital One Services, Llc Three-dimensional tree diagrams

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015137968A (en) * 2014-01-23 2015-07-30 日立Geニュークリア・エナジー株式会社 System and method for detecting position of underwater vehicle
US10482130B2 (en) * 2018-03-19 2019-11-19 Capital One Services, Llc Three-dimensional tree diagrams

Similar Documents

Publication Publication Date Title
WO2020253663A1 (en) Artificial intelligence-based image region recognition method and apparatus, and model training method and apparatus
US10235412B2 (en) Detecting, representing, and interpreting three-space input: gestural continuum subsuming freespace, proximal, and surface-contact modes
JP5592011B2 (en) Multi-scale 3D orientation
US20150138086A1 (en) Calibrating control device for use with spatial operating system
JP6098120B2 (en) Assembly sequence generation program, assembly sequence generation apparatus, and manufacturing method
US11048335B2 (en) Stroke operation prediction for three-dimensional digital content
CN102708355A (en) Information processing device, authoring method, and program
US20120105446A1 (en) Building controllable clairvoyance device in virtual world
US11551388B2 (en) Image modification using detected symmetry
US9007373B2 (en) Systems and methods for creating texture exemplars
US10949069B2 (en) Shake event detection system
CN110070616A (en) Memory, statistical data rendering method, device and equipment based on GIS platform
Stober et al. Musicgalaxy: A multi-focus zoomable interface for multi-facet exploration of music collections
JP2012014569A (en) Assembly sequence generation system, program and method
CN109544702A (en) Three-dimension varying processing method, device, electronic equipment and storage medium
US9792835B2 (en) Proxemic interfaces for exploring imagery
Hildebrandt et al. An assisting, constrained 3D navigation technique for multiscale virtual 3D city models
CN115668271A (en) Method and device for generating plan
JP2009276913A (en) Clustering analysis device, clustering analysis method, and clustering analysis program
US20230169736A1 (en) Planet-scale positioning of augmented reality content
CN108597025A (en) Accelerated model construction method and device based on artificial intelligence Virtual reality
US10324621B2 (en) Facilitating analysis of use interface gesture patterns
JP2021015533A (en) Image classification system and image classification method
US11915356B2 (en) Semi-automatic 3D scene optimization with user-provided constraints
CN111383310B (en) Picture splitting method and device