JP2015087966A - 分析装置、分析方法および分析プログラム - Google Patents
分析装置、分析方法および分析プログラム Download PDFInfo
- Publication number
- JP2015087966A JP2015087966A JP2013226058A JP2013226058A JP2015087966A JP 2015087966 A JP2015087966 A JP 2015087966A JP 2013226058 A JP2013226058 A JP 2013226058A JP 2013226058 A JP2013226058 A JP 2013226058A JP 2015087966 A JP2015087966 A JP 2015087966A
- Authority
- JP
- Japan
- Prior art keywords
- data
- cluster
- sampling
- prediction
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】分析装置100は分析対象データ141から抽出したサンプリングデータをクラスタ分析し、サンプリングデータのクラスタ分析結果を基にして、分析対象データ141の各データが属するクラスタを予測した複数の予測データを生成する。そして、分析装置100は、複数の予測データのうち、評価値のよい予測データのクラスタ分類結果を用いて、分析対象データ141の最終的なクラスタ分類結果を特定する。
【選択図】図1
Description
前記複数のサンプリングデータについてクラスタ分析を実行し、前記サンプリングデータ毎に、前記サンプリングデータに含まれるデータを異なるクラスタに分類するクラスタ分析部と、
前記複数のサンプリングデータに対する前記クラスタ分析部の複数の分類結果と前記入力データとを基にして、前記入力データに含まれるデータの所属するクラスタを予測したデータを示す予測データを複数生成するクラスタ予測部と、
前記予測データのクラスタ間距離およびクラスタ内距離を基にして、予測データ毎に評価値を算出し、パレート解となる評価値に対応する予測データを判定する判定部と、
前記パレート解となる評価値に対応する予測データを基にして、前記入力データに含まれるデータをクラスタに分類する最終クラスタ計算部と
を有することを特徴とする分析装置。
入力データに対してサンプリングを実行し前記入力データから一部のデータを抽出する処理を繰り返し実行して複数のサンプリングデータを生成し、
前記複数のサンプリングデータについてクラスタ分析を実行し、前記サンプリングデータ毎に、前記サンプリングデータに含まれるデータを異なるクラスタに分類し、
前記複数のサンプリングデータに対する前記クラスタ分析部の複数の分類結果と前記入力データとを基にして、前記入力データに含まれるデータの所属するクラスタを予測したデータを示す予測データを複数生成し、
前記予測データのクラスタ間距離およびクラスタ内距離を基にして、予測データ毎に評価値を算出し、パレート解となる評価値に対応する予測データを判定し、
前記パレート解となる評価値に対応する予測データを基にして、前記入力データに含まれるデータをクラスタに分類する
各処理を実行することを特徴とする分析方法。
入力データに対してサンプリングを実行し前記入力データから一部のデータを抽出する処理を繰り返し実行して複数のサンプリングデータを生成し、
前記複数のサンプリングデータについてクラスタ分析を実行し、前記サンプリングデータ毎に、前記サンプリングデータに含まれるデータを異なるクラスタに分類し、
前記複数のサンプリングデータに対する前記クラスタ分析部の複数の分類結果と前記入力データとを基にして、前記入力データに含まれるデータの所属するクラスタを予測したデータを示す予測データを複数生成し、
前記予測データのクラスタ間距離およびクラスタ内距離を基にして、予測データ毎に評価値を算出し、パレート解となる評価値に対応する予測データを判定し、
前記パレート解となる評価値に対応する予測データを基にして、前記入力データに含まれるデータをクラスタに分類する
各処理を実行させることを特徴とする分析プログラム。
151,251 サンプリング実行部
152,252 クラスタ分析部
153,253 クラスタ予測部
154,254 判定部
155,255 最終クラスタ計算部
Claims (5)
- 入力データに対してサンプリングを実行し前記入力データから一部のデータを抽出する処理を繰り返し実行して複数のサンプリングデータを生成するサンプリング実行部と、
前記複数のサンプリングデータについてクラスタ分析を実行し、前記サンプリングデータ毎に、前記サンプリングデータに含まれるデータを異なるクラスタに分類するクラスタ分析部と、
前記複数のサンプリングデータに対する前記クラスタ分析部の複数の分類結果と前記入力データとを基にして、前記入力データに含まれるデータの所属するクラスタを予測したデータを示す予測データを複数生成するクラスタ予測部と、
前記予測データのクラスタ間距離およびクラスタ内距離を基にして、予測データ毎に評価値を算出し、パレート解となる評価値に対応する予測データを判定する判定部と、
前記パレート解となる評価値に対応する予測データを基にして、前記入力データに含まれるデータをクラスタに分類する最終クラスタ計算部と
を有することを特徴とする分析装置。 - 前記最終クラスタ計算部は、パレート解となる評価値に対応する類似の予測データをグループ化し、同一グループに含まれる予測データを基にして、前記入力データに含まれるデータを異なるクラスタに分類する処理を、グループ毎に実行することを特徴とする請求項1に記載の分析装置。
- 前記最終クラスタ計算部は、前記入力データに対して、ランダムにクラスタを割り当てた複数の最終クラスタデータを生成し、各最終クラスタデータと予測データとの類似度を基にして、特定の最終クラスタデータを選択することを特徴とする請求項1または2に記載の分析装置。
- コンピュータが実行する分析方法であって、
入力データに対してサンプリングを実行し前記入力データから一部のデータを抽出する処理を繰り返し実行して複数のサンプリングデータを生成し、
前記複数のサンプリングデータについてクラスタ分析を実行し、前記サンプリングデータ毎に、前記サンプリングデータに含まれるデータを異なるクラスタに分類し、
前記複数のサンプリングデータに対する前記クラスタ分析部の複数の分類結果と前記入力データとを基にして、前記入力データに含まれるデータの所属するクラスタを予測したデータを示す予測データを複数生成し、
前記予測データのクラスタ間距離およびクラスタ内距離を基にして、予測データ毎に評価値を算出し、パレート解となる評価値に対応する予測データを判定し、
前記パレート解となる評価値に対応する予測データを基にして、前記入力データに含まれるデータをクラスタに分類する
各処理を実行することを特徴とする分析方法。 - コンピュータに、
入力データに対してサンプリングを実行し前記入力データから一部のデータを抽出する処理を繰り返し実行して複数のサンプリングデータを生成し、
前記複数のサンプリングデータについてクラスタ分析を実行し、前記サンプリングデータ毎に、前記サンプリングデータに含まれるデータを異なるクラスタに分類し、
前記複数のサンプリングデータに対する前記クラスタ分析部の複数の分類結果と前記入力データとを基にして、前記入力データに含まれるデータの所属するクラスタを予測したデータを示す予測データを複数生成し、
前記予測データのクラスタ間距離およびクラスタ内距離を基にして、予測データ毎に評価値を算出し、パレート解となる評価値に対応する予測データを判定し、
前記パレート解となる評価値に対応する予測データを基にして、前記入力データに含まれるデータをクラスタに分類する
各処理を実行させることを特徴とする分析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013226058A JP6160445B2 (ja) | 2013-10-30 | 2013-10-30 | 分析装置、分析方法および分析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013226058A JP6160445B2 (ja) | 2013-10-30 | 2013-10-30 | 分析装置、分析方法および分析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015087966A true JP2015087966A (ja) | 2015-05-07 |
JP6160445B2 JP6160445B2 (ja) | 2017-07-12 |
Family
ID=53050691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013226058A Active JP6160445B2 (ja) | 2013-10-30 | 2013-10-30 | 分析装置、分析方法および分析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6160445B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022009112A (ja) * | 2016-03-29 | 2022-01-14 | ソニーグループ株式会社 | 情報処理装置、端末装置、情報処理方法、プログラム、および情報処理システム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11250094A (ja) * | 1998-03-04 | 1999-09-17 | Nippon Telegr & Teleph Corp <Ntt> | 2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体 |
US7162413B1 (en) * | 1999-07-09 | 2007-01-09 | International Business Machines Corporation | Rule induction for summarizing documents in a classified document collection |
JP2007172427A (ja) * | 2005-12-26 | 2007-07-05 | Nissan Motor Co Ltd | パレート新領域探索装置,パレート新領域探索プログラムが記録された媒体,パレート新領域探索表示装置及びパレート新領域探索方法 |
JP2007179143A (ja) * | 2005-12-27 | 2007-07-12 | Nissan Motor Co Ltd | パレート新領域探索装置,パレート新領域探索プログラムが記録された媒体,パレート新領域探索表示装置及びパレート新領域探索方法 |
JP2007179288A (ja) * | 2005-12-28 | 2007-07-12 | Nissan Motor Co Ltd | パレート新領域探索装置,パレート新領域探索プログラムが記録された媒体,パレート新領域探索表示装置及びパレート新領域探索方法 |
-
2013
- 2013-10-30 JP JP2013226058A patent/JP6160445B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11250094A (ja) * | 1998-03-04 | 1999-09-17 | Nippon Telegr & Teleph Corp <Ntt> | 2相データクラスタ方法および装置と2相データクラスタプログラムを記録した記録媒体 |
US7162413B1 (en) * | 1999-07-09 | 2007-01-09 | International Business Machines Corporation | Rule induction for summarizing documents in a classified document collection |
JP2007172427A (ja) * | 2005-12-26 | 2007-07-05 | Nissan Motor Co Ltd | パレート新領域探索装置,パレート新領域探索プログラムが記録された媒体,パレート新領域探索表示装置及びパレート新領域探索方法 |
JP2007179143A (ja) * | 2005-12-27 | 2007-07-12 | Nissan Motor Co Ltd | パレート新領域探索装置,パレート新領域探索プログラムが記録された媒体,パレート新領域探索表示装置及びパレート新領域探索方法 |
JP2007179288A (ja) * | 2005-12-28 | 2007-07-12 | Nissan Motor Co Ltd | パレート新領域探索装置,パレート新領域探索プログラムが記録された媒体,パレート新領域探索表示装置及びパレート新領域探索方法 |
Non-Patent Citations (2)
Title |
---|
小林 優、外2名: "特徴要素の重みを考慮に入れたクラスタ代表の洗練による文書クラスタリング", 情報処理学会研究報告, vol. 第2002巻,第28号, JPN6017016417, 15 March 2002 (2002-03-15), JP, pages p.135−142 * |
山代 大輔、外2名: "可視化手法を用いた多目的最適化問題における満足解の選択支援", 知能と情報, vol. 第20巻,第6号, JPN6017016419, 15 December 2008 (2008-12-15), JP, pages p.24−32 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022009112A (ja) * | 2016-03-29 | 2022-01-14 | ソニーグループ株式会社 | 情報処理装置、端末装置、情報処理方法、プログラム、および情報処理システム |
US11568492B2 (en) | 2016-03-29 | 2023-01-31 | Sony Corporation | Information processing apparatus, information processing method, program, and system |
Also Published As
Publication number | Publication date |
---|---|
JP6160445B2 (ja) | 2017-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106650780B (zh) | 数据处理方法及装置、分类器训练方法及系统 | |
Hopfensitz et al. | Multiscale binarization of gene expression data for reconstructing Boolean networks | |
Kumar et al. | Feature selection and classification of microarray data using MapReduce based ANOVA and K-nearest neighbor | |
JP6555061B2 (ja) | クラスタリングプログラム、クラスタリング方法、および情報処理装置 | |
CN110826648B (zh) | 一种利用时序聚类算法实现故障检测的方法 | |
Ayadi et al. | BicFinder: a biclustering algorithm for microarray data analysis | |
Kumar et al. | Fuzzy-rough discriminative feature selection and classification algorithm, with application to microarray and image datasets | |
KR102351306B1 (ko) | 질환 연관 유전자 변이 분석을 통한 질환별 위험 유전자 변이 정보 생성 장치 및 그 방법 | |
Erbilek et al. | Framework for managing ageing effects in signature biometrics | |
Sebastiani et al. | Detection of significant groups in hierarchical clustering by resampling | |
Bhattacharya | Some Salient Aspects of Machine Learning Research: A Bibliometric Analysis. | |
Ji et al. | A novel cluster center initialization method for the k-prototypes algorithms using centrality and distance | |
Kim et al. | A method to identify differential expression profiles of time-course gene data with Fourier transformation | |
JP5873764B2 (ja) | 欠陥画像の提示方法 | |
Patowary et al. | Developing an effective biclustering technique using an enhanced proximity measure | |
Azhar et al. | A hierarchical Gamma Mixture Model-based method for estimating the number of clusters in complex data | |
Wang et al. | Automatic cluster number selection by finding density peaks | |
JP6160445B2 (ja) | 分析装置、分析方法および分析プログラム | |
Corral-Corral et al. | Machine learnable fold space representation based on residue cluster classes | |
Cao et al. | A novel filter feature selection method for paired microarray expression data analysis | |
Sylligardos et al. | Choose wisely: An extensive evaluation of model selection for anomaly detection in time series | |
Liu et al. | An improved method for multi-objective clustering ensemble algorithm | |
JP6233432B2 (ja) | 混合モデルの選択方法及び装置 | |
JP2014006613A (ja) | 近傍探索方法および類似画像探索方法 | |
Dash et al. | Efficient microarray data classification with three-stage dimensionality reduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170427 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6160445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |