JP2011003156A - データ分類装置、データ分類方法及びデータ分類プログラム - Google Patents
データ分類装置、データ分類方法及びデータ分類プログラム Download PDFInfo
- Publication number
- JP2011003156A JP2011003156A JP2009148001A JP2009148001A JP2011003156A JP 2011003156 A JP2011003156 A JP 2011003156A JP 2009148001 A JP2009148001 A JP 2009148001A JP 2009148001 A JP2009148001 A JP 2009148001A JP 2011003156 A JP2011003156 A JP 2011003156A
- Authority
- JP
- Japan
- Prior art keywords
- data
- cluster
- hierarchical
- relationship
- representative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明によるデータ分類装置は、データ集合に含まれる各データを階層的にクラスタリングした階層的クラスタ構造において最下層に属する各クラスタについて、各クラスタを代表するデータをそれぞれ決定する最下層代表データ決定手段3と、最下層代表データ決定手段3が決定した各データのうち、各クラスタ間において中心性の高いクラスタを代表するデータを、最下層より1つ上位の階層に属するクラスタを代表するデータと決定し、さらに、最上層に至るまで、処理対象の階層に属する中心性の高いクラスタを代表するデータを、処理対象の階層より1つ上位の階層に属するクラスタを代表するデータと決定する処理を繰り返し実行する階層的代表データ決定手段4とを備えたことを特徴とする。
【選択図】図8
Description
2 階層的クラスタ構造解析手段
3 最下層代表データ決定手段
4 階層的代表データ決定手段
5 データ表示手段
c11、c12、c13、c14 クラスタ
c211、c212、c213、c214、c215 c11の下位クラスタ
c221、c222、c223、c224 c12の下位クラスタ
c231、c232、c233、c234、c235 c13の下位クラスタ
c214、c242、c243、c244、c245、c246 c14の下位クラスタ
d11、d12、d13、d14、d212、d213、d214、d215 データ
Claims (18)
- データ集合に含まれる各データを階層的にクラスタリングした階層的クラスタ構造において最下層に属する各クラスタについて、前記各クラスタを代表するデータをそれぞれ決定する最下層代表データ決定手段と、
前記最下層代表データ決定手段が決定した各データのうち、前記各クラスタ間において中心性の高いクラスタを代表するデータを、前記最下層より1つ上位の階層に属するクラスタを代表するデータと決定し、さらに、最上層に至るまで、処理対象の階層に属する中心性の高いクラスタを代表するデータを、前記処理対象の階層より1つ上位の階層に属するクラスタを代表するデータと決定する処理を繰り返し実行する階層的代表データ決定手段とを
備えたことを特徴とするデータ分類装置。 - データ集合の階層的クラスタ構造を解析するとともに、各クラスタ間の関連性を算出する階層的クラスタ構造解析手段を備え、
階層的代表データ決定手段は、前記階層的クラスタ構造解析手段が算出した各クラスタ間の関連性に基づいて、中心性の高いクラスタを特定する
請求項1記載のデータ分類装置。 - データ集合を分類するデータ分類装置であって、
前記データ集合に含まれる各データ及び前記各データ間の関連性を取得するデータ取得手段と、
前記データ取得手段が取得した前記各データ及び前記各データ間の関連性に基づいて、前記データ集合に含まれる前記各データを階層的にクラスタリングする階層的クラスタ構造を解析し、各クラスタ間の関連性及び各クラスタと各データとの関連性を算出する階層的クラスタ構造解析手段と、
前記階層的クラスタ構造解析手段が解析した前記階層的クラスタ構造において最下層に属する各クラスタについて、前記各クラスタを代表するデータをそれぞれ決定する最下層代表データ決定手段と、
前記最下層代表データ決定手段が決定した前記最下層の各クラスタを代表するデータを用いて、前記階層的クラスタ構造において、前記最下層の各クラスタよりも上位の各クラスタについて、前記上位の各クラスタを代表するデータをそれぞれ決定し、さらに、最上層のクラスタにいたるまで、処理対象のクラスタの一つ下の層の各クラスタを代表するデータを用いて、前記処理対象のクラスタを代表するデータを決定する処理を繰り返し実行する階層的代表データ決定手段と、
前記最下層代表データ決定手段及び前記階層的データ決定手段が決定した前記各クラスタを代表するデータ、前記各データ間の関連性、前記階層的クラスタ構造解析手段が解析した各クラスタの階層構造、各クラスタ間の関連性及び各クラスタと各データとの関連性に基づいて、前記データ集合を分類した表示用データを生成し、生成した前記表示用データを表示部に表示させるように制御するデータ表示制御手段とを
備えたことを特徴とするデータ分類装置。 - データ表示制御手段は、各クラスタを代表するデータをノードとし、各データ間の関連性、階層的クラスタ構造に基づく各クラスタ間の関連性及び各クラスタと各データとの関連性をリンクとしたグラフ構造を表示するための表示用データを生成し、生成した前記表示用データを表示部に表示させるように制御する
請求項3記載のデータ分類装置。 - 最下層代表データ決定手段は、最下層の各クラスタに属する各データ間の関連性に基づいて中心性を算出し、算出した前記中心性に基づいて、前記最下層の各クラスタを代表するデータを決定する
請求項3又は請求項4記載のデータ分類装置。 - 階層的代表データ決定手段は、代表するデータの決定対象のクラスタの一つ下の層の各クラスタについて、階層的クラスタ構造解析手段が解析した前記一つ下の層の各クラスタ間の関連性に基づいて、前記各クラスタの中心性を算出し、算出した中心性に基づいて、前記決定対象のクラスタを代表するデータを決定する
請求項3から請求項5のうちのいずれか1項に記載のデータ分類装置。 - データ集合に含まれる各データを階層的にクラスタリングした階層的クラスタ構造において最下層に属する各クラスタについて、前記各クラスタを代表するデータをそれぞれ決定する最下層代表データ決定ステップと、
決定した各データのうち、前記各クラスタ間において中心性の高いクラスタを代表するデータを、前記最下層より1つ上位の階層に属するクラスタを代表するデータと決定し、さらに、最上層に至るまで、処理対象の階層に属する中心性の高いクラスタを代表するデータを、前記処理対象の階層より1つ上位の階層に属するクラスタを代表するデータと決定する処理を繰り返し実行する階層的代表データ決定ステップとを
含むことを特徴とするデータ分類方法。 - データ集合の階層的クラスタ構造を解析するとともに、各クラスタ間の関連性を算出する階層的クラスタ構造解析ステップを含み、
階層的代表データ決定ステップで、算出した各クラスタ間の関連性に基づいて、中心性の高いクラスタを特定する
請求項7記載のデータ分類方法。 - データ集合に含まれる各データ及び前記各データ間の関連性を取得するデータ取得ステップと、
取得した前記各データ及び前記各データ間の関連性に基づいて、前記データ集合に含まれる前記各データを階層的にクラスタリングする階層的クラスタ構造を解析し、各クラスタ間の関連性及び各クラスタと各データとの関連性を算出する階層的クラスタ構造解析ステップと、
解析した前記階層的クラスタ構造において最下層に属する各クラスタについて、前記各クラスタを代表するデータをそれぞれ決定する最下層代表データ決定ステップと、
決定した前記最下層の各クラスタを代表するデータを用いて、前記階層的クラスタ構造において、前記最下層の各クラスタよりも上位の各クラスタについて、前記上位の各クラスタを代表するデータをそれぞれ決定し、さらに、最上層のクラスタにいたるまで、処理対象のクラスタの一つ下の層の各クラスタを代表するデータを用いて、前記処理対象のクラスタを代表するデータを決定する処理を繰り返し実行する階層的代表データ決定ステップと、
決定した前記各クラスタを代表するデータ、前記各データ間の関連性、解析した各クラスタの階層構造、各クラスタ間の関連性及び各クラスタと各データとの関連性に基づいて、前記データ集合を分類した表示用データを生成し、生成した前記表示用データを表示部に表示させるように制御するデータ表示制御ステップとを
含むことを特徴とするデータ分類方法。 - データ制御表示ステップで、各クラスタを代表するデータをノードとし、各データ間の関連性、階層的クラスタ構造に基づく各クラスタ間の関連性及び各クラスタと各データとの関連性をリンクとしたグラフ構造を表示するための表示用データを生成し、生成した前記表示データを表示部に表示させるように制御する
請求項9記載のデータ分類方法。 - 最下層代表データ決定ステップで、最下層の各クラスタに属する各データ間の関連性に基づいて中心性を算出し、算出した前記中心性に基づいて、前記最下層の各クラスタを代表するデータを決定する
請求項9又は請求項10記載のデータ分類方法。 - 階層的代表データ決定ステップで、代表するデータの決定対象のクラスタの一つ下の層の各クラスタについて、階層的クラスタ構造解析手段が解析した前記一つ下の層の各クラスタ間の関連性に基づいて、前記各クラスタの中心性を算出し、算出した中心性に基づいて、前記決定対象のクラスタを代表するデータを決定する
請求項9から請求項11のうちのいずれか1項に記載のデータ分類方法。 - コンピュータに、
データ集合に含まれる各データを階層的にクラスタリングした階層的クラスタ構造において最下層に属する各クラスタについて、前記各クラスタを代表するデータをそれぞれ決定する最下層代表データ決定処理と、
決定した各データのうち、前記各クラスタ間において中心性の高いクラスタを代表するデータを、前記最下層より1つ上位の階層に属するクラスタを代表するデータと決定し、さらに、最上層に至るまで、処理対象の階層に属する中心性の高いクラスタを代表するデータを、前記処理対象の階層より1つ上位の階層に属するクラスタを代表するデータと決定する処理を繰り返し実行する階層的代表データ決定処理とを
実行させるためのデータ分類プログラム。 - コンピュータに、
データ集合の階層的クラスタ構造を解析するとともに、各クラスタ間の関連性を算出する階層的クラスタ構造解析処理を実行させ、
階層的代表データ決定処理で、算出した各クラスタ間の関連性に基づいて、中心性の高いクラスタを特定する処理を実行させる
請求項13記載のデータ分類プログラム。 - コンピュータに、
データ集合に含まれる各データ及び前記各データ間の関連性を取得するデータ取得処理と、
取得した前記各データ及び前記各データ間の関連性に基づいて、前記データ集合に含まれる前記各データを階層的にクラスタリングする階層的クラスタ構造を解析し、各クラスタ間の関連性及び各クラスタと各データとの関連性を算出する階層的クラスタ構造解析処理と、
解析した前記階層的クラスタ構造において最下層に属する各クラスタについて、前記各クラスタを代表するデータをそれぞれ決定する最下層代表データ決定処理と、
決定した前記最下層の各クラスタを代表するデータを用いて、前記階層的クラスタ構造において、前記最下層の各クラスタよりも上位の各クラスタについて、前記上位の各クラスタを代表するデータをそれぞれ決定し、さらに、最上層のクラスタにいたるまで、処理対象のクラスタの一つ下の層の各クラスタを代表するデータを用いて、前記処理対象のクラスタを代表するデータを決定する処理を繰り返し実行する階層的代表データ決定処理と、
決定した前記各クラスタを代表するデータ、前記各データ間の関連性、解析した各クラスタの階層構造、各クラスタ間の関連性及び各クラスタと各データとの関連性に基づいて、前記データ集合を分類した表示用データを生成し、生成した前記表示用データを表示部に表示させるように制御するデータ表示制御処理とを
実行させるためのデータ分類プログラム。 - コンピュータに、
データ表示制御処理で、各クラスタを代表するデータをノードとし、各データ間の関連性、階層的クラスタ構造に基づく各クラスタ間の関連性及び各クラスタと各データとの関連性をリンクとしたグラフ構造を表示するための表示用データを生成し、生成した前記表示データを表示部に表示させるように制御する処理を実行させる
請求項15記載のデータ分類プログラム。 - コンピュータに、
最下層代表データ決定処理で、最下層の各クラスタに属する各データ間の関連性に基づいて中心性を算出し、算出した前記中心性に基づいて、前記最下層の各クラスタを代表するデータを決定する処理を実行させる
請求項15又は請求項16記載のデータ分類プログラム。 - コンピュータに、
階層的代表データ決定処理で、代表するデータの決定対象のクラスタの一つ下の層の各クラスタについて、階層的クラスタ構造解析手段が解析した前記一つ下の層の各クラスタ間の関連性に基づいて、前記各クラスタの中心性を算出し、算出した中心性に基づいて、前記決定対象のクラスタを代表するデータを決定する処理を実行させる
請求項15から請求項17のうちのいずれか1項に記載のデータ分類プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009148001A JP2011003156A (ja) | 2009-06-22 | 2009-06-22 | データ分類装置、データ分類方法及びデータ分類プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009148001A JP2011003156A (ja) | 2009-06-22 | 2009-06-22 | データ分類装置、データ分類方法及びデータ分類プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011003156A true JP2011003156A (ja) | 2011-01-06 |
Family
ID=43561039
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009148001A Pending JP2011003156A (ja) | 2009-06-22 | 2009-06-22 | データ分類装置、データ分類方法及びデータ分類プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011003156A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013058176A (ja) * | 2011-09-09 | 2013-03-28 | Kddi Corp | 通信サービスにおける地理的領域の価値を判定するサーバ装置及びプログラム |
JP2013130929A (ja) * | 2011-12-20 | 2013-07-04 | Nec Corp | 因果関係要約方法、因果関係要約装置及び因果関係要約プログラム |
WO2016103451A1 (ja) * | 2014-12-26 | 2016-06-30 | 株式会社日立製作所 | 関連情報取得方法及び装置並びに記憶媒体 |
KR101865027B1 (ko) * | 2010-11-15 | 2018-06-07 | 코닌클리케 필립스 엔.브이. | 펨토셀 액세스 포인트를 설치하기 위한 방법 |
US11244109B2 (en) | 2019-06-07 | 2022-02-08 | Hitachi, Ltd. | Information processing device and information processing method |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016465A (ja) * | 2001-06-19 | 2003-01-17 | Internatl Business Mach Corp <Ibm> | グラフィックス・イメージ作成装置、及びその方法並びにプログラム |
JP2003248689A (ja) * | 2002-02-26 | 2003-09-05 | Just Syst Corp | 選択肢作成装置、選択肢作成方法、及び選択肢作成プログラム |
JP2007087125A (ja) * | 2005-09-22 | 2007-04-05 | Wakayama Univ | 生命情報の可視化方法、可視化プログラム及び記憶媒体 |
JP2007304735A (ja) * | 2006-05-09 | 2007-11-22 | Canon Inc | ファイル管理装置及びファイル管理方法 |
JP2008059442A (ja) * | 2006-09-01 | 2008-03-13 | Nippon Telegr & Teleph Corp <Ntt> | 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体 |
WO2008103412A1 (en) * | 2007-02-22 | 2008-08-28 | Eastman Kodak Company | Representative image selection based on hierarchical clustering |
-
2009
- 2009-06-22 JP JP2009148001A patent/JP2011003156A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016465A (ja) * | 2001-06-19 | 2003-01-17 | Internatl Business Mach Corp <Ibm> | グラフィックス・イメージ作成装置、及びその方法並びにプログラム |
JP2003248689A (ja) * | 2002-02-26 | 2003-09-05 | Just Syst Corp | 選択肢作成装置、選択肢作成方法、及び選択肢作成プログラム |
JP2007087125A (ja) * | 2005-09-22 | 2007-04-05 | Wakayama Univ | 生命情報の可視化方法、可視化プログラム及び記憶媒体 |
JP2007304735A (ja) * | 2006-05-09 | 2007-11-22 | Canon Inc | ファイル管理装置及びファイル管理方法 |
JP2008059442A (ja) * | 2006-09-01 | 2008-03-13 | Nippon Telegr & Teleph Corp <Ntt> | 文書集合分析装置,文書集合分析方法,その方法を実装したプログラム及びそのプログラムを格納した記録媒体 |
WO2008103412A1 (en) * | 2007-02-22 | 2008-08-28 | Eastman Kodak Company | Representative image selection based on hierarchical clustering |
Non-Patent Citations (2)
Title |
---|
CSNG200700493011; 戸田 浩之: 'グラフ分析を利用した文書集合からの話題構造マイニング' 電子情報通信学会論文誌 (J90-D) 第2号 THE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS (J 第J90-D巻,第2号, 20070201, page 292〜310, 社団法人電子情報通信学会 * |
JPN6014008421; 戸田 浩之: 'グラフ分析を利用した文書集合からの話題構造マイニング' 電子情報通信学会論文誌 (J90-D) 第2号 THE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS (J 第J90-D巻,第2号, 20070201, page 292〜310, 社団法人電子情報通信学会 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101865027B1 (ko) * | 2010-11-15 | 2018-06-07 | 코닌클리케 필립스 엔.브이. | 펨토셀 액세스 포인트를 설치하기 위한 방법 |
JP2013058176A (ja) * | 2011-09-09 | 2013-03-28 | Kddi Corp | 通信サービスにおける地理的領域の価値を判定するサーバ装置及びプログラム |
JP2013130929A (ja) * | 2011-12-20 | 2013-07-04 | Nec Corp | 因果関係要約方法、因果関係要約装置及び因果関係要約プログラム |
WO2016103451A1 (ja) * | 2014-12-26 | 2016-06-30 | 株式会社日立製作所 | 関連情報取得方法及び装置並びに記憶媒体 |
JPWO2016103451A1 (ja) * | 2014-12-26 | 2017-04-27 | 株式会社日立製作所 | 関連情報取得方法及び装置並びに記憶媒体 |
US11244109B2 (en) | 2019-06-07 | 2022-02-08 | Hitachi, Ltd. | Information processing device and information processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Middlehurst et al. | The temporal dictionary ensemble (TDE) classifier for time series classification | |
Chen et al. | Personalized QoS-aware web service recommendation and visualization | |
WO2022116537A1 (zh) | 一种资讯推荐方法、装置、电子设备和存储介质 | |
CN111373392B (zh) | 文献分类装置 | |
Kang et al. | Neural and attentional factorization machine-based web api recommendation for mashup development | |
JP5320307B2 (ja) | 興味情報推薦装置、興味情報推薦方法および興味情報推薦プログラム | |
CN112836509A (zh) | 一种专家系统知识库构建方法及系统 | |
KR102334236B1 (ko) | 음성 변환 Text Data에서 의미있는 키워드 추출 방법과 활용 | |
JP2011003156A (ja) | データ分類装置、データ分類方法及びデータ分類プログラム | |
CN113326432A (zh) | 一种基于决策树与推荐方法的模型优选方法 | |
JP6680956B1 (ja) | 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法 | |
CN114297025A (zh) | 数据中心资源分析系统及方法、存储介质及电子设备 | |
JP5929532B2 (ja) | イベント検出装置、イベント検出方法およびイベント検出プログラム | |
JP5973309B2 (ja) | 配信装置及びコンピュータプログラム | |
Kar et al. | Task-specific representation learning for web-scale entity disambiguation | |
CN108197183B (zh) | 一种基于安卓应用的控件布局推荐方法及其系统 | |
JP6924450B2 (ja) | 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法 | |
Lou et al. | The diversity of canonical and ubiquitous progress in computer vision: A dynamic topic modeling approach | |
CN109657710A (zh) | 数据筛选方法、装置、服务器及存储介质 | |
CN112463964B (zh) | 文本分类及模型训练方法、装置、设备及存储介质 | |
Suresh et al. | A fuzzy based hybrid hierarchical clustering model for twitter sentiment analysis | |
JP4346531B2 (ja) | テキストデータ学習分析システム、テキストデータ学習装置、テキストデータ分析装置、方法及びプログラム | |
JP2021152751A (ja) | 分析支援装置及び分析支援方法 | |
CN111291182A (zh) | 热点事件发现方法、装置、设备及存储介质 | |
JP5240777B2 (ja) | 文書分類装置及び文書分類方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120514 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130625 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130805 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140304 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140701 |