JP2014081899A - 共クラスタリング装置、共クラスタリング方法、プログラム及び集積回路 - Google Patents
共クラスタリング装置、共クラスタリング方法、プログラム及び集積回路 Download PDFInfo
- Publication number
- JP2014081899A JP2014081899A JP2012231218A JP2012231218A JP2014081899A JP 2014081899 A JP2014081899 A JP 2014081899A JP 2012231218 A JP2012231218 A JP 2012231218A JP 2012231218 A JP2012231218 A JP 2012231218A JP 2014081899 A JP2014081899 A JP 2014081899A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- clustering
- importance
- distribution
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 54
- 238000009826 distribution Methods 0.000 claims abstract description 132
- 238000004364 calculation method Methods 0.000 claims abstract description 62
- 239000011159 matrix material Substances 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims description 16
- 230000014509 gene expression Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 15
- 238000005070 sampling Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 241000872198 Serjania polyphylla Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】行列又は3次元以上のテンソルの形式で表現可能な関係データに対して共クラスタリング処理を行うことで、関係データを複数のクラスタブロックに分割する共クラスタリング装置100であって、複数のクラスタブロックのそれぞれにおいて生成される関係の傾向を示す統計量の、関係データ全体における分布傾向を生成する分布傾向生成部130と、複数のクラスタブロックのそれぞれの統計量と、分布傾向生成部130が生成した分布傾向とに基づいて、分布傾向に応じて算出結果が変化する算出方法により、複数のクラスタブロックのそれぞれに対して重要度を算出する算出部140と、複数のクラスタブロックの少なくとも1つを示す情報と、当該少なくとも1つに対して算出部140が算出した重要度を示す情報とを出力する出力部150とを備える。
【選択図】図1
Description
本発明者は、「背景技術」の欄において記載した、関係データの分析方法に関し、以下の問題が生じることを見出した。
まず、本発明の実施の形態1に係る共クラスタリング装置の概要について説明する。本発明の実施の形態1に係る共クラスタリング装置は、行列又は3次元以上のテンソルの形式で表現可能な関係データに対して共クラスタリング処理を行うことによって、前記関係データを複数のクラスタブロックに分割する共クラスタリング装置であって、前記複数のクラスタブロックのそれぞれにおいて生成される関係の傾向を示す統計量の、前記関係データ全体における分布傾向を生成する分布傾向生成部と、前記複数のクラスタブロックのそれぞれの統計量と、前記分布傾向生成部が生成した前記分布傾向とに基づいて、前記分布傾向に応じて算出結果が変化する算出方法により、前記複数のクラスタブロックのそれぞれに対して重要度を算出する算出部と、前記複数のクラスタブロックの少なくとも1つを示す情報と、当該少なくとも1つに対して前記算出部が算出した前記重要度を示す情報とを出力する出力部とを備える。
(手順1)z1及びz2の初期値を適当に決める。
(手順2)i=1,2,・・・,N1に対して以下の処理を行う。
(手順2−1)
(手順3)j=1,2,・・・,N2に対して以下の処理を行う。
(手順3−1)
(手順4)
本発明の実施の形態1の変形例について説明する。
次に、本実施の形態2に係る共クラスタリング装置200の概要について説明する。本実施の形態に係る共クラスタリング装置では、前記分布傾向生成部は、前記複数のクラスタブロックのそれぞれの統計量を要素とする統計量データに対してクラスタリング処理を行うことによって、前記統計量データを複数のクラスタに分割し、分割することで得られた前記複数のクラスタの情報を、前記分布傾向として生成する。
なお、上記の実施の形態の共クラスタリング装置は、典型的には半導体集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部またはすべてを含むように1チップ化されてもよい。ここではLSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
110 データ入力部
120、120A 共クラスタリング部
130、130A、230 分布傾向生成部
140、140A、240 算出部
150 出力部
Claims (10)
- 行列又は3次元以上のテンソルの形式で表現可能な関係データに対して共クラスタリング処理を行うことによって、前記関係データを複数のクラスタブロックに分割する共クラスタリング装置であって、
前記複数のクラスタブロックのそれぞれにおいて生成される関係の傾向を示す統計量の、前記関係データ全体における分布傾向を生成する分布傾向生成部と、
前記複数のクラスタブロックのそれぞれの統計量と、前記分布傾向生成部が生成した前記分布傾向とに基づいて、前記分布傾向に応じて算出結果が変化する算出方法により、前記複数のクラスタブロックのそれぞれに対して重要度を算出する算出部と、
前記複数のクラスタブロックの少なくとも1つを示す情報と、当該少なくとも1つに対して前記算出部が算出した前記重要度を示す情報とを出力する出力部とを備える
共クラスタリング装置。 - 前記分布傾向生成部は、
前記関係データ全体の統計量を、前記分布傾向として生成する
請求項1に記載の共クラスタリング装置。 - 前記算出部は、
前記複数のクラスタブロックのそれぞれについて、当該クラスタブロックにおける前記分布傾向により示される値と、当該クラスタブロックの統計量との距離が大きいほど、大きくなるように前記重要度を算出する
請求項2に記載の共クラスタリング装置。 - 前記算出部は、
前記複数のクラスタブロックのそれぞれについて、前記分布傾向と、当該クラスタブロックの統計量と、当該クラスタブロックの大きさとを用いて前記重要度を算出する
請求項2に記載の共クラスタリング装置。 - 前記分布傾向生成部は、
前記複数のクラスタブロックのそれぞれの統計量を要素とする統計量データに対してクラスタリング処理を行うことによって、前記統計量データを複数のクラスタに分割し、分割することで得られた前記複数のクラスタの情報を、前記分布傾向として生成する
請求項1に記載の共クラスタリング装置。 - 前記算出部は、
前記複数のクラスタのそれぞれについて、当該クラスタ内の要素の数が少ないほど、当該クラスタに要素として含まれるクラスタブロックに対して大きくなるように前記重要度を算出する
請求項5に記載の共クラスタリング装置。 - 前記算出部は、
前記複数のクラスタのそれぞれについて、当該クラスタ内の要素の数と、前記複数のクラスタの要素に対応する1以上の前記クラスタブロックの大きさとに基づいて、当該クラスタに要素として含まれる前記クラスタブロックのそれぞれに対して前記重要度を算出する
請求項5に記載の共クラスタリング装置。 - 行列又は3次元以上のテンソルの形式で表現可能な関係データに対して共クラスタリング処理を行うことによって、前記関係データを複数のクラスタブロックに分割する共クラスタリング装置における共クラスタリング方法であって、
前記複数のクラスタブロックのそれぞれにおいて生成される関係の傾向を示す統計量の、前記関係データ全体における分布傾向を生成する分布傾向生成ステップと、
前記複数のクラスタブロックのそれぞれの統計量と、前記分布傾向生成ステップで生成した前記分布傾向とに基づいて、前記分布傾向に応じて算出結果が変化する算出方法により、前記複数のクラスタブロックのそれぞれに対して重要度を算出する算出ステップと、
前記複数のクラスタブロックの少なくとも1つを示す情報と、当該少なくとも1つに対して前記算出ステップで算出した前記重要度を示す情報とを出力する出力ステップとを含む
共クラスタリング方法。 - 請求項8に記載の共クラスタリング方法をコンピュータに実行させるためのプログラム。
- 行列又は3次元以上のテンソルの形式で表現可能な関係データに対して共クラスタリング処理を行うことによって、前記関係データを複数のクラスタブロックに分割する集積回路であって、
前記複数のクラスタブロックのそれぞれにおいて生成される関係の傾向を示す統計量の、前記関係データ全体における分布傾向を生成する分布傾向生成部と、
前記複数のクラスタブロックのそれぞれの統計量と、前記分布傾向生成部が生成した前記分布傾向とに基づいて、前記分布傾向に応じて算出結果が変化する算出方法により、前記複数のクラスタブロックのそれぞれに対して重要度を算出する算出部と、
前記複数のクラスタブロックの少なくとも1つを示す情報と、当該少なくとも1つに対して前記算出部が算出した前記重要度を示す情報とを出力する出力部とを備える
集積回路。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012231218A JP5967577B2 (ja) | 2012-10-18 | 2012-10-18 | 共クラスタリング装置、共クラスタリング方法、プログラム及び集積回路 |
US14/054,890 US20140114974A1 (en) | 2012-10-18 | 2013-10-16 | Co-clustering apparatus, co-clustering method, recording medium, and integrated circuit |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012231218A JP5967577B2 (ja) | 2012-10-18 | 2012-10-18 | 共クラスタリング装置、共クラスタリング方法、プログラム及び集積回路 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014081899A true JP2014081899A (ja) | 2014-05-08 |
JP5967577B2 JP5967577B2 (ja) | 2016-08-10 |
Family
ID=50486300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012231218A Expired - Fee Related JP5967577B2 (ja) | 2012-10-18 | 2012-10-18 | 共クラスタリング装置、共クラスタリング方法、プログラム及び集積回路 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20140114974A1 (ja) |
JP (1) | JP5967577B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016148905A (ja) * | 2015-02-10 | 2016-08-18 | 日本電信電話株式会社 | 多次元データの予測装置、多次元データの予測方法、多次元データの予測プログラム |
JP2018206343A (ja) * | 2017-06-01 | 2018-12-27 | 富士ゼロックス株式会社 | データ内の同格化した関係を視覚的に調査するためのシステム、関係のデータを視覚化する方法、プログラム、及びコンピュータ装置 |
WO2020261449A1 (ja) * | 2019-06-26 | 2020-12-30 | 日本電信電話株式会社 | 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム |
CN112566093A (zh) * | 2020-11-13 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 一种终端关系识别方法、装置、计算机设备及存储介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9324169B2 (en) * | 2012-11-29 | 2016-04-26 | International Business Machines Corporation | Identifying relationships between entities using two-dimensional array of scalar elements, and a block matrix |
JP6519434B2 (ja) * | 2015-10-08 | 2019-05-29 | 株式会社デンソー | 運転支援装置 |
CN109191364A (zh) * | 2018-08-01 | 2019-01-11 | 南京天数智芯科技有限公司 | 加速人工智能处理器的硬件架构 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000075809A1 (fr) * | 1999-06-04 | 2000-12-14 | Seiko Epson Corporation | Procede de triage d'informations, trieur d'informations, support enregistre sur lequel le programme de triage d'informations est enregistre |
US20020161561A1 (en) * | 2001-01-16 | 2002-10-31 | Sridevi Sarma | System and method for association of object sets |
CN101208694A (zh) * | 2005-04-25 | 2008-06-25 | 株式会社Ipb | 信息解析报告书自动生成装置、信息解析报告书自动生成程序以及信息解析报告书自动生成方法 |
US20090144226A1 (en) * | 2007-12-03 | 2009-06-04 | Kei Tateno | Information processing device and method, and program |
EP2416236B1 (en) * | 2009-03-30 | 2016-05-04 | Nec Corporation | Data restore system and method |
JP2010263500A (ja) * | 2009-05-08 | 2010-11-18 | Fujitsu Ltd | 映像処理システム、撮影装置及び映像処理方法 |
US8737961B2 (en) * | 2009-09-23 | 2014-05-27 | Nokia Corporation | Method and apparatus for incrementally determining location context |
US20130001015A1 (en) * | 2011-06-30 | 2013-01-03 | Bettendorf John S | Device and method for changing outboard engine oil |
CN103098088B (zh) * | 2011-07-13 | 2016-11-02 | 松下电器(美国)知识产权公司 | 图像评价装置、图像评价方法以及集成电路 |
JP6023058B2 (ja) * | 2011-08-29 | 2016-11-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像処理装置、画像処理方法、プログラム、集積回路 |
-
2012
- 2012-10-18 JP JP2012231218A patent/JP5967577B2/ja not_active Expired - Fee Related
-
2013
- 2013-10-16 US US14/054,890 patent/US20140114974A1/en not_active Abandoned
Non-Patent Citations (1)
Title |
---|
JPN6016022785; 大濱郁、外3名: '非対称で個体差がある関係データ分析のための機会調整型無限関係モデル' 電子情報通信学会技術研究報告 Vol.111,No.480, 20120305, pp.1〜8, 社団法人電子情報通信学会 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016148905A (ja) * | 2015-02-10 | 2016-08-18 | 日本電信電話株式会社 | 多次元データの予測装置、多次元データの予測方法、多次元データの予測プログラム |
JP2018206343A (ja) * | 2017-06-01 | 2018-12-27 | 富士ゼロックス株式会社 | データ内の同格化した関係を視覚的に調査するためのシステム、関係のデータを視覚化する方法、プログラム、及びコンピュータ装置 |
WO2020261449A1 (ja) * | 2019-06-26 | 2020-12-30 | 日本電信電話株式会社 | 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム |
JPWO2020261449A1 (ja) * | 2019-06-26 | 2020-12-30 | ||
JP7294421B2 (ja) | 2019-06-26 | 2023-06-20 | 日本電信電話株式会社 | 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム |
CN112566093A (zh) * | 2020-11-13 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 一种终端关系识别方法、装置、计算机设备及存储介质 |
CN112566093B (zh) * | 2020-11-13 | 2022-02-01 | 腾讯科技(深圳)有限公司 | 一种终端关系识别方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20140114974A1 (en) | 2014-04-24 |
JP5967577B2 (ja) | 2016-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5967577B2 (ja) | 共クラスタリング装置、共クラスタリング方法、プログラム及び集積回路 | |
Stella et al. | Influence of augmented humans in online interactions during voting events | |
US20210279642A1 (en) | Mixed-initiative machine learning systems and methods for determining segmentations | |
WO2020207196A1 (zh) | 用户标签生成方法、装置、存储介质和计算机设备 | |
US20220277404A1 (en) | Pattern Identification in Time-Series Social Media Data, and Output-Dynamics Engineering for a Dynamic System Having One or More Multi-Scale Time-Series Data Sets | |
Franke et al. | Statistical inference, learning and models in big data | |
Bouchard et al. | Convex collective matrix factorization | |
Burgess et al. | Link-prediction enhanced consensus clustering for complex networks | |
JP6261547B2 (ja) | 判定装置、判定方法及び判定プログラム | |
Xu et al. | Graphcar: Content-aware multimedia recommendation with graph autoencoder | |
CN104077723B (zh) | 一种社交网络推荐系统及方法 | |
Sjögårde et al. | Granularity of algorithmically constructed publication-level classifications of research publications: Identification of specialties | |
CN113051317B (zh) | 一种数据挖掘模型更新方法、系统、计算机设备及可读介质 | |
Lehrer et al. | The bigger picture: Combining econometrics with analytics improves forecasts of movie success | |
CN112131322A (zh) | 时间序列分类方法及装置 | |
WO2023231542A1 (zh) | 表示信息的确定方法、装置、设备及存储介质 | |
Straton et al. | Big social data analytics for public health: Predicting facebook post performance using artificial neural networks and deep learning | |
JP2017182724A (ja) | アイテム推薦プログラム、アイテム推薦方法およびアイテム推薦装置 | |
JP2017201535A (ja) | 判定装置、学習装置、判定方法及び判定プログラム | |
Yang et al. | Static analysis and exponential random graph modelling for micro-blog network | |
CN117455529A (zh) | 基于大数据技术的用户用电特征画像构建方法及系统 | |
Thorne et al. | Topological approximate Bayesian computation for parameter inference of an angiogenesis model | |
Goode et al. | Pricing a protest: Forecasting the dynamics of civil unrest activity in social media | |
Modak | Validity index for clustered data in non-negative space | |
Höltgen et al. | On the richness of calibration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20141003 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160608 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160627 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5967577 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |