JPWO2016170600A1 - データ分析支援システム及びデータ分析支援方法 - Google Patents
データ分析支援システム及びデータ分析支援方法 Download PDFInfo
- Publication number
- JPWO2016170600A1 JPWO2016170600A1 JP2017513867A JP2017513867A JPWO2016170600A1 JP WO2016170600 A1 JPWO2016170600 A1 JP WO2016170600A1 JP 2017513867 A JP2017513867 A JP 2017513867A JP 2017513867 A JP2017513867 A JP 2017513867A JP WO2016170600 A1 JPWO2016170600 A1 JP WO2016170600A1
- Authority
- JP
- Japan
- Prior art keywords
- index
- data analysis
- value
- analysis support
- explanation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (14)
- 処理装置と、前記処理装置に接続される記憶装置と、を有するデータ分析支援システムであって、
前記記憶装置は、
主キーの値と目的指標の値とを対応付ける目的指標情報と、
前記主キーと共通する値と複数の項目の説明指標の値の組とを対応付ける説明指標情報と、を保持し、
前記処理装置は、
前記説明指標の一つ以上の項目を選択し、
前記選択された一つ以上の項目の説明指標の値をクラスタリングし、
クラスタリングによって得られた各クラスタの各項目の説明指標の値の範囲を特定し、特定された値の範囲を出力することを特徴とするデータ分析支援システム。 - 請求項1に記載のデータ分析支援システムであって、
前記処理装置は、前記説明指標の各組について、前記選択された一つ以上の項目の説明指標の値が前記特定された説明指標の値の範囲内であるという条件を満たすか否かを判定し、前記主キーの値ごとに、前記条件を満たす前記説明指標の組の数を集計し、集計された前記説明指標の組の数を特徴量として出力することを特徴とするデータ分析支援システム。 - 請求項2に記載のデータ分析支援システムであって、
前記処理装置は、前記各主キーの値に対応する前記特徴量と、前記各主キーの値に対応する前記目的指標の値との相関に基づいて、前記目的指標を説明するモデルを生成することを特徴とするデータ分析支援システム。 - 請求項2に記載のデータ分析支援システムであって、
前記記憶装置は、前記説明指標情報に含まれる説明指標の各項目のデータ型を示す情報を保持し、
前記処理装置は、文字列型の項目及び文字列型以外のデータ型の項目を含む、前記説明指標の複数の項目が選択された場合、前記文字列型以外のデータ型の項目の説明指標の値をクラスタリングすることを特徴とするデータ分析支援システム。 - 請求項1に記載のデータ分析支援システムであって、
前記処理装置は、前記選択された一つ以上の項目の説明指標の値と、前記選択された一つ以上の項目の説明指標の値に対応する前記主キーの値に対応する前記目的指標の値と、を含む値の組をクラスタリングすることを特徴とするデータ分析支援システム。 - 請求項1に記載のデータ分析支援システムであって、
前記処理装置は、
所定の大きさの複数のグリッドに分割された空間に、前記選択された一つ以上の項目の説明指標の値の各組をプロットし、プロットされた前記値の組の密度が所定の閾値を超える複数のグリッドが隣接する場合、それらを一つのクラスタに含めるように、前記選択された一つ以上の項目の説明指標の値をクラスタリングし、
前記空間における前記各クラスタに含まれる複数のグリッドの範囲を前記各クラスタの各項目の説明指標の値の範囲として特定することを特徴とするデータ分析支援システム。 - 請求項6に記載のデータ分析支援システムであって、
前記処理装置は、前記各クラスタを、前記プロットされた値の組の密度が前記所定の閾値を超えないグリッドを含まない長方形、直方体又は超直方体の複数のクラスタに分割することを特徴とするデータ分析支援システム。 - 処理装置と、前記処理装置に接続される記憶装置と、を有する計算機システムが実行するデータ分析支援方法であって、
前記記憶装置は、
主キーの値と目的指標の値とを対応付ける目的指標情報と、
前記主キーと共通する値と複数の項目の説明指標の値の組とを対応付ける説明指標情報と、を保持し、
前記データ分析支援方法は、
前記処理装置が、前記説明指標の一つ以上の項目を選択する第1手順と、
前記処理装置が、前記選択された一つ以上の項目の説明指標の値をクラスタリングする第2手順と、
前記処理装置が、クラスタリングによって得られた各クラスタの各項目の説明指標の値の範囲を特定し、特定された値の範囲を出力する第3手順と、を含むことを特徴とするデータ分析支援方法。 - 請求項8に記載のデータ分析支援方法であって、
前記処理装置が、前記説明指標の各組について、前記選択された一つ以上の項目の説明指標の値が前記特定された説明指標の値の範囲内であるという条件を満たすか否かを判定し、前記主キーの値ごとに、前記条件を満たす前記説明指標の組の数を集計し、集計された前記説明指標の組の数を特徴量として出力する第4手順をさらに含むことを特徴とするデータ分析支援方法。 - 請求項9に記載のデータ分析支援方法であって、
前記処理装置が、前記各主キーの値に対応する前記特徴量と、前記各主キーの値に対応する前記目的指標の値との相関に基づいて、前記目的指標を説明するモデルを生成する第5手順をさらに含むことを特徴とするデータ分析支援方法。 - 請求項9に記載のデータ分析支援方法であって、
前記記憶装置は、前記説明指標情報に含まれる説明指標の各項目のデータ型を示す情報を保持し、
前記第2手順において、前記処理装置は、文字列型の項目及び文字列型以外のデータ型の項目を含む、前記説明指標の複数の項目が選択された場合、前記文字列型以外のデータ型の項目の説明指標の値をクラスタリングすることを特徴とするデータ分析支援方法。 - 請求項8に記載のデータ分析支援方法であって、
前記第2手順において、前記処理装置は、前記選択された一つ以上の項目の説明指標の値と、前記選択された一つ以上の項目の説明指標の値に対応する前記主キーの値に対応する前記目的指標の値と、を含む値の組をクラスタリングすることを特徴とするデータ分析支援方法。 - 請求項8に記載のデータ分析支援方法であって、
前記第2手順において、前記処理装置は、所定の大きさの複数のグリッドに分割された空間に、前記選択された一つ以上の項目の説明指標の値の各組をプロットし、プロットされた前記値の組の密度が所定の閾値を超える複数のグリッドが隣接する場合、それらを一つのクラスタに含めるように、前記選択された一つ以上の項目の説明指標の値をクラスタリングし、
前記第3手順において、前記処理装置は、前記空間における前記各クラスタに含まれる複数のグリッドの範囲を前記各クラスタの各項目の説明指標の値の範囲として特定することを特徴とするデータ分析支援方法。 - 請求項13に記載のデータ分析支援方法であって、
前記第2手順において、前記処理装置は、前記各クラスタを、前記プロットされた値の組の密度が前記所定の閾値を超えないグリッドを含まない長方形、直方体又は超直方体の複数のクラスタに分割することを特徴とするデータ分析支援方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/062115 WO2016170600A1 (ja) | 2015-04-21 | 2015-04-21 | データ分析支援システム及びデータ分析支援方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016170600A1 true JPWO2016170600A1 (ja) | 2017-06-08 |
JP6393411B2 JP6393411B2 (ja) | 2018-09-19 |
Family
ID=57143180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513867A Active JP6393411B2 (ja) | 2015-04-21 | 2015-04-21 | データ分析支援システム及びデータ分析支援方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10509808B2 (ja) |
JP (1) | JP6393411B2 (ja) |
WO (1) | WO2016170600A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11267065B2 (en) | 2019-02-18 | 2022-03-08 | Lincoln Global, Inc. | Systems and methods providing pattern recognition and data analysis in welding and cutting |
US20220222686A1 (en) * | 2019-05-21 | 2022-07-14 | Nippon Telegraph And Telephone Corporation | Analysis apparatus, analysis system, analysis method and program |
CN112214531B (zh) * | 2020-10-12 | 2021-11-05 | 海南大学 | 跨数据、信息、知识多模态的特征挖掘方法及组件 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002278762A (ja) * | 2001-03-19 | 2002-09-27 | Nippon Steel Corp | データクラスタリング方法 |
JP2006039970A (ja) * | 2004-07-27 | 2006-02-09 | Kokuritsu Iyakuhin Shokuhin Eisei Kenkyusho | 高次元データを塊に分割する装置 |
JP2008117016A (ja) * | 2006-10-31 | 2008-05-22 | Toshiba Corp | 文書データ処理装置 |
JP2012198809A (ja) * | 2011-03-22 | 2012-10-18 | Toshiba Corp | 文書分析装置およびプログラム |
JP2015060259A (ja) * | 2013-09-17 | 2015-03-30 | 株式会社日立製作所 | データ分析支援システム |
WO2015049797A1 (ja) * | 2013-10-04 | 2015-04-09 | 株式会社日立製作所 | データ管理方法、データ管理装置及び記憶媒体 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3054708B1 (ja) | 1999-02-23 | 2000-06-19 | 工業技術院長 | ストレス計測装置 |
WO2012117966A1 (ja) * | 2011-02-28 | 2012-09-07 | 日本電気株式会社 | データ判別装置、方法及びプログラム |
WO2014141660A1 (ja) * | 2013-03-13 | 2014-09-18 | 日本電気株式会社 | システム分析装置、及び、システム分析方法 |
US20150339782A1 (en) * | 2014-05-26 | 2015-11-26 | Tata Consultancy Services Limited | System and method for classifying a plurality of customer accounts |
-
2015
- 2015-04-21 WO PCT/JP2015/062115 patent/WO2016170600A1/ja active Application Filing
- 2015-04-21 JP JP2017513867A patent/JP6393411B2/ja active Active
- 2015-04-21 US US15/534,576 patent/US10509808B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002278762A (ja) * | 2001-03-19 | 2002-09-27 | Nippon Steel Corp | データクラスタリング方法 |
JP2006039970A (ja) * | 2004-07-27 | 2006-02-09 | Kokuritsu Iyakuhin Shokuhin Eisei Kenkyusho | 高次元データを塊に分割する装置 |
JP2008117016A (ja) * | 2006-10-31 | 2008-05-22 | Toshiba Corp | 文書データ処理装置 |
JP2012198809A (ja) * | 2011-03-22 | 2012-10-18 | Toshiba Corp | 文書分析装置およびプログラム |
JP2015060259A (ja) * | 2013-09-17 | 2015-03-30 | 株式会社日立製作所 | データ分析支援システム |
WO2015049797A1 (ja) * | 2013-10-04 | 2015-04-09 | 株式会社日立製作所 | データ管理方法、データ管理装置及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
WO2016170600A1 (ja) | 2016-10-27 |
US20180260470A1 (en) | 2018-09-13 |
JP6393411B2 (ja) | 2018-09-19 |
US10509808B2 (en) | 2019-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI718643B (zh) | 異常群體識別方法及裝置 | |
Yagoubi et al. | Dpisax: Massively distributed partitioned isax | |
JP6032467B2 (ja) | 時空間データ管理システム、時空間データ管理方法、及びそのプログラム | |
KR101696338B1 (ko) | 컬럼-인덱스 데이터 포맷을 이용하여 빅데이터를 효율적으로 처리 및 분석하는 시스템 및 방법 | |
EP3299972A1 (en) | Efficient query processing using histograms in a columnar database | |
US10579616B2 (en) | Data search system, data search method, and program product | |
JP2015026188A (ja) | データベース分析装置及び方法 | |
CN111782686A (zh) | 用户数据的查询方法、装置、电子设备及存储介质 | |
JP6242540B1 (ja) | データ変換システム及びデータ変換方法 | |
JP6393411B2 (ja) | データ分析支援システム及びデータ分析支援方法 | |
Bang et al. | HPC workload characterization using feature selection and clustering | |
CN110019017B (zh) | 一种基于访问特征的高能物理文件存储方法 | |
US11620406B2 (en) | Information processing device, information processing method, and recording medium | |
US9201888B2 (en) | File management apparatus, file management method, and file management system | |
CN110874366A (zh) | 数据处理、查询方法和装置 | |
Dai et al. | Research on personalized behaviors recommendation system based on cloud computing | |
Abdullahi et al. | Big data: performance profiling of meteorological and oceanographic data on hive | |
JP7292235B2 (ja) | 分析支援装置及び分析支援方法 | |
JP7418781B2 (ja) | 企業類似度算出サーバ及び企業類似度算出方法 | |
US11126604B2 (en) | Aggregation apparatus, aggregation method, and storage medium | |
JP6320891B2 (ja) | 問題構造抽出装置および問題構造抽出方法 | |
KR101795564B1 (ko) | 컬럼-인덱스 데이터 포맷을 이용하여 빅데이터를 효율적으로 처리 및 분석하는 시스템 및 방법 | |
JP7106924B2 (ja) | クラスタ分析システム、クラスタ分析方法およびクラスタ分析プログラム | |
EP3413203A1 (en) | Information processing device, information processing method, and computer-readable recording medium | |
Torres et al. | A similarity study of I/O traces via string kernels |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180821 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180824 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6393411 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |