JP7464142B2 - データ分析処理装置、データ分析処理方法、およびプログラム - Google Patents
データ分析処理装置、データ分析処理方法、およびプログラム Download PDFInfo
- Publication number
- JP7464142B2 JP7464142B2 JP2022558636A JP2022558636A JP7464142B2 JP 7464142 B2 JP7464142 B2 JP 7464142B2 JP 2022558636 A JP2022558636 A JP 2022558636A JP 2022558636 A JP2022558636 A JP 2022558636A JP 7464142 B2 JP7464142 B2 JP 7464142B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- multidimensional
- range
- ranges
- storage areas
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007405 data analysis Methods 0.000 title claims description 35
- 238000003672 processing method Methods 0.000 title claims description 4
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000000034 method Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 7
- 238000007726 management method Methods 0.000 description 66
- 238000010586 diagram Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000005484 gravity Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 102220353742 c.41G>A Human genes 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
多次元キューブを構成する各次元のデータ/各特性を表すデータの分類に用いた値域を索引として利用することにより、単一の検索/操作を実行する場合には、両多次元キューブの同一値域に対応するストレージ領域に検索/操作する範囲を限定するとともに、複数の検索/操作を同時実行する場合には、さらに検索/操作するストレージ領域の競合を回避する。
詳しくは、従来のデータ分析処理装置は、新たに、ある多次元キューブに対してOLAP操作を実行する場合に、OLAP操作の引数として他の多次元キューブを構成するデータを利用しようと試みる場合において、ある多次元キューブを構成するデータを、他の多次元キューブを構成するデータをキーとして検索/操作する場合に、関係データベースの高速化手段を利用することができる。しかし、高速化可能な範囲が限定されていた。
例えば、従来のデータ分析処理装置は、多次元キューブを構成する各次元のデータ/各特性を表すデータのそれぞれが1次元データである場合には、データのうち最大2項目のデータを、多次元キューブの間で共通する1次元の値域のリスト、名称のリスト、ハッシュ関数のいずれかに基づく値域で分類し、値域で分類したデータが単一の値域に属する場合には、データが属する唯一の値域に対応するストレージ領域に蓄積及び管理し、単一の検索/操作を実行する場合には、両多次元キューブの同一値域に対応するストレージ領域に検索/操作する範囲を限定するとともに、複数の検索/操作を同時実行する場合には、さらに検索/操作するストレージ領域の競合を回避することにより、高速化することができた。
しかし、多次元キューブを構成する各次元のデータ/各特性を表すデータのそれぞれが多次元データである場合に、データを、多次元キューブ間で共通する多次元の値域で分類することや、値域で分類したデータが複数の値域に属する場合に、各値域に対応するストレージ領域に重複して蓄積及び管理することはできない。したがって、多次元キューブを構成する各次元のデータ/各特性を表すデータのそれぞれが多次元データである場合や、値域で分類したデータが複数の値域に属する場合において、単一の検索/操作を実行する場合には、検索/操作する範囲に限定するとともに、複数の検索/操作を同時実行する場合には、さらに検索/操作するストレージ領域の競合を回避することにより、高速化することができなかった。
また、OLAP操作実行部は、ある多次元キューブに対してOLAP操作を実行する場合に、OLAP操作の引数としてクライアントから指示された引数、または、他の多次元キューブを構成するデータの少なくともいずれかを利用する。
多次元データベース管理部は、多次元キューブにおいて、時間次元のデータと、空間次元のデータと、複数種別の固有次元のデータと、複数種別の特性を表すデータとを管理する。この多次元データベース管理部は、多次元キューブを構成するデータのそれぞれが多次元データであれば、当該多次元キューブの間で共通する多次元の値域で当該多次元データを分類する。
より詳しくは、多次元データベース管理部は、多次元キューブを構成する各次元のデータ/各特性を表すデータのそれぞれが多次元データであれば、当該多次元キューブの間で共通する多次元の値域で分類する。値域で分類したデータが単一の値域に属する場合には、多次元データベース管理部は、当該データを値域に対応するストレージ領域に蓄積及び管理する。値域で分類したデータが複数の値域に属する場合には、多次元データベース管理部は、当該データを各値域に対応するストレージ領域に当該データの実体、または当該データの参照を重複して蓄積及び管理する。
また、多次元データベース管理部は、多次元キューブを構成するデータを他の多次元キューブを構成するデータをキーとして検索/操作する場合に、分類に用いた値域を索引として利用することにより、単一の検索/操作を実行する場合には、両多次元キューブの同一値域に対応するストレージ領域と、両多次元キューブの同一値域の近傍の値域に対応するストレージ領域とに、検索/操作する範囲を限定するとともに、複数の検索/操作を同時並行に実行する場合には、さらに検索/操作するストレージ領域の競合を回避する。
図1は、この発明に係るデータ分析処理装置の一例を示す機能ブロック図である。データ分析処理装置10は、OLAP操作実行部11と、多次元データベース管理部15と、多次元データベース16とを備える。
なお図2において、*が、データの実体(本体)を表し、**が、データの実体の複製/実体の本体への参照を表す。
次に、以上のように構成されたデータ分析処理装置の処理動作を説明する。
図5は、データ分析処理装置10の動作の一例を説明するためのシーケンス図である。図5において、OLAP操作実行部11は、クライアント20からOLAP操作と引数を受信すると、それらに応じて多次元データベース管理部15に多次元データの操作を指示する。
図6は、多次元データベース管理部15の処理手順の一例を示すフローチャートである。図6において、多次元データベース管理部15は、OLAP操作実行部11から多次元データの操作指示の受信を待ち受ける(ステップS11)。操作指示を受信すると、多次元データベース管理部15は、多次元キューブを構成する各次元のデータ/各特性を表すデータの分類に用いた値域の情報を索引情報として参照する(ステップS12)。
すなわち多次元データベース管理部15は、多次元キューブを構成する各次元のデータ/各特性を表すデータの分類に用いた値域を索引として利用することにより、単一の検索/操作を実行する場合には、両多次元キューブの同一値域に対応するストレージ領域と、両多次元キューブの同一値域の近傍の値域に対応するストレージ領域とに、検索/操作する範囲を限定する。また、多次元データベース管理部15は、複数の検索/操作を同時並行に実行する場合には、さらに検索/操作するストレージ領域の競合を回避する。
以上述べたように、実施形態では、多次元データベース管理部15は、多次元キューブを構成するデータのそれぞれが多次元データである場合に、該データを多次元キューブの間で共通する多次元の値域で分類する。さらに、値域で分類したデータが単一の値域に属する場合には、多次元データベース管理部15は、当該データを値域に対応するストレージ領域に蓄積し、値域で分類したデータが複数の値域に属する場合には、各値域に対応するストレージ領域に実体あるいは参照を重複して蓄積する。
11…OLAP操作実行部
12…プロセッサ
13…インタフェース部
14…メモリ
14a…プログラム
14b…データ
15…多次元データベース管理部
16…多次元データベース
17…時系列整列部
20…クライアント
100…ネットワーク
200…ストレージ
Claims (7)
- 主題ごとに構築される多次元キューブに、実世界の事象を体現するデータを当該事象の識別子と対応付けて蓄積する多次元データベースをと、
クライアントからの要求に応じて前記多次元キューブに対するOLAP(Online Analytical Processing)操作を実行するOLAP操作実行部と、
前記多次元キューブにおいて、時間次元のデータと、空間次元のデータと、複数種別の固有次元のデータと、複数種別の特性を表すデータとを管理する多次元データベース管理部とを具備し、
前記多次元データベース管理部は、前記多次元キューブを構成するデータのそれぞれが多次元データであれば、前記多次元キューブの間で共通する多次元の値域で当該多次元データを分類し、
多次元キューブを構成するデータを他の多次元キューブを構成するデータをキーとして検索/操作する場合に、前記分類に用いた値域を索引として利用することにより、単一の検索/操作を実行する場合には、両多次元キューブの同一値域に対応するストレージ領域と、両多次元キューブの同一値域の近傍の値域に対応するストレージ領域とに、検索/操作する範囲を限定するとともに、複数の検索/操作を同時並行に実行する場合には、さらに検索/操作するストレージ領域の競合を回避する、データ分析処理装置。 - 前記多次元データベース管理部は、前記分類されたデータが単一の値域に属する場合に、当該値域に対応するストレージ領域に前記データを蓄積する、請求項1に記載のデータ分析処理装置。
- 前記多次元データベース管理部は、前記分類されたデータが複数の値域に属する場合に、当該値域のそれぞれに対応するストレージ領域に前記データの実体、または当該データの参照を重複して蓄積する、請求項1に記載のデータ分析処理装置。
- 前記OLAP操作実行部は、前記OLAP操作の引数として、前記クライアントから指示された引数、または、他の前記多次元キューブを構成するデータの少なくともいずれかを利用する、請求項1に記載のデータ分析処理装置。
- 前記多次元データベース管理部は、上位の値域が下位の隣接する値域を包含する値域の階層を構築し、状況に応じて検索/操作の処理単位とする値域の階層を選択し、複数のストレージ領域に対応する値域の階層を選択した場合には、前記複数のストレージ領域に重複して蓄積及び管理されているデータを利用しない、請求項1に記載のデータ分析処理装置。
- コンピュータのプロセッサが、主題ごとに構築される多次元キューブに、実世界の事象を体現するデータを当該事象の識別子と対応付けて多次元データベースに蓄積する過程と、
前記プロセッサが、クライアントからの要求に応じて前記多次元キューブに対するOLAP(Online Analytical Processing)操作を実行する過程と、
前記プロセッサが、前記多次元キューブにおいて、時間次元のデータと、空間次元のデータと、複数種別の固有次元のデータと、複数種別の特性を表すデータとを管理する過程と、
前記プロセッサが、前記多次元キューブを構成するデータのそれぞれが多次元データであれば、前記多次元キューブの間で共通する多次元の値域で当該多次元データを分類する過程と、
前記プロセッサが、多次元キューブを構成するデータを他の多次元キューブを構成するデータをキーとして検索/操作する場合に、前記分類に用いた値域を索引として利用することにより、単一の検索/操作を実行する場合には、両多次元キューブの同一値域に対応するストレージ領域と、両多次元キューブの同一値域の近傍の値域に対応するストレージ領域とに、検索/操作する範囲を限定するとともに、複数の検索/操作を同時並行に実行する場合には、さらに検索/操作するストレージ領域の競合を回避する過程とを含む、データ分析処理方法。 - コンピュータのプロセッサを、請求項1乃至5の何れかに記載のデータ分析処理装置として機能させる、プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/040213 WO2022091204A1 (ja) | 2020-10-27 | 2020-10-27 | データ分析処理装置、データ分析処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2022091204A1 JPWO2022091204A1 (ja) | 2022-05-05 |
JP7464142B2 true JP7464142B2 (ja) | 2024-04-09 |
Family
ID=81382206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022558636A Active JP7464142B2 (ja) | 2020-10-27 | 2020-10-27 | データ分析処理装置、データ分析処理方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7464142B2 (ja) |
WO (1) | WO2022091204A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007502466A (ja) | 2003-08-12 | 2007-02-08 | オラクル・インターナショナル・コーポレイション | 次元分割による、オンライン分析処理(olap)および多次元計画アプリケーションにおける相互属性分析および操作のためのシステムならびに方法 |
US20070150862A1 (en) | 2005-11-07 | 2007-06-28 | Business Objects, S.A. | Apparatus and method for defining report parts |
JP2016518646A (ja) | 2013-03-15 | 2016-06-23 | デシジョン, インク. | 次元データによってデータ測定値にマッピングされた文脈オブジェクトを生成するためのシステム、装置、及び方法 |
JP2018136963A (ja) | 2014-11-19 | 2018-08-30 | 株式会社インフォメックス | データ検索装置、データ検索方法、データ検索プログラム、及び記録媒体 |
-
2020
- 2020-10-27 JP JP2022558636A patent/JP7464142B2/ja active Active
- 2020-10-27 WO PCT/JP2020/040213 patent/WO2022091204A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007502466A (ja) | 2003-08-12 | 2007-02-08 | オラクル・インターナショナル・コーポレイション | 次元分割による、オンライン分析処理(olap)および多次元計画アプリケーションにおける相互属性分析および操作のためのシステムならびに方法 |
US20070150862A1 (en) | 2005-11-07 | 2007-06-28 | Business Objects, S.A. | Apparatus and method for defining report parts |
JP2016518646A (ja) | 2013-03-15 | 2016-06-23 | デシジョン, インク. | 次元データによってデータ測定値にマッピングされた文脈オブジェクトを生成するためのシステム、装置、及び方法 |
JP2018136963A (ja) | 2014-11-19 | 2018-08-30 | 株式会社インフォメックス | データ検索装置、データ検索方法、データ検索プログラム、及び記録媒体 |
Non-Patent Citations (1)
Title |
---|
八木 哲,実世界事象を対象とする多次元データ分析システムの構想,情報処理学会 研究報告 情報基礎とアクセス技術(IFAT),日本,情報処理学会,2019年09月03日,p.1-6 |
Also Published As
Publication number | Publication date |
---|---|
WO2022091204A1 (ja) | 2022-05-05 |
JPWO2022091204A1 (ja) | 2022-05-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12056583B2 (en) | Target variable distribution-based acceptance of machine learning test data sets | |
US9740706B2 (en) | Management of intermediate data spills during the shuffle phase of a map-reduce job | |
CN108140040A (zh) | 存储器中数据库的选择性数据压缩 | |
Jiang et al. | Holistic primary key and foreign key detection | |
US9389913B2 (en) | Resource assignment for jobs in a system having a processing pipeline that satisfies a data freshness query constraint | |
WO2016107497A1 (en) | Method and apparatus for scalable sorting of data set | |
Li et al. | ASLM: Adaptive single layer model for learned index | |
Hu et al. | Towards big linked data: a large-scale, distributed semantic data storage | |
US10599614B1 (en) | Intersection-based dynamic blocking | |
CN108804556A (zh) | 基于时间旅行和时态聚合查询的分布式处理框架系统 | |
US20200218705A1 (en) | System and method of managing indexing for search index partitions | |
Mesmoudi et al. | Benchmarking SQL on MapReduce systems using large astronomy databases | |
JP7464142B2 (ja) | データ分析処理装置、データ分析処理方法、およびプログラム | |
Olafsson et al. | Dynamic behavior of balanced NV-trees | |
Wang et al. | Turbo: Dynamic and decentralized global analytics via machine learning | |
Shaabani et al. | Incrementally updating unary inclusion dependencies in dynamic data | |
CN108664662A (zh) | 时间旅行和时态聚合查询处理方法 | |
TW201837750A (zh) | 電腦化方法及使用元合併及/或元分組的索引的電腦化系統 | |
JP7211255B2 (ja) | 検索処理プログラム、検索処理方法及び情報処理装置 | |
Topcu | Evaluating Riak Key Value Cluster for Big Data | |
NR et al. | MapReduce‐based storage and indexing for big health data | |
Salah et al. | Optimizing the data-process relationship for fast mining of frequent itemsets in mapreduce | |
JP7505572B2 (ja) | データ分析処理装置、データ分析処理方法、およびプログラム | |
Grigoriev et al. | Efficiency Analysis of the access method with the cascading Bloom filter to the data warehouse on the parallel computing platform | |
Jones et al. | Data aware caching using MapReduce framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240311 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7464142 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |