JP2016130929A - 集約装置、集約システム、集約方法、および、プログラム - Google Patents
集約装置、集約システム、集約方法、および、プログラム Download PDFInfo
- Publication number
- JP2016130929A JP2016130929A JP2015004726A JP2015004726A JP2016130929A JP 2016130929 A JP2016130929 A JP 2016130929A JP 2015004726 A JP2015004726 A JP 2015004726A JP 2015004726 A JP2015004726 A JP 2015004726A JP 2016130929 A JP2016130929 A JP 2016130929A
- Authority
- JP
- Japan
- Prior art keywords
- aggregation
- data set
- sum
- value
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本実施の形態の集約システム50は、リレーショナルデータベース等から読み出した多数の入力レコードに対して問合せ(クエリ)で要求された集約演算を行う際に、a)並列プロセッサによる前処理と、b)クエリの変更とを組み合わせて実行する。これにより、集約システム50は、クエリの応答時間を短縮する。
並列演算部30は、部分データセットの集約を、複数の部分データセットについて、並列して実行しても良い。この場合、1つの部分データセットの集約処理は、必ずしも、並列処理されなくても良い。
図7は、第2の実施の形態の集約装置10の構成を示す。
11 クエリ構文解析部
12 クエリ最適化部
13 クエリ実行部
14 集約前処理部
15 通信部
20 データ記憶部
30 並列演算部
50 集約システム
Claims (10)
- N(複数)個の原レコードからなる全体データセットを格納するデータ記憶手段に接続され、
当該全体データセットをn(N未満の複数)個の部分集合に分割し、各部分集合に対して指定された集約演算を行って中間結果を含むn個の中間レコードからなる部分集約済みデータセットを出力する集約前処理手段と、
指定されたデータセットに対して指定された集約演算を行って、集約結果を装置外に出力するクエリ実行手段と、
前記全体データセットに対する第1の集約演算命令を受信して、前記前処理部に第2の集約演算を実行させ、前記クエリ実行手段に前記部分集約済みデータセット対して第3の集約演算を実行させるクエリ最適化手段と、を備える集約装置。 - 前記原レコードの各々は、変数Yの値を包含し、
前記クエリ最適化手段は、前記全体データセットに対する変数Yの値の平均値を求める第1の集約演算命令を受信すると、1)前記前処理部に、各部分集合の原レコード数であるNROWSと、各原レコードの変数Yの値の合計であるP−SUM(Y)と、を求める第2の集約演算を実行させ、2)前記集約部に、各部分集合のP−SUM(Y)の合計値を各部分集合のNROWSの合計値で除す第3の集約演算を実行させる、請求項1の集約装置。 - 前記原レコードの各々は、変数Yの値を包含し、
前記クエリ最適化手段は、前記全体データセットに対する変数Yの値の分散を求める第1の集約演算命令を受信すると、1)前記前処理部に、各部分集合の原レコード数であるNROWSと、各原レコードの変数Yの値の合計であるP−SUM(Y)と、各原レコードの変数Yの値の二乗の合計であるP−SUM(Y^2)と、を求める第2の集約演算を実行させ、2)前記集約部に、各部分集合のP−SUM(Y^2)の合計値から、各部分集合のP−SUM(Y)の合計値の2乗を減じた値を、各部分集合のNROWSの合計値で除す第3の集約演算を実行させる、請求項1の集約装置。 - 前記原レコードの各々は、変数Xの値を包含し、
前記集約前処理手段は、変数Xの値をキーに部分集合に属する原レコードをソートして、変数Xの値が同一である原レコードのグループごとに第2の集約演算を実行して、変数Xの値対応の中間結果を包含する中間レコードを生成し、
前記クエリ実行手段は、変数Xの値が同一である中間結果を対象に第3の集約演算を行う、請求項1の集約装置。 - 並列演算が可能な並列演算手段に接続され、
前記集約前処理手段は、前記並列演算手段を用いて、ソートと第2の集約演算を並列に実行する、請求項4の集約装置。 - 請求項5の集約装置と、
前記並列演算手段と、
前記データ記憶手段と、を包含する集約システム。 - データ記憶手段に格納された、N(複数)個の原レコードからなる全体データセットに対する第1の集約演算命令を受信して、
当該全体データセットを、n(N未満の複数)個の部分集合に分割し、各部分集合に対して第2の集約演算を行って中間結果を含むn個の中間レコードからなる部分集約済みデータセットを生成し、
前記部分集約済みデータセットに対して第3の集約演算を行って、集約結果を出力する集約方法。 - 前記原レコードの各々は、変数Yの値を包含し、
前記全体データセットに対する変数Yの値の平均値を求める第1の集約演算命令を受信すると、1)各部分集合の原レコード数であるNROWSと、各原レコードの変数Yの値の合計であるP−SUM(Y)と、を求める第2の集約演算を実行し、2)各部分集合のP−SUM(Y)の合計値を各部分集合のNROWSの合計値で除す第3の集約演算を実行する、請求項7の集約方法。 - 前記原レコードの各々は、変数Yの値を包含し、
前記全体データセットに対する変数Yの値の分散を求める第1の集約演算命令を受信すると、1)各部分集合の原レコード数であるNROWSと、各原レコードの変数Yの値の合計であるP−SUM(Y)と、各原レコードの変数Yの値の二乗の合計であるP−SUM(Y^2)と、を求める第2の集約演算を実行し、2)各部分集合のP−SUM(Y^2)の合計値から、各部分集合のP−SUM(Y)の合計値の2乗を減じた値を、各部分集合のNROWSの合計値で除す第3の集約演算を実行する、請求項7の集約方法。 - コンピュータに、請求項7乃至請求項9の集約方法を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015004726A JP2016130929A (ja) | 2015-01-14 | 2015-01-14 | 集約装置、集約システム、集約方法、および、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015004726A JP2016130929A (ja) | 2015-01-14 | 2015-01-14 | 集約装置、集約システム、集約方法、および、プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016130929A true JP2016130929A (ja) | 2016-07-21 |
Family
ID=56415446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015004726A Pending JP2016130929A (ja) | 2015-01-14 | 2015-01-14 | 集約装置、集約システム、集約方法、および、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016130929A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7382233B2 (ja) | 2017-06-23 | 2023-11-16 | ザイリンクス インコーポレイテッド | データベースアクセラレータに対する並列計算オフロード |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH052610A (ja) * | 1991-06-25 | 1993-01-08 | Mitsubishi Electric Corp | リレーシヨナルデータベースにおける集約演算処理方式 |
JPH1097544A (ja) * | 1996-09-20 | 1998-04-14 | Hitachi Ltd | データベース処理システム |
US5850547A (en) * | 1997-01-08 | 1998-12-15 | Oracle Corporation | Method and apparatus for parallel processing aggregates using intermediate aggregate values |
JP2010108073A (ja) * | 2008-10-28 | 2010-05-13 | Hitachi Ltd | ストリームデータ処理方法、及びシステム |
-
2015
- 2015-01-14 JP JP2015004726A patent/JP2016130929A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH052610A (ja) * | 1991-06-25 | 1993-01-08 | Mitsubishi Electric Corp | リレーシヨナルデータベースにおける集約演算処理方式 |
JPH1097544A (ja) * | 1996-09-20 | 1998-04-14 | Hitachi Ltd | データベース処理システム |
US5850547A (en) * | 1997-01-08 | 1998-12-15 | Oracle Corporation | Method and apparatus for parallel processing aggregates using intermediate aggregate values |
JP2010108073A (ja) * | 2008-10-28 | 2010-05-13 | Hitachi Ltd | ストリームデータ処理方法、及びシステム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7382233B2 (ja) | 2017-06-23 | 2023-11-16 | ザイリンクス インコーポレイテッド | データベースアクセラレータに対する並列計算オフロード |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110109898B (zh) | 基于fpga片内bram的哈希连接加速方法及系统 | |
US20120109888A1 (en) | Data partitioning method of distributed parallel database system | |
US11003649B2 (en) | Index establishment method and device | |
WO2018036549A1 (zh) | 分布式数据库查询方法、装置及管理系统 | |
US11372929B2 (en) | Sorting an array consisting of a large number of elements | |
US9600559B2 (en) | Data processing for database aggregation operation | |
KR20170109119A (ko) | 분산 질의 엔진에서의 질의 최적화 방법 및 장치 | |
JP6418431B2 (ja) | 効率的な1対1結合のための方法 | |
US20180357298A1 (en) | Performance of Distributed Databases and Database-Dependent Software Applications | |
US9189489B1 (en) | Inverse distribution function operations in a parallel relational database | |
CN111512283A (zh) | 数据库中的基数估算 | |
US20200159594A1 (en) | Systems and methods for dynamic partitioning in distributed environments | |
US20210182293A1 (en) | Candidate projection enumeration based query response generation | |
CN101916281A (zh) | 并行计算系统及去重计数方法 | |
US10127192B1 (en) | Analytic system for fast quantile computation | |
US10997175B2 (en) | Method for predicate evaluation in relational database systems | |
JP6398632B2 (ja) | 制御装置、分散データベースシステム、方法およびプログラム | |
US20170011083A1 (en) | Multi-column statistic generation of a multi-dimensional tree | |
Bai et al. | Association rule mining algorithm based on Spark for pesticide transaction data analyses | |
CN103823881A (zh) | 分布式数据库的性能优化的方法及装置 | |
JP2016130929A (ja) | 集約装置、集約システム、集約方法、および、プログラム | |
Gupta et al. | An approach for optimizing the performance for apache spark applications | |
US8046394B1 (en) | Dynamic partitioning for an ordered analytic function | |
CN108052522B (zh) | 一种对olap预计算模型进行动态优化的方法及系统 | |
CN110737679B (zh) | 数据资源的查询方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181016 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190528 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200128 |