JP2016529586A - マルチストアシステムをチューニングし、ビッグデータクエリワークロードを高速化するためのシステムおよび方法 - Google Patents
マルチストアシステムをチューニングし、ビッグデータクエリワークロードを高速化するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2016529586A JP2016529586A JP2016519729A JP2016519729A JP2016529586A JP 2016529586 A JP2016529586 A JP 2016529586A JP 2016519729 A JP2016519729 A JP 2016519729A JP 2016519729 A JP2016519729 A JP 2016519729A JP 2016529586 A JP2016529586 A JP 2016529586A
- Authority
- JP
- Japan
- Prior art keywords
- store
- view
- views
- query
- stores
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24539—Query rewriting; Transformation using cached or materialised query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2393—Updating materialised views
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
ビューを使用することの利益は、ビューが前の計算をカプセル化し、ストア間にまたがってビューを配置することにより、コストのかかる、クエリ処理中にまとめてデータを移動させる必要を取り除くことができる。正しいときに正しいストア内に正しいビューを有することにより、ストアのための有益な物理設計が生み出される。
観察されたクエリストリーム、マルチストア設計M=<Vh,Vd>、および設計制約Bh、Bd、Btのセットを考えて、これらの制約を満たし、将来のワークロードコストを最小限に抑える新しいマルチストア設計
場合1:ビューvkがDWから立ち退かされたとき
場合2:ビューvkがDWから立ち退かされなかったとき
234で、互いに強く相互作用しているビューのサブセットの中で、
・ 負の相互作用について、これらのビューの中の1つをナップサックの詰込みのためのアイテムとして選択する。
・ 正の相互作用について、それらをナップサックの詰込みのための単一のアイテムになるように統合する。
236で、このプロセスは、以下を実施する。
・ 記憶バジェットBdおよび転送バジェットBtでRDBMSのためのナップサックの詰込み
・ アイテムViの値はCOST(Vi,Q)であり、記憶容量SIZE(Vi)を消費する。
・ 現在ビッグデータストア内に存在する場合、転送バジェットSIZE(Vi)を消費する。
238では、このプロセスは、
・ 詰込みに使用可能な残りのアイテムを考慮し、
・ 記憶バジェットBdおよび任意の残りの転送バジェットでRDBMSのためのナップサックの詰込みを実施し、
・ アイテムViの値はCOST(Vi,Q)であり、記憶容量SIZE(Vi)を消費する。
Claims (20)
- マルチストアシステムを動作させるための方法であって、
前記マルチストアシステム内のクエリ処理の副産物を受け取り、前記副産物が、ビューまたは中間データの具体化されたものを含むことと、
前記ビューまたは具体化されたものを、将来のクエリワークロードを示すものとして最近観察されたクエリに基づいて、前記ストア間にまたがって配置することと、
予測された、クエリの将来のワークロードに基づいて、各ビューについて利益スコアを決定し、各ストアにはビュー記憶バジェットが割り振られ、前記ストア間でビューを転送するためにビュー転送バジェットがあることと、
前記マルチストアシステムの物理設計をチューニングすることを含む方法。 - すべてのバジェット内で最終的なビュー配置に収まり、前記将来のクエリワークロードのコストを最小限に抑えるように、前記ストア間でビューを転送することを含む、請求項1に記載の方法。
- 各バジェットが一意の値を含む、請求項1に記載の方法。
- ビューの統一セットを、各ストア内にあるビューすべての和集合として考慮することを含む、請求項1に記載の方法。
- 各ストア内に配置されるべきビューのサブセットを含む解を生成することを含む、請求項1に記載の方法。
- 最初に高性能ストアのためのビュー配置を解決することを含む、請求項1に記載の方法。
- 前記高性能ストアに転送する(またはその中で保持する)ために、将来のワークロードにとって最も有益となるビューを決定することを含む、請求項6に記載の方法。
- 前記高性能ストアについて解が計算され、前記解が、前記高性能ストア内に配置するための前記ビューのセットである、請求項1に記載の方法。
- 前記高性能ストアについての前記解が、前記高性能ストアのためのビュー記憶バジェット、およびビュー転送バジェットより小さい、請求項1に記載の方法。
- 第2のストアについて解を決定することを含む、請求項1に記載の方法。
- 前記高性能ストアのためのビュー記憶バジェットより小さく、前記高性能ストアのための前記解によって消費されなかった残りのビュー転送バジェットより小さいコストで、前記第2のストアについて解を決定することを含む、請求項1に記載の方法。
- どのビューをどのストア内に配置するべきか、またどのビューを破棄するべきか判断することを含む、請求項1に記載の方法。
- 所与の記憶バジェットについて最も有益なビューのセットを判断する、請求項1に記載の方法。
- ストア間にまたがって転送するために最も有益なビューのセットを判断することを含む、請求項1に記載の方法。
- RDBMSにとって最も有益なビューを選択することを含む、請求項1に記載の方法。
- 前記ビッグデータストアのためのどのビューが次に選択されるか決定することを含む、請求項1に記載の方法。
- ビュー間の相互作用を扱うことを含む、請求項1に記載の方法。
- 動的なプログラミング解決策を使用し、両ストアを詰める、請求項1に記載の方法。
- プロセッサと、
コンピュータ可読コードとを備えており、前記コンピュータ可読コードが、
前記マルチストアシステム内のクエリ処理の副産物を受け取り、前記副産物が、ビューまたは中間データの具体化されたものを含むこと、
前記ビューまたは具体化されたものを、将来のクエリワークロードを示すものとして最近観察されたクエリに基づいて、前記ストア間にまたがって配置すること、
予測された、クエリの将来のワークロードに基づいて、各ビューについて利益スコアを決定し、各ストアにはビュー記憶バジェットが割り振られ、前記ストア間でビューを転送するためにビュー転送バジェットがあること、および、
前記マルチストアシステムの物理設計をチューニングすることのためのものである、マルチストアシステム。 - すべてのバジェット内で最終的なビュー配置に収まり、前記将来のクエリワークロードのコストを最小限に抑えるように、前記ストア間でビューを転送することを含む、請求項19に記載のシステム。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877430P | 2013-09-13 | 2013-09-13 | |
US201361877423P | 2013-09-13 | 2013-09-13 | |
US61/877,430 | 2013-09-13 | ||
US61/877,423 | 2013-09-13 | ||
US14/321,881 US9569491B2 (en) | 2013-09-13 | 2014-07-02 | MISO (multistore-online-tuning) system |
US14/321,875 US20150081668A1 (en) | 2013-09-13 | 2014-07-02 | Systems and methods for tuning multi-store systems to speed up big data query workload |
US14/321,881 | 2014-07-02 | ||
US14/321,875 | 2014-07-02 | ||
PCT/US2014/045348 WO2015038224A1 (en) | 2013-09-13 | 2014-07-03 | Systems and methods for tuning multi-store systems to speed up big data query workload |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016529586A true JP2016529586A (ja) | 2016-09-23 |
JP6123028B2 JP6123028B2 (ja) | 2017-04-26 |
Family
ID=52668956
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016519729A Active JP6123028B2 (ja) | 2013-09-13 | 2014-07-03 | マルチストアシステムをチューニングし、ビッグデータクエリワークロードを高速化するためのシステムおよび方法 |
Country Status (3)
Country | Link |
---|---|
US (2) | US20150081668A1 (ja) |
EP (1) | EP3044704A4 (ja) |
JP (1) | JP6123028B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019040409A (ja) * | 2017-08-25 | 2019-03-14 | Kddi株式会社 | データベース管理装置、データベース管理方法、及びデータベース管理プログラム |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170024432A1 (en) | 2015-07-24 | 2017-01-26 | International Business Machines Corporation | Generating sql queries from declarative queries for semi-structured data |
CN106815274B (zh) * | 2015-12-02 | 2022-02-18 | 中兴通讯股份有限公司 | 基于Hadoop的日志数据挖掘方法及系统 |
US10776846B2 (en) * | 2016-07-27 | 2020-09-15 | Nike, Inc. | Assortment optimization |
US10540366B2 (en) | 2017-03-09 | 2020-01-21 | Bank Of America Corporation | Transforming data structures and data objects for migrating data between databases having different schemas |
CN108108490B (zh) * | 2018-01-12 | 2019-08-27 | 平安科技(深圳)有限公司 | Hive表扫描方法、装置、计算机设备及存储介质 |
US11030204B2 (en) | 2018-05-23 | 2021-06-08 | Microsoft Technology Licensing, Llc | Scale out data storage and query filtering using data pools |
MY192169A (en) * | 2018-11-14 | 2022-08-03 | Mimos Berhad | System and method for managing duplicate entities based on a relationship cardinality in production knowledge base repository |
US11797518B2 (en) * | 2021-06-29 | 2023-10-24 | Amazon Technologies, Inc. | Registering additional type systems using a hub data model for data processing |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7007006B2 (en) * | 2001-06-21 | 2006-02-28 | International Business Machines Corporation | Method for recommending indexes and materialized views for a database workload |
US20070174292A1 (en) * | 2006-01-26 | 2007-07-26 | Wen-Syan Li | Autonomic recommendation and placement of materialized query tables for load distribution |
JP2012524947A (ja) * | 2009-04-24 | 2012-10-18 | マイクロソフト コーポレーション | 複製データの動的配置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9934276B2 (en) * | 2012-10-15 | 2018-04-03 | Teradata Us, Inc. | Systems and methods for fault tolerant, adaptive execution of arbitrary queries at low latency |
US20140114952A1 (en) * | 2012-10-23 | 2014-04-24 | Microsoft Corporation | Optimizing queries of parallel databases |
US9652482B2 (en) * | 2012-12-31 | 2017-05-16 | Teradata Us, Inc. | Data storage management based on indicated storage levels and other criteria for multilevel storage systems |
US20140215506A1 (en) * | 2013-01-25 | 2014-07-31 | Mobitv, Inc. | Time context weighted content recommendation |
US9632829B2 (en) * | 2013-03-14 | 2017-04-25 | California Institute Of Technology | Distributed storage allocation for heterogeneous systems |
-
2014
- 2014-07-02 US US14/321,875 patent/US20150081668A1/en not_active Abandoned
- 2014-07-02 US US14/321,881 patent/US9569491B2/en active Active
- 2014-07-03 JP JP2016519729A patent/JP6123028B2/ja active Active
- 2014-07-03 EP EP14844611.5A patent/EP3044704A4/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7007006B2 (en) * | 2001-06-21 | 2006-02-28 | International Business Machines Corporation | Method for recommending indexes and materialized views for a database workload |
US20070174292A1 (en) * | 2006-01-26 | 2007-07-26 | Wen-Syan Li | Autonomic recommendation and placement of materialized query tables for load distribution |
JP2012524947A (ja) * | 2009-04-24 | 2012-10-18 | マイクロソフト コーポレーション | 複製データの動的配置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019040409A (ja) * | 2017-08-25 | 2019-03-14 | Kddi株式会社 | データベース管理装置、データベース管理方法、及びデータベース管理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20160147832A1 (en) | 2016-05-26 |
US9569491B2 (en) | 2017-02-14 |
EP3044704A1 (en) | 2016-07-20 |
US20150081668A1 (en) | 2015-03-19 |
EP3044704A4 (en) | 2017-06-07 |
JP6123028B2 (ja) | 2017-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6123028B2 (ja) | マルチストアシステムをチューニングし、ビッグデータクエリワークロードを高速化するためのシステムおよび方法 | |
US11157478B2 (en) | Technique of comprehensively support autonomous JSON document object (AJD) cloud service | |
Marcu et al. | Spark versus flink: Understanding performance in big data analytics frameworks | |
US11675785B2 (en) | Dynamic asynchronous traversals for distributed graph queries | |
EP3098730B1 (en) | Aggregating database entries by hashing | |
US10713255B2 (en) | Spool file for optimizing hash join operations in a relational database system | |
US20080189251A1 (en) | Processing elements of a hardware accelerated reconfigurable processor for accelerating database operations and queries | |
US20140344287A1 (en) | Database controller, method, and program for managing a distributed data store | |
Lu et al. | Scalagist: Scalable generalized search trees for mapreduce systems [innovative systems paper] | |
US12001425B2 (en) | Duplication elimination in depth based searches for distributed systems | |
US9251155B1 (en) | Maintaining sort order of data in databases | |
Potter et al. | Distributed RDF query answering with dynamic data exchange | |
US11429629B1 (en) | Data driven indexing in a spreadsheet based data store | |
Theocharidis et al. | SRX: efficient management of spatial RDF data | |
Ramdane et al. | Building a novel physical design of a distributed big data warehouse over a Hadoop cluster to enhance OLAP cube query performance | |
US20230394055A1 (en) | Heapsort in a parallel processing framework | |
Xu et al. | A dynamic view materialization scheme for sequences of query and update statements | |
Koumarelas et al. | Flexible partitioning for selective binary theta-joins in a massively parallel setting | |
CN113742346A (zh) | 资产大数据平台架构优化方法 | |
Hameurlain et al. | CPU and incremental memory allocation in dynamic parallelization of SQL queries | |
WO2015038224A1 (en) | Systems and methods for tuning multi-store systems to speed up big data query workload | |
Qin et al. | Dot-product join: An array-relation join operator for big model analytics | |
Andrade et al. | Large-scale response-aware online ANN search in dynamic datasets | |
Liu et al. | DCODE: A distributed column-oriented database engine for big data analytics | |
US20230281201A1 (en) | On-demand access of database table partitions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170110 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170307 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6123028 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |