JP2016126770A5 - - Google Patents

Download PDF

Info

Publication number
JP2016126770A5
JP2016126770A5 JP2015242282A JP2015242282A JP2016126770A5 JP 2016126770 A5 JP2016126770 A5 JP 2016126770A5 JP 2015242282 A JP2015242282 A JP 2015242282A JP 2015242282 A JP2015242282 A JP 2015242282A JP 2016126770 A5 JP2016126770 A5 JP 2016126770A5
Authority
JP
Japan
Prior art keywords
index
query
numerical values
database
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015242282A
Other languages
English (en)
Other versions
JP6673683B2 (ja
JP2016126770A (ja
Filing date
Publication date
Priority claimed from EP14307192.6A external-priority patent/EP3038018A1/en
Application filed filed Critical
Publication of JP2016126770A publication Critical patent/JP2016126770A/ja
Publication of JP2016126770A5 publication Critical patent/JP2016126770A5/ja
Application granted granted Critical
Publication of JP6673683B2 publication Critical patent/JP6673683B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (11)

  1. 基準クエリとのターゲットクエリの類似性に基づいて、データベースにおける前記ターゲットクエリの実行時間を予測するための前記データベースにおいて前記基準クエリをクラスタリングするコンピュータにより実行される方法であって、
    前記基準クエリの前記実行時間を表す数値(x1,…,xn)の数(n)を設けるステップと、
    予め定められた数(K)のクラスタに対する前記数値の最適K平均クラスタリングを算出するステップであって、前記算出するステップは、前記予め定められた数のクラスタに対応する回数、前記数値の数に等しい次数(n)の正方行列(H)に適用される線形時間行最小検索アルゴリズムを反復するステップを含む、ステップと、
    前記数値の前記算出されたクラスタリングに従って、前記基準クエリをクラスタリングするステップと
    を備えたことを特徴とする方法。
  2. 前記数値(x1,…,xn)は、記憶およびインデックス付けされ、前記算出するステップ内で反復することは、各々のそれぞれの反復ランク(k)において、ならびに前記数値の数(n)未満のそれぞれのインデックス(j)ごとに、前記正方行列(H)に適用される前記線形時間行最小検索アルゴリズムに従って、前記それぞれの反復ランク(k)に対応するクラスタの数で、前記それぞれのインデックス(i<=j)よりも低くインデックス付けされた数値(xi)のサブセットに対して達成可能な最小全歪み(TDmin(j,k))の算出を含む、ことを特徴とする請求項1に記載の方法。
  3. 各々のそれぞれの反復ランク(k)において、および前記数値の数(n)未満のそれぞれのインデックス(j)ごとに、行インデックス(i)ごと、および列インデックス(j)ごとに、行列エントリ(H(i,j))は、
    前記行インデックスに先行するインデックス(i−1)に対する前の反復において算出された最小全歪み(TDmin(i−1,k−1))、および
    前記行インデックスと前記列インデックスとの間の前記数値の連続するサブセット(xi,…,xj)の歪み(disto(i,j))
    の合計に対応する、ことを特徴とする請求項2に記載の方法。
  4. 前記方法は、各々のそれぞれの反復ランク(k)において、前記行最小検索アルゴリズムによって返されるインデックス(Cutmin(j,k))を記憶するステップをさらに備えている、ことを特徴とする請求項3に記載の方法。
  5. 前記方法は、前記算出するステップにおいて、前記記憶されたインデックスから最適クラスタリングを判定するステップをさらに備えている、ことを特徴とする請求項4に記載の方法。
  6. 前記記憶されたインデックスから前記最適クラスタリングを判定するステップは、前記記憶されたインデックス(Cutmin)における最後にインデックス付けされた数値(Cutmin(n,K))から開始して、前記数値を反復して区分化するステップを備え、各々のそれぞれの反復ランク(q)において、現在形成されているクラスタの開始数値のインデックスは、前記算出するステップ内での反復の間に、前記予め定められた数のクラスタから、前記現在形成されているクラスタの最後にインデックス付けされた数値の前記インデックスに等しい前記行インデックスに対するそれぞれの反復ランク(q)を引いたのに等しいランク(K−q)の反復において、記憶されたインデックスに等しい、ことを特徴とする請求項5に記載の方法。
  7. データベースにおいてターゲットクエリの実行時間を予測する方法であって、
    請求項1乃至6のいずれか一項に記載の方法によって取得可能な前記データベースにおける基準クエリのクラスタリング、および前記基準クエリの前記実行時間を提供するステップと、
    前記基準クエリとの前記ターゲットクエリの類似性に基づいて、前記ターゲットクエリを前記クラスタリングのクラスタに関連付けるステップと、
    前記ターゲットクエリに関連付けられた前記クラスタの前記基準クエリの前記実行時間に従って、前記ターゲットクエリの前記実行時間を予測するステップと
    を備えたことを特徴とする方法。
  8. コンピュータによって実行されるとき、前記コンピュータに、請求項1乃至7のいずれか一項に記載の方法を実行させるためのコンピュータ実行可能命令を備えたことを特徴とするコンピュータプログラム。
  9. 請求項8に記載のコンピュータプログラムを記憶したことを特徴とするデータ記憶媒体。
  10. メモリに結合されたプロセッサを備えたシステムであって、前記プロセッサは、前記メモリに記憶された、請求項8に記載の前記コンピュータプログラムを実行するように構成されていることを特徴とするシステム。
  11. 前記メモリはデータベースをさらに記憶し、前記プロセッサは、前記データベースにおける基準クエリおよび/または前記データベースにおけるターゲットクエリ上で前記コンピュータプログラムを実行するように構成されていることを特徴とする請求項10に記載のシステム。
JP2015242282A 2014-12-27 2015-12-11 実行時間予測のためのデータベースクエリのクラスタリング Active JP6673683B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP14307192.6A EP3038018A1 (en) 2014-12-27 2014-12-27 Clustering database queries for runtime prediction
EP14307192.6 2014-12-27

Publications (3)

Publication Number Publication Date
JP2016126770A JP2016126770A (ja) 2016-07-11
JP2016126770A5 true JP2016126770A5 (ja) 2019-01-24
JP6673683B2 JP6673683B2 (ja) 2020-03-25

Family

ID=52396394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015242282A Active JP6673683B2 (ja) 2014-12-27 2015-12-11 実行時間予測のためのデータベースクエリのクラスタリング

Country Status (4)

Country Link
US (1) US10191967B2 (ja)
EP (1) EP3038018A1 (ja)
JP (1) JP6673683B2 (ja)
CN (1) CN105740312B (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9959354B2 (en) * 2015-06-23 2018-05-01 Google Llc Utilizing user co-search behavior to identify search queries seeking inappropriate content
US11249995B2 (en) * 2016-12-30 2022-02-15 Salesforce.Com, Inc. Techniques and architectures for providing and operating an application-aware database environment with predictive execution of queries and query flows
US11120021B2 (en) * 2017-01-11 2021-09-14 Facebook, Inc. Systems and methods for optimizing queries
CN106991006B (zh) * 2017-03-30 2018-05-15 浙江天正信息科技有限公司 支持依赖和时间平衡的云工作流任务聚类方法
US11372858B2 (en) * 2017-05-18 2022-06-28 Oracle International Corporation Estimated query performance
CN107491508B (zh) * 2017-08-01 2020-05-26 浙江大学 一种基于循环神经网络的数据库查询时间预测方法
CN108052614B (zh) * 2017-12-14 2021-12-03 太原理工大学 一种数据库系统负载的调度方法
US11100555B1 (en) * 2018-05-04 2021-08-24 Coupa Software Incorporated Anticipatory and responsive federated database search
US11586939B2 (en) * 2019-02-28 2023-02-21 Entigenlogic Llc Generating comparison information
US11327970B1 (en) 2019-03-25 2022-05-10 Amazon Technologies, Inc. Context dependent execution time prediction for redirecting queries
US11308100B2 (en) 2019-06-25 2022-04-19 Amazon Technologies, Inc. Dynamically assigning queries to secondary query processing resources
US11416270B2 (en) * 2020-03-11 2022-08-16 Td Ameritrade Ip Company, Inc. Systems and methods for dynamic server control based on estimated script complexity
US11314561B2 (en) 2020-03-11 2022-04-26 UiPath, Inc. Bottleneck detection for processes
US11537616B1 (en) 2020-06-29 2022-12-27 Amazon Technologies, Inc. Predicting query performance for prioritizing query execution
CN112256725A (zh) * 2020-11-06 2021-01-22 山东伏羲智库互联网研究院 一种基于gpu和cpu的相似数据查询方法及系统
CN112397146B (zh) * 2020-12-02 2021-08-24 广东美格基因科技有限公司 一种基于云平台的微生物组学数据交互分析系统
US11741101B2 (en) 2020-12-15 2023-08-29 International Business Machines Corporation Estimating execution time for batch queries

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1543036A (en) 1924-10-10 1925-06-23 Lawrence H Taylor Domestic press
US5694591A (en) 1995-05-02 1997-12-02 Hewlett Packard Company Reducing query response time using tree balancing
US7356526B2 (en) 2003-09-30 2008-04-08 International Business Machines Corporation Estimating the compilation time of a query optimizer
US20050192937A1 (en) 2004-02-26 2005-09-01 International Business Machines Corporation Dynamic query optimization
US8346761B2 (en) 2004-08-05 2013-01-01 International Business Machines Corporation Method and system for data mining for automatic query optimization
US7831594B2 (en) 2007-04-30 2010-11-09 Hewlett-Packard Development Company, L.L.P. Estimating the static execution time of a database query
US7895192B2 (en) 2007-07-19 2011-02-22 Hewlett-Packard Development Company, L.P. Estimating the loaded execution runtime of a database query
US8352480B2 (en) * 2010-12-20 2013-01-08 Nokia Corporation Methods, apparatuses and computer program products for converting a geographical database into a map tile database
US10216799B2 (en) * 2012-10-19 2019-02-26 Telefonaktiebolaget Lm Ericsson (Publ) Federated database system

Similar Documents

Publication Publication Date Title
JP2016126770A5 (ja)
CN105740312B (zh) 使数据库查询形成聚类以用于运行时间预测
Ng et al. PEGASUS: A policy search method for large MDPs and POMDPs
US20190188611A1 (en) Multi-step time series forecasting with residual learning
US20210042606A1 (en) Deep neural network with equilibrium solver
GB2581304A (en) Cognitive learning workflow execution
JP2021500658A5 (ja)
JPWO2020159568A5 (ja)
JP2016503205A5 (ja)
CN109739975B (zh) 热点事件抽取方法、装置、可读存储介质及电子设备
JP2013522720A5 (ja)
JP2022074880A5 (ja)
JP2017120633A5 (ja)
JP6468364B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP2016126771A5 (ja)
WO2015143985A1 (zh) 一种确定结果向量的方法和装置
CN113010525B (zh) 一种基于pid的海洋时空大数据并行knn查询处理方法
Wang et al. An adaptive Kriging method based on K-means clustering and sampling in n-ball for structural reliability analysis
US20160283862A1 (en) Multi-distance similarity analysis with tri-point arbitration
JP2018535484A5 (ja)
Ji et al. An apache spark implementation of block power method for computing dominant eigenvalues and eigenvectors of large-scale matrices
Eger Sequence alignment with arbitrary steps and further generalizations, with applications to alignments in linguistics
CN104794237A (zh) 网页信息处理方法及装置
WO2017198168A2 (en) Reduction of parameters in fully connected layers of neural networks by low rank factorizations
Kumar et al. A new Initial Centroid finding Method based on Dissimilarity Tree for K-means Algorithm