JP2018190450A - 基数推定を介した結合パスの効率的な判定 - Google Patents
基数推定を介した結合パスの効率的な判定 Download PDFInfo
- Publication number
- JP2018190450A JP2018190450A JP2018141008A JP2018141008A JP2018190450A JP 2018190450 A JP2018190450 A JP 2018190450A JP 2018141008 A JP2018141008 A JP 2018141008A JP 2018141008 A JP2018141008 A JP 2018141008A JP 2018190450 A JP2018190450 A JP 2018190450A
- Authority
- JP
- Japan
- Prior art keywords
- columns
- column
- data
- intersection
- estimate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24558—Binary matching operations
- G06F16/2456—Join operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/275—Synchronous replication
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
Abstract
【解決手段】選択された列の集合のそれぞれのためのテーブルスキャンの間に、hyperloglogなどの確率的計数構造が形成される。それぞれの列のデータ型に基づいてもよく、関連度の初期推定に基づいて列が選択されてもよい。確率的データ構造の交点に基づいて、列の交点または和集合の基数推定が行われる。列の交点または和集合の推定された基数に基づいて、結合パスが判定されてもよい。
【選択図】図1
Description
本出願は2014年12月22日に出願された米国特許出願第14/578,841の利益を主張し、その開示内容全体を本明細書に参照として援用する。
1.トランザクションデータにおける、分析関係の識別システムであって、
複数の行を含むテーブルを維持する1つまたは複数の計算ノードと、
コンピュータ可読命令を格納した1つまたは複数のメモリであって、計算装置による実行時に前記コンピュータ可読命令が、前記システムに少なくとも、
前記複数の行の第1の列および第2の列を、前記第1および第2の列の間の関連性の第1の推定に少なくとも部分的に基づいて選択させ、
第1のhyperloglogを、前記第1の列に対応する前記複数の行における第1の複数のフィールドに少なくとも部分的に基づいて形成させ、
第2のhyperloglogを、前記第2の列に対応する前記複数の行における第2の複数のフィールドに少なくとも部分的に基づいて形成させ、
前記第1のhyperloglogと前記第2のhyperloglogとの交点を算出させ、
前記交点に少なくとも部分的に基づく、前記第1の複数のフィールドのフィールドと前記第2の複数のフィールドのフィールドとの間の第2の一致度の推定に少なくとも部分的に基づき、前記第1の列と前記第2の列との間の結合パスを識別させる、
前記メモリと、
を含む、前記システム。
前記第1の列および前記第2の列に共通のデータ型に基づいて、関連性の前記第1の推定を行わせる、
前記メモリ、
をさらに含む、条項1に記載のシステム。
前記第1および第2の列のための前記第2の一致度の推定を2つ以上の付加的な列のための付加的な一致度の推定と少なくとも比較することにより、前記結合パスを識別させる、
前記メモリ、
をさらに含む、条項1に記載のシステム。
前記第1のhyperloglogと前記第2のhyperloglogとの交点を、前記第1のhyperloglogと前記第2のhyperloglogとの和集合から少なくとも減じることにより、前記第2の一致度の推定を行わせる、
前記メモリ、
をさらに含む、条項1に記載のシステム。
前記複数の行の第1のスキャンを少なくとも実行することにより、複数のhyperloglogを形成させ、
前記複数の行の第2のスキャンを少なくとも実行することにより、前記第1のhyperloglogを形成させ、
前記第1のhyperloglogのサイズが前記第1のスキャンの間に形成される前記複数のhyperloglog内のhyperloglogのサイズよりも大きい、
前記メモリ、
をさらに含む、条項1に記載のシステム。
複数の行において前記複数の行の第1の列に対応する第1の複数のフィールドに少なくとも部分的に基づいて、第1の確率的計数構造を形成させ、
前記複数の行において前記複数の行の第2の列に対応する第2の複数のフィールドに少なくとも部分的に基づいて、第2の確率的計数構造を形成させ、
前記第1および第2の確率的計数構造の交点を算出させ、
前記交点に少なくとも部分的に基づく、前記第1の複数のフィールドのフィールドと前記第2の複数のフィールドのフィールドとの間の一致度の推定に少なくとも部分的に基づいて、前記第1の列と前記第2の列との間の結合パスを識別させる、
前記非一時的コンピュータ可読記憶媒体。
前記第1および第2の列に共通のデータ型に少なくとも部分的に基づいて、前記第1および第2の確率的計数構造を形成するために、前記第1の列および前記第2の列を選択させる、
命令、
をさらに含む、条項6に記載の非一時的コンピュータ可読記憶媒体。
前記第1および第2の列のための前記一致度の推定を2つ以上の付加的な列のための付加的な一致度の推定と少なくとも比較することにより、前記結合パスを識別させる、
命令、
をさらに含む、条項6に記載の非一時的コンピュータ可読記憶媒体。
命令、
をさらに含む、条項6に記載の非一時的コンピュータ可読記憶媒体。
前記複数の行の第1のスキャンおよび前記複数の行の第2のスキャンを少なくとも実行することで、前記第1の確率的計数構造を形成させる命令であって、前記第2のスキャンのために前記第1の確率的計数構造のサイズが増大される前記命令、
をさらに含む、条項6に記載の非一時的コンピュータ可読記憶媒体。
前記第1および第2の確率的計数構造において対応するバケットを少なくとも組み合わせることによって、前記交点を算出させる、
命令、
をさらに含む、条項6に記載の非一時的コンピュータ可読記憶媒体。
計算装置のメモリにおいて、前記計算装置に通信可能に接続される1つまたは複数の記憶装置に格納され、第1の列に対応する第1の複数のフィールドのスキャンに少なくとも部分的に基づき、第1の確率的計数構造を形成することと、
前記計算装置の前記メモリにおいて、前記1つまたは複数の記憶装置に格納され、第2の列に対応する第2の複数のフィールドに少なくとも部分的に基づき、第2の確率的計数構造を形成することと、
前記第1および第2の確率的計数構造の交点を算出することと、
前記交点に少なくとも部分的に基づく、前記第1の複数のフィールドのフィールドと前記第2の複数のフィールドのフィールドとの間の一致度の推定に少なくとも部分的に基づき、前記第1の列と前記第2の列との間の結合パスを識別することと、
を含む、前記方法。
をさらに含む、条項14に記載のコンピュータ実装方法。
をさらに含む、条項14に記載のコンピュータ実装方法。
をさらに含む、条項14に記載のコンピュータ実装方法。
をさらに含む、条項14に記載のコンピュータ実装方法。
をさらに含む、条項14に記載のコンピュータ実装方法。
[請求項1]
トランザクションデータにおける、分析関係の識別システムであって、
複数の行を含むテーブルを維持する1つまたは複数の計算ノードと、
コンピュータ可読命令を格納した1つまたは複数のメモリと、
を含み、
前記コンピュータ可読命令は、計算装置による実行時に、前記システムに少なくとも、
前記複数の行の第1の列および第2の列を、前記第1および第2の列の間の関連性の第1のyに少なくとも部分的に基づいて選択させ、
第1のhyperloglogを、前記第1の列に対応する前記複数の行における第1の複数のフィールドに少なくとも部分的に基づいて形成させ、
第2のhyperloglogを、前記第2の列に対応する前記複数の行における第2の複数のフィールドに少なくとも部分的に基づいて形成させ、
前記第1のhyperloglogと前記第2のhyperloglogとの交点を算出させ、
前記交点に少なくとも部分的に基づく、前記第1の複数のフィールドのフィールドと前記第2の複数のフィールドのフィールドとの間の第2の一致度の推定に少なくとも部分的に基づき、前記第1の列と前記第2の列との間の結合パスを識別させる、
システム。
[請求項2]
コンピュータ可読命令を格納した1つまたは複数のメモリをさらに含み、
前記コンピュータ可読命令は、前記1つまたは複数の計算ノードによる実行時に、前記システムに少なくとも、
前記第1の列および前記第2の列に共通のデータ型に基づいて、関連性の前記第1の推定を行わせる、
請求項1に記載のシステム。
[請求項3]
コンピュータ可読命令を格納した1つまたは複数のメモリをさらに含み、
前記コンピュータ可読命令は、前記1つまたは複数の計算ノードによる実行時に、前記システムに少なくとも、
前記第1および第2の列のための前記第2の一致度の推定を2つ以上の付加的な列のための付加的な一致度の推定と少なくとも比較することにより、前記結合パスを識別させる、
請求項1に記載のシステム。
[請求項4]
コンピュータ可読命令を格納した1つまたは複数のメモリをさらに含み、
前記コンピュータ可読命令は、前記1つまたは複数の計算ノードによる実行時に、前記システムに少なくとも、
前記第1のhyperloglogと前記第2のhyperloglogとの交点を、前記第1のhyperloglogと前記第2のhyperloglogとの和集合から少なくとも減じることにより、前記第2の一致度の推定を行わせる、
請求項1に記載のシステム。
[請求項5]
コンピュータ可読命令を格納した1つまたは複数のメモリをさらに含み、
前記コンピュータ可読命令は、前記1つまたは複数の計算ノードによる実行時に、前記システムに少なくとも、
前記複数の行の第1のスキャンを少なくとも実行することにより、複数のhyperloglogを形成させ、
前記複数の行の第2のスキャンを少なくとも実行することにより、前記第1のhyperloglogを形成させ、
前記第1のhyperloglogのサイズが前記第1のスキャンの間に形成される前記複数のhyperloglog内のhyperloglogのサイズよりも大きい、
請求項1に記載のシステム。
[請求項6]
1つまたは複数のプロセッサと、
命令を格納した1つまたは複数のメモリと、
を含むシステムであって、
前記命令は、1つまたは複数の計算装置による実行時に、前記計算装置に少なくとも、
複数の行において前記複数の行の第1の列に対応する第1の複数のフィールドに少なくとも部分的に基づいて、第1の確率的計数構造を形成させ、
前記複数の行において前記複数の行の第2の列に対応する第2の複数のフィールドに少なくとも部分的に基づいて、第2の確率的計数構造を形成させ、
前記第1および第2の確率的計数構造の交点を算出させ、
前記交点に少なくとも部分的に基づく、前記第1の複数のフィールドのフィールドと前記第2の複数のフィールドのフィールドとの間の一致度の推定に少なくとも部分的に基づいて、前記第1の列と前記第2の列との間の結合パスを識別させる、
システム。
[請求項7]
さらに命令を含み、
前記命令は、前記1つまたは複数の計算装置による実行時に、前記1つまたは複数の計算装置に少なくとも、
前記第1および第2の列に共通のデータ型に少なくとも部分的に基づいて、前記第1および第2の確率的計数構造を形成するために、前記第1の列および前記第2の列を選択させる、
請求項6に記載のシステム。
[請求項8]
前記確率的計数構造がloglog、hyperloglog、ブルームフィルタ、またはmin−hashの少なくとも1つを含む、
請求項6に記載のシステム。
[請求項9]
トランザクションデータにおける分析関係を識別するためのコンピュータ実装方法であって、前記コンピュータ実装方法は、
計算装置のメモリにおいて、前記計算装置に通信可能に接続される1つまたは複数の記憶装置に格納され、第1の列に対応する第1の複数のフィールドのスキャンに少なくとも部分的に基づき、第1の確率的計数構造を形成するステップと、
前記計算装置の前記メモリにおいて、前記1つまたは複数の記憶装置に格納され、第2の列に対応する第2の複数のフィールドに少なくとも部分的に基づき、第2の確率的計数構造を形成するステップと、
前記第1および第2の確率的計数構造の交点を算出するステップと、
前記交点に少なくとも部分的に基づく、前記第1の複数のフィールドのフィールドと前記第2の複数のフィールドのフィールドとの間の一致度の推定に少なくとも部分的に基づき、前記第1の列と前記第2の列との間の結合パスを識別するステップと、
を含むコンピュータ実装方法。
[請求項10]
前記第1および第2の列に共通のデータ型に少なくとも部分的に基づき、前記第1および第2の確率的計数構造を形成するために、前記第1の列および前記第2の列を選択するステップをさらに含む、
請求項9に記載のコンピュータ実装方法。
[請求項11]
前記第1および第2の列のための前記一致度の推定を2つ以上の付加的な列のための付加的な一致度の推定と少なくとも比較することにより、前記結合パスを識別するステップをさらに含む、
請求項9に記載のコンピュータ実装方法。
[請求項12]
前記第1および第2の確率的計数構造の交点を前記第1および第2の確率的計数構造の和集合から減じることにより、前記一致度の推定を行うステップをさらに含む、
請求項9に記載のコンピュータ実装方法。
[請求項13]
前記一致度の推定が、前記交点に含まれないフィールドの計数を確率的に判定することに少なくとも部分的に基づく、
請求項9に記載のコンピュータ実装方法。
[請求項14]
前記識別された結合パスに少なくとも部分的に基づき、階層を形成するステップをさらに含む、
請求項9に記載のコンピュータ実装方法。
[請求項15]
前記第1および第2の確率的計数構造において対応するバケットを少なくとも組み合わせることによって、前記交点を算出するステップをさらに含む、
請求項9に記載のコンピュータ実装方法。
Claims (15)
- 少なくとも1つのプロセッサと、
命令を格納した少なくとも1つのメモリと、
を備えるシステムであって、
前記命令は、前記少なくとも1つのプロセッサによって実行されることに応答して、前記システムに、少なくとも、
第1の列のデータに格納される一意の値の第1の推定計数を格納させ、
第2の列のデータに格納される一意の値の第2の推定計数を格納させ、
前記第1および第2の推定計数の交点を計算させ、
前記交点に少なくとも部分的に基づいて、前記第1の列と前記第2の列との間の結合パスを識別させる、
システム。 - 前記少なくとも1つのメモリは、命令を格納し、前記命令は、前記少なくとも1つのプロセッサによって実行されることに応答して、前記システムに、少なくとも、
前記第1および第2の列の間の関連性の推定に基づいて、前記第1および第2の列のデータを選択させる、
請求項1に記載のシステム。 - 関連性の前記推定は、前記第1および第2の列に共通のデータ型に少なくとも部分的に基づく、
請求項2に記載のシステム。 - 前記結合パスは、前記第1および第2の列のフィールド間の一致度の推定に少なくとも部分的に基づいて識別される、
請求項1に記載のシステム。 - 前記第1の推定計数は、第1の確率的計数構造に格納され、前記第2の推定計数は、第2の確率的計数構造に格納される、
請求項1に記載のシステム。 - 前記確率的計数構造は、loglog、hyperloglog、ブルームフィルタまたはmin−hashの少なくとも1つを含む、
請求項5に記載のシステム。 - 前記第1の推定計数は、データベーステーブルの複数の列の第1の走査を実行することによって生成される、
請求項1に記載のシステム。 - 第1の列のデータに格納される一意の値の第1の推定計数を格納するステップと、
第2の列のデータに格納される一意の値の第2の推定計数を格納するステップと、
前記第1および第2の推定計数の交点を計算するステップと、
前記交点に少なくとも部分的に基づいて、前記第1の列と前記第2の列との間の結合パスを識別するステップと、
を含む方法。 - 前記第1および第2の列の間の関連性の推定に基づいて、前記第1および第2の列のデータを選択するステップをさらに含む、
請求項8に記載の方法。 - 関連性の前記推定は、前記第1および第2の列に共通のデータ型に少なくとも部分的に基づく、
請求項9に記載の方法。 - 前記結合パスは、前記第1および第2の列のフィールド間の一致度の推定に少なくとも部分的に基づいて識別される、
請求項8に記載の方法。 - 前記第1の推定計数は、第1の確率的計数構造に格納され、前記第2の推定計数は、第2の確率的計数構造に格納される、
請求項8に記載の方法。 - 前記確率的計数構造は、loglog、hyperloglog、ブルームフィルタまたはmin−hashの少なくとも1つを含む、
請求項12に記載の方法。 - 前記第1の推定計数は、データベーステーブルの複数の列の第1の走査を実行することによって生成される、
請求項8に記載の方法。 - 前記第1および第2の列のための一致度の推定と、2つ以上の追加の列のための一致度の追加の推定と、を少なくともに比較することによって、前記結合パスを識別するステップをさらに含み、
一致度の前記推定は、前記交点に少なくとも部分的に基づく、
請求項8に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/578,841 | 2014-12-22 | ||
US14/578,841 US10120905B2 (en) | 2014-12-22 | 2014-12-22 | Efficient determination of join paths via cardinality estimation |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017533922A Division JP6381170B2 (ja) | 2014-12-22 | 2015-12-21 | 基数推定を介した結合パスの効率的な判定 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018190450A true JP2018190450A (ja) | 2018-11-29 |
Family
ID=55642809
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017533922A Active JP6381170B2 (ja) | 2014-12-22 | 2015-12-21 | 基数推定を介した結合パスの効率的な判定 |
JP2018141008A Pending JP2018190450A (ja) | 2014-12-22 | 2018-07-27 | 基数推定を介した結合パスの効率的な判定 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017533922A Active JP6381170B2 (ja) | 2014-12-22 | 2015-12-21 | 基数推定を介した結合パスの効率的な判定 |
Country Status (6)
Country | Link |
---|---|
US (2) | US10120905B2 (ja) |
EP (1) | EP3238100B1 (ja) |
JP (2) | JP6381170B2 (ja) |
CN (1) | CN107251017B (ja) |
SG (1) | SG11201705014TA (ja) |
WO (1) | WO2016106246A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11138170B2 (en) * | 2016-01-11 | 2021-10-05 | Oracle International Corporation | Query-as-a-service system that provides query-result data to remote clients |
US10983976B2 (en) * | 2016-04-18 | 2021-04-20 | Verizon Media Inc. | Optimized full-spectrum cardinality estimation based on unified counting and ordering estimation techniques |
US10713244B2 (en) * | 2016-05-09 | 2020-07-14 | Sap Se | Calculation engine optimizations for join operations utilizing automatic detection of forced constraints |
CN106997378B (zh) * | 2017-03-13 | 2020-05-15 | 上海摩库数据技术有限公司 | 基于Redis的数据库数据聚合同步的方法 |
US11651382B2 (en) * | 2017-05-31 | 2023-05-16 | Adobe Inc. | User data overlap determination in a digital medium environment |
GB2565539A (en) * | 2017-08-11 | 2019-02-20 | Infosum Ltd | Systems and methods for determining dataset intersection |
US11500931B1 (en) * | 2018-06-01 | 2022-11-15 | Amazon Technologies, Inc. | Using a graph representation of join history to distribute database data |
KR102061879B1 (ko) | 2018-08-22 | 2020-01-02 | 국민대학교산학협력단 | 랜섬웨어 탐지를 위한 초경량 주소 블록 카운팅 장치 및 방법 |
JP7307939B2 (ja) | 2018-12-12 | 2023-07-13 | 株式会社WEST inx | ラッチ錠 |
CN110580307B (zh) * | 2019-08-09 | 2021-09-24 | 北京大学 | 一种快速统计的处理方法及装置 |
ZA202100191B (en) | 2020-01-20 | 2023-12-20 | EXFO Solutions SAS | Method and device for estimating a number of distinct subscribers of a telecommunication network impacted by network issues |
JP7335511B2 (ja) * | 2020-03-03 | 2023-08-30 | 富士通株式会社 | データマッチングシステム、情報処理装置およびデータマッチング方法 |
US11487668B2 (en) | 2021-04-06 | 2022-11-01 | Thoughtspot, Inc. | Approximate unique count |
US20220398220A1 (en) * | 2021-06-14 | 2022-12-15 | EMC IP Holding Company LLC | Systems and methods for physical capacity estimation of logical space units |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5675714A (en) | 1992-03-30 | 1997-10-07 | Canon Kabushiki Kaisha | Mode identifying method and output apparatus using such a method |
JPH0934759A (ja) | 1995-07-21 | 1997-02-07 | Omron Corp | チューニング情報作成装置およびチューニング情報作成方法 |
JPH113340A (ja) | 1997-06-12 | 1999-01-06 | Mitsubishi Electric Corp | 製造履歴検索装置 |
US6263331B1 (en) | 1998-07-30 | 2001-07-17 | Unisys Corporation | Hybrid hash join process |
JP2000353163A (ja) | 1999-06-11 | 2000-12-19 | Just Syst Corp | データベース処理装置、及びデータベース処理のためのプログラムが記憶された記憶媒体 |
US6374263B1 (en) | 1999-07-19 | 2002-04-16 | International Business Machines Corp. | System for maintaining precomputed views |
US7676384B2 (en) * | 2000-01-18 | 2010-03-09 | Medigenesis, Inc. | System and method for the automated presentation of system data to, and interaction with, a computer maintained database |
US20020029207A1 (en) * | 2000-02-28 | 2002-03-07 | Hyperroll, Inc. | Data aggregation server for managing a multi-dimensional database and database management system having data aggregation server integrated therein |
AU2001288469A1 (en) | 2000-08-28 | 2002-03-13 | Emotion, Inc. | Method and apparatus for digital media management, retrieval, and collaboration |
US7620615B1 (en) * | 2001-10-26 | 2009-11-17 | Teradata Us, Inc. | Joins of relations in an object relational database system |
US8868544B2 (en) | 2002-04-26 | 2014-10-21 | Oracle International Corporation | Using relational structures to create and support a cube within a relational database system |
US7313559B2 (en) | 2002-07-19 | 2007-12-25 | Microsoft Corporation | System and method for analytically modeling data organized according to a referenced attribute |
JP2004086782A (ja) | 2002-08-29 | 2004-03-18 | Hitachi Ltd | 異種データベース統合支援装置 |
US7895191B2 (en) * | 2003-04-09 | 2011-02-22 | International Business Machines Corporation | Improving performance of database queries |
US7299226B2 (en) * | 2003-06-19 | 2007-11-20 | Microsoft Corporation | Cardinality estimation of joins |
US7761480B2 (en) | 2003-07-22 | 2010-07-20 | Kinor Technologies Inc. | Information access using ontologies |
US7647293B2 (en) | 2004-06-10 | 2010-01-12 | International Business Machines Corporation | Detecting correlation from data |
US20060020582A1 (en) | 2004-07-22 | 2006-01-26 | International Business Machines Corporation | Method and system for processing abstract derived entities defined in a data abstraction model |
US7908242B1 (en) | 2005-04-11 | 2011-03-15 | Experian Information Solutions, Inc. | Systems and methods for optimizing database queries |
US7827179B2 (en) | 2005-09-02 | 2010-11-02 | Nec Corporation | Data clustering system, data clustering method, and data clustering program |
US7630967B1 (en) * | 2005-11-22 | 2009-12-08 | At&T Intellectual Property Ii, L.P. | Join paths across multiple databases |
WO2007131545A2 (en) | 2005-12-09 | 2007-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A method and apparatus for automatic comparison of data sequences |
US20070156734A1 (en) | 2005-12-30 | 2007-07-05 | Stefan Dipper | Handling ambiguous joins |
US7752233B2 (en) | 2006-03-29 | 2010-07-06 | Massachusetts Institute Of Technology | Techniques for clustering a set of objects |
JP4880376B2 (ja) * | 2006-06-14 | 2012-02-22 | 株式会社日立製作所 | 支援装置、プログラム、情報処理システム及び支援方法 |
US7831617B2 (en) | 2006-07-25 | 2010-11-09 | Microsoft Corporation | Re-categorization of aggregate data as detail data and automated re-categorization based on data usage context |
US7562073B2 (en) * | 2006-08-02 | 2009-07-14 | Sap Ag | Business object search using multi-join indexes and extended join indexes |
US7870123B2 (en) * | 2006-12-01 | 2011-01-11 | Teradata Us, Inc. | Database optimizer plan validation and characterizations |
US7890480B2 (en) | 2008-02-11 | 2011-02-15 | International Business Machines Corporation | Processing of deterministic user-defined functions using multiple corresponding hash tables |
US8005868B2 (en) * | 2008-03-07 | 2011-08-23 | International Business Machines Corporation | System and method for multiple distinct aggregate queries |
US8073840B2 (en) * | 2008-06-17 | 2011-12-06 | Attivio, Inc. | Querying joined data within a search engine index |
US8204901B2 (en) | 2009-09-02 | 2012-06-19 | International Business Machines Corporation | Generating query predicates for processing multidimensional data |
US9189535B2 (en) | 2009-12-01 | 2015-11-17 | International Business Machines Corporation | Compensating for unbalanced hierarchies when generating OLAP queries from report specifications |
CN102156933A (zh) * | 2010-02-11 | 2011-08-17 | 阿里巴巴集团控股有限公司 | 统计电子商务交易数据的方法和统计系统 |
US9886483B1 (en) * | 2010-04-29 | 2018-02-06 | Quest Software Inc. | System for providing structured query language access to non-relational data stores |
CN102314633A (zh) | 2010-06-30 | 2012-01-11 | 国际商业机器公司 | 用于处理数据分析的设备和方法 |
US8484077B2 (en) * | 2010-07-21 | 2013-07-09 | Yahoo! Inc. | Using linear and log-linear model combinations for estimating probabilities of events |
CA2712028C (en) | 2010-08-25 | 2011-12-20 | Ibm Canada Limited - Ibm Canada Limitee | Geospatial database integration using business models |
CN102890678A (zh) | 2011-07-20 | 2013-01-23 | 华东师范大学 | 一种基于格雷编码的分布式数据布局方法及查询方法 |
GB2493714A (en) * | 2011-08-12 | 2013-02-20 | Nec Corp | A base station, having a membership-based access mode and a non-membership-based access mode, manages a list of stored membership identifiers |
US9484743B2 (en) | 2012-02-16 | 2016-11-01 | General Electric Company | Power distribution network event analysis using data from different data sources |
US8682885B2 (en) * | 2012-05-15 | 2014-03-25 | Sap Ag | Method and system for combining data objects |
US8788506B1 (en) * | 2012-05-21 | 2014-07-22 | Google Inc. | Methods and systems for estimating a count of unique items |
US9582553B2 (en) * | 2012-06-26 | 2017-02-28 | Sap Se | Systems and methods for analyzing existing data models |
US9152670B2 (en) * | 2012-12-20 | 2015-10-06 | Teradata Us, Inc. | Estimating number of iterations or self joins required to evaluate iterative or recursive database queries |
US9183048B2 (en) * | 2012-12-20 | 2015-11-10 | Oracle International Corporation | System and method for implementing scalable contention-adaptive statistics counters |
CN103049556B (zh) | 2012-12-28 | 2016-11-09 | 中国科学院深圳先进技术研究院 | 一种海量医疗数据的快速统计查询方法 |
US9268801B2 (en) | 2013-03-11 | 2016-02-23 | Business Objects Software Ltd. | Automatic file structure and field data type detection |
JP6416194B2 (ja) * | 2013-03-15 | 2018-10-31 | アマゾン・テクノロジーズ・インコーポレーテッド | 半構造データのためのスケーラブルな分析プラットフォーム |
US9146979B2 (en) * | 2013-06-13 | 2015-09-29 | Sap Se | Optimization of business warehouse queries by calculation engines |
US20150039667A1 (en) * | 2013-08-02 | 2015-02-05 | Linkedin Corporation | Incremental processing on data intensive distributed applications |
US20150088925A1 (en) | 2013-09-20 | 2015-03-26 | Oracle International Corporation | User interface for pivot views |
US9639548B2 (en) * | 2013-10-28 | 2017-05-02 | Pivotal Software, Inc. | Selecting files for compaction |
CN103631911B (zh) | 2013-11-27 | 2017-11-03 | 中国人民大学 | 基于数组存储和向量处理的olap查询处理方法 |
US10055506B2 (en) * | 2014-03-18 | 2018-08-21 | Excalibur Ip, Llc | System and method for enhanced accuracy cardinality estimation |
US9633058B2 (en) * | 2014-06-16 | 2017-04-25 | International Business Machines Corporation | Predictive placement of columns during creation of a large database |
US9465831B2 (en) | 2014-07-18 | 2016-10-11 | Wipro Limited | System and method for optimizing storage of multi-dimensional data in data storage |
US9507824B2 (en) * | 2014-08-22 | 2016-11-29 | Attivio Inc. | Automated creation of join graphs for unrelated data sets among relational databases |
-
2014
- 2014-12-22 US US14/578,841 patent/US10120905B2/en active Active
-
2015
- 2015-12-21 EP EP15848153.1A patent/EP3238100B1/en active Active
- 2015-12-21 CN CN201580070304.8A patent/CN107251017B/zh active Active
- 2015-12-21 WO PCT/US2015/067186 patent/WO2016106246A1/en active Application Filing
- 2015-12-21 JP JP2017533922A patent/JP6381170B2/ja active Active
- 2015-12-21 SG SG11201705014TA patent/SG11201705014TA/en unknown
-
2018
- 2018-07-27 JP JP2018141008A patent/JP2018190450A/ja active Pending
- 2018-11-02 US US16/179,802 patent/US10831759B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3238100A1 (en) | 2017-11-01 |
US10120905B2 (en) | 2018-11-06 |
JP2018506107A (ja) | 2018-03-01 |
WO2016106246A1 (en) | 2016-06-30 |
US20160179894A1 (en) | 2016-06-23 |
JP6381170B2 (ja) | 2018-08-29 |
US10831759B2 (en) | 2020-11-10 |
EP3238100B1 (en) | 2019-06-19 |
SG11201705014TA (en) | 2017-07-28 |
CN107251017A (zh) | 2017-10-13 |
CN107251017B (zh) | 2020-09-25 |
US20190073398A1 (en) | 2019-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6381170B2 (ja) | 基数推定を介した結合パスの効率的な判定 | |
US10432639B1 (en) | Security management for graph analytics | |
CN109416643B (zh) | 应用程序迁移系统 | |
JP6778704B2 (ja) | 分散ストレージシステム上でデータを分散させること | |
Wang et al. | Performance prediction for apache spark platform | |
US8595262B1 (en) | Resource resolution in computing environments using directed graphs | |
US10698926B2 (en) | Clustering and labeling streamed data | |
Bautista Villalpando et al. | Performance analysis model for big data applications in cloud computing | |
JP6434154B2 (ja) | トランザクションアクセスパターンに基づいた結合関係の識別 | |
Araujo et al. | Availability evaluation of digital library cloud services | |
US10769175B1 (en) | Real-time hosted system analytics | |
US10747764B1 (en) | Index-based replica scale-out | |
US11886898B2 (en) | GPU-remoting latency aware virtual machine migration | |
Zhu et al. | Bigop: Generating comprehensive big data workloads as a benchmarking framework | |
JP2023522882A (ja) | データ品質問題の動的発見及び修正 | |
US10326826B1 (en) | Migrating an on premises workload to a web services platform | |
Premchaiswadi et al. | Optimizing and tuning MapReduce jobs to improve the large‐scale data analysis process | |
Anjos et al. | BIGhybrid: a simulator for MapReduce applications in hybrid distributed infrastructures validated with the Grid5000 experimental platform | |
US10387578B1 (en) | Utilization limiting for nested object queries | |
US11620311B1 (en) | Transformation of directed graph into relational data | |
US11222036B1 (en) | Data warehouse access reporting | |
Torres et al. | Storage services in private clouds: Analysis, performance and availability modeling | |
Xu et al. | Learning to optimize federated queries | |
US10970196B1 (en) | Semantic-aware fuzz-based functional testing | |
WM Ribeiro et al. | OLAP parallel query processing in clouds with C‐ParGRES |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200212 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200520 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201019 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210209 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210706 |