JP2016509294A - 分散型データベースクエリ・エンジン用のシステムおよび方法 - Google Patents
分散型データベースクエリ・エンジン用のシステムおよび方法 Download PDFInfo
- Publication number
- JP2016509294A JP2016509294A JP2015551711A JP2015551711A JP2016509294A JP 2016509294 A JP2016509294 A JP 2016509294A JP 2015551711 A JP2015551711 A JP 2015551711A JP 2015551711 A JP2015551711 A JP 2015551711A JP 2016509294 A JP2016509294 A JP 2016509294A
- Authority
- JP
- Japan
- Prior art keywords
- query
- node
- worker
- data
- partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2358—Change logging, detection, and notification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24539—Query rewriting; Transformation using cached or materialised query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24552—Database cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Multi Processors (AREA)
Abstract
Description
他のリレーショナル・データベース(MySQLおよびOracleなど)に記憶されているデータに基づく報告を生成するべくHiveクエリを承認および実行するためのウェブ・ベースのツールを含む。
を生成することができる。システムのオペレータは、一連のクエリの有効性をテストするために、関連するデータの全集合に対して一連のクエリを処理する前に、その一連のクエリのラッピッド・プロトタイプを受信することができる。
前記ゲートウェイ・サーバは、前記複数の中間結果の一部に基づき近似のクエリ結果を構築するようにもさらに構成され得る。
システムは、前記データベースのテーブル・レベル・メタデータおよび前記分散型ストレージ・クラスタのファイル・レベル・メタデータをキャッシュするように構成されているメタデータ・キャッシュをさらに備え得る。
前記複数のワーカ・ノードの各ワーカ・ノードは、そのワーカ・ノードによる部分クエリ処理の状態を報告するために、前記ゲートウェイ・サーバにハートビート・メッセージを周期的に送ることが可能である。
前記クエリ結果は、前記クエリ結果について走査されたデータ・ノードに記憶されている関連するデータの一部を示す標識を伴うことが可能である。
本発明のさらなる一実施形態では、方法は、本発明または上記において言及した実施形態のいずれかによるシステムを用いる。
ノードは前記分散型ストレージ・クラスタのデータ・ノード上で動くサービスである、工程と、散在するワーカ・ノードを識別する工程と、前記散在するワーカ・ノードに割り当てられている部分クエリを複数の下位の部分クエリに分割し、前記複数の下位の部分クエリを前記複数のワーカ・ノードの一部に割り当てる工程と、前記ワーカ・ノードから前記部分クエリに対する複数の中間結果を取り出す工程であって、各中間結果は前記ワーカ・ノードのそれぞれのワーカ・ノードが該それぞれのワーカ・ノードが動いているデータ・ノードに記憶されている関連するデータを走査することによって処理される、中間結果の取出工程と、前記複数の中間結果に基づきクエリ結果を生成する工程と、を備える。
本発明のこれらのおよび他の目的、特徴、および特性は、本出願の一部をなす添付の特許請求の範囲および図面とともに以下の詳細な説明の検討から、当業者には、より明らかとなるだろう。
イテンシで高速に応答する手法が必要である。本発明では、インメモリサービング木ベースの計算フレームワークを近似クエリ処理と組み合わせることによって可能となる分散型クエリ・エンジンを開示する。この分散型クエリ・エンジンは、さらなるインメモリ処理のために、クエリ・タスクを複数の部分タスクに分割し、部分タスクをワーカ・ノードに対し分散させる。この分散型クエリ・エンジンは、データの走査された部分に基づきワーカ・ノードに近似の中間結果を要求することによって、クエリ処理中の任意の時に近似の結果を生成することが可能である。従来のHadoopクラスタのマップ縮小スキームと異なり、ワーカ・ノードは部分タスクを処理し、処理時間を減少させ全レイテンシを改良するべく、メモリに全中間結果を記憶する。中間結果(その元になるデータではなく)のみが結果の構築のために転送され、転送されるデータの量および転送時間を著しく減少させる。
態では、第2のNameNodeサービスを動作させている第2のメタデータ・ノードが存在してもよい。この第2のメタデータ・ノードは、メタデータ・ノードが故障する場合、バックアップとして働く。
に対し提出されると、JobTracker210Aは、ジョブ用のHDFSにおいて、入出力ファイル、ディレクトリ、またはその両方を識別する。MapReduceタスク用の入力ファイルは、MapReduceタスクのための入力データを格納している複数の入力ファイル・ブロックを含むことが可能である。JobTracker210Aは、いくつの従タスクが作成されるか決定するために、入力ファイル・ブロック(ブロックの物理量およびどこにブロックが位置するのか)についての知識を用いる。MapReduceアプリケーションは、入力ファイル・ブロックが存在する処理ノード毎にコピーされる。各割り当てられた処理ノードについて、JobTracker210Aは少なくとも1つの従タスクを作成する。各割り当てられた処理ノード上で、TaskTrackerサービスは、そのノード上の従タスクの状態を監視し、状態および中間物出力をJobTrackerに報告する。Hadoopクラスタ200は、ファイル・ブロックについての知識に基づき従タスクを分配する。したがって、処理ロケーションにストレージを移動させることに代えて、Hadoopクラスタは処理タスクをストレージ・ロケーションに移動させる。
サーバサービスとして定義および作成するために、Apache Thriftフレームワークなど、RPCフレームワークを用いる。
ウェイ410が妥当な期間に大多数のワーカ412から中間結果を受信することが可能である一方、ノードまたはサービスの故障または遅延により中間結果を送達できないワーカ412が存在する。これらのワーカは、部分クエリの分配から所定時間後に所定のパーセンテージ未満の進行速度を報告するか、または単にゲートウェイ410に進行を回答しない。それらのワーカは散在するワーカであると識別される。ゲートウェイ410は、散在するワーカを識別すると、部分クエリの割当を取り消すために、散在するワーカにメッセージを送る。散在するワーカが中間結果を送達しなかった各々の未完成の部分クエリについて、ゲートウェイ410は、部分クエリを複数の下位の部分クエリにさらに分割し、この下位の部分クエリを一部のワーカ412に割り当てる。一実施形態では、ゲートウェイ410は、ワーカ412の現在の仕事量に基づき下位の部分クエリの割当を決定する。他の実施形態では、ゲートウェイ410は、当業者によって想定され得るように、他の方法により割当を決定することができる。この追加の並行化処理は、未完了の部分クエリの再試行のスピードを上げ、したがって散在するワーカによって引き起こされるクエリ・レイテンシを減少させる。
、走査される入力データの量を明示的に制限するために用いられる。別の実施形態では、分散型クエリ・エンジンのサポートするWITH節は、同じクエリにおいて複数回用いられるである複雑な表現について変数を宣言することによって、オペレータがより読みやすいクエリを書くことを可能とする。また、WITH節では、実行中に共通する下位表現をオプティマイザが一度だけ評価するように、オペレータがオプティマイザに対してヒントを指定するための手段を提供することができる。
中間結果を組み合わせることによって近似の結果を返す。この近似の結果は、オペレータのクライアント・デバイスに返される。クライアント・デバイスは、総処理時間、用いられるワーカの数、走査されたデータ・レコードの行、走査されたデータの量、正確な結果のために走査されるデータの量、走査されたデータのパーセンテージ、および/または故障の数に関する情報を、さらに受信することができる。
分散型クエリ・エンジンは、Hiveシステムを単独で用いることによるクエリ・レイテンシと比べ、Hadoopクラスタなどのデータ・ストレージ・クラスタに記憶されているデータに対するクエリのレイテンシを著しく減少させる。分散型クエリ・エンジンのオペレータまたはユーザは、わずかな待機期間でアドホックな(ad hoc)クエリを
行うことができる。分散型クエリ・エンジンは、様々な状況において利用することができる。例えば、分散型クエリ・エンジンがない場合、オペレータまたはアナリストは、MySQLまたはオラクルなどのデータベースにHiveからのデータを明示的にロードし、次いで、ウェブ・ベースのデータ分析報告を動かすためにデータベースからデータをフェッチする必要がある。分散型クエリ・エンジンを用いると、オペレータは、Hiveシステムからデータを直接フェッチし、ウェブ・ベースのデータ分析報告を生成させることができる。
令を含むコード770を格納してもよい。
Claims (19)
- 複数のデータ・ノードを有する分散型ストレージ・クラスタに記憶されているデータを格納しているデータベースに対するデータベース・クエリから複数の部分クエリを生成するように、かつ、複数の中間結果に基づきクエリ結果を構築するように構成されているゲートウェイ・サーバと、
複数のワーカ・ノードと、を備え、前記複数のワーカ・ノードの各ワーカ・ノードは、前記複数の部分クエリのそれぞれの部分クエリを、前記それぞれの部分クエリに関係し前記分散型ストレージ・クラスタの少なくとも1つのデータ・ノード上に記憶されているデータを走査することによって処理するように構成されており、前記複数のワーカ・ノードの各ワーカ・ノードは、そのワーカ・ノードのメモリに記憶されている前記複数の中間結果のうちの1つの中間結果を生成するようにさらに構成されている、システム。 - 前記複数のワーカ・ノードの各ワーカ・ノードは、前記複数の部分クエリの前記それぞれの部分クエリを、前記分散型ストレージ・クラスタの前記少なくとも1つのデータ・ノード上に記憶されている前記それぞれの部分クエリに関係している前記データの一部を走査することによって処理するように、かつ、ワーカ・ノードの前記メモリに記憶されている近似の中間結果を生成するようにさらに構成されており、
好適には、前記ゲートウェイ・サーバは、少なくとも1つの近似の中間結果に基づき近似のクエリ結果を構築するようにさらに構成されている、請求項1に記載のシステム。 - 前記ゲートウェイ・サーバは、前記複数の中間結果の一部に基づき近似のクエリ結果を構築するようにさらに構成されている、請求項1または2に記載のシステム。
- 前記ゲートウェイ・サーバは、散在するワーカ・ノードを識別し、前記散在するワーカ・ノードに割り当てられている部分クエリを複数の下位の部分クエリにさらに分割し、前記複数の下位の部分クエリを前記複数のワーカ・ノードの一部に割り当てるように、さらに構成されており、前記散在するワーカ・ノードは、前記ゲートウェイ・サーバに進行割合を報告しないか、所定期間の後に所定値未満の前記進行割合を前記ゲートウェイ・サーバに報告するワーカ・ノードである、請求項1〜3のいずれか一項に記載のシステム。
- 前記複数のワーカ・ノードの各ワーカ・ノードは、前記分散型ストレージ・クラスタ内のそれぞれのデータ・ノードを動かすサービスである、請求項1〜4のいずれか一項に記載のシステム。
- 前記データベースのテーブル・レベル・メタデータおよび前記分散型ストレージ・クラスタのファイル・レベル・メタデータをキャッシュするように構成されているメタデータ・キャッシュをさらに備え、好適には、前記メタデータ・キャッシュは、前記データベース・クエリ用に以前のデータベース・クエリからキャッシュされたメタデータを保持するように構成されている、請求項1〜5のいずれか一項に記載のシステム。
- 前記複数のワーカ・ノードの各ワーカ・ノードは、そのワーカ・ノードによる部分クエリ処理の状態を報告するために、前記ゲートウェイ・サーバにハートビート・メッセージを周期的に送る、請求項1〜6のいずれか一項に記載のシステム。
- 前記ゲートウェイ・サーバは、近似のクエリ結果を返すかまたは前記データベース・クエリの処理を終了する命令をクライアント・デバイスから受け取るようにさらに構成されている、請求項1〜7のいずれか一項に記載のシステム。
- 前記ゲートウェイ・サーバは、前記ワーカ・ノードに対し、近似の中間結果を直ちに返
し、クライアント・デバイスに対する前記近似の中間結果に基づき、近似のクエリ結果を返すようにさらに構成されている、請求項1〜8のいずれか一項に記載のシステム。 - 前記データベース・クエリは、近似のクエリ結果の要求を含む、請求項1〜9のいずれか一項に記載のシステム。
- 前記クエリ結果は、前記クエリ結果について走査されたデータ・ノードに記憶されている関連するデータの一部を示す標識を伴う、請求項1〜10のいずれか一項に記載のシステム。
- 前記データベースは、Hiveデータ・ウェアハウス・システムであり、前記分散型ストレージ・クラスタはHadoopクラスタである、請求項1〜11のいずれか一項に記載のシステム。
- 請求項1〜12のいずれか一項に記載のシステムを用いる方法。
- クライアント・デバイスから複数のデータ・ノードを有する分散型ストレージ・クラスタに記憶されているデータを格納しているデータベースに対するデータベース・クエリを受信する工程と、
前記データベース・クエリを複数の部分クエリに分割する工程と、
複数のワーカ・ノードのそれぞれのワーカ・ノードに前記部分クエリの各々を送信する工程であって、各ワーカ・ノードは前記分散型ストレージ・クラスタのデータ・ノード上で動くサービスである、部分クエリ送信工程と、
前記ワーカ・ノードから前記部分クエリに対する複数の中間結果を取り出す工程であって、各中間結果は前記ワーカ・ノードのそれぞれのワーカ・ノードが該それぞれのワーカ・ノードが動いているデータ・ノードに記憶されている関連するデータを走査することによって処理される、中間結果取出工程と、
前記複数の中間結果に基づきクエリ結果を生成する工程と、を備える方法。 - 前記クライアント・デバイスに前記クエリ結果および部分インジケータを返す工程であって、前記部分インジケータは、前記クエリ結果に対して走査された前記データ・ノードに記憶されている関連するデータの部分を示す、工程をさらに備える、請求項14に記載の方法。
- 前記ワーカ・ノードに対し近似のクエリ結果を直ちに返すように命令する工程をさらに備え、
前記中間結果取出工程は、前記ワーカ・ノードから前記部分クエリに対する複数の近似の中間結果を取り出す工程であって、各近似の中間結果は前記ワーカ・ノードのそれぞれのワーカ・ノードが該それぞれのワーカ・ノードが動いているデータ・ノードに記憶されている関連するデータの一部を走査することによって処理される、工程をさらに備える、請求項14に記載の方法。 - 各部分クエリについて、前記部分クエリに関連するデータを記憶するデータ・ノードに関するメタデータを取り出す工程をさらに備え、
前記部分クエリ送信工程は、前記メタデータに基づき複数のワーカ・ノードのそれぞれのワーカ・ノードに前記部分クエリの各々を送信する工程を含む、請求項14に記載の方法。 - クライアント・デバイスから複数のデータ・ノードを有する分散型ストレージ・クラスタに記憶されているデータを格納しているデータベースに対するデータベース・クエリを
受信する工程と、
前記データベース・クエリを複数の部分クエリに分割する工程と、
複数のワーカ・ノードのそれぞれのワーカ・ノードに前記部分クエリの各々を送信する工程であって、各ワーカ・ノードは前記分散型ストレージ・クラスタのデータ・ノード上で動くサービスである、部分クエリ送信工程と、
散在するワーカ・ノードを識別するワーカ・ノード識別工程と、
前記散在するワーカ・ノードに割り当てられている部分クエリを複数の下位の部分クエリに分割し、前記複数の下位の部分クエリを前記複数のワーカ・ノードの一部に割り当てる工程と、
前記ワーカ・ノードから前記部分クエリに対する複数の中間結果を取り出す工程であって、各中間結果は前記ワーカ・ノードのそれぞれのワーカ・ノードが該それぞれのワーカ・ノードが動いているデータ・ノードに記憶されている関連するデータを走査することによって処理される、中間結果取出工程と、
前記複数の中間結果に基づきクエリ結果を生成する工程と、を備える方法。 - ワーカ・ノード識別工程は、前記ワーカ・ノードが周期的に送信するハートビート・メッセージを監視することによって散在するワーカ・ノードを識別する工程であって、前記散在するワーカ・ノードは、前記散在するワーカ・ノードからのハートビート・メッセージが所定期間のあいだ受信されないとき、または、前記散在するワーカ・ノードから、前記散在するワーカ・ノードによる部分クエリ処理の状態を表す、閾値未満である数を含むハートビート・メッセージが受信されるときに識別される、工程と、を備える請求項18に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/735,820 | 2013-01-07 | ||
US13/735,820 US9081826B2 (en) | 2013-01-07 | 2013-01-07 | System and method for distributed database query engines |
EP13198563.2 | 2013-12-19 | ||
EP13198563.2A EP2752779B1 (en) | 2013-01-07 | 2013-12-19 | System and method for distributed database query engines |
PCT/US2013/077240 WO2014107359A1 (en) | 2013-01-07 | 2013-12-20 | System and method for distributed database query engines |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016509294A true JP2016509294A (ja) | 2016-03-24 |
JP2016509294A5 JP2016509294A5 (ja) | 2016-12-15 |
JP6117378B2 JP6117378B2 (ja) | 2017-04-19 |
Family
ID=49886706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015551711A Active JP6117378B2 (ja) | 2013-01-07 | 2013-12-20 | 分散型データベースクエリ・エンジン用のシステムおよび方法 |
Country Status (11)
Country | Link |
---|---|
US (5) | US9081826B2 (ja) |
EP (2) | EP3096250B1 (ja) |
JP (1) | JP6117378B2 (ja) |
KR (2) | KR102037232B1 (ja) |
CN (2) | CN104903894B (ja) |
AU (1) | AU2013371448B2 (ja) |
BR (1) | BR112015016352A2 (ja) |
CA (1) | CA2896855C (ja) |
IL (1) | IL239717A (ja) |
MX (1) | MX349042B (ja) |
WO (1) | WO2014107359A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016071837A (ja) * | 2014-09-30 | 2016-05-09 | Kddi株式会社 | データ仮想化装置及び大規模データ処理プログラム |
JP2019204433A (ja) * | 2018-05-25 | 2019-11-28 | Zホールディングス株式会社 | 演算システムおよび演算方法 |
US10698913B2 (en) | 2013-01-07 | 2020-06-30 | Facebook, Inc. | System and methods for distributed database query engines |
Families Citing this family (188)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9495381B2 (en) | 2005-01-12 | 2016-11-15 | Wandisco, Inc. | Geographically-distributed file system using coordinated namespace replication over a wide area network |
US9332069B2 (en) | 2012-12-28 | 2016-05-03 | Wandisco, Inc. | Methods, devices and systems for initiating, forming and joining memberships in distributed computing systems |
US9424272B2 (en) * | 2005-01-12 | 2016-08-23 | Wandisco, Inc. | Distributed file system using consensus nodes |
US9361311B2 (en) * | 2005-01-12 | 2016-06-07 | Wandisco, Inc. | Distributed file system using consensus nodes |
US9317572B2 (en) | 2010-03-31 | 2016-04-19 | Cloudera, Inc. | Configuring a system to collect and aggregate datasets |
US9081888B2 (en) | 2010-03-31 | 2015-07-14 | Cloudera, Inc. | Collecting and aggregating log data with fault tolerance |
US9082127B2 (en) | 2010-03-31 | 2015-07-14 | Cloudera, Inc. | Collecting and aggregating datasets for analysis |
US8874526B2 (en) | 2010-03-31 | 2014-10-28 | Cloudera, Inc. | Dynamically processing an event using an extensible data model |
US20120239681A1 (en) | 2011-03-14 | 2012-09-20 | Splunk Inc. | Scalable interactive display of distributed data |
US9128949B2 (en) | 2012-01-18 | 2015-09-08 | Cloudera, Inc. | Memory allocation buffer for reduction of heap fragmentation |
US9172608B2 (en) | 2012-02-07 | 2015-10-27 | Cloudera, Inc. | Centralized configuration and monitoring of a distributed computing cluster |
US9405692B2 (en) | 2012-03-21 | 2016-08-02 | Cloudera, Inc. | Data processing performance enhancement in a distributed file system |
US9338008B1 (en) | 2012-04-02 | 2016-05-10 | Cloudera, Inc. | System and method for secure release of secret information over a network |
US9842126B2 (en) | 2012-04-20 | 2017-12-12 | Cloudera, Inc. | Automatic repair of corrupt HBases |
US9607045B2 (en) | 2012-07-12 | 2017-03-28 | Microsoft Technology Licensing, Llc | Progressive query computation using streaming architectures |
US9264516B2 (en) | 2012-12-28 | 2016-02-16 | Wandisco, Inc. | Methods, devices and systems enabling a secure and authorized induction of a node into a group of nodes in a distributed computing environment |
US9454573B1 (en) | 2013-02-25 | 2016-09-27 | Emc Corporation | Parallel processing database system with a shared metadata store |
US9984083B1 (en) | 2013-02-25 | 2018-05-29 | EMC IP Holding Company LLC | Pluggable storage system for parallel query engines across non-native file systems |
US9342557B2 (en) * | 2013-03-13 | 2016-05-17 | Cloudera, Inc. | Low latency query engine for Apache Hadoop |
US9009215B2 (en) | 2013-03-15 | 2015-04-14 | Wandisco, Inc. | Methods, devices and systems for dynamically managing memberships in replicated state machines within a distributed computing environment |
US9292373B2 (en) * | 2013-03-15 | 2016-03-22 | International Business Machines Corporation | Query rewrites for data-intensive applications in presence of run-time errors |
US9448851B2 (en) * | 2013-06-19 | 2016-09-20 | International Business Machines Corporation | Smarter big data processing using collaborative map reduce frameworks |
US9442967B2 (en) * | 2013-07-25 | 2016-09-13 | Facebook, Inc. | Systems and methods for efficient data ingestion and query processing |
US9477731B2 (en) * | 2013-10-01 | 2016-10-25 | Cloudera, Inc. | Background format optimization for enhanced SQL-like queries in Hadoop |
US9934382B2 (en) | 2013-10-28 | 2018-04-03 | Cloudera, Inc. | Virtual machine image encryption |
US10491663B1 (en) * | 2013-10-28 | 2019-11-26 | Amazon Technologies, Inc. | Heterogeneous computations on homogeneous input data |
US9690671B2 (en) | 2013-11-01 | 2017-06-27 | Cloudera, Inc. | Manifest-based snapshots in distributed computing environments |
US10628417B2 (en) * | 2013-12-01 | 2020-04-21 | Paraccel Llc | Physical planning of database queries using partial solutions |
US8874835B1 (en) | 2014-01-16 | 2014-10-28 | Pure Storage, Inc. | Data placement based on data properties in a tiered storage device system |
US10255320B1 (en) | 2014-01-27 | 2019-04-09 | Microstrategy Incorporated | Search integration |
US11386085B2 (en) | 2014-01-27 | 2022-07-12 | Microstrategy Incorporated | Deriving metrics from queries |
US10635669B1 (en) * | 2014-01-27 | 2020-04-28 | Microstrategy Incorporated | Data engine integration and data refinement |
US9952894B1 (en) | 2014-01-27 | 2018-04-24 | Microstrategy Incorporated | Parallel query processing |
US11921715B2 (en) | 2014-01-27 | 2024-03-05 | Microstrategy Incorporated | Search integration |
US9715515B2 (en) | 2014-01-31 | 2017-07-25 | Microsoft Technology Licensing, Llc | External data access with split index |
US9576039B2 (en) | 2014-02-19 | 2017-02-21 | Snowflake Computing Inc. | Resource provisioning systems and methods |
CN104520815B (zh) * | 2014-03-17 | 2019-03-01 | 华为技术有限公司 | 一种任务调度的方法及装置 |
CA2938768C (en) * | 2014-03-31 | 2020-03-24 | Wandisco, Inc. | Geographically-distributed file system using coordinated namespace replication |
US9667736B2 (en) * | 2014-04-29 | 2017-05-30 | International Business Machines Corporation | Parallel I/O read processing for use in clustered file systems having cache storage |
US20150347508A1 (en) * | 2014-06-02 | 2015-12-03 | Microsoft Corporation | Partial result classification |
US9836506B2 (en) * | 2014-06-11 | 2017-12-05 | International Business Machines Corporation | Dynamic query optimization with pilot runs |
US11487771B2 (en) * | 2014-06-25 | 2022-11-01 | Microsoft Technology Licensing, Llc | Per-node custom code engine for distributed query processing |
US10983859B2 (en) | 2014-08-07 | 2021-04-20 | Pure Storage, Inc. | Adjustable error correction based on memory health in a storage unit |
US9766972B2 (en) * | 2014-08-07 | 2017-09-19 | Pure Storage, Inc. | Masking defective bits in a storage array |
US9082512B1 (en) | 2014-08-07 | 2015-07-14 | Pure Storage, Inc. | Die-level monitoring in a storage cluster |
US9558069B2 (en) | 2014-08-07 | 2017-01-31 | Pure Storage, Inc. | Failure mapping in a storage array |
US11474874B2 (en) | 2014-08-14 | 2022-10-18 | Qubole, Inc. | Systems and methods for auto-scaling a big data system |
US10599648B2 (en) * | 2014-09-26 | 2020-03-24 | Applied Materials, Inc. | Optimized storage solution for real-time queries and data modeling |
US10467569B2 (en) * | 2014-10-03 | 2019-11-05 | Datameer, Inc. | Apparatus and method for scheduling distributed workflow tasks |
US9747333B2 (en) | 2014-10-08 | 2017-08-29 | Cloudera, Inc. | Querying operating system state on multiple machines declaratively |
US10606478B2 (en) * | 2014-10-22 | 2020-03-31 | Qubole, Inc. | High performance hadoop with new generation instances |
US10298709B1 (en) * | 2014-12-31 | 2019-05-21 | EMC IP Holding Company LLC | Performance of Hadoop distributed file system operations in a non-native operating system |
JP2016159499A (ja) * | 2015-02-27 | 2016-09-05 | 京セラドキュメントソリューションズ株式会社 | 機能提供システムおよび機能中継プログラム |
US11294893B2 (en) * | 2015-03-20 | 2022-04-05 | Pure Storage, Inc. | Aggregation of queries |
US10002153B2 (en) | 2015-05-14 | 2018-06-19 | Illumon Llc | Remote data object publishing/subscribing system having a multicast key-value protocol |
US11436667B2 (en) | 2015-06-08 | 2022-09-06 | Qubole, Inc. | Pure-spot and dynamically rebalanced auto-scaling clusters |
US20170004527A1 (en) * | 2015-07-01 | 2017-01-05 | Turn Inc. | Systems, methods, and devices for scalable data processing |
US20170060941A1 (en) * | 2015-08-25 | 2017-03-02 | Futurewei Technologies, Inc. | Systems and Methods for Searching Heterogeneous Indexes of Metadata and Tags in File Systems |
CN105302697B (zh) * | 2015-11-13 | 2018-05-18 | 中国建设银行股份有限公司 | 一种密集数据模型数据库的运行状态监控方法及系统 |
CN106815254B (zh) * | 2015-12-01 | 2020-08-14 | 阿里巴巴集团控股有限公司 | 一种数据处理方法和装置 |
US10394600B2 (en) * | 2015-12-29 | 2019-08-27 | Capital One Services, Llc | Systems and methods for caching task execution |
WO2017190757A1 (en) * | 2016-05-02 | 2017-11-09 | Norcom Information Technology Ag | Distributed data analysis system and method |
US11080207B2 (en) | 2016-06-07 | 2021-08-03 | Qubole, Inc. | Caching framework for big-data engines in the cloud |
US10740328B2 (en) | 2016-06-24 | 2020-08-11 | Microsoft Technology Licensing, Llc | Aggregate-query database system and processing |
US10331668B1 (en) * | 2016-07-19 | 2019-06-25 | Arcadia Data Inc. | Apparatus and method for query processing using analytical view partitions and database partitions |
US9672905B1 (en) | 2016-07-22 | 2017-06-06 | Pure Storage, Inc. | Optimize data protection layouts based on distributed flash wear leveling |
US10262002B2 (en) | 2016-08-11 | 2019-04-16 | International Business Machines Corporation | Consistent execution of partial queries in hybrid DBMS |
CN106354765B (zh) * | 2016-08-19 | 2020-06-26 | 广东亿迅科技有限公司 | 一种基于分布式采集的日志分析系统及方法 |
US10455045B2 (en) | 2016-09-06 | 2019-10-22 | Samsung Electronics Co., Ltd. | Automatic data replica manager in distributed caching and data processing systems |
US10467195B2 (en) * | 2016-09-06 | 2019-11-05 | Samsung Electronics Co., Ltd. | Adaptive caching replacement manager with dynamic updating granulates and partitions for shared flash-based storage system |
US10606664B2 (en) | 2016-09-07 | 2020-03-31 | Qubole Inc. | Heterogeneous auto-scaling big-data clusters in the cloud |
KR101728873B1 (ko) | 2016-09-07 | 2017-05-04 | 주식회사 비트나인 | 그래프 질의 언어 분산처리시스템 및 그 질의 언어 분산처리방법 |
US11567993B1 (en) | 2016-09-26 | 2023-01-31 | Splunk Inc. | Copying buckets from a remote shared storage system to memory associated with a search node for query execution |
US10353965B2 (en) | 2016-09-26 | 2019-07-16 | Splunk Inc. | Data fabric service system architecture |
US11243963B2 (en) | 2016-09-26 | 2022-02-08 | Splunk Inc. | Distributing partial results to worker nodes from an external data system |
US10795884B2 (en) | 2016-09-26 | 2020-10-06 | Splunk Inc. | Dynamic resource allocation for common storage query |
US11586627B2 (en) | 2016-09-26 | 2023-02-21 | Splunk Inc. | Partitioning and reducing records at ingest of a worker node |
US20180089324A1 (en) | 2016-09-26 | 2018-03-29 | Splunk Inc. | Dynamic resource allocation for real-time search |
US11126632B2 (en) | 2016-09-26 | 2021-09-21 | Splunk Inc. | Subquery generation based on search configuration data from an external data system |
US11874691B1 (en) | 2016-09-26 | 2024-01-16 | Splunk Inc. | Managing efficient query execution including mapping of buckets to search nodes |
US11615104B2 (en) | 2016-09-26 | 2023-03-28 | Splunk Inc. | Subquery generation based on a data ingest estimate of an external data system |
US11294941B1 (en) | 2016-09-26 | 2022-04-05 | Splunk Inc. | Message-based data ingestion to a data intake and query system |
US10977260B2 (en) | 2016-09-26 | 2021-04-13 | Splunk Inc. | Task distribution in an execution node of a distributed execution environment |
US11599541B2 (en) | 2016-09-26 | 2023-03-07 | Splunk Inc. | Determining records generated by a processing task of a query |
US11222066B1 (en) | 2016-09-26 | 2022-01-11 | Splunk Inc. | Processing data using containerized state-free indexing nodes in a containerized scalable environment |
US11562023B1 (en) | 2016-09-26 | 2023-01-24 | Splunk Inc. | Merging buckets in a data intake and query system |
US11163758B2 (en) | 2016-09-26 | 2021-11-02 | Splunk Inc. | External dataset capability compensation |
US11620336B1 (en) | 2016-09-26 | 2023-04-04 | Splunk Inc. | Managing and storing buckets to a remote shared storage system based on a collective bucket size |
US11314753B2 (en) | 2016-09-26 | 2022-04-26 | Splunk Inc. | Execution of a query received from a data intake and query system |
US11321321B2 (en) | 2016-09-26 | 2022-05-03 | Splunk Inc. | Record expansion and reduction based on a processing task in a data intake and query system |
US10726009B2 (en) | 2016-09-26 | 2020-07-28 | Splunk Inc. | Query processing using query-resource usage and node utilization data |
US11442935B2 (en) | 2016-09-26 | 2022-09-13 | Splunk Inc. | Determining a record generation estimate of a processing task |
US11250056B1 (en) | 2016-09-26 | 2022-02-15 | Splunk Inc. | Updating a location marker of an ingestion buffer based on storing buckets in a shared storage system |
US11550847B1 (en) | 2016-09-26 | 2023-01-10 | Splunk Inc. | Hashing bucket identifiers to identify search nodes for efficient query execution |
US10956415B2 (en) | 2016-09-26 | 2021-03-23 | Splunk Inc. | Generating a subquery for an external data system using a configuration file |
US10776355B1 (en) | 2016-09-26 | 2020-09-15 | Splunk Inc. | Managing, storing, and caching query results and partial query results for combination with additional query results |
US11663227B2 (en) | 2016-09-26 | 2023-05-30 | Splunk Inc. | Generating a subquery for a distinct data intake and query system |
US11023463B2 (en) | 2016-09-26 | 2021-06-01 | Splunk Inc. | Converting and modifying a subquery for an external data system |
US11461334B2 (en) | 2016-09-26 | 2022-10-04 | Splunk Inc. | Data conditioning for dataset destination |
US11416528B2 (en) * | 2016-09-26 | 2022-08-16 | Splunk Inc. | Query acceleration data store |
US11106734B1 (en) | 2016-09-26 | 2021-08-31 | Splunk Inc. | Query execution using containerized state-free search nodes in a containerized scalable environment |
US11281706B2 (en) | 2016-09-26 | 2022-03-22 | Splunk Inc. | Multi-layer partition allocation for query execution |
US11860940B1 (en) | 2016-09-26 | 2024-01-02 | Splunk Inc. | Identifying buckets for query execution using a catalog of buckets |
US11593377B2 (en) | 2016-09-26 | 2023-02-28 | Splunk Inc. | Assigning processing tasks in a data intake and query system |
US11232100B2 (en) * | 2016-09-26 | 2022-01-25 | Splunk Inc. | Resource allocation for multiple datasets |
US11604795B2 (en) | 2016-09-26 | 2023-03-14 | Splunk Inc. | Distributing partial results from an external data system between worker nodes |
US10984044B1 (en) | 2016-09-26 | 2021-04-20 | Splunk Inc. | Identifying buckets for query execution using a catalog of buckets stored in a remote shared storage system |
US11580107B2 (en) | 2016-09-26 | 2023-02-14 | Splunk Inc. | Bucket data distribution for exporting data to worker nodes |
US11003714B1 (en) | 2016-09-26 | 2021-05-11 | Splunk Inc. | Search node and bucket identification using a search node catalog and a data store catalog |
US11269939B1 (en) | 2016-09-26 | 2022-03-08 | Splunk Inc. | Iterative message-based data processing including streaming analytics |
US9747158B1 (en) | 2017-01-13 | 2017-08-29 | Pure Storage, Inc. | Intelligent refresh of 3D NAND |
US10482096B2 (en) * | 2017-02-13 | 2019-11-19 | Microsoft Technology Licensing, Llc | Distributed index searching in computing systems |
KR101856454B1 (ko) | 2017-03-06 | 2018-05-10 | 주식회사 티맥스데이터 | 분산처리를 위한 컴퓨팅 장치 |
US10552435B2 (en) * | 2017-03-08 | 2020-02-04 | Microsoft Technology Licensing, Llc | Fast approximate results and slow precise results |
US10544955B2 (en) | 2017-03-09 | 2020-01-28 | Johnson Controls Technology Company | Dynamically updatable building management system control platform |
US10846318B1 (en) | 2017-04-18 | 2020-11-24 | Microstrategy Incorporated | Natural language visualizations |
US10209982B2 (en) | 2017-05-16 | 2019-02-19 | Bank Of America Corporation | Distributed storage framework information server platform architecture |
US10733024B2 (en) | 2017-05-24 | 2020-08-04 | Qubole Inc. | Task packing scheduling process for long running applications |
CN109213743B (zh) * | 2017-06-30 | 2021-10-15 | 北京京东尚科信息技术有限公司 | 一种数据查询方法和装置 |
US11921672B2 (en) | 2017-07-31 | 2024-03-05 | Splunk Inc. | Query execution at a remote heterogeneous data store of a data fabric service |
US11989194B2 (en) | 2017-07-31 | 2024-05-21 | Splunk Inc. | Addressing memory limits for partition tracking among worker nodes |
US10198469B1 (en) | 2017-08-24 | 2019-02-05 | Deephaven Data Labs Llc | Computer data system data source refreshing using an update propagation graph having a merged join listener |
US11489355B2 (en) * | 2017-09-04 | 2022-11-01 | Envision Aesc Energy Devices Ltd. | Battery pack, control device, control method, and program |
US10552394B2 (en) | 2017-09-07 | 2020-02-04 | International Business Machines Corporation | Data storage with improved efficiency |
US10896182B2 (en) | 2017-09-25 | 2021-01-19 | Splunk Inc. | Multi-partitioning determination for combination operations |
US11151137B2 (en) | 2017-09-25 | 2021-10-19 | Splunk Inc. | Multi-partition operation in combination operations |
CN107784103A (zh) * | 2017-10-27 | 2018-03-09 | 北京人大金仓信息技术股份有限公司 | 一种访问hdfs分布式存储系统的标准接口 |
KR101966201B1 (ko) * | 2017-11-01 | 2019-04-05 | (주)데이터스트림즈 | 빅 데이터의 실시간 저장 및 검색 시스템 |
US10467112B2 (en) | 2017-11-09 | 2019-11-05 | Bank Of America Corporation | Distributed data monitoring device |
US10331484B2 (en) | 2017-11-14 | 2019-06-25 | Bank Of America Corporation | Distributed data platform resource allocator |
US11228489B2 (en) * | 2018-01-23 | 2022-01-18 | Qubole, Inc. | System and methods for auto-tuning big data workloads on cloud platforms |
WO2019171327A1 (en) * | 2018-03-07 | 2019-09-12 | Open Text Sa Ulc | Flexible and scalable artificial intelligence and analytics platform with flexible content storage and retrieval |
US10904357B1 (en) * | 2018-03-16 | 2021-01-26 | Intuit Inc. | Optimizing request dispatching between services |
US11354696B1 (en) | 2018-03-21 | 2022-06-07 | 84.51, Llc | Systems and methods for implementing a rewards program |
US11138230B2 (en) * | 2018-03-26 | 2021-10-05 | Mcafee, Llc | Methods, apparatus, and systems to aggregate partitioned computer database data |
KR102038527B1 (ko) * | 2018-03-28 | 2019-11-26 | 주식회사 리얼타임테크 | 분산 클러스터 관리 시스템 및 그 방법 |
US10761891B2 (en) | 2018-04-05 | 2020-09-01 | International Business Machines Corporation | Workload management with data access awareness by aggregating file locality information in a computing cluster |
US10768998B2 (en) | 2018-04-05 | 2020-09-08 | International Business Machines Corporation | Workload management with data access awareness in a computing cluster |
US10585714B2 (en) | 2018-04-05 | 2020-03-10 | International Business Machines Corporation | Workload management with data access awareness using an ordered list of hosts in a computing cluster |
CN110309334B (zh) * | 2018-04-20 | 2023-07-18 | 腾讯科技(深圳)有限公司 | 图数据库的查询方法、系统、计算机设备和可读存储介质 |
US11334543B1 (en) | 2018-04-30 | 2022-05-17 | Splunk Inc. | Scalable bucket merging for a data intake and query system |
CN110457971B (zh) * | 2018-05-07 | 2022-09-16 | 腾讯科技(深圳)有限公司 | 重复识别码信息的检测方法和装置 |
CN110866062B (zh) * | 2018-08-09 | 2023-11-24 | 菜鸟智能物流控股有限公司 | 基于分布式集群的数据同步方法以及装置 |
CN108959660B (zh) * | 2018-08-15 | 2021-07-27 | 东北大学 | 一种基于hdfs分布式文件系统的存储方法及使用方法 |
CN109766368B (zh) * | 2018-11-14 | 2021-08-27 | 国云科技股份有限公司 | 一种基于Hive的数据查询多类型视图产出系统及方法 |
CN109767274B (zh) * | 2018-12-05 | 2023-04-25 | 航天信息股份有限公司 | 一种对海量发票数据进行关联存储的方法及系统 |
CN111291040B (zh) * | 2018-12-10 | 2022-10-18 | 中国移动通信集团四川有限公司 | 一种数据处理方法、装置、设备及介质 |
US10902069B2 (en) * | 2018-12-18 | 2021-01-26 | Runtime Collective Limited | Distributed indexing and aggregation |
CN111367954A (zh) * | 2018-12-26 | 2020-07-03 | 中兴通讯股份有限公司 | 数据查询处理方法、装置及系统、计算机可读存储介质 |
WO2020133391A1 (en) * | 2018-12-29 | 2020-07-02 | Alibaba Group Holding Limited | Systems and methods for efficiently scanning a database using hardware acceleration |
US11195050B2 (en) | 2019-02-05 | 2021-12-07 | Microstrategy Incorporated | Machine learning to generate and evaluate visualizations |
CN109815209A (zh) * | 2019-03-20 | 2019-05-28 | 上海电力学院 | 一种用于医院后勤精益管理的分布式存储系统 |
CN110008257B (zh) * | 2019-04-10 | 2024-04-16 | 深圳市腾讯计算机系统有限公司 | 数据处理方法、装置、系统、计算机设备和存储介质 |
WO2020220216A1 (en) | 2019-04-29 | 2020-11-05 | Splunk Inc. | Search time estimate in data intake and query system |
US11715051B1 (en) | 2019-04-30 | 2023-08-01 | Splunk Inc. | Service provider instance recommendations using machine-learned classifications and reconciliation |
US11100109B2 (en) * | 2019-05-03 | 2021-08-24 | Microsoft Technology Licensing, Llc | Querying data in a distributed storage system |
CN110175151A (zh) * | 2019-05-22 | 2019-08-27 | 中国农业科学院农业信息研究所 | 一种农业大数据的处理方法、装置、设备和存储介质 |
US11144360B2 (en) | 2019-05-31 | 2021-10-12 | Qubole, Inc. | System and method for scheduling and running interactive database queries with service level agreements in a multi-tenant processing system |
CN110297827A (zh) * | 2019-05-31 | 2019-10-01 | 国网上海市电力公司 | 一种集合Lucene和Hbase的电力数据检索系统 |
US11704316B2 (en) | 2019-05-31 | 2023-07-18 | Qubole, Inc. | Systems and methods for determining peak memory requirements in SQL processing engines with concurrent subtasks |
US11567957B2 (en) * | 2019-09-25 | 2023-01-31 | Salesforce.Com, Inc. | Incremental addition of data to partitions in database tables |
US11494380B2 (en) | 2019-10-18 | 2022-11-08 | Splunk Inc. | Management of distributed computing framework components in a data fabric service system |
US11429441B2 (en) | 2019-11-18 | 2022-08-30 | Bank Of America Corporation | Workflow simulator |
US11106509B2 (en) | 2019-11-18 | 2021-08-31 | Bank Of America Corporation | Cluster tuner |
KR102178121B1 (ko) * | 2019-12-03 | 2020-11-12 | 아이씨티웨이주식회사 | 웹 기반의 공간 빅데이터 관리 서비스를 제공하는 방법 및 이를 수행하기 위한 명령어들이 저장된 컴퓨터 판독 가능한 저장 매체 |
CN110909048A (zh) * | 2019-12-03 | 2020-03-24 | 北京明略软件系统有限公司 | 数据查询方法、装置、服务器、客户端及存储介质 |
US11614970B2 (en) | 2019-12-06 | 2023-03-28 | Microstrategy Incorporated | High-throughput parallel data transmission |
CN111061791B (zh) * | 2019-12-12 | 2023-04-07 | 广东食品药品职业学院 | 一种中小型电商大数据平台 |
US11567965B2 (en) | 2020-01-23 | 2023-01-31 | Microstrategy Incorporated | Enhanced preparation and integration of data sets |
US11922222B1 (en) | 2020-01-30 | 2024-03-05 | Splunk Inc. | Generating a modified component for a data intake and query system using an isolated execution environment image |
CN111414349A (zh) * | 2020-03-18 | 2020-07-14 | 江苏鸿程大数据技术与应用研究院有限公司 | 交互式统一大数据编程计算平台 |
US11210288B2 (en) | 2020-05-12 | 2021-12-28 | Coupang Corp. | Systems and methods for reducing database query latency |
CN111756732B (zh) * | 2020-06-23 | 2022-07-12 | 北京明朝万达科技股份有限公司 | 数据扫描、管控方法及装置、电子设备、可读存储介质 |
CN111988165B (zh) * | 2020-07-09 | 2023-01-24 | 云知声智能科技股份有限公司 | 一种分布式存储系统使用情况的监控方法及系统 |
CN113254488A (zh) * | 2020-08-05 | 2021-08-13 | 深圳市汉云科技有限公司 | 分布式数据库的数据排序方法及系统 |
US11704313B1 (en) | 2020-10-19 | 2023-07-18 | Splunk Inc. | Parallel branch operation using intermediary nodes |
CN112307066B (zh) * | 2020-11-03 | 2023-04-07 | 平安普惠企业管理有限公司 | 分布式数据聚合方法、系统、设备及存储介质 |
CN112395308A (zh) * | 2020-11-05 | 2021-02-23 | 深圳市中博科创信息技术有限公司 | 一种基于hdfs数据库的数据查询方法 |
KR102265085B1 (ko) * | 2020-12-04 | 2021-06-14 | 김근석 | 코드 분산 처리 서버, 코드 분산 처리 방법 및 기록 매체에 저장된 프로그램 |
CN112835895A (zh) * | 2021-01-27 | 2021-05-25 | 世纪龙信息网络有限责任公司 | 一种数据存储系统及其存储方法 |
US11513876B2 (en) | 2021-02-23 | 2022-11-29 | Sap Se | Resolving data location for queries in a multi-system instance landscape |
US11727022B2 (en) | 2021-03-19 | 2023-08-15 | International Business Machines Corporation | Generating a global delta in distributed databases |
US11704327B2 (en) * | 2021-03-19 | 2023-07-18 | International Business Machines Corporation | Querying distributed databases |
CN113590316A (zh) * | 2021-07-23 | 2021-11-02 | 中共四川省委组织部 | 一种基于国产cpu的数据库集群处理方法 |
CN113609238A (zh) * | 2021-07-24 | 2021-11-05 | 全图通位置网络有限公司 | 基于Hadoop平台的地理实体空间数据的处理方法及存储介质 |
US11645231B1 (en) * | 2022-04-24 | 2023-05-09 | Morgan Stanley Services Group Inc. | Data indexing for distributed query execution and aggregation |
US20230376485A1 (en) * | 2022-05-17 | 2023-11-23 | Sap Se | Distributed query plan generation |
CN115168474B (zh) * | 2022-07-26 | 2023-04-14 | 成都智元汇信息技术股份有限公司 | 一种基于大数据模型的物联中台系统搭建方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001312504A (ja) * | 2000-04-25 | 2001-11-09 | Jarg Corp | 知識抽出システム及びその方法 |
JP2002108670A (ja) * | 2000-09-29 | 2002-04-12 | Hitachi Kokusai Electric Inc | データベースアクセス方法及び多次元データベースアクセスシステム |
JP2002108899A (ja) * | 2000-09-27 | 2002-04-12 | Hitachi Kokusai Electric Inc | データベースアクセス方法及び多次元データベースアクセスシステム |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5987449A (en) | 1996-08-23 | 1999-11-16 | At&T Corporation | Queries on distributed unstructured databases |
US6922791B2 (en) * | 2001-08-09 | 2005-07-26 | Dell Products L.P. | Failover system and method for cluster environment |
AUPR796701A0 (en) | 2001-09-27 | 2001-10-25 | Plugged In Communications Pty Ltd | Database query system and method |
EP1349082A1 (en) | 2002-03-28 | 2003-10-01 | LION Bioscience AG | Method and apparatus for querying relational databases |
US20040103087A1 (en) * | 2002-11-25 | 2004-05-27 | Rajat Mukherjee | Method and apparatus for combining multiple search workers |
WO2005076160A1 (en) | 2004-02-06 | 2005-08-18 | Critical Software, Sa | Data warehouse distributed system and architecture to support distributed query execution |
US7523118B2 (en) * | 2006-05-02 | 2009-04-21 | International Business Machines Corporation | System and method for optimizing federated and ETL'd databases having multidimensionally constrained data |
US7984043B1 (en) * | 2007-07-24 | 2011-07-19 | Amazon Technologies, Inc. | System and method for distributed query processing using configuration-independent query plans |
CN100573524C (zh) * | 2007-07-31 | 2009-12-23 | 武汉大学 | 一种高效、透明的分布式空间数据库查询方法 |
US8468212B2 (en) * | 2007-08-08 | 2013-06-18 | Silicon Image, Inc. | Network repository for metadata |
JP4995750B2 (ja) | 2008-02-06 | 2012-08-08 | 日本電信電話株式会社 | Web検索装置、Web検索方法、プログラムおよび記録媒体 |
US8213924B2 (en) * | 2008-10-06 | 2012-07-03 | Facebook, Inc. | Providing distributed online services for mobile devices |
US20100115100A1 (en) * | 2008-10-30 | 2010-05-06 | Olga Tubman | Federated configuration data management |
US8392402B2 (en) | 2008-12-03 | 2013-03-05 | International Business Machines Corporation | Hybrid push/pull execution of continuous SQL queries |
US8219552B2 (en) | 2009-10-07 | 2012-07-10 | International Business Machines Corporation | Information theory based result merging for searching hierarchical entities across heterogeneous data sources |
US9043319B1 (en) * | 2009-12-07 | 2015-05-26 | Google Inc. | Generating real-time search results |
US8874961B2 (en) * | 2010-03-22 | 2014-10-28 | Infosys Limited | Method and system for automatic failover of distributed query processing using distributed shared memory |
KR101183768B1 (ko) * | 2010-08-13 | 2012-09-17 | 삼성에스디에스 주식회사 | 통합 뷰 제공 시스템 및 방법 그리고 이에 적용되는 뷰 생성 기능을 가지는 서버 |
US8775425B2 (en) * | 2010-08-24 | 2014-07-08 | International Business Machines Corporation | Systems and methods for massive structured data management over cloud aware distributed file system |
US10579634B2 (en) * | 2012-08-30 | 2020-03-03 | Citus Data Bilgi Islemleri Ticaret A.S. | Apparatus and method for operating a distributed database with foreign tables |
US9081826B2 (en) | 2013-01-07 | 2015-07-14 | Facebook, Inc. | System and method for distributed database query engines |
US10185744B2 (en) * | 2015-06-23 | 2019-01-22 | Sap Se | Caching views on historical data |
-
2013
- 2013-01-07 US US13/735,820 patent/US9081826B2/en active Active
- 2013-12-19 EP EP16176465.9A patent/EP3096250B1/en active Active
- 2013-12-19 EP EP13198563.2A patent/EP2752779B1/en active Active
- 2013-12-20 KR KR1020177024191A patent/KR102037232B1/ko active IP Right Grant
- 2013-12-20 CA CA2896855A patent/CA2896855C/en not_active Expired - Fee Related
- 2013-12-20 AU AU2013371448A patent/AU2013371448B2/en not_active Ceased
- 2013-12-20 MX MX2015008799A patent/MX349042B/es active IP Right Grant
- 2013-12-20 KR KR1020157020768A patent/KR101775433B1/ko active IP Right Grant
- 2013-12-20 CN CN201380069759.9A patent/CN104903894B/zh active Active
- 2013-12-20 WO PCT/US2013/077240 patent/WO2014107359A1/en active Application Filing
- 2013-12-20 CN CN201811509796.8A patent/CN110069526A/zh active Pending
- 2013-12-20 BR BR112015016352A patent/BR112015016352A2/pt active Search and Examination
- 2013-12-20 JP JP2015551711A patent/JP6117378B2/ja active Active
-
2015
- 2015-06-02 US US14/728,966 patent/US9361344B2/en active Active
- 2015-06-30 IL IL239717A patent/IL239717A/en active IP Right Grant
-
2016
- 2016-03-08 US US15/064,559 patent/US10210221B2/en active Active
-
2018
- 2018-12-19 US US16/226,051 patent/US10698913B2/en active Active
-
2020
- 2020-05-12 US US15/930,008 patent/US11347761B1/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001312504A (ja) * | 2000-04-25 | 2001-11-09 | Jarg Corp | 知識抽出システム及びその方法 |
JP2002108899A (ja) * | 2000-09-27 | 2002-04-12 | Hitachi Kokusai Electric Inc | データベースアクセス方法及び多次元データベースアクセスシステム |
JP2002108670A (ja) * | 2000-09-29 | 2002-04-12 | Hitachi Kokusai Electric Inc | データベースアクセス方法及び多次元データベースアクセスシステム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10698913B2 (en) | 2013-01-07 | 2020-06-30 | Facebook, Inc. | System and methods for distributed database query engines |
US11347761B1 (en) | 2013-01-07 | 2022-05-31 | Meta Platforms, Inc. | System and methods for distributed database query engines |
JP2016071837A (ja) * | 2014-09-30 | 2016-05-09 | Kddi株式会社 | データ仮想化装置及び大規模データ処理プログラム |
JP2019204433A (ja) * | 2018-05-25 | 2019-11-28 | Zホールディングス株式会社 | 演算システムおよび演算方法 |
JP7313123B2 (ja) | 2018-05-25 | 2023-07-24 | ヤフー株式会社 | 演算システムおよび演算方法 |
Also Published As
Publication number | Publication date |
---|---|
IL239717A0 (en) | 2015-08-31 |
JP6117378B2 (ja) | 2017-04-19 |
CN110069526A (zh) | 2019-07-30 |
AU2013371448B2 (en) | 2017-02-16 |
BR112015016352A2 (pt) | 2017-07-11 |
US20150261831A1 (en) | 2015-09-17 |
US20160188677A1 (en) | 2016-06-30 |
WO2014107359A1 (en) | 2014-07-10 |
CN104903894A (zh) | 2015-09-09 |
US20140195558A1 (en) | 2014-07-10 |
CA2896855C (en) | 2016-11-01 |
CN104903894B (zh) | 2018-12-28 |
MX2015008799A (es) | 2016-04-25 |
KR20150104585A (ko) | 2015-09-15 |
EP3096250A1 (en) | 2016-11-23 |
IL239717A (en) | 2017-04-30 |
EP2752779A2 (en) | 2014-07-09 |
US10210221B2 (en) | 2019-02-19 |
MX349042B (es) | 2017-07-07 |
KR101775433B1 (ko) | 2017-09-06 |
AU2013371448A1 (en) | 2015-07-23 |
CA2896855A1 (en) | 2014-07-10 |
KR102037232B1 (ko) | 2019-10-28 |
US10698913B2 (en) | 2020-06-30 |
EP3096250B1 (en) | 2019-02-20 |
US9081826B2 (en) | 2015-07-14 |
US11347761B1 (en) | 2022-05-31 |
EP2752779B1 (en) | 2016-06-29 |
KR20170103021A (ko) | 2017-09-12 |
EP2752779A3 (en) | 2015-02-18 |
US20190121809A1 (en) | 2019-04-25 |
US9361344B2 (en) | 2016-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11347761B1 (en) | System and methods for distributed database query engines | |
JP7130600B2 (ja) | ファーストクラスデータベース要素としての半構造データの実装 | |
US10581957B2 (en) | Multi-level data staging for low latency data access | |
US10223431B2 (en) | Data stream splitting for low-latency data access | |
US10127275B2 (en) | Mapping query operations in database systems to hardware based query accelerators | |
US10599648B2 (en) | Optimized storage solution for real-time queries and data modeling | |
EP2765517B1 (en) | Data stream splitting for low-latency data access | |
US11868352B2 (en) | Systems and methods for spilling data for hash joins | |
CN112732704B (zh) | 一种数据处理方法、装置及存储介质 | |
CN113641750A (zh) | 一种企业大数据分析平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161026 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161026 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20161026 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20161128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170322 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6117378 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |