JP5818394B2 - 大量データプラットフォームを操作するシステム及び方法 - Google Patents
大量データプラットフォームを操作するシステム及び方法 Download PDFInfo
- Publication number
- JP5818394B2 JP5818394B2 JP2014541254A JP2014541254A JP5818394B2 JP 5818394 B2 JP5818394 B2 JP 5818394B2 JP 2014541254 A JP2014541254 A JP 2014541254A JP 2014541254 A JP2014541254 A JP 2014541254A JP 5818394 B2 JP5818394 B2 JP 5818394B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage system
- query
- client
- client data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/221—Column-oriented storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2365—Ensuring data consistency and integrity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
Description
本出願は、2011年11月10日に出願された米国暫定特許出願第61/558,395号の利益を請求する。この出願は、全体が参照により組み込まれている。
図1に示すように本発明の好ましい実施例の大量データプラットフォームを操作するシステム100は、離散イベントチャネルと一体化したクライアントデータエージェント110と、遠隔分散型ストレージシステム120と、問い合わせ処理クラスタ130と、問い合わせインターフェース140を具える。遠隔分散ストレージシステムは、更に、リアルタイムストレージシステム122とアーカイブストレージシステム124を具える。このシステムは、あらゆる基盤にアプリケーションを構築できるように機能して、特殊かつ専門的な基盤のデータ処理能力から利益を得ている。このシステムは、クライアントのアプリケーションから独立して機能するので、大量のデータ処理の要求が、クライアントの単純なインターフェースに取り込まれる。このシステムは、好ましくは、分散した計算環境に配置した列ベースのアーカイブストレージシステム124とデータ集約型問い合わせ処理クラスタ130を使用して、拡張可能なシステム上で迅速なデータの相互作用を可能にしている。このシステムは、更に、マルチテナントサービスとして機能するように構成して、様々なクライアントがシステムを同時に使用できるようにしてもよい。様々なユーザのデータは、好ましくは安全に、他のユーザデータから隔離されたフォーマットで保管される。問い合わせ処理クラスタは、好ましくは、マルチテナント基盤のユーザが共用する。システム100は、テラバイト、ペタバイト、あるいはより大きなデータサイズで測定されるデータセットなど、大量のデータセットに使用するのに適している。このシステムは、アプリケーションを操作するときに周期的に直面する一般的な分散された組織化されていないデータを使用し、このような組織化されていないデータを大量のデータセットから組織化されたデータに変換するときに利点がある。関連する利点として、このシステムは、既存のアプリケーションとデータソースを、大量データプラットフォームから容易にかつ有機的に利益を享受させることができる。このことは、大量のデータ処理について考慮することなく設計された既存のアプリケーションとデータソースにも当てはまる。言い換えれば、このシステムによって、伝統的なアプリケーションが、非伝統的なデータマネージメントツールを必要とするデータの分析から利益を享受することができる。図2に示すように、このシステムは、好ましくは、Hadoopと、いくつかのベースコンポーネントについてのクラウドホスティングサービスを利用して構築できる。このシステムは、代替的に、適宜のコンポーネントを具えていてもよく、あるいは適宜の基盤に構築することもできる。
図6に示すように、好ましい実施例のデータ集約型基盤と一体化する方法には、離散したクライアントデータを読み出すステップS110と;遠隔ストレージシステムに離散したクライアントデータを保存するステップS120とを具え;このデータを保存するステップが、クライアントデータをリアルタイムストレージシステムに保存するステップS122と;列フォーマットのクライアントデータをアーカイブストレージシステムに保存するステップS124と;ユーザインターフェースを介してデータリクエストを受信するステップS130と;リアルタイムストレージシステムとアーカイブストレージシステムからのデータと選択的に更新するステップS140と;を具える。この方法は、いずれかの基盤に構築したアプリケーションが、大量データに特化した基盤のデータ処理能力から利益を受けられるように機能する。この方法は、好ましくは、列ベースで分散されたアーカイブストレージシステムとデータ集約型処理クラスタ(例えば、Hadoop)を利用して、迅速かつ拡張可能なデータ分析及びサービスを提供する。この方法は、広範囲にわたるクライアントタイプの非組織化された分散イベント記録を取り、このデータを問い合わせ可能に組織化されたデータに変換する。この方法は、大量データアプリケーション(例えば、テラバイトより大きいデータセット、又は、いくつかのケースではペタバイト)に好ましく使用される。この方法は、データ処理サービスプロバイダに好ましく利用される。サービスプロバイダは、好ましくは、マルチテナント環境で複数クライアントがこの基盤を利用できるようにする。この方法は、好ましくは上述のシステムに実装されるが、代替的に適宜のシステムにこの方法を実装するようにしてもよい。
Claims (19)
- 大量データプラットフォームを動作させる方法において:
当該方法が、コンピュータで読み取り可能な媒体に記憶された指示をコンピュータで実行可能な構成要素で実行することによって実施され、前記方法が、マルチテナントデータ分析プラットホームで、
離散したクライアントデータであって、独自の識別子を介して前記マルチテナントデータ分析プラットホームのユーザアカウントに関連するクライアントデータ、を受信するステップと;
ネットワークにアクセス可能な分散ストレージシステムに前記クライアントデータを保存するステップであって:
行フォーマットで前記クライアントデータをリアルタイムストレージシステムに保存するステップと;
前記クライアントデータを列ベースで分散したアーカイブストレージシステムに保存するステップであって、前記アーカイブデータストレージシステムに保存される前記クライアントデータが、前記クライアントデータに関連する前記ユーザアカウントに応じて分離される、ステップと;
を具えるステップと;
問い合わせインターフェースを介してデータ問い合わせを受信するステップと;
データマッピング処理と削減処理に従って前記リアルタイムストレージシステムとアーカイブストレージシステムからの前記クライアントデータと選択的にインターフェースを取ることによって前記データ問い合わせを処理するステップと;
を具えており、当該データ問い合わせを処理するステップが、
前記リアルタイムストレージシステムとアーカイブストレージシステムに協調的に問い合わせを行うステップと、
前記リアルタイムストレージシステムとアーカイブストレージシステムに亘って前記データ問い合わせを分散させて、単一のまとまった問い合わせ結果を引き出すステップと具えており、
前記クライアントデータを列ベースで分散したアーカイブストレージシステムに保存するステップが、
列フォーマットで前記アーカイブストレージシステムに前記クライアントデータを記憶するステップを具えており、
前記アーカイブストレージシステムからの前記クライアントデータとインターフェースを取ることが、
問い合わせ処理クラスタを用いることによって、前記マッピング処理と削減処理に前記データ問い合わせの少なくとも一部を変換するステップと、
前記問い合わせ処理クラスタを用いることによって、前記マッピング処理と削減処理を実行するステップと、
を具えることを特徴とする方法。 - 請求項1に記載の方法において、前記分散クライアントデータが動的スキーマで受信され保存されることを特徴とする方法。
- 請求項2に記載の方法において、前記データ問い合わせが、スキーマ定義を具え、前記クライアントデータと選択的にインターフェースを取るステップが、前記動的スキーマに前記スキーマ定義を適用するステップを具えることを特徴とする方法。
- 請求項1に記載の方法が更に、クライアントデータエージェントにおいて、クライアントデータを回収するステップと、前記データ分析プラットフォームに前記クライアントデータを転送するステップと、を具えることを特徴とする方法。
- 請求項4に記載の方法において、前記クライアントデータエージェントが、クライアントデータを回収するイベントチャネルに一体化されていることを特徴とする方法。
- 請求項5に記載の方法において、前記イベントチャネルが、システムログ、関連データベース、クラウドデータ、及びセンサデータからなるリストから選択されることを特徴とする方法。
- 請求項4に記載の方法が更に、前記クライアントデータエージェントにおいて、データを、前記データ分析プラットフォームに送信されたバイナリシリアル化データ交換にシリアル化するステップを具えることを特徴とする方法。
- 請求項4に記載の方法において、クライアントデータを回収するステップが、クライアントエージェントデータ入力プラグインを介して回収されることを特徴とする方法。
- 請求項1に記載の方法において、前記列ベースの分散アーカイブストレージシステムが、時系列順クライアントデータを保存し、クライアントデータと選択的にインターフェースを取るステップが、分散ストレージシステムからのデータを問い合わせるステップを具えることを特徴とする方法。
- 請求項1に記載の方法において、データ問合わせを受信するステップが、関連するデータベーススタイルの問い合わせを、大量データクラスタ問い合わせプロセスに変換するステップを具えることを特徴とする方法。
- 請求項1に記載の方法において、前記データ問い合わせを、インフォグラフィックスインターフェースを介して受信し、この方法が、前記選択的にインターフェースを取ったクライアントデータからインフォグラフィックを戻すステップを具えることを特徴とする方法。
- 請求項1に記載の方法において、データ問い合わせを受信するステップが、ビジネスインテリジェンスツールドライバを介して受信するステップを具え、この方法が、データ分析結果を前記ビジネスインテリジェンスツールドライバに戻すステップを具えることを特徴とする方法。
- 請求項1に記載の方法が更に、クライアントデータエージェントにおいて、クライアントデータを回収し、当該クライアントデータを前記データ分析プラットフォームに送信するステップを具え;前記列ベースの分散アーカイブストレージシステムが、動的スキーマを用いてクライアントデータを時系列順に保存し、クライアントデータと選択的にインターフェースを取るステップが、リアルタイムストレージシステムとアーカイブストレージシステムからまとまった問い合わせ結果を求めて、協調的にデータ問い合わせを行うステップを具えることを特徴とする方法。
- 請求項13に記載の方法において、分散ストレージシステムが一ペタバイト以上のデータを具えることを特徴とする方法。
- 請求項1に記載の方法において、前記マッピング処理及び削減処理が、MapReduce処理であることを特徴とする方法。
- 請求項1に記載の方法において、前記問い合わせ処理クラスタが、MapReduce処理を実行するよう構築され、前記マッピング処理及び削減処理が、MapReduce処理であることを特徴とする方法。
- 請求項1に記載の方法において、前記問い合わせ処理クラスタが、MapReduce処理を実行するよう構築されるHadoop対応クラスタを有しており、前記マッピング処理及び削減処理が、MapReduce処理であることを特徴とする方法。
- 請求項1に記載の方法において、前記問い合わせ結果が構造化データを有することを特徴とする方法。
- 大量データプラットフォームを動作させる方法において、
当該方法が、コンピュータで読み取り可能な媒体に記憶された指示をコンピュータで実行可能な構成要素で実行することによって実施され、前記方法が、マルチテナントデータ分析プラットホームで、
離散したクライアントデータであって、独自の識別子を介して前記マルチテナントデータ分析プラットホームのユーザアカウントに関連するクライアントデータ、を受信するステップと、
リアルタイムストレージシステム及び列ベースの分散したアーカイブストレージシステムを有するネットワークにアクセス可能な分散ストレージシステムに前記クライアントデータを保存するステップであって、
行フォーマットで前記リアルタイムストレージシステムに前記クライアントデータを保存するステップと、
前記クライアントデータを列フォーマットで前記アーカイブストレージシステムに保存するステップであって、前記アーカイブデータストレージシステムに保存される前記クライアントデータが、前記クライアントデータに関連する前記ユーザアカウントに応じて分離される、ステップと、
を具えるステップと、
問い合わせインターフェースを介してデータ問い合わせを受信するステップと、
前記リアルタイムストレージシステム及びアーカイブストレージシステムからの前記クライアントデータと選択的にインターフェースを取ることによって前記データ問い合わせを処理するステップであって、当該データ問い合わせを処理するステップが、前記リアルタイムストレージシステムとアーカイブストレージシステムに協調的に問い合わせを行うステップと、前記リアルタイムストレージシステムとアーカイブストレージシステムに亘って前記データ問い合わせを分散させて、単一のまとまった問い合わせ結果を引き出すステップと具えており、
前記アーカイブストレージシステムからの前記クライアントデータとインターフェースを取ることが、
問い合わせ処理クラスタを用いることによって、前記MapReduceマッピング処理とMapReduce削減処理に前記データ問い合わせを変換するステップと、
前記問い合わせ処理クラスタを用いることによって、前記MapReduceマッピング処理とMapReduce削減処理を実行するステップと、
を具えており、
前記問い合わせ処理クラスタが、MapReduce処理を実行するよう構築されるHadoop対応クラスタを有することを特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161558395P | 2011-11-10 | 2011-11-10 | |
US61/558,395 | 2011-11-10 | ||
PCT/US2012/064089 WO2013070873A1 (en) | 2011-11-10 | 2012-11-08 | System and method for operating a big-data platform |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015501976A JP2015501976A (ja) | 2015-01-19 |
JP5818394B2 true JP5818394B2 (ja) | 2015-11-18 |
Family
ID=48281607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014541254A Active JP5818394B2 (ja) | 2011-11-10 | 2012-11-08 | 大量データプラットフォームを操作するシステム及び方法 |
Country Status (3)
Country | Link |
---|---|
US (2) | US20130124483A1 (ja) |
JP (1) | JP5818394B2 (ja) |
WO (1) | WO2013070873A1 (ja) |
Families Citing this family (87)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8332365B2 (en) | 2009-03-31 | 2012-12-11 | Amazon Technologies, Inc. | Cloning and recovery of data volumes |
US9082127B2 (en) | 2010-03-31 | 2015-07-14 | Cloudera, Inc. | Collecting and aggregating datasets for analysis |
US9081888B2 (en) | 2010-03-31 | 2015-07-14 | Cloudera, Inc. | Collecting and aggregating log data with fault tolerance |
US8874526B2 (en) | 2010-03-31 | 2014-10-28 | Cloudera, Inc. | Dynamically processing an event using an extensible data model |
TW201322022A (zh) * | 2011-11-24 | 2013-06-01 | Alibaba Group Holding Ltd | 分散式資料流處理方法及其系統 |
US9361263B1 (en) * | 2011-12-21 | 2016-06-07 | Emc Corporation | Co-located clouds, vertically integrated clouds, and federated clouds |
US8768927B2 (en) * | 2011-12-22 | 2014-07-01 | Sap Ag | Hybrid database table stored as both row and column store |
US9864817B2 (en) * | 2012-01-28 | 2018-01-09 | Microsoft Technology Licensing, Llc | Determination of relationships between collections of disparate media types |
US9338008B1 (en) | 2012-04-02 | 2016-05-10 | Cloudera, Inc. | System and method for secure release of secret information over a network |
WO2014124671A1 (en) * | 2013-02-14 | 2014-08-21 | Nokia Solutions And Networks Oy | Method of adapting operation of self-organizing network functions |
US9418241B2 (en) * | 2013-02-15 | 2016-08-16 | Infosys Limited | Unified platform for big data processing |
US9342557B2 (en) | 2013-03-13 | 2016-05-17 | Cloudera, Inc. | Low latency query engine for Apache Hadoop |
US9811938B2 (en) | 2013-03-14 | 2017-11-07 | Business Objects Software Ltd. | Methods, apparatus and system for analytics replay utilizing random sampling |
US8996889B2 (en) | 2013-03-29 | 2015-03-31 | Dropbox, Inc. | Portable computing device with methodologies for client-side analytic data collection |
TWI506456B (zh) * | 2013-05-23 | 2015-11-01 | Chunghwa Telecom Co Ltd | 基於Hadoop多叢集環境的工作分派系統及方法 |
US10078683B2 (en) | 2013-07-02 | 2018-09-18 | Jpmorgan Chase Bank, N.A. | Big data centralized intelligence system |
US20150032743A1 (en) * | 2013-07-18 | 2015-01-29 | CIMCON Software, Inc. | Analyzing files using big data tools |
US10133800B2 (en) | 2013-09-11 | 2018-11-20 | Microsoft Technology Licensing, Llc | Processing datasets with a DBMS engine |
US20150073958A1 (en) * | 2013-09-12 | 2015-03-12 | Bank Of America Corporation | RESEARCH REPORT RECOMMENDATION ENGINE ("R+hu 3 +lE") |
WO2015038224A1 (en) * | 2013-09-13 | 2015-03-19 | Nec Laboratories America, Inc. | Systems and methods for tuning multi-store systems to speed up big data query workload |
US9477731B2 (en) * | 2013-10-01 | 2016-10-25 | Cloudera, Inc. | Background format optimization for enhanced SQL-like queries in Hadoop |
US9794135B2 (en) | 2013-11-11 | 2017-10-17 | Amazon Technologies, Inc. | Managed service for acquisition, storage and consumption of large-scale data streams |
US9720989B2 (en) | 2013-11-11 | 2017-08-01 | Amazon Technologies, Inc. | Dynamic partitioning techniques for data streams |
US10635644B2 (en) | 2013-11-11 | 2020-04-28 | Amazon Technologies, Inc. | Partition-based data stream processing framework |
CA2930026C (en) * | 2013-11-11 | 2020-06-16 | Amazon Technologies, Inc. | Data stream ingestion and persistence techniques |
TWI544342B (zh) | 2013-12-17 | 2016-08-01 | 緯創資通股份有限公司 | 伺服器品質驗證方法及其系統 |
WO2015125225A1 (ja) * | 2014-02-19 | 2015-08-27 | 株式会社日立製作所 | データ処理システム及びデータ処理方法 |
US10853536B1 (en) * | 2014-12-11 | 2020-12-01 | Imagars Llc | Automatic requirement verification engine and analytics |
US9785510B1 (en) | 2014-05-09 | 2017-10-10 | Amazon Technologies, Inc. | Variable data replication for storage implementing data backup |
US9892179B2 (en) | 2014-05-21 | 2018-02-13 | International Business Machines Corporation | Managing queries in business intelligence platforms |
US11080244B2 (en) | 2014-05-28 | 2021-08-03 | Hewlett Packard Enterprise Development Lp | Inter-version mapping of distributed file systems |
CN105205082A (zh) | 2014-06-27 | 2015-12-30 | 国际商业机器公司 | 用于处理hdfs中的文件存储的方法和系统 |
CN104077398B (zh) * | 2014-06-30 | 2017-09-22 | 中华电信股份有限公司 | 基于Hadoop多丛集环境的工作分派系统及方法 |
CN104112010B (zh) * | 2014-07-16 | 2017-09-01 | 深圳国泰安教育技术股份有限公司 | 一种数据存储方法及装置 |
US11474874B2 (en) | 2014-08-14 | 2022-10-18 | Qubole, Inc. | Systems and methods for auto-scaling a big data system |
US9734021B1 (en) | 2014-08-18 | 2017-08-15 | Amazon Technologies, Inc. | Visualizing restoration operation granularity for a database |
CN104156465B (zh) * | 2014-08-22 | 2018-07-20 | 金石易诚(北京)科技有限公司 | 一种实时网页同步及后台分布式数据存储系统 |
WO2016065198A1 (en) * | 2014-10-22 | 2016-04-28 | Qubole, Inc. | High performance hadoop with new generation instances |
US10046457B2 (en) | 2014-10-31 | 2018-08-14 | General Electric Company | System and method for the creation and utilization of multi-agent dynamic situational awareness models |
AU2015201361B2 (en) * | 2014-11-14 | 2017-03-02 | Tata Consultancy Services Limited | A method and system for efficient performance prediction of structured query for big data |
US10097659B1 (en) * | 2014-12-16 | 2018-10-09 | Amazon Technologies, Inc. | High performance geographically distributed data storage, retrieval and update |
US10459881B2 (en) | 2015-02-27 | 2019-10-29 | Podium Data, Inc. | Data management platform using metadata repository |
US10671565B2 (en) * | 2015-04-24 | 2020-06-02 | Quest Software Inc. | Partitioning target data to improve data replication performance |
US9658794B2 (en) | 2015-05-08 | 2017-05-23 | Sonicwall Inc. | Two stage memory allocation using a cache |
US11436667B2 (en) | 2015-06-08 | 2022-09-06 | Qubole, Inc. | Pure-spot and dynamically rebalanced auto-scaling clusters |
US10303786B2 (en) * | 2015-08-05 | 2019-05-28 | International Business Machines Corporation | Retrieving and displaying data from a columnar database |
US10496545B2 (en) * | 2015-11-24 | 2019-12-03 | Hewlett Packard Enterprise Development Lp | Data caching in a large-scale processing environment |
US9798762B2 (en) | 2015-11-30 | 2017-10-24 | International Business Machines Corporation | Real time big data master data management |
US10235780B2 (en) | 2015-12-18 | 2019-03-19 | Dropbox, Inc. | Integrated data exploration, modeling and visualization |
US10423493B1 (en) | 2015-12-21 | 2019-09-24 | Amazon Technologies, Inc. | Scalable log-based continuous data protection for distributed databases |
US10567500B1 (en) | 2015-12-21 | 2020-02-18 | Amazon Technologies, Inc. | Continuous backup of data in a distributed data store |
US10853182B1 (en) | 2015-12-21 | 2020-12-01 | Amazon Technologies, Inc. | Scalable log-based secondary indexes for non-relational databases |
US10067817B2 (en) | 2016-05-25 | 2018-09-04 | International Business Machines Corporation | Equipment failure risk detection and prediction in industrial process |
US11080207B2 (en) | 2016-06-07 | 2021-08-03 | Qubole, Inc. | Caching framework for big-data engines in the cloud |
WO2018043767A1 (ko) * | 2016-08-30 | 2018-03-08 | 디포커스(주) | 데이터 에이전트 컨테이너를 이용한 데이터 수집 방법 및 이의 시스템 |
US10606664B2 (en) | 2016-09-07 | 2020-03-31 | Qubole Inc. | Heterogeneous auto-scaling big-data clusters in the cloud |
US10614092B2 (en) | 2017-01-24 | 2020-04-07 | International Business Machines Corporation | Optimizing data retrieval operation in big-data processing systems |
CN107016128A (zh) * | 2017-05-16 | 2017-08-04 | 郑州云海信息技术有限公司 | 一种数据处理方法及装置 |
US10733024B2 (en) | 2017-05-24 | 2020-08-04 | Qubole Inc. | Task packing scheduling process for long running applications |
CN107665233B (zh) * | 2017-07-24 | 2020-07-31 | 深圳壹账通智能科技有限公司 | 数据库数据处理方法、装置、计算机设备和存储介质 |
US10754844B1 (en) | 2017-09-27 | 2020-08-25 | Amazon Technologies, Inc. | Efficient database snapshot generation |
US10990581B1 (en) | 2017-09-27 | 2021-04-27 | Amazon Technologies, Inc. | Tracking a size of a database change log |
US11182372B1 (en) | 2017-11-08 | 2021-11-23 | Amazon Technologies, Inc. | Tracking database partition change log dependencies |
US11042503B1 (en) | 2017-11-22 | 2021-06-22 | Amazon Technologies, Inc. | Continuous data protection and restoration |
US11269731B1 (en) | 2017-11-22 | 2022-03-08 | Amazon Technologies, Inc. | Continuous data protection |
CN107895046B (zh) * | 2017-11-30 | 2021-02-23 | 广东奥飞数据科技股份有限公司 | 一种异构数据集成平台 |
CN109981698B (zh) * | 2017-12-27 | 2022-03-04 | 博元森禾信息科技(北京)有限公司 | 基于元数据的数联网跨域数据访问标准化系统及方法 |
US11228489B2 (en) | 2018-01-23 | 2022-01-18 | Qubole, Inc. | System and methods for auto-tuning big data workloads on cloud platforms |
US10621049B1 (en) | 2018-03-12 | 2020-04-14 | Amazon Technologies, Inc. | Consistent backups based on local node clock |
US10719508B2 (en) * | 2018-04-19 | 2020-07-21 | Risk Management Solutions, Inc. | Data storage system for providing low latency search query responses |
US11070600B1 (en) | 2018-07-16 | 2021-07-20 | Amazon Technologies, Inc. | Optimization techniques to support lagging readers at streaming data service |
US10956246B1 (en) | 2018-07-16 | 2021-03-23 | Amazon Technologies, Inc. | Isolated read channel management interfaces at streaming data service |
US11075984B1 (en) | 2018-07-16 | 2021-07-27 | Amazon Technologies, Inc. | Workload management at streaming data service supporting persistent connections for reads |
US10855754B1 (en) | 2018-07-16 | 2020-12-01 | Amazon Technologies, Inc. | Isolated read channel categories at streaming data service |
US10798140B1 (en) | 2018-07-16 | 2020-10-06 | Amazon Technologies, Inc. | Stream data record reads using push-mode persistent connections |
US10768830B1 (en) | 2018-07-16 | 2020-09-08 | Amazon Technologies, Inc. | Streaming data service with isolated read channels |
US11126505B1 (en) | 2018-08-10 | 2021-09-21 | Amazon Technologies, Inc. | Past-state backup generator and interface for database systems |
CN109542871A (zh) * | 2018-10-23 | 2019-03-29 | 高新兴科技集团股份有限公司 | 多源数据管理方法、系统和数据管理设备 |
US11120034B2 (en) * | 2018-11-13 | 2021-09-14 | Sap Se | Automatic routing of connection requests in business intelligence (BI) tools |
US11042454B1 (en) | 2018-11-20 | 2021-06-22 | Amazon Technologies, Inc. | Restoration of a data source |
CN111490999A (zh) * | 2019-01-28 | 2020-08-04 | 上海菲碧文化传媒有限公司 | 一种基于Hadoop的大数据处理分析平台 |
US11704316B2 (en) | 2019-05-31 | 2023-07-18 | Qubole, Inc. | Systems and methods for determining peak memory requirements in SQL processing engines with concurrent subtasks |
US11144360B2 (en) | 2019-05-31 | 2021-10-12 | Qubole, Inc. | System and method for scheduling and running interactive database queries with service level agreements in a multi-tenant processing system |
US11061856B2 (en) | 2019-07-03 | 2021-07-13 | Bank Of America Corporation | Data ingestion system |
US11747978B2 (en) | 2019-07-23 | 2023-09-05 | International Business Machines Corporation | Data compaction in distributed storage system |
US11507622B2 (en) | 2020-03-25 | 2022-11-22 | The Toronto-Dominion Bank | System and method for automatically managing storage resources of a big data platform |
CN113515610B (zh) * | 2021-06-21 | 2022-09-13 | 中盾创新数字科技(北京)有限公司 | 一种基于面向对象语言处理的档案管理方法 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5966126A (en) * | 1996-12-23 | 1999-10-12 | Szabo; Andrew J. | Graphic user interface for database system |
US6081810A (en) * | 1998-02-03 | 2000-06-27 | Electronic Data Systems Corporation | Report database system |
US20060112123A1 (en) * | 2004-11-24 | 2006-05-25 | Macnica, Inc. | Spreadsheet user-interfaced business data visualization and publishing system |
US7783679B2 (en) * | 2005-01-12 | 2010-08-24 | Computer Associates Think, Inc. | Efficient processing of time series data |
US7877370B2 (en) * | 2006-05-15 | 2011-01-25 | Algebraix Data Corporation | Systems and methods for data storage and retrieval using algebraic relations composed from query language statements |
US8024329B1 (en) * | 2006-06-01 | 2011-09-20 | Monster Worldwide, Inc. | Using inverted indexes for contextual personalized information retrieval |
US8271429B2 (en) * | 2006-09-11 | 2012-09-18 | Wiredset Llc | System and method for collecting and processing data |
US20080208820A1 (en) * | 2007-02-28 | 2008-08-28 | Psydex Corporation | Systems and methods for performing semantic analysis of information over time and space |
US9626421B2 (en) * | 2007-09-21 | 2017-04-18 | Hasso-Plattner-Institut Fur Softwaresystemtechnik Gmbh | ETL-less zero-redundancy system and method for reporting OLTP data |
JP5198929B2 (ja) * | 2008-04-25 | 2013-05-15 | 株式会社日立製作所 | ストリームデータ処理方法及び計算機システム |
US8239389B2 (en) * | 2008-09-29 | 2012-08-07 | International Business Machines Corporation | Persisting external index data in a database |
US7917463B2 (en) * | 2008-10-10 | 2011-03-29 | Business.Com, Inc. | System and method for data warehousing and analytics on a distributed file system |
JP4939568B2 (ja) * | 2009-04-28 | 2012-05-30 | インターナショナル・ビジネス・マシーンズ・コーポレーション | データベース間でデータを同期するための方法、並びにそのコンピュータ・システム及びコンピュータ・プログラム |
US20110004589A1 (en) * | 2009-07-06 | 2011-01-06 | Rockwell Automation Technologies, Inc. | Diagnostics in a distributed directory system |
US20110153603A1 (en) * | 2009-12-17 | 2011-06-23 | Yahoo! Inc. | Time series storage for large-scale monitoring system |
US8874600B2 (en) * | 2010-01-30 | 2014-10-28 | International Business Machines Corporation | System and method for building a cloud aware massive data analytics solution background |
JPWO2011111532A1 (ja) * | 2010-03-10 | 2013-06-27 | 日本電気株式会社 | データベースシステム |
JP5464017B2 (ja) * | 2010-04-01 | 2014-04-09 | 日本電気株式会社 | 分散メモリデータベースシステム、データベースサーバ、データ処理方法およびそのプログラム |
US20120110004A1 (en) * | 2010-11-03 | 2012-05-03 | Microsoft Corporation | Homomorphism lemma for efficiently querying databases |
US8954967B2 (en) * | 2011-05-31 | 2015-02-10 | International Business Machines Corporation | Adaptive parallel data processing |
US9462040B2 (en) * | 2011-12-07 | 2016-10-04 | Cisco Technology, Inc. | Network-based dynamic data management |
-
2012
- 2012-11-08 WO PCT/US2012/064089 patent/WO2013070873A1/en active Application Filing
- 2012-11-08 JP JP2014541254A patent/JP5818394B2/ja active Active
- 2012-11-08 US US13/671,896 patent/US20130124483A1/en not_active Abandoned
-
2016
- 2016-05-05 US US15/147,790 patent/US9582528B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015501976A (ja) | 2015-01-19 |
WO2013070873A1 (en) | 2013-05-16 |
US20160246824A1 (en) | 2016-08-25 |
US9582528B2 (en) | 2017-02-28 |
US20130124483A1 (en) | 2013-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5818394B2 (ja) | 大量データプラットフォームを操作するシステム及び方法 | |
JP7271734B2 (ja) | 分散イベント処理システムにおけるデータシリアライズ | |
US10769148B1 (en) | Relocating data sharing operations for query processing | |
CN109074377B (zh) | 用于实时处理数据流的受管理功能执行 | |
CN110032604B (zh) | 数据存储装置、转译装置及数据库访问方法 | |
KR101621137B1 (ko) | 아파치 하둡을 위한 로우 레이턴시 쿼리 엔진 | |
US8321450B2 (en) | Standardized database connectivity support for an event processing server in an embedded context | |
KR20200106950A (ko) | Sql 질의 플랜들을 최적화하기 위한 차원 콘텍스트 전파 기술들 | |
US9582541B2 (en) | Systems, methods, and computer program products to ingest, process, and output large data | |
CN109491989B (zh) | 数据处理方法及装置、电子设备、存储介质 | |
US11074261B1 (en) | Format independent processing for distributed data | |
US9930113B2 (en) | Data retrieval via a telecommunication network | |
US10990598B2 (en) | Aggregating quantile metrics in multidimensional data sets | |
Ahuja et al. | State of big data analysis in the cloud | |
CN113312376B (zh) | 一种用于Nginx日志实时处理分析的方法及终端 | |
CN104199978A (zh) | 基于NoSQL实现元数据缓存与分析的系统及方法 | |
Kuderu et al. | Relational database to NoSQL conversion by schema migration and mapping | |
JP6262505B2 (ja) | 分散型データ仮想化システム、クエリ処理方法及びクエリ処理プログラム | |
KR20100132752A (ko) | 데이터베이스 분산을 통한 서비스 성능 향상을 위한 질의 데이터 분산 처리시스템 | |
US11175905B2 (en) | Optimizing uploads for an offline scenario by merging modification operations | |
CN107330089B (zh) | 跨网络结构化数据收集系统 | |
EP2990960A1 (en) | Data retrieval via a telecommunication network | |
CN112612453A (zh) | RESTful服务驱动的JS对象简谱数据互换平台 | |
JP2016071837A (ja) | データ仮想化装置及び大規模データ処理プログラム | |
CN112732704B (zh) | 一种数据处理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150901 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5818394 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |