JP6542785B2 - 第一クラスデータベース要素としての半構造データの実装 - Google Patents

第一クラスデータベース要素としての半構造データの実装 Download PDF

Info

Publication number
JP6542785B2
JP6542785B2 JP2016552932A JP2016552932A JP6542785B2 JP 6542785 B2 JP6542785 B2 JP 6542785B2 JP 2016552932 A JP2016552932 A JP 2016552932A JP 2016552932 A JP2016552932 A JP 2016552932A JP 6542785 B2 JP6542785 B2 JP 6542785B2
Authority
JP
Japan
Prior art keywords
data
data elements
semi
class
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016552932A
Other languages
English (en)
Other versions
JP2017512338A (ja
Inventor
ダジュヴィル,ブノワット
アントノフ,ヴァディム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Snowflake Inc
Original Assignee
Snowflake Computing Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Snowflake Computing Inc filed Critical Snowflake Computing Inc
Publication of JP2017512338A publication Critical patent/JP2017512338A/ja
Application granted granted Critical
Publication of JP6542785B2 publication Critical patent/JP6542785B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • G06F9/5016Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals the resource being the memory
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61FFILTERS IMPLANTABLE INTO BLOOD VESSELS; PROSTHESES; DEVICES PROVIDING PATENCY TO, OR PREVENTING COLLAPSING OF, TUBULAR STRUCTURES OF THE BODY, e.g. STENTS; ORTHOPAEDIC, NURSING OR CONTRACEPTIVE DEVICES; FOMENTATION; TREATMENT OR PROTECTION OF EYES OR EARS; BANDAGES, DRESSINGS OR ABSORBENT PADS; FIRST-AID KITS
    • A61F5/00Orthopaedic methods or devices for non-surgical treatment of bones or joints; Nursing devices; Anti-rape devices
    • A61F5/56Devices for preventing snoring
    • A61F5/566Intra-oral devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/128Details of file system snapshots on the file-level, e.g. snapshot creation, administration, deletion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture
    • G06F16/1827Management specifically adapted to NAS
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24532Query optimisation of parallel queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24542Plan optimisation
    • G06F16/24545Selectivity estimation or determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24558Binary matching operations
    • G06F16/2456Join operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1095Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching

Description

[関連出願に対する参照]
本出願は、2014年2月19日に出願された“Apparatus and method for enterprise data warehouse data processing on cloud infrastructure”と題された米国仮出願整理番号61/941,986の利益を享受する権利を主張し、米国仮出願整理番号61/941,986の開示は、その全体において参照によって本明細書に組み入れられる。
本開示は、データストレージおよびコンピューティングリソースを管理するリソース管理システムおよび方法に関する。
今日、多くの既存のデータ格納・検索(retrieval、取得)システムが利用可能である。例えば、共有されたディスクシステムにおいては、データクラスタ内の全ての処理ノードからアクセス可能な共有ストレージデバイス上に全てのデータが格納される。この種類のシステムにおいては、全てのデータ変更は、データクラスタ内の全ての処理ノードが整合性のあるバージョンのデータにアクセスすることを保証するために共有ストレージデバイスに書き込まれる。多数の処理ノードが共有されたディスクシステム内で増加すると、共有ストレージデバイス(および処理ノードと共有ストレージデバイスとの間の通信リンク)は、データ読み出しおよびデータ書き込み動作を遅延させるボトルネックとなる。このボトルネックは、より多くの処理ノードの追加によってさらに悪化する。このように、既存の共有されたディスクシステムは、このボトルネック問題によって制限されたスケーラビリティを有する。
別の既存のデータストレージおよび検索システムは、“シェアード・ナッシング・アーキテクチャ(shared−nothing architecture)”と称される。このアーキテクチャにおいては、データは、複数の処理ノードにわたって分散し、各ノードは、全データベース内のデータのサブセットを格納する。新しい処理ノードが追加、または除去されると、シェアード・ナッシング・アーキテクチャは、複数の処理ノードにわたってデータを再配列しなければならない。このデータの再配列は時間を消費し、データ再配列中に実行されるデータ読み出しおよび書き込み動作に対して混乱を生じさせ得る。また、特定のノードに対するデータのアフィニティは、一般的なデータに対するデータクラスタ上に“ホットスポット(hot spots)”を生成し得る。さらに、各処理ノードは、ストレージ機能も実施するため、このアーキテクチャは、データを格納するために少なくとも一つの処理ノードを必要とする。このように、シェアード・ナッシング・アーキテクチャは、全ての処理ノードが除去される場合にはデータを格納するのに失敗する。さらに、シェアード・ナッシング・アーキテクチャにおけるデータの管理は、多くの異なる処理ノードにわたるデータの分散によって複雑である。
本明細書に記述されるシステムおよび方法は、既存のシステムの上記で特定された制限を軽減するデータストレージおよびデータ検索に対する改良されたアプローチを提供する。
本開示の非限定かつ非包括的な実施形態は、以下の図面を参照して記述され、類似の参照番号は、そうでないと特に断らない限りは、種々の図面を通して類似の部分のことを称する。
半構造データの処理を示す情報フローおよび関係図を示す。 本明細書に開示される方法の実装を示すプロセスフロー図である。 本開示の教示によるオペレーティング環境の一実施形態を示すブロック図を示す。 本開示の教示によるリソースマネージャの実装の一例を示すブロック図を示す。 本開示の教示による実行プラットフォームの実装の一例を示すブロック図を示す。 本開示の教示による例示的コンピューティングデバイスを示すブロック図を示す。
半構造データ(半構造化データ)を管理するための方法、装置およびシステムが本明細書に開示される。例えば、半構造データを管理するための方法の実装は、半構造データソースから半構造データ要素を受信し、データベースに半構造データ要素が加えられると、半構造データ要素の集合に対して統計解析を実施してもよい。さらに、半構造データ内から共通のデータ要素が特定され、共通性の閾値によって、ファーストクラスデータおよび/またはより低いクラスのデータとして割り当てられてもよい。実装は、キャッシュメモリ内に格納された個別の擬似列に、半構造データソースからの共通データ要素を更に組み合わせ、その後、コンピュータベースのクエリジェネレータに対して利用可能なファーストクラスデータの擬似列に対応するメタデータおよび統計を作成してもよい。
以下の記述においては、本明細書の一部を形成する添付の図面に対する参照が行われ、その中では、本開示が実践され得る特定の例示的実施形態の例示として示される。これらの実施形態は、本明細書に開示された概念を当業者が実施することを可能にするために十分詳細に記述され、本開示の範囲から逸脱することなく、種々の開示された実施形態に対する改変が行われてもよく、他の実施形態が使用されてもよいことを理解されたい。したがって、以下の詳細な記述は、限定する意味で解釈されるべきではない。
本明細書中の“一実施形態(one embodiment)”、“ある実施形態(an embodiment)”、“一例(one example)”または“ある例(an example)”に対する言及は、実施形態または例に関連して記述される特定の特徴、構造または特性が本開示の少なくとも一実施形態に含まれることを意味する。このように、本明細書中の種々の位置における“一実施形態においては(in one embodiment)”“ある実施形態においては(in an embodiment)”、“一例”または“ある例”という句の出現は、必ずしもすべて同一の実施形態または同一の例に対して言及するものではない。さらに、本明細書に提供される図面は、当業者に対して説明する目的のためのものであって、図面は必ずしも同一の縮尺で描かれているとは限らないことを理解されたい。
本開示による実施形態は、装置、方法またはコンピュータプログラム製品として具現化されてもよい。したがって、本開示は、全体としてハードウェア構成実施形態、全体としてソフトウェア構成実施形態(ファームウェア、レジデントソフトウェア、マイクロコードなどを含む)または“回路”“モジュール”もしくは“システム”として本明細書で全て一般的に称され得るソフトウェアおよびハードウェア態様を組み合わせる実施形態の形式をとってもよい。さらに、本開示の実施形態は、媒体中で具現化されるコンピュータ利用可能なプログラムコードを有する表現の任意の有形媒体内で具現化されるコンピュータプログラム製品の形式をとってもよい。
一つ以上のコンピュータ利用可能またはコンピュータ可読媒体の如何なる組み合わせが使用されてもよい。例えば、コンピュータ可読媒体は、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)デバイス、リードオンリーメモリ(ROM)デバイス、消去可能なプログラマブルリードオンリーメモリ(EPROMまたはフラッシュメモリ)デバイス、ポータブルコンパクトディスクリードオンリーメモリ(CDROM)、光学ストレージデバイス、磁気ストレージデバイスのうちの一つ以上を含んでもよい。本開示の動作を実行するためのコンピュータプログラムコードは、一つ以上のプログラミング言語の任意の組み合わせで書き込まれてもよい。このようなコードは、コンピュータ可読アセンブリ言語に対するソースコードまたはコードが実行されるであろうデバイスもしくはコンピュータに対して適切なマシンコードからコンパイルされてもよい。
実施形態は、クラウドコンピューティング環境内でも実装されてもよい。この記述および以下の請求項においては、“クラウドコンピューティング(cloud computing)”とは、仮想化によって迅速にセットアップでき、最小の管理努力またはサービスプロバイダ相互作用でリリースすることができ、その後それによってスケーリングすることができる、構成可能なコンピューティングリソース(例えば、ネットワーク、サーバ、ストレージ、アプリケーションおよびサービス)の共有されたプールに対して、ユビキタスで簡便なオンデマンドネットワークアクセスを可能にするためのモデルとして定義されてもよい。クラウドモデルは、種々の特性(例えば、オンデマンドセルフサービス、ブロードネットワークアクセス、リソースプーリング、迅速な柔軟性(rapid elasticity)およびメジャードサービス)、サービスモデル(例えば、ソフトウェア・アズ・ア・サービス(“SaaS”)、プラットフォーム・アズ・ア・サービス(“PaaS”)およびインフラストラクチャ・アズ・ア・サービス(“IaaS”))および展開モデル(例えば、プライベートクラウド、コミュニティクラウド、パブリッククラウドおよびハイブリッドクラウド)で構成することができる。
添付の図面内のフロー図およびブロック図は、本開示の種々の実施形態によるシステム、方法およびコンピュータプログラム製品の可能性のある実装のアーキテクチャ、機能および動作を図示するものである。この点においては、フロー図またはブロック図内の各ブロックは、モジュール、セグメントまたはコードの一部を表してもよく、それは、特定の(複数の)論理関数を実装するための一つ以上の実行可能な命令を含む。ブロック図および/またはフロー図の各ブロック、ブロック図および/またはフロー図内のブロックの組み合わせは、特定の機能もしくは動作、または専用ハードウェアおよびコンピュータ命令の組み合わせを実施する専用ハードウェアベースシステムによって実装されてもよいことにも留意されたい。コンピュータ可読媒体内に格納された命令が、フロー図および/またはブロック図の一つ以上のブロック内で特定される機能/動作を実装する命令手段を含む製造の態様を作成するように、これらのコンピュータプログラム命令は、コンピュータまたは他のプログラマブルデータ処理装置を特定の方法で機能させることができるコンピュータ可読媒体内にも格納されてもよい。
本明細書に記述されたシステムおよび方法は、新しいデータ処理プラットフォームを使用するフレキシブルかつスケーラブルなデータウェアハウスを提供する。幾つかの実施形態においては、記述されたシステムおよび方法は、クラウドベースストレージリソース、コンピューティングリソースなどをサポートするクラウドインフラストラクチャを利用する。例示的なクラウドベースのストレージリソースは、低コストで、オンデマンドで利用可能なかなりのストレージ容量を提供する。さらに、これらのクラウドベースストレージリソースは、フォールト・トレラントかつ高いスケーラビリティを有してもよく、個人的なデータストレージシステム内で実現するためには高価であり得る。例示的なクラウドベースのコンピューティングリソースは、オンデマンドで利用可能であり、リソースの実際の利用レベルに基づいて値段設定されてもよい。典型的には、クラウドインフラストラクチャは、迅速な方法で動的に展開され、再構成され、閉鎖される。
記述されたシステムおよび方法においては、データストレージシステムは、半構造ベースのリレーショナル(関係)データベースを利用する。しかしながら、これらのシステムおよび方法は、任意のデータストレージアーキテクチャを利用し、データベース内のデータを格納して検索するために任意の言語を利用する任意の種類のデータベースに対して適用可能である。本明細書で用いられるように、半構造データとは、リレーショナルデータベースに関連づけられるデータモデルの典型的な形式的構造とは一致しないが、それにもかかわらず、意味的要素を分離し、データ内のレコードおよびフィールドの階層を強制するためのタグまたは他のマーカを含む構造データの形式を伝達することを意味する。本明細書に記述されるシステムおよび方法は、異なるカスタマー/クライアント間、および同一のカスタマー/クライアント内の異なるユーザ間でコンピューティングリソースおよびデータの分離をサポートするマルチテナントシステムをさらに提供する。
大量の半構造データを扱うデータベースおよびデータウェアハウスシステムの性能を顕著に改善する方法およびシステムが本明細書に開示される。既存のデータベースシステムは、リレーショナル(即ち、SQLデータベース)またはキー値ストアのいずれかである。
リレーショナルデータベースは、クエリデータアクセスプルーニング(テーブルの特定の列に格納された値について集約されたメタデータに基づいて、検索からデータベースの一部を排除すること)によって効率的なクエリを実施することができる。しかしながら、これは、半構造データを表すために使用することができないデータの厳格な表フォーマットを必要とする。
一方、キー値ストアは、よりフレキシブルであるが、プルーニングの欠如によって深刻な性能のペナルティを導入する。既存の製品および研究プロジェクトにおけるリレーショナルデータベースに対して半構造データの取り扱いを追加するための多数の方法が存在する。
1.シリアライズエンコード。半構造データ記録は、シリアライズ表現としてにして格納される。幾つかのフィールドの値が利用されると常に、その値が抽出されて、基本タイプに変換される。この方法はフレキシブルであるが、このプルーニングによって改善されるべきデータに対するアクセスを行う。シリアライズ表現からの抽出はコストが高く、通常のリレーショナルデータで動作するよりも顕著に多くのCPU時間を必要とする。全てのシリアライズデータの記録は、それらのうちのごくわずかな部分のみ(単一要素など)がクエリ内で使用される場合でさえも、持続性ストレージから読み出され、処理されなければならない。
2.取り込みにおける変換。半構造データは、取り込みにおいて、リレーショナルデータに変換される。これは、任意の他のリレーショナルデータに対するアクセスと同程度に迅速に、このデータにアクセスするが、取り込みにおいてデータ構造の厳格な仕様を必要とし、対応するデータベーススキーマが事前に完全に特定されることを必要とする。データベーススキーマを変更する必要があるため、この方法は、変化する構造を有するデータの取り扱いのコストを非常に高くする。ある記録から記録へと変化する構造を有するデータは、この方法を利用して扱うことが不可能である。変換方法は、事前に特定されなければならず、あらゆる重要な変化は、元の半構造データを再度取り込むことを必要とする。
3.従来のリレーショナルデータベースに格納されたオブジェクト属性値三つ揃え表現に等価な構造データのリレーショナル様表現。この方法はフレキシブルであるが、実用上、データサブコンポーネントに対するアクセス用のジョイン演算を必要とし、それは、データに依存して非常に遅く成り得る。
4.ソースデータの階層反映構造内で異なる濃度を有する列がリンクすることを可能とする、リレーショナルデータモデルに対する非伝統的拡張。このようなデータ表現のためのクエリ生成方法は、十分理解されていない(効率的なクエリ生成は、本技術分野の現在の状態で不可能である)。この方法は、厳格な(とはいっても表ではない)スキーマに一致する入力データを必要とし、このため、任意の半構造データを扱うほど十分フレキシブルではない。
必要とされるのは、効率的で低コストかつ反応の速い半構造データと動作するためのシステムおよび方法である。なぜなら、それは、より伝統的なデータ構造と同様に処理してクエリすることができる、少なくとも擬似的な列内のデータを管理しながら、半構造データの意味を保存するからである。
以下の開示の実装においては、データは、ファイル、ファイルの要素、ファイルの一部などの形式で入力されてもよい。ファイルは、ドキュメントの集合を含んでもよく、データの一部は、ファイル、接続由来の複数のドキュメントおよび/またはドキュメントの一部を含んでもよい。さらに、実装においては、メタデータは、ファイル、ファイルの一部、データの一部に関連付けられてもよい。
本明細書で用いられるように、“共通データ要素”とは、同一グループに属するデータ要素および論理的に類似の要素の集合を意味することを意図される。
図1は、半構造データを処理し、クエリに対するアクセスを増加させるためにデータ要素に対するクラス指定を割り当てるコンピュータシステムにおける半構造データフローの概略を図示する。図面からわかるように、半構造データ110は、その中に、共通および非共通データ要素を含んでもよい。半構造データから共通データを抽出するために、解析統計122は、半構造データに対して実行されてもよく、共通のデータ要素および非共通データ要素を決定し、各データ要素に対して割り当てられるべきクラス指定を生成する。さらに、ユーザの関心およびユーザの要求124は、共通データ要素のためのクラス指定を決定するために使用されてもよいことに留意されたい。図面に示されるように、共通データは、擬似列120と呼ばれる一時的な列構造にして格納されてもよく、クラス指定に従ってさらに格納されてもよく、ファーストクラスデータ要素は、クエリのためのより良好なアクセスのために格納される。共通であることを判定されなかったデータ要素は、“オーバーフロー”シリアライズデータ140にしてシリアルに格納されてもよい。最終的に、ユーザは、ファーストクラスデータ要素からより迅速かつ正確に折丁に対する結果130を受信するだろう。
実装においては、必要とされるデータ要素が擬似列120内にない場合、それは“オーバーフロー”シリアライズデータ140から抽出されてもよく、全体の半構造データ記録150が再構成されることを要求される場合、それは擬似列120内のファーストクラスデータ、擬似列120内のより低いデータおよび“オーバーフロー”データ140から再構成され、元の形式へと再度シリアライズされてもよい。
図2は、半構造データを取り扱い、データストレージの優先順位を決定するためのデータクラスを割り当てるための方法200のフロー図を図示する。図面からわかるように、210において、半構造データ要素は、半構造データソースまたは複数の半構造データソースから受信される。データ要素が受信されると、それらは共通データ要素および非共通データ要素として割り当てられてもよい。これは、220において、半構造データの集合がデータベースに追加されるときに半構造データの集合の統計解析を実施することによって達成されてもよい。統計解析に基づいて、230において共通データ要素が特定されてもよい。240において、共通データ要素は、所望のまたは繰り返し生じるデータに対するファーストクラス指定や、それほど望ましくなく、かつそれほど生じないデータ要素に対するより低いクラス指定など、クラス指定を割り当てられてもよい。方法200の命令を実施するシステムは、さらに、250において、共通性の閾値に従った240での半構造データからファーストクラスデータ要素のストレージを、個別の擬似列へとまとめる一方で、非共通データ要素“オーバーフロー”シリアライズストレージにして格納されてもよい。共通性の閾値は、例えば、半構造データ内にデータ要素が何回現れるかに基づいてもよく、または、ユーザのクエリがデータを何回検索するかに基づいてもよい。これらの要素は、半構造データから抽出されてもよく、ユーザに対して見えない列のフォーマットで個別に格納されてもよい。260において、ファーストクラスデータは、その望ましさのゆえに、素早くアクセス可能なキャッシュメモリ内擬似列にして格納されてもよく、これらの擬似列のメタデータおよび統計(最小値および最大値、個別値の数など)は、その後、270においてクエリジェネレータに利用可能にされてもよいことを理解されたい。個別の集合(即ち、個別のファイル内に格納されたテーブルの一部)は、抽出されたデータ要素の異なるサブセットを有してもよいことに留意されたい。
図2からわかるように、共通性の指定およびデータ要素に対するクラスの割り当ては、半構造データ要素のデータベースがクエリに対して最新のものに維持されることを保証するために繰り返されてもよい。
実装においては、データを抽出するとき、共通データ要素の値が必要とされる場合、効率的な列アクセスを利用して、対応する擬似列から直接取得されてもよい。
実装においては、共通データ要素は、何時でもファーストクラス指定に追加されてもよいし、同様に、データ要素は、それほど望ましくない、またはそれほど表現していないことが分かったときに、ファーストクラス指定を失うことがある。
ユーザにとって、この方法は、シリアライズされた記録を格納することと区別がつかないことがあり、個々のデータ記録の構造に対して何の制約も課さない。しかしながら、大部分の共通データ要素が、従来のリレーショナルデータと同一の方法で格納されるため、それらに対するアクセスが提供されてもよく、全体の半構造記録の読み出しおよび抽出を必要としない。それによって、従来のリレーショナルデータベースの速度の利点を得る。
(同一のテーブル由来の)半構造記録の異なる集合は、抽出されたデータ要素の異なる組を有し得るため、クエリジェネレータおよびプルーニングは、部分的に利用可能なメタデータで動作することが可能であるべきである(即ち、テーブルの一部は、特定のデータ要素に対して利用可能なメタデータおよび統計を有してもよいが、他の部分はそれを欠いていてもよい)。
従来技術に対する利点は、(それほど共通ではない要素のシリアライズストレージおよび共通要素の列ストレージの双方として)ハイブリッドデータストレージ表現を利用するための方法によって提供される性能である。これは、従来のリレーショナルデータベースによって提供されるデータクエリのシリアライズ表現と高性能とを利用して、システムの任意の半構造データを格納するための柔軟性および性能の双方をユーザが達成することを可能とする。
任意のデータ処理プラットフォームが半構造データを扱うためにこのアプローチを利用することができることが当業者には理解されるだろう。それは、SQLを実行するDBMSシステムに限定される必要がない。
図3に図示されるのは、本明細書に開示された方法を実行するためのコンピュータシステムである。図3に図示されるように、リソースマネージャ302は、複数のユーザ304、306および308に結合される。特定の実装においては、リソースマネージャ302は、データ処理プラットフォーム300にアクセスを望むあらゆる数のユーザをサポートすることができる。ユーザ304−308は、例えば、データストレージおよび検索要求を提供するエンドユーザと、本明細書に記述されたシステムおよび方法、データベースと相互作用するソフトウェアアプリケーションおよびリソースマネージャ302と相互作用する他のコンポーネント/デバイスを管理するシステム管理者と、を含んでもよい。リソースマネージャ302は、データ処理プラットフォーム300内の全システムおよびコンポーネントの動作をサポートする種々のサービスおよび機能を提供する。リソースマネージャ302は、メタデータ310にも結合され、メタデータ310は、データ処理プラットフォーム300中に格納されたデータ全体と関連付けられる。リソースマネージャは、ファイルの組に対応するメタデータと結合されるため、メタデータは、ユーザクエリを生成するために使用されてもよい。幾つかの実施形態においては、メタデータ310は、ローカルキャッシュから利用可能なデータと同様に、遠隔データストレージシステム内に格納されたデータの要約を含む。さらに、メタデータ310は、遠隔データストレージシステムおよびローカルキャッシュ内で如何にしてデータが組織化されるかに関する情報を含んでもよい。メタデータ310は、ストレージデバイスから実際のデータをロードまたはアクセスすることなく、一片のデータが処理される必要があるか否かをシステムおよびサービスが判定することを可能にする。
リソースマネージャ302は、実行プラットフォーム312にさらに結合され、実行プラットフォーム312は、以下により詳細に議論されるように、種々のデータストレージおよびデータ検索タスクを実行する複数のコンピューティングリソースを提供する。実行プラットフォーム312は、ストレージプラットフォーム314の一部である複数のデータストレージデバイス316、318および320に結合される。3つのデータストレージデバイス316、318および320が図3に図示されるが、実行プラットフォーム312は、あらゆる数のデータストレージデバイスと通信することが可能である。幾つかの実施形態においては、データストレージデバイス316、318および320は、一つ以上の地理的位置に配置されたクラウドベースのストレージデバイスである。例えば、データストレージデバイス316、318および320は、パブリッククラウドインフラストラクチャの一部またはプライベートクラウドインフラストラクチャであってもよい。データストレージデバイス316、318および320は、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)、ストレージクラスタまたは任意の他のデータストレージ技術であってもよい。さらに、ストレージプラットフォーム314は、(Hadoop分散ファイルシステム(HDFS)などの)分散ファイルシステム、オブジェクトストレージシステムなどを含んでもよい。
特定の実施形態においては、リソースマネージャ302とユーザ304−308、メタデータ310および実行プラットフォーム312との間の通信リンクは、一つ以上のデータ通信ネットワークを介して実装される。同様に、実行プラットフォーム312とストレージプラットフォーム314内のデータストレージデバイス316−320との間の通信リンクは、一つ以上のデータ通信ネットワークを介して実装される。これらのデータ通信ネットワークは、任意の通信プロトコルおよび任意の種類の通信媒体を使用してもよい。幾つかの実施形態においては、データ通信ネットワークは、互いに結合された二つ以上のデータ通信ネットワーク(または、サブネットワーク)の組み合わせである。別の実施形態においては、これらの通信リンクは、任意の種類の通信媒体および任意の通信プロトコルを利用して実装される。
図3に図示されるように、データストレージデバイス316、318および320は、実行プラットフォーム312に関連付けられたコンピューティングリソースから切り離される。このアーキテクチャは、データ処理プラットフォーム300にアクセスするユーザおよびシステムのニーズの変化と同様に、データストレージ/検索ニーズの変化に基づいて、データ処理プラットフォーム300に対する動的な変化をサポートする。動的変化のサポートによって、データ処理プラットフォーム300内のシステムおよびコンポーネントに対する需要の変化に迅速に応じて、データ処理プラットフォーム300をスケーリングすることを可能にする。データストレージデバイスからのコンピューティングリソースの切断は、対応する大量のコンピューティングリソースを必要とすることなく、大量のデータのストレージをサポートする。同様に、このリソースの切断は、利用可能なデータストレージリソース内で対応する増加を必要とすることなく、特定の時刻に使用されるコンピューティングリソース内の顕著な増加をサポートする。
リソースマネージャ302、メタデータ310、実行プラットフォーム312およびストレージプラットフォーム314は、個々のコンポーネントとして図3に図示される。しかしながら、リソースマネージャ302、メタデータ310、実行プラットフォーム312およびストレージプラットフォーム314の各々は、分散システム(例えば、複数の地理的位置において、複数のシステム/プラットフォームにわたって分散される)として実装されてもよい。さらに、リソースマネージャ302、メタデータ310、実行プラットフォーム312およびストレージプラットフォーム314の各々は、ユーザ304−308から受信された要求の変化およびデータ処理プラットフォーム300のニーズの変化によって(互いに独立して)拡張または縮小することができる。このように、記述された実施形態においては、データ処理プラットフォーム300は動的であって、現在のデータ処理ニーズに見合うように規則的な変化をサポートする。
図4は、リソースマネージャ302の一実施形態を図示するブロック図である。図3に図示されるように、リソースマネージャ302は、データストレージデバイス406に結合されたアクセスマネージャ402とキーマネージャ404とを含む。アクセスマネージャ402は、本明細書に記述されたシステムに対する認証および承認タスクを扱う。キーマネージャ404は、認証および承認タスク中に、使用されるキーのストレージおよび認証を管理する。要求処理サービス408は、受信されたデータストレージ要求およびデータ検索要求を管理する。管理コンソールデバイス410は、管理者および他のシステムマネージャによる種々のシステムおよびプロセスに対するアクセスをサポートする。
リソースマネージャ302は、SQLコンパイラ412、SQLオプティマイザ414およびSQLエグゼキュータ410も含む。SQLコンパイラ412は、SQLクエリを解析し、クエリのための実行コードを生成する。SQLオプティマイザ414は、処理される必要があるデータに基づいてクエリを実行するための最良の方法を決定する。SQLエグゼキュータ416は、リソースマネージャ302によって受信されるクエリのためのクエリコードを実行する。クエリスケジューラおよびコーディネータ418は、コンパイル、最適化および実行プラットフォームに対するディスパッチのために適切なサービスまたはシステムに対して、受信されたクエリを送信する。仮想ウェアハウスマネージャ420は、実行プラットフォーム内で実装される複数の仮想ウェアハウスの動作を管理する。
さらに、リソースマネージャ302は、構成およびメタデータマネージャ422を含み、これは、遠隔データストレージデバイス内およびローカルキャッシュ内に格納されたデータに関する情報を管理する。監視および作業負荷アナライザ424は、リソースマネージャ302によって実施されるプロセスを監視し、実行プラットフォーム内の仮想ウェアハウスおよび実行ノードにわたるタスク(例えば、作業負荷)の分散を管理する。構成およびメタデータマネージャ422と、監視および作業負荷アナライザ424は、データストレージデバイス426に結合される。
リソースマネージャ302は、トランザクション管理およびアクセス制御モジュール428も含み、これは、種々のタスクと、データストレージ要求およびデータアクセス要求の処理に関連付けられる他のアクティビティとを管理する。例えば、トランザクション管理およびアクセス制御モジュール428は、複数のユーザまたはシステムによる、データに対する一貫し、かつ同期したアクセスを提供する。複数のユーザ/システムは、同時に同一のデータにアクセスしてもよいため、データに対する変更は、現在のバージョンのデータを各ユーザ/システムが扱うことを確実にするために同期されなければならない。トランザクション管理およびアクセス制御モジュール428は、リソースマネージャ302内の単一の中央に集中した位置において、種々のデータ処理アクティビティの制御を提供する。
図5は、実行プラットフォームの一実施形態を図示するブロック図である。図5に図示されるように、実行プラットフォーム512は、複数の仮想ウェアハウス502、504および506を含む。各仮想ウェアハウスは、各々がキャッシュとプロセッサとを含む複数の実行ノードを含む。図5に図示された各仮想ウェアハウス502−506は3つの実行ノードを含むが、特定の仮想ウェアハウスは、如何なる数の実行ノードを含んでもよい。さらに、仮想ウェアハウス内の実行ノードの数は動的であり、さらなる需要が存在するときには新しい実行ノードが生成され、もう必要とされないときには既存の実行ノードが消去される。
各仮想ウェアハウス502−506は、図3に図示されたデータストレージデバイス316−320のうちの任意のデバイスにアクセスすることが可能である。したがって、仮想ウェアハウス502−506は、必ずしも特定のデータストレージデバイス316−320に割り当てられるわけではなく、その代わりに、データストレージデバイス316−320のうちの任意のデータストレージデバイスからデータにアクセスすることができる。同様に、図5に図示される実行ノードの各々は、データストレージデバイス316−320のうちの任意のデータストレージデバイスからデータにアクセスすることができる。幾つかの実施形態においては、特定の仮想ウェアハウスまたは特定の実行ノードは、特定のデータストレージデバイスに一時的に割り当てられてもよいが、仮想ウェアハウスまたは実行ノードは、その後、他の如何なるデータストレージデバイスからデータにアクセスしてもよい。
図5の例においては、仮想ウェアハウス502は、3つの実行ノード508、510および512を含む。実行ノード508は、キャッシュ514とプロセッサ516とを含む。実行ノード510は、キャッシュ518とプロセッサ520とを含む。実行ノード512は、キャッシュ522とプロセッサ524とを含む。各実行ノード508−512は、一つ以上のデータストレージおよび/またはデータ検索タスクの処理に関連付けられる。例えば、特定の仮想ウェアハウスは、特定のユーザまたはカスタマーに関連付けられたデータストレージおよびデータ検索タスクを扱ってもよい。他の実装においては、特定の仮想ウェアハウスは、特定のデータストレージシステムまたは特定のカテゴリーのデータに関連付けられたデータストレージおよびデータ検索タスクを扱ってもよい。
上記で議論された仮想ウェアハウス502と同様に、仮想ウェアハウス504は、3つの実行ノード526、528および530を含む。実行ノード526は、キャッシュ532とプロセッサ534とを含む。実行ノード528は、キャッシュ536とプロセッサ538とを含む。実行ノード530は、キャッシュ540とプロセッサ542とを含む。さらに、仮想ウェアハウス506は、3つの実行ノード544、546および548を含む。実行ノード544は、キャッシュ550とプロセッサ552とを含む。実行ノード546は、キャッシュ554とプロセッサ556とを含む。実行ノード548は、キャッシュ558とプロセッサ560とを含む。
図5に図示された実行ノードは、1つのキャッシュと1つのプロセッサとを各々含むが、別の実施形態は、如何なる数のプロセッサと如何なる数のキャッシュとを含む実行ノードを含んでもよい。さらに、キャッシュは、異なる実行ノードの間でサイズが変化してもよい。図5に図示されたキャッシュは、ストレージプラットフォーム314(図3)内の一つ以上のデータストレージデバイスから検索されたデータをローカル実行ノードに格納する。このように、キャッシュは、遠隔ストレージシステムから常にデータを検索するプラットフォーム内で生じるボトルネック問題を軽減するか、または排除する。遠隔ストレージデバイスからデータに繰り返しアクセスする代わりに、本明細書に記述されたシステムおよび方法は、有意により高速であって、上記で議論されたボトルネック問題を回避する実行ノード内のキャッシュからデータにアクセスする。幾つかの実施形態においては、キャッシュは、キャッシュされたデータに対する素早いアクセスを提供する高速メモリデバイスを利用して実装される。各キャッシュは、ストレージプラットフォーム314内のストレージデバイスのうちの任意のストレージデバイスからデータを格納することができる。
さらに、キャッシュリソースおよびコンピューティングリソースは、異なる実行ノードの間で変化してもよい。例えば、一つの実行ノードは、多くのコンピューティングリソースと最小のキャッシュリソースとを含んでもよく、多くのコンピューティングリソースを必要とするタスクに対してその実行ノードを有用にする。別の実行ノードは、多くのキャッシュリソースと、最小のコンピューティングリソースとを含んでもよく、大量のデータをキャッシュすることを必要とするタスクに対してこの実行ノードを有用にする。幾つかの実施形態においては、実行ノードによって実施されるべき期待されるタスクに基づいて実行ノードが生成されると、特定の実行ノードに関連付けられたキャッシュリソースとコンピューティングリソースとが決定される。
さらに、特定の実行ノードに関連付けられたキャッシュリソースとコンピューティングリソースとは、実行ノードによって実施されるタスクの変化に基づいて、時間につれて変化してもよい。例えば、特定の実行ノードは、実行ノードによって実施されるタスクがプロセッサをより集中的に使用するものになる場合に、より多くの処理リソースが割り当てられてもよい。同様に、実行ノードは、実行ノードによって実施されるタスクがより大きいキャッシュ容量を必要とする場合に、より多くのキャッシュリソースが割り当てられてもよい。
仮想ウェアハウス502−506は、図3の同一の実行プラットフォーム312に関連付けられるが、仮想ウェアハウスは、複数の地理的位置における複数のコンピューティングシステムを利用して実装されてもよい。例えば、仮想ウェアハウス502は、第一の地理的位置においてコンピューティングシステムによって実装することができるが、仮想ウェアハウス504および506は、第二の地理的位置において、別のコンピューティングシステムによって実装される。幾つかの実施形態においては、これらの異なるコンピューティングシステムは、一つ以上の異なるエンティティによって維持されるクラウドベースのコンピューティングシステムである。
さらに、各仮想ウェアハウスは、複数の実行ノードを有するものとして、図5に図示される。各仮想ウェアハウスに関連付けられる複数の実行ノードは、複数の地理的位置において複数のコンピューティングシステムを利用して実装されてもよい。例えば、仮想ウェアハウス502の具体的な例は、特定の地理的位置における一つのコンピューティングプラットフォーム上で実行ノード508および510を実装し、別の地理的位置において異なるコンピューティングプラットフォームにおける実行ノード512を実装する。実行ノードを実装するために特定のコンピューティングシステムを選択することは、(例えば、処理リソース要件およびキャッシュ要件などの)特定の実行ノードに対して必要とされるリソースのレベル、特定のコンピューティングシステムで使用可能なリソース、地理的位置内または地理的位置間でのネットワークの通信容量、どのコンピューティングシステムが仮想ウェアハウス内の他の実行ノードを既に実装しているか、などの種々の要因に依存し得る。実行プラットフォーム312もまた、フォールト・トレラントである。例えば、一つの仮想ウェアハウスが機能しない場合、その仮想ウェアハウスは、異なる地理的位置において異なる仮想ウェアハウスと素早く置換される。
特定の実行プラットフォーム312は、あらゆる数の仮想ウェアハウス502−506を含んでもよい。さらに、追加の処理および/またはキャッシュリソースが必要とされるときには新しい仮想ウェアハウスが生成されるように、特定の実行プラットフォーム内の仮想ウェアハウスの数は動的である。同様に、既存の仮想ウェアハウスは、仮想ウェアハウスに関連付けられたリソースがもう必要ではない場合には消去されてもよい。
図6は、例示的なコンピューティングデバイス600を図示するブロック図である。幾つかの実施形態においては、コンピューティングデバイス600は、本明細書で議論されるシステムおよびコンポーネントのうちの一つ以上を実装するために使用される。例えば、コンピューティングデバイス600は、リソースマネージャ302にユーザまたは管理者がアクセスすることを可能にしてもよい。さらに、コンピューティングデバイス600は、本明細書で記述されたシステムおよびコンポーネントのうちの任意のシステムおよびコンポーネントと相互作用してもよい。したがって、コンピューティングデバイス600は、本明細書で議論されたような種々の手順およびタスクを実施するために使用されてもよい。コンピューティングデバイス600は、サーバ、クライアントまたは任意の他のコンピューティングエンティティとして機能することができる。コンピューティングデバイス600は、デスクトップコンピュータ、ノートブックコンピュータ、サーバコンピュータ、ハンドヘルドコンピュータ、タブレットなどの種々のコンピューティングデバイスのうちの任意のコンピューティングデバイスとすることができる。
コンピューティングデバイス600は、一つ以上のプロセッサ602、一つ以上のメモリデバイス604、一つ以上のインターフェイス606、一つ以上のマスストレージデバイス608、一つ以上の入力/出力(I/O)デバイス610を含み、その全ては、バス612に結合される。(複数の)プロセッサ602は、(複数の)メモリデバイス604および/または(複数の)マスストレージデバイス608に格納された命令を実行する一つ以上のプロセッサまたはコントローラを含む。(複数の)プロセッサ602は、キャッシュメモリなどの種々の種類のコンピュータ可読媒体も含んでもよい。
(複数の)メモリデバイス604は、揮発性メモリ(例えば、ランダムアクセスメモリ(RAM))および/または不揮発性メモリ(例えば、リードオンリーメモリ(ROM))などの種々のコンピュータ可読媒体を含む。(複数の)メモリデバイス604は、フラッシュメモリなどの再書き込み可能なROMも含んでもよい。
(複数の)マスストレージデバイス608は、磁気テープ、磁気ディスク、光ディスク、ソリッドステートメモリ(例えば、フラッシュメモリ)などの種々のコンピュータ可読媒体を含む。種々のドライブは、種々のコンピュータ可読媒体からの読み出しおよび/または種々のコンピュータ可読媒体への書き込みを可能とするために、(複数の)マスストレージデバイス608に含まれてもよい。(複数の)マスストレージデバイス608は、リムーバブル媒体および/または非リムーバブル媒体を含む。
(複数の)I/Oデバイス610は、コンピューティングデバイス600から、データおよび/または他の情報を入力または検索することを可能とする種々のデバイスを含む。例示的な(複数の)I/Oデバイス610は、カーソル制御デバイス、キーボード、キーパッド、マイク、モニタまたは他のディスプレイデバイス、スピーカ、プリンタ、ネットワークインターフェイスカード、モデム、レンズ、CCDまたは他の画像捕捉デバイスなどを含む。
(複数の)インターフェイス606は、他のシステム、デバイス、またはコンピューティング環境とコンピューティングデバイス600が相互作用することを可能とする種々のインターフェイスを含む。例示的な(複数の)インターフェイス606は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、無線ネットワークおよびインターネットに対するインターフェイスなどの、あらゆる数の異なるネットワークインターフェイスを含む。
バス612は、バス612に結合された他のデバイスまたはコンポーネントと同様に、(複数の)プロセッサ602、(複数の)メモリデバイス604、(複数の)インターフェイス606、(複数の)マスストレージデバイス608および(複数の)I/Oデバイス610が互いに通信することを可能とする。バス612は、システムバス、PCIバス、IEEE1394バス、USBバスなどの幾つかの種類のバス構造のうちの一つ以上を表す。
例示の目的のために、プログラムおよび他の実行可能なプログラムコンポーネントは、個別のブロックとして本明細書に図示されるが、このようなプログラムおよびコンポーネントは、様々な時点でコンピューティングデバイス600の異なるストレージコンポーネントにおいて存在してもよく、(複数の)プロセッサ602によって実行されることを理解されたい。あるいは、本明細書に記述されたシステムおよび手順は、ハードウェア、またはハードウェアとソフトウェアおよび/またはファームウェアとの組み合わせで実装することができる。例えば、一つ以上の特定用途集積回路(ASIC)は、本明細書に記述されたシステムおよび手順のうちの一つ以上を実行するためにプログラムすることができる。
本開示は、ある種の好適な実施形態の観点から記述されているが、この開示という恩恵が与えられれば、当業者にとっては、ここに述べた利点と特徴をすべて提供するわけではない実施形態も含めて、他の実施形態も明らかであろうし、それらの他の実施形態もまた、この開示の範囲内である。本開示の範囲から逸脱することなく、他の実施形態が使用されてもよいことを理解されたい。

Claims (22)

  1. 半構造データを格納するための方法であって、
    データソースから半構造データ要素を受信することと、
    前記半構造データ要素の集合がデータベースに追加されると、前記半構造データ要素の前記集合に対して統計解析を実施することと、
    前記半構造データの中から共通データ要素を特定することと、
    前記共通データ要素を、共通性の閾値に依存するファーストクラスデータおよびより低いクラスのデータとして割り当てることと、
    前記データソースから前記共通データ要素をまとめて個別の擬似列にすることと、
    ャッシュメモリ内にファーストクラスデータを擬似列にして格納し、前記ファーストクラスデータ要素の前記擬似列に対応するメタデータおよび統計を、コンピュータベースのクエリジェネレータに利用可能にすることと、
    を含む、方法。
  2. 前記半構造データの中から共通データ要素を再度特定することと、追加の共通データ要素をファーストクラスデータとして割り当てることと、キャッシュメモリ内に前記追加の共通データ要素を保存することと、をさらに含む請求項1に記載の方法。
  3. 前記共通性の閾よりも下まで低下したファーストクラスデータ要素を特定することと、前記特定されたデータ要素により低いクラスを割り当てることと、キャッシュメモリから除去することと、をさらに含む、請求項2に記載の方法。
  4. 前記共通性の閾値は、如何なる頻度で前記データ要素が前記半構造データに生じるかに関する計数である、請求項1に記載の方法。
  5. 前記共通性の閾値は、如何なる頻度でデータ要素がユーザによって要求されるかである、請求項1に記載の方法。
  6. より低いクラスのデータをディスクストレージ上擬似列にして格納することをさらに含む、請求項1に記載の方法。
  7. 非共通半構造データ要素をオーバーフローシリアライズ列にして格納することをさらに含む、請求項2に記載の方法。
  8. 前記ファーストクラスデータ要素および前記より低いクラスのデータ要素および前記非共通半構造データをまとめることによって、半構造データを元の形式に再構成することをさらに含む、請求項7に記載の方法。
  9. 現在の擬似列構造および内容を表すアップデートで、集約されたメタデータを維持することをさらに含む、請求項7に記載の方法。
  10. メインメモリ内に、より低いクラスのデータ要素を格納することをさらに含む、請求項1に記載の方法。
  11. コンピュータプロセッサと、キャッシュメモリと、ディスクストレージと、コンピュータ命令とを含む半構造データを集約するためのシステムであって、
    データソースから半構造データ要素を受信するように構成された受信モジュールと、
    前記半構造データ要素の集合がデータベースに追加されると、前記半構造データ要素の前記集合に対応する統計解析データを導出するように構成された統計解析モジュールと、
    前記半構造データの中から共通データ要素を特定するように構成され、共通データ要素を、共通性の閾値に依存するファーストクラスデータおよびより低いクラスデータとして割り当てるように構成された特定モジュールと、
    前記データソースから共通データ要素をまとめて個別の擬似列にするように構成された集約モジュールと、
    をさらに含み、
    前記集約モジュールは、ファーストクラスデータを擬似列にしてキャッシュメモリ内に格納するように構成され、かつ、前記ファーストクラスデータ要素の前記擬似列のメタデータおよび統計を、コンピュータベースのクエリジェネレータに利用可能にするように構成される、システム。
  12. 前記特定モジュールは、前記半構造データの中から共通データ要素を再度特定するようにさらに構成され、かつ、追加の共通データ要素をファーストクラスデータとして割り当て、前記追加の共通データ要素をキャッシュメモリ内に保存するようにさらに構成される、請求項11に記載のシステム。
  13. 前記特定モジュールは、前記共通性の閾よりも下まで低下したファーストクラスデータ要素を特定し、前記特定されたデータ要素により低いクラスを割り当て、キャッシュメモリから除去するようにさらに構成される、請求項12に記載のシステム。
  14. 前記共通性の閾値は、前記半構造データ内に前記データ要素が如何なる頻度で生じるかに関する計数である、請求項11に記載のシステム。
  15. 前記共通性の閾値は、データ要素が如何なる頻度でユーザによって要求されるかである、請求項11に記載のシステム。
  16. より低いクラスのデータはディスクストレージ上擬似列にして格納される、請求項11に記載のシステム。
  17. 非共通半構造データ要素は、オーバーフローシリアライズ列にして格納される、請求項11に記載のシステム。
  18. 半構造データは、ファーストクラスデータ要素およびより低いクラスデータを再度まとめることによって、元の形式に再構成される、請求項17に記載のシステム。
  19. 半構造データを集約するための装置であって、
    データソースから半構造データ要素を受信するように構成された受信モジュールと、
    前記半構造データ要素の集合がデータベースに追加されると、前記半構造データ要素の前記集合に対応する統計解析データを導出するように構成された統計モジュールと、
    前記半構造データの中から共通データ要素を特定し、共通データ要素を、共通性の閾値に依存するファーストクラスデータおよびより低いクラスデータとして割り当てる集約手段であって、前記集約手段は、更に、前記データソースから共通データ要素をまとめて個別の擬似列にし、前記集約手段は、更に、キャッシュメモリ内にファーストクラスデータを擬似列にして格納する、集約手段と、
    を含む、装置。
  20. 前記集約手段は、更に、前記半構造データの中から共通データ要素を再特定し、更に、追加の共通データ要素をファーストクラスデータとして割り当て、キャッシュメモリ内に前記追加の共通データ要素を保存する、請求項19に記載の装置。
  21. 前記集約手段は、更に、前記共通性の閾よりも下まで低下したファーストクラスデータ要素を特定し、更に、前記特定されたデータ要素により低いクラスを割り当て、キャッシュメモリから除去する、請求項20に記載の装置。
  22. 前記集約手段は、更に、現在の擬似列構造および内容を表すアップデートで実質的に継続して、集約されたメタデータを維持する、請求項19に記載の装置。
JP2016552932A 2014-02-19 2015-02-18 第一クラスデータベース要素としての半構造データの実装 Active JP6542785B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461941986P 2014-02-19 2014-02-19
US61/941,986 2014-02-19
US14/518,913 2014-10-20
US14/518,913 US10108686B2 (en) 2014-02-19 2014-10-20 Implementation of semi-structured data as a first-class database element
PCT/US2015/016409 WO2015126961A1 (en) 2014-02-19 2015-02-18 Implementaton of semi-structured data as a first-class database element

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019110553A Division JP7130600B2 (ja) 2014-02-19 2019-06-13 ファーストクラスデータベース要素としての半構造データの実装

Publications (2)

Publication Number Publication Date
JP2017512338A JP2017512338A (ja) 2017-05-18
JP6542785B2 true JP6542785B2 (ja) 2019-07-10

Family

ID=53798208

Family Applications (12)

Application Number Title Priority Date Filing Date
JP2016552943A Active JP6643242B2 (ja) 2014-02-19 2015-02-18 データ管理システム及び方法
JP2016552965A Active JP6697392B2 (ja) 2014-02-19 2015-02-18 半構造データスキーマのトランスペアレントディスカバリ
JP2016553025A Active JP6882893B2 (ja) 2014-02-19 2015-02-18 リソースを提供するためのシステム、方法、及び非一時的コンピュータ可読媒体
JP2016552990A Active JP6730189B2 (ja) 2014-02-19 2015-02-18 キャッシングシステム及び方法
JP2016552932A Active JP6542785B2 (ja) 2014-02-19 2015-02-18 第一クラスデータベース要素としての半構造データの実装
JP2016553023A Pending JP2017506396A (ja) 2014-02-19 2015-02-18 リソース管理システム及び方法
JP2016552966A Pending JP2017506394A (ja) 2014-02-19 2015-02-19 リソース提供システム及び方法
JP2018563493A Active JP6901504B2 (ja) 2014-02-19 2017-06-01 カタログオブジェクトのクローン化
JP2019110553A Active JP7130600B2 (ja) 2014-02-19 2019-06-13 ファーストクラスデータベース要素としての半構造データの実装
JP2019211737A Active JP7163268B2 (ja) 2014-02-19 2019-11-22 リソース管理システム及び方法
JP2021017358A Active JP7163430B2 (ja) 2014-02-19 2021-02-05 リソースを提供するためのシステム、方法、及び非一時的コンピュータ可読媒体
JP2022129785A Active JP7431902B2 (ja) 2014-02-19 2022-08-17 リソース管理システム及び方法

Family Applications Before (4)

Application Number Title Priority Date Filing Date
JP2016552943A Active JP6643242B2 (ja) 2014-02-19 2015-02-18 データ管理システム及び方法
JP2016552965A Active JP6697392B2 (ja) 2014-02-19 2015-02-18 半構造データスキーマのトランスペアレントディスカバリ
JP2016553025A Active JP6882893B2 (ja) 2014-02-19 2015-02-18 リソースを提供するためのシステム、方法、及び非一時的コンピュータ可読媒体
JP2016552990A Active JP6730189B2 (ja) 2014-02-19 2015-02-18 キャッシングシステム及び方法

Family Applications After (7)

Application Number Title Priority Date Filing Date
JP2016553023A Pending JP2017506396A (ja) 2014-02-19 2015-02-18 リソース管理システム及び方法
JP2016552966A Pending JP2017506394A (ja) 2014-02-19 2015-02-19 リソース提供システム及び方法
JP2018563493A Active JP6901504B2 (ja) 2014-02-19 2017-06-01 カタログオブジェクトのクローン化
JP2019110553A Active JP7130600B2 (ja) 2014-02-19 2019-06-13 ファーストクラスデータベース要素としての半構造データの実装
JP2019211737A Active JP7163268B2 (ja) 2014-02-19 2019-11-22 リソース管理システム及び方法
JP2021017358A Active JP7163430B2 (ja) 2014-02-19 2021-02-05 リソースを提供するためのシステム、方法、及び非一時的コンピュータ可読媒体
JP2022129785A Active JP7431902B2 (ja) 2014-02-19 2022-08-17 リソース管理システム及び方法

Country Status (8)

Country Link
US (102) US10108686B2 (ja)
EP (14) EP3828723B1 (ja)
JP (12) JP6643242B2 (ja)
CN (10) CN106233255B (ja)
AU (8) AU2015219101B2 (ja)
CA (8) CA2939908C (ja)
DE (14) DE202015009777U1 (ja)
WO (8) WO2015126959A1 (ja)

Families Citing this family (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3097481B1 (en) 2014-01-21 2022-11-30 Oracle International Corporation System and method for supporting multi-tenancy in an application server, cloud, or other environment
US10108686B2 (en) 2014-02-19 2018-10-23 Snowflake Computing Inc. Implementation of semi-structured data as a first-class database element
US9607073B2 (en) 2014-04-17 2017-03-28 Ab Initio Technology Llc Processing data from multiple sources
US9542220B2 (en) * 2014-04-28 2017-01-10 Oracle International Corporation System and method for supporting resource manager (RM) instance awareness in a transactional environment
US11474874B2 (en) 2014-08-14 2022-10-18 Qubole, Inc. Systems and methods for auto-scaling a big data system
CN107077382B (zh) * 2014-09-26 2021-07-16 甲骨文国际公司 在多租户应用服务器环境中进行事务恢复的系统和方法
US9672122B1 (en) * 2014-09-29 2017-06-06 Amazon Technologies, Inc. Fault tolerant distributed tasks using distributed file systems
US10587465B1 (en) 2015-02-19 2020-03-10 VCE IP Holding Company LLC Methods, systems, and computer readable mediums for selecting and configuring a computing system to support a replicated application
US11436667B2 (en) 2015-06-08 2022-09-06 Qubole, Inc. Pure-spot and dynamically rebalanced auto-scaling clusters
US10210220B2 (en) * 2015-09-16 2019-02-19 DataStax System and method for fault tolerant queries
CN106548262B (zh) 2015-09-21 2020-11-06 阿里巴巴集团控股有限公司 用于处理任务的资源的调度方法、装置和系统
US10091295B1 (en) * 2015-09-23 2018-10-02 EMC IP Holding Company LLC Converged infrastructure implemented with distributed compute elements
CN106790324B (zh) * 2015-11-20 2020-06-16 华为技术有限公司 内容分发方法、虚拟服务器管理方法、云平台和系统
CN107193813B (zh) * 2016-03-14 2021-05-14 阿里巴巴集团控股有限公司 数据表连接方式处理方法及装置
US10289347B2 (en) 2016-04-26 2019-05-14 Servicenow, Inc. Detection and remediation of memory leaks
KR101866487B1 (ko) * 2016-04-27 2018-06-12 주식회사 와이즈넛 복수의 이기종 사물인터넷디바이스의 반정형 데이터를 그룹핑하여 실시간으로 분석하는 데이터처리장치
DE202017007217U1 (de) * 2016-04-28 2020-02-06 Snowflake Inc. Multicluster-Lager
US11080207B2 (en) * 2016-06-07 2021-08-03 Qubole, Inc. Caching framework for big-data engines in the cloud
US11169982B2 (en) 2016-06-30 2021-11-09 Microsoft Technology Licensing, Llc Dynamic deactivation of cold database in database service
US11240305B2 (en) 2016-07-28 2022-02-01 At&T Intellectual Property I, L.P. Task allocation among devices in a distributed data storage system
CN106250566A (zh) * 2016-08-31 2016-12-21 天津南大通用数据技术股份有限公司 一种分布式数据库及其数据运算的管理方法
US10614066B2 (en) 2016-09-01 2020-04-07 Amazon Technologies, Inc. Selecting resource configurations for query execution
US10817540B2 (en) * 2016-09-02 2020-10-27 Snowflake Inc. Incremental clustering maintenance of a table
US10606664B2 (en) 2016-09-07 2020-03-31 Qubole Inc. Heterogeneous auto-scaling big-data clusters in the cloud
US10353965B2 (en) 2016-09-26 2019-07-16 Splunk Inc. Data fabric service system architecture
US11562023B1 (en) 2016-09-26 2023-01-24 Splunk Inc. Merging buckets in a data intake and query system
US11321321B2 (en) 2016-09-26 2022-05-03 Splunk Inc. Record expansion and reduction based on a processing task in a data intake and query system
US20180089324A1 (en) 2016-09-26 2018-03-29 Splunk Inc. Dynamic resource allocation for real-time search
US11442935B2 (en) 2016-09-26 2022-09-13 Splunk Inc. Determining a record generation estimate of a processing task
US11250056B1 (en) 2016-09-26 2022-02-15 Splunk Inc. Updating a location marker of an ingestion buffer based on storing buckets in a shared storage system
US11222066B1 (en) 2016-09-26 2022-01-11 Splunk Inc. Processing data using containerized state-free indexing nodes in a containerized scalable environment
US11599541B2 (en) 2016-09-26 2023-03-07 Splunk Inc. Determining records generated by a processing task of a query
US11604795B2 (en) 2016-09-26 2023-03-14 Splunk Inc. Distributing partial results from an external data system between worker nodes
US11106734B1 (en) 2016-09-26 2021-08-31 Splunk Inc. Query execution using containerized state-free search nodes in a containerized scalable environment
US11615104B2 (en) 2016-09-26 2023-03-28 Splunk Inc. Subquery generation based on a data ingest estimate of an external data system
US10726009B2 (en) * 2016-09-26 2020-07-28 Splunk Inc. Query processing using query-resource usage and node utilization data
US10956415B2 (en) 2016-09-26 2021-03-23 Splunk Inc. Generating a subquery for an external data system using a configuration file
US11269939B1 (en) 2016-09-26 2022-03-08 Splunk Inc. Iterative message-based data processing including streaming analytics
US11586627B2 (en) 2016-09-26 2023-02-21 Splunk Inc. Partitioning and reducing records at ingest of a worker node
US10977260B2 (en) 2016-09-26 2021-04-13 Splunk Inc. Task distribution in an execution node of a distributed execution environment
US11663227B2 (en) 2016-09-26 2023-05-30 Splunk Inc. Generating a subquery for a distinct data intake and query system
US11874691B1 (en) 2016-09-26 2024-01-16 Splunk Inc. Managing efficient query execution including mapping of buckets to search nodes
US11580107B2 (en) 2016-09-26 2023-02-14 Splunk Inc. Bucket data distribution for exporting data to worker nodes
US11126632B2 (en) 2016-09-26 2021-09-21 Splunk Inc. Subquery generation based on search configuration data from an external data system
US11593377B2 (en) 2016-09-26 2023-02-28 Splunk Inc. Assigning processing tasks in a data intake and query system
US10984044B1 (en) 2016-09-26 2021-04-20 Splunk Inc. Identifying buckets for query execution using a catalog of buckets stored in a remote shared storage system
US10776355B1 (en) 2016-09-26 2020-09-15 Splunk Inc. Managing, storing, and caching query results and partial query results for combination with additional query results
US11567993B1 (en) 2016-09-26 2023-01-31 Splunk Inc. Copying buckets from a remote shared storage system to memory associated with a search node for query execution
US11416528B2 (en) 2016-09-26 2022-08-16 Splunk Inc. Query acceleration data store
US11023463B2 (en) 2016-09-26 2021-06-01 Splunk Inc. Converting and modifying a subquery for an external data system
US11860940B1 (en) 2016-09-26 2024-01-02 Splunk Inc. Identifying buckets for query execution using a catalog of buckets
US11232100B2 (en) 2016-09-26 2022-01-25 Splunk Inc. Resource allocation for multiple datasets
US11163758B2 (en) 2016-09-26 2021-11-02 Splunk Inc. External dataset capability compensation
US11243963B2 (en) 2016-09-26 2022-02-08 Splunk Inc. Distributing partial results to worker nodes from an external data system
US11003714B1 (en) 2016-09-26 2021-05-11 Splunk Inc. Search node and bucket identification using a search node catalog and a data store catalog
US11294941B1 (en) 2016-09-26 2022-04-05 Splunk Inc. Message-based data ingestion to a data intake and query system
US11281706B2 (en) 2016-09-26 2022-03-22 Splunk Inc. Multi-layer partition allocation for query execution
US11550847B1 (en) 2016-09-26 2023-01-10 Splunk Inc. Hashing bucket identifiers to identify search nodes for efficient query execution
US11461334B2 (en) 2016-09-26 2022-10-04 Splunk Inc. Data conditioning for dataset destination
US10795884B2 (en) 2016-09-26 2020-10-06 Splunk Inc. Dynamic resource allocation for common storage query
US11314753B2 (en) 2016-09-26 2022-04-26 Splunk Inc. Execution of a query received from a data intake and query system
US11620336B1 (en) 2016-09-26 2023-04-04 Splunk Inc. Managing and storing buckets to a remote shared storage system based on a collective bucket size
US10482098B2 (en) 2016-11-14 2019-11-19 Microsoft Technology Licensing, Llc Consuming streamed data records
US11003658B2 (en) * 2016-11-21 2021-05-11 International Business Machines Corporation Selectively retrieving data from remote share nothing computer clusters
US11106639B1 (en) 2016-12-05 2021-08-31 EMC IP Holding Company LLC Methods, systems, and computer readable mediums for performing metadata-driven data collection
US10592681B2 (en) 2017-01-10 2020-03-17 Snowflake Inc. Data sharing in a multi-tenant database system
EP3355225B1 (en) * 2017-01-31 2022-07-27 Sony Group Corporation Apparatus and method for providing a ethereum virtual device
CN108399102A (zh) * 2017-02-08 2018-08-14 阿里巴巴集团控股有限公司 一种资源分配方法和装置
US11157690B2 (en) 2017-02-22 2021-10-26 Microsoft Technology Licensing, Llc Techniques for asynchronous execution of computationally expensive local spreadsheet tasks
US10725799B2 (en) * 2017-02-22 2020-07-28 Microsoft Technology Licensing, Llc Big data pipeline management within spreadsheet applications
US10979328B2 (en) * 2017-03-31 2021-04-13 Intel Corporation Resource monitoring
US10733024B2 (en) 2017-05-24 2020-08-04 Qubole Inc. Task packing scheduling process for long running applications
US10671671B2 (en) 2017-06-09 2020-06-02 Microsoft Technology Licensing, Llc Supporting tuples in log-based representations of graph databases
US20180357328A1 (en) * 2017-06-09 2018-12-13 Linkedin Corporation Functional equivalence of tuples and edges in graph databases
US10445370B2 (en) 2017-06-09 2019-10-15 Microsoft Technology Licensing, Llc Compound indexes for graph databases
US11921672B2 (en) 2017-07-31 2024-03-05 Splunk Inc. Query execution at a remote heterogeneous data store of a data fabric service
US11113090B1 (en) 2017-08-09 2021-09-07 United Services Automobile Association (Usaa) Systems and methods for container management
US11249808B2 (en) * 2017-08-22 2022-02-15 Intel Corporation Connecting accelerator resources using a switch
CN107481006B (zh) * 2017-08-24 2020-06-26 维沃移动通信有限公司 一种资源转移方法、服务器及终端
CN107679096B (zh) * 2017-09-08 2020-06-05 北京京东尚科信息技术有限公司 数据集市间指标共享的方法和装置
US11151137B2 (en) 2017-09-25 2021-10-19 Splunk Inc. Multi-partition operation in combination operations
US10896182B2 (en) 2017-09-25 2021-01-19 Splunk Inc. Multi-partitioning determination for combination operations
CN109814861A (zh) * 2017-11-21 2019-05-28 海云数据 为终端用户提供能力的开放平台
US11228489B2 (en) 2018-01-23 2022-01-18 Qubole, Inc. System and methods for auto-tuning big data workloads on cloud platforms
WO2019183219A1 (en) 2018-03-22 2019-09-26 Snowflake Computing Inc. Incremental feature development and workload capture in database systems
TWI666901B (zh) * 2018-03-27 2019-07-21 緯穎科技服務股份有限公司 資料傳輸方法與使用此方法的主機系統
US11892996B1 (en) 2019-07-16 2024-02-06 Splunk Inc. Identifying an indexing node to process data using a resource catalog
US11275733B1 (en) 2018-04-30 2022-03-15 Splunk Inc. Mapping search nodes to a search head using a tenant identifier
US11157497B1 (en) * 2018-04-30 2021-10-26 Splunk Inc. Dynamically assigning a search head and search nodes for a query
US11327992B1 (en) 2018-04-30 2022-05-10 Splunk Inc. Authenticating a user to access a data intake and query system
US11334543B1 (en) 2018-04-30 2022-05-17 Splunk Inc. Scalable bucket merging for a data intake and query system
US20190364109A1 (en) * 2018-05-23 2019-11-28 Microsoft Technology Licensing, Llc Scale out data storage and query filtering using storage pools
US11030204B2 (en) * 2018-05-23 2021-06-08 Microsoft Technology Licensing, Llc Scale out data storage and query filtering using data pools
US20190362004A1 (en) * 2018-05-23 2019-11-28 Microsoft Technology Licensing, Llc Data platform fabric
US10949254B2 (en) * 2018-09-28 2021-03-16 Atlassian Pty Ltd. Systems and methods for scheduling tasks
US10339150B1 (en) * 2018-10-04 2019-07-02 Capital One Services, Llc Scalable dynamic acronym decoder
CN109582858A (zh) * 2018-10-17 2019-04-05 北京邮电大学 一种可信的知识生态系统
KR102047233B1 (ko) * 2018-10-22 2019-11-21 강릉원주대학교산학협력단 이중 부하 분산을 이용한 메타데이터 검색 시스템 및 이중 부하 분산을 통한 데이터베이스 관리 방법
CN113228000A (zh) * 2018-10-26 2021-08-06 斯诺弗雷克公司 物化视图的增量刷新
US11521089B2 (en) * 2018-11-29 2022-12-06 Sap Se In-database predictive pipeline incremental engine
CN109685375B (zh) * 2018-12-26 2020-10-30 重庆誉存大数据科技有限公司 一种基于半结构化文本数据的企业风险规则引擎运算方法
KR20200083048A (ko) * 2018-12-31 2020-07-08 삼성전자주식회사 폴링 시간을 예측하는 뉴럴 네트워크 시스템 및 이를 이용한 뉴럴 네트워크 모델 처리 방법
US11128701B1 (en) * 2019-03-28 2021-09-21 Amazon Technologies, Inc. Cooperative preemption in a distributed multi-tenant resource pool
US11194795B2 (en) * 2019-04-16 2021-12-07 Snowflake Inc. Automated maintenance of external tables in database systems
US11222022B2 (en) 2019-04-17 2022-01-11 Verizon Patent And Licensing Inc. Method and system for searching a key-value storage
US11048423B2 (en) 2019-04-17 2021-06-29 Verizon Media Inc. Method and system for synchronizing requests related to key-value storage having different portions
WO2020220216A1 (en) 2019-04-29 2020-11-05 Splunk Inc. Search time estimate in data intake and query system
US11715051B1 (en) 2019-04-30 2023-08-01 Splunk Inc. Service provider instance recommendations using machine-learned classifications and reconciliation
US11704316B2 (en) 2019-05-31 2023-07-18 Qubole, Inc. Systems and methods for determining peak memory requirements in SQL processing engines with concurrent subtasks
US11144360B2 (en) 2019-05-31 2021-10-12 Qubole, Inc. System and method for scheduling and running interactive database queries with service level agreements in a multi-tenant processing system
US11556640B1 (en) * 2019-06-27 2023-01-17 Mandiant, Inc. Systems and methods for automated cybersecurity analysis of extracted binary string sets
US11270531B2 (en) 2019-06-28 2022-03-08 GM Cruise Holdings, LLC Autonomous vehicle data management platform
US11416465B1 (en) 2019-07-16 2022-08-16 Splunk Inc. Processing data associated with different tenant identifiers
US11429604B2 (en) * 2019-09-10 2022-08-30 Oracle International Corporation Techniques of heterogeneous hardware execution for SQL analytic queries for high volume data processing
US11334604B2 (en) 2019-09-12 2022-05-17 Snowflake Inc. Private data exchange
US11265328B2 (en) 2019-09-12 2022-03-01 Snowflake Inc. Private data exchange metrics sharing
US11494380B2 (en) 2019-10-18 2022-11-08 Splunk Inc. Management of distributed computing framework components in a data fabric service system
US20210182070A1 (en) * 2019-12-11 2021-06-17 International Business Machines Corporation Explicit resource file to assign exact resources to job ranks
US11567939B2 (en) * 2019-12-26 2023-01-31 Snowflake Inc. Lazy reassembling of semi-structured data
US11308090B2 (en) 2019-12-26 2022-04-19 Snowflake Inc. Pruning index to support semi-structured data types
US11275725B2 (en) * 2020-01-29 2022-03-15 Salesforce.Com, Inc. Transporting a database structure from a first version to a second version
US11922222B1 (en) 2020-01-30 2024-03-05 Splunk Inc. Generating a modified component for a data intake and query system using an isolated execution environment image
US11829415B1 (en) 2020-01-31 2023-11-28 Splunk Inc. Mapping buckets and search peers to a bucket map identifier for searching
US11048716B1 (en) * 2020-01-31 2021-06-29 Snowflake Inc. Managed virtual warehouses for tasks
CN111291231B (zh) * 2020-02-14 2023-09-15 支付宝(杭州)信息技术有限公司 数据处理结果的存储方法及其系统
US11580102B2 (en) * 2020-04-02 2023-02-14 Ocient Holdings LLC Implementing linear algebra functions via decentralized execution of query operator flows
US10860381B1 (en) * 2020-05-14 2020-12-08 Snowflake Inc. Flexible computing
US11163768B1 (en) 2020-06-01 2021-11-02 Snowflake Inc. Checkpoints in batch file processing
US11347735B2 (en) 2020-06-01 2022-05-31 Snowflake Inc. Scalable query processing
US10997286B1 (en) * 2020-06-02 2021-05-04 Snowflake Inc. Secure code execution in a database system
US11556636B2 (en) * 2020-06-30 2023-01-17 Microsoft Technology Licensing, Llc Malicious enterprise behavior detection tool
US11687497B2 (en) * 2020-07-21 2023-06-27 Akamai Technologies Inc. Learning-based storage reduction in an overlay network
CN111881123B (zh) * 2020-07-22 2022-04-22 北京浪潮数据技术有限公司 分布式系统之间的数据同步方法及系统
US11615082B1 (en) 2020-07-31 2023-03-28 Splunk Inc. Using a data store and message queue to ingest data for a data intake and query system
CN112035516B (zh) * 2020-09-30 2023-08-18 北京百度网讯科技有限公司 用于算子服务的处理方法、装置、智能工作站和电子设备
US11609913B1 (en) 2020-10-16 2023-03-21 Splunk Inc. Reassigning data groups from backup to searching for a processing node
US11704313B1 (en) 2020-10-19 2023-07-18 Splunk Inc. Parallel branch operation using intermediary nodes
KR102360061B1 (ko) * 2020-11-17 2022-02-09 쿠팡 주식회사 데이터베이스 쿼리 효율 향상을 위한 시스템 및 방법.
CN112348444A (zh) * 2020-11-18 2021-02-09 关酢壬 一种基于互联网的物料仓库远程监控管理系统
CN113762865A (zh) * 2021-01-06 2021-12-07 北京京东乾石科技有限公司 一种库存信息处理方法和装置
CN112631527A (zh) * 2021-01-07 2021-04-09 上海明略人工智能(集团)有限公司 基于k8s多租户的Juypter Notebook代码远端存储方法及装置
US11138038B1 (en) * 2021-01-29 2021-10-05 Snowflake Inc. Adaptive freepool size prediction
US20220284056A1 (en) * 2021-03-05 2022-09-08 Oracle International Corporation Fast and memory efficient in-memory columnar graph updates while preserving analytical performance
US11354362B1 (en) 2021-05-06 2022-06-07 Workiva Inc. System and method for copying linked documents
CN113176878B (zh) * 2021-06-30 2021-10-08 深圳市维度数据科技股份有限公司 自动查询方法、装置和设备
CN113507464B (zh) * 2021-07-06 2023-10-13 深圳市吉芯微半导体有限公司 基于虚拟设备的数据访问方法、装置、设备及存储介质
US11914595B2 (en) 2021-07-13 2024-02-27 Capital One Services, Llc Virtual warehouse query monitoring and reporting
US11669529B2 (en) * 2021-07-13 2023-06-06 Capital One Services, Llc Dynamic query allocation to virtual warehouses
US11809395B1 (en) 2021-07-15 2023-11-07 Splunk Inc. Load balancing, failover, and reliable delivery of data in a data intake and query system
CN113488180B (zh) * 2021-07-28 2023-07-18 中国医学科学院医学信息研究所 一种临床指南知识建模方法及系统
WO2023137444A2 (en) * 2022-01-14 2023-07-20 Sentinel Labs Israel Ltd. Systems and methods for data management and query optimization
US11621882B1 (en) * 2022-01-28 2023-04-04 United Services Automobile Association (Usaa) Automated remedial actions for service level objective thresholds
CN114511149B (zh) * 2022-02-16 2022-12-02 长沙祥云瑞风信息技术有限公司 一种分层分布式气象预测平台、方法、介质及设备
TWI820684B (zh) * 2022-04-21 2023-11-01 騰升科技股份有限公司 開放式倉儲生產系統及方法
CN114945026A (zh) * 2022-04-24 2022-08-26 网易(杭州)网络有限公司 数据处理方法、装置和系统
US11914637B2 (en) * 2022-07-25 2024-02-27 Sap Se Image scaling cloud database
US11947559B1 (en) 2022-10-10 2024-04-02 Bank Of America Corporation Dynamic schema identification to process incoming data feeds in a database system
CN116150093B (zh) * 2023-03-04 2023-11-03 北京大道云行科技有限公司 一种对象存储列举对象的实现方法及电子设备
CN116226095A (zh) * 2023-05-08 2023-06-06 中用科技有限公司 一种无共享架构数据库的存算分离系统

Family Cites Families (500)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3074210A (en) 1959-07-28 1963-01-22 Yates American Machine Co Combination sander
US4967341A (en) * 1986-02-14 1990-10-30 Hitachi, Ltd. Method and apparatus for processing data base
US5325509A (en) 1991-03-05 1994-06-28 Zitel Corporation Method of operating a cache memory including determining desirability of cache ahead or cache behind based on a number of available I/O operations
US5634125A (en) * 1993-09-02 1997-05-27 International Business Machines Corporation Selecting buckets for redistributing data between nodes in a parallel database in the quiescent mode
US5584024A (en) * 1994-03-24 1996-12-10 Software Ag Interactive database query system and method for prohibiting the selection of semantically incorrect query parameters
US5694593A (en) * 1994-10-05 1997-12-02 Northeastern University Distributed computer database system and method
JPH08339323A (ja) * 1995-06-12 1996-12-24 Mitsubishi Electric Corp データベース管理システムにおける分散データ管理方式
US5864842A (en) * 1995-10-23 1999-01-26 Ncr Corporation Optimization of SQL queries using hash star join operations
US5892945A (en) * 1996-03-21 1999-04-06 Oracle Corporation Method and apparatus for distributing work granules among processes based on the location of data accessed in the work granules
US5787466A (en) 1996-05-01 1998-07-28 Sun Microsystems, Inc. Multi-tier cache and method for implementing such a system
DE19758466B4 (de) 1997-03-11 2007-10-04 Betriebsforschungsinstitut VDEh - Institut für angewandte Forschung GmbH Planheits-Regelungssystem für Metallband
FR2762110A1 (fr) * 1997-04-14 1998-10-16 Renishaw Plc Systeme formant capteur programmable
US5873074A (en) * 1997-04-18 1999-02-16 Informix Software, Inc. Applying distinct hash-join distributions of operators to both even and uneven database records
US6453334B1 (en) * 1997-06-16 2002-09-17 Streamtheory, Inc. Method and apparatus to allow remotely located computer programs and/or data to be accessed on a local computer in a secure, time-limited manner, with persistent caching
US6112198A (en) * 1997-06-30 2000-08-29 International Business Machines Corporation Optimization of data repartitioning during parallel query optimization
US6363411B1 (en) * 1998-08-05 2002-03-26 Mci Worldcom, Inc. Intelligent network
US7047300B1 (en) * 1998-02-10 2006-05-16 Sprint Communications Company L.P. Survivable and scalable data system and method for computer networks
US6209128B1 (en) * 1998-06-05 2001-03-27 International Business Machines Corporation Apparatus and method for providing access to multiple object versions
US6185557B1 (en) * 1998-07-31 2001-02-06 Unisys Corporation Merge join process
US6226639B1 (en) * 1998-09-22 2001-05-01 International Business Machines Corporation System and method for hybrid hash join using over-partitioning to respond to database query
JP4406944B2 (ja) * 1998-11-11 2010-02-03 株式会社日立製作所 計算機システム及び問合せに対する処理分散システム
US6338056B1 (en) * 1998-12-14 2002-01-08 International Business Machines Corporation Relational database extender that supports user-defined index types and user-defined search
US20020038308A1 (en) * 1999-05-27 2002-03-28 Michael Cappi System and method for creating a virtual data warehouse
JP2000348038A (ja) * 1999-06-02 2000-12-15 Fujitsu Ltd 半構造データベースのためのデータ格納装置および方法
US6374235B1 (en) * 1999-06-25 2002-04-16 International Business Machines Corporation Method, system, and program for a join operation on a multi-column table and satellite tables including duplicate values
CA2743462C (en) * 1999-07-30 2012-10-16 Basantkumar John Oommen A method of generating attribute cardinality maps
US6597956B1 (en) * 1999-08-23 2003-07-22 Terraspring, Inc. Method and apparatus for controlling an extensible computing system
JP3463803B2 (ja) * 1999-11-09 2003-11-05 松下電器産業株式会社 クラスタサーバ装置
US6938256B2 (en) * 2000-01-18 2005-08-30 Galactic Computing Corporation System for balance distribution of requests across multiple servers using dynamic metrics
US6604100B1 (en) * 2000-02-09 2003-08-05 At&T Corp. Method for converting relational data into a structured document
US6490590B1 (en) 2000-02-14 2002-12-03 Ncr Corporation Method of generating a logical data model, physical data model, extraction routines and load routines
US6484186B1 (en) * 2000-02-15 2002-11-19 Novell, Inc. Method for backing up consistent versions of open files
US7124144B2 (en) 2000-03-02 2006-10-17 Actuate Corporation Method and apparatus for storing semi-structured data in a structured manner
US6618720B1 (en) * 2000-06-15 2003-09-09 Ncr Corporation Common spool files for maintaining join indexes
US6826564B2 (en) * 2000-07-10 2004-11-30 Fastforward Networks Scalable and programmable query distribution and collection in a network of queryable devices
JP2002132455A (ja) 2000-10-25 2002-05-10 Hitachi Ltd キャッシュマネジャー及びこれを含むコンピュータシステム
US6954757B2 (en) 2001-02-02 2005-10-11 Hewlett-Packard Development Company, L.P. Framework, architecture, method and system for reducing latency of business operations of an enterprise
US7418620B1 (en) 2001-02-16 2008-08-26 Swsoft Holdings, Ltd. Fault tolerant distributed storage method and controller using (N,K) algorithms
US6804677B2 (en) * 2001-02-26 2004-10-12 Ori Software Development Ltd. Encoding semi-structured data for efficient search and browsing
JP2004533738A (ja) * 2001-03-02 2004-11-04 カセンナ インコーポレイテッド ネットワークにわたって低レイテンシで効率的にビデオコンテンツを配給するためのメタデータイネーブル型プッシュ−プルモデル
JP4129353B2 (ja) 2001-03-29 2008-08-06 株式会社東芝 分散データ管理システム、分散データ管理方法及び分散データ管理プログラム
US7085891B2 (en) * 2001-04-04 2006-08-01 International Business Machines Corporation Method for managing a cache memory using a predictive modeling engine to select a caching algorithm
US7085769B1 (en) * 2001-04-26 2006-08-01 Ncr Corporation Method and apparatus for performing hash join
US7797375B2 (en) * 2001-05-07 2010-09-14 International Business Machines Corporat System and method for responding to resource requests in distributed computer networks
US7363353B2 (en) * 2001-07-06 2008-04-22 Juniper Networks, Inc. Content service aggregation device for a data center
US7092951B1 (en) * 2001-07-06 2006-08-15 Ncr Corporation Auxiliary relation for materialized view
WO2003017136A1 (en) * 2001-08-16 2003-02-27 Etagon Israel Ltd. Using associative memory to perform database operations
US7499960B2 (en) * 2001-10-01 2009-03-03 Oracle International Corporation Adaptive memory allocation
US6954456B2 (en) * 2001-12-14 2005-10-11 At & T Corp. Method for content-aware redirection and content renaming
US7257597B1 (en) 2001-12-18 2007-08-14 Siebel Systems, Inc. Table substitution
US7188364B2 (en) 2001-12-20 2007-03-06 Cranite Systems, Inc. Personal virtual bridged local area networks
US7092954B1 (en) * 2001-12-31 2006-08-15 Ncr Corporation Optimizing an equi-join operation using a bitmap index structure
WO2003065634A2 (en) * 2002-02-01 2003-08-07 John Fairweather System and method for analyzing data
US7266823B2 (en) 2002-02-21 2007-09-04 International Business Machines Corporation Apparatus and method of dynamically repartitioning a computer system in response to partition workloads
JP2003271429A (ja) 2002-03-15 2003-09-26 Hitachi Ltd 記憶装置資源管理方法、記憶資源管理プログラム、該プログラムを記録した記録媒体、及び記憶資源管理装置
US7149737B1 (en) * 2002-04-04 2006-12-12 Ncr Corp. Locking mechanism using a predefined lock for materialized views in a database system
US7617179B2 (en) * 2002-06-29 2009-11-10 Ianywhere Solutions, Inc. System and methodology for cost-based subquery optimization using a left-deep tree join enumeration algorithm
US7379990B2 (en) 2002-08-12 2008-05-27 Tsao Sheng Ted Tai Distributed virtual SAN
US6996556B2 (en) 2002-08-20 2006-02-07 International Business Machines Corporation Metadata manager for database query optimizer
AU2003273333A1 (en) * 2002-09-18 2004-04-08 Netezza Corporation Field oriented pipeline architecture for a programmable data streaming processor
JP2004126804A (ja) * 2002-09-30 2004-04-22 Just Syst Corp 文書管理方法および装置
DE20217309U1 (de) 2002-11-09 2003-01-30 Eichenauer Heizelemente Gmbh Heizkörper für gasförmige Medien
US7395536B2 (en) 2002-11-14 2008-07-01 Sun Microsystems, Inc. System and method for submitting and performing computational tasks in a distributed heterogeneous networked environment
US6968335B2 (en) * 2002-11-14 2005-11-22 Sesint, Inc. Method and system for parallel processing of database queries
US7562090B2 (en) * 2002-12-19 2009-07-14 International Business Machines Corporation System and method for automating data partitioning in a parallel database
US8468227B2 (en) * 2002-12-31 2013-06-18 Motorola Solutions, Inc. System and method for rendering content on multiple devices
US20040181522A1 (en) * 2003-01-16 2004-09-16 Jardin Cary A. Shared memory router system and method for node communication in a distributed system
US20040181524A1 (en) * 2003-01-16 2004-09-16 Jardin Cary A. System and method for distributed processing in a node environment
US7490097B2 (en) 2003-02-20 2009-02-10 Microsoft Corporation Semi-structured data storage schema selection
JP2004252789A (ja) * 2003-02-21 2004-09-09 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置、情報検索方法、情報検索プログラム及びそのプログラムを記録した記録媒体
US7254636B1 (en) * 2003-03-14 2007-08-07 Cisco Technology, Inc. Method and apparatus for transparent distributed network-attached storage with web cache communication protocol/anycast and file handle redundancy
JP4313068B2 (ja) * 2003-03-28 2009-08-12 株式会社日立製作所 記憶装置のキャッシュ管理方法
US7111025B2 (en) * 2003-04-30 2006-09-19 International Business Machines Corporation Information retrieval system and method using index ANDing for improving performance
US7603464B2 (en) 2003-06-04 2009-10-13 Sony Computer Entertainment Inc. Method and system for identifying available resources in a peer-to-peer network
EP1634052A4 (en) 2003-06-06 2008-04-30 Univ Illinois DETECTION CHIP AND APPARATUS FOR TOUCH DETECTION AND / OR FLOW
US7280998B1 (en) 2003-07-28 2007-10-09 At&T Corp. Virtual data warehousing
JP2005056077A (ja) 2003-08-01 2005-03-03 Hitachi Ltd データベース制御方法
JP2005056085A (ja) * 2003-08-01 2005-03-03 Fujitsu Ltd データ構造変換プログラム
US7401104B2 (en) * 2003-08-21 2008-07-15 Microsoft Corporation Systems and methods for synchronizing computer systems through an intermediary file system share or device
US7349913B2 (en) * 2003-08-21 2008-03-25 Microsoft Corporation Storage platform for organizing, searching, and sharing data
WO2005028627A2 (en) * 2003-09-19 2005-03-31 Netezza Corporation Performing sequence analysis as a relational join
US7555504B2 (en) * 2003-09-23 2009-06-30 Emc Corporation Maintenance of a file version set including read-only and read-write snapshot copies of a production file
US20050081210A1 (en) * 2003-09-25 2005-04-14 International Business Machines Corporation Dynamic adjustment of system resource allocation during query execution in a database management system
KR100872204B1 (ko) 2003-10-15 2008-12-09 오에스아이 파마슈티컬스, 인코포레이티드 이미다조피라진 티로신 키나제 억제제
US20050091231A1 (en) * 2003-10-24 2005-04-28 Shankar Pal System and method for storing and retrieving XML data encapsulated as an object in a database store
CN1543138B (zh) * 2003-11-04 2010-09-08 浙江大学 宽带adsl业务自动处理系统
US7380039B2 (en) * 2003-12-30 2008-05-27 3Tera, Inc. Apparatus, method and system for aggregrating computing resources
US20050198303A1 (en) * 2004-01-02 2005-09-08 Robert Knauerhase Dynamic virtual machine service provider allocation
US7562143B2 (en) * 2004-01-13 2009-07-14 International Business Machines Corporation Managing escalating resource needs within a grid environment
US7136973B2 (en) 2004-02-04 2006-11-14 Sandisk Corporation Dual media storage device
JP4247135B2 (ja) * 2004-02-10 2009-04-02 株式会社東芝 構造化文書記憶方法、構造化文書記憶装置、構造化文書検索方法
US7843906B1 (en) * 2004-02-13 2010-11-30 Habanero Holdings, Inc. Storage gateway initiator for fabric-backplane enterprise servers
CN101120340B (zh) * 2004-02-21 2010-12-08 数据迅捷股份有限公司 超无共享并行数据库
US20050192937A1 (en) * 2004-02-26 2005-09-01 International Business Machines Corporation Dynamic query optimization
US7519608B2 (en) 2004-03-22 2009-04-14 Sliccware Secure virtual data warehousing system and method
JP4631301B2 (ja) * 2004-03-31 2011-02-16 株式会社日立製作所 記憶装置のキャッシュ管理方法
US20110145489A1 (en) * 2004-04-05 2011-06-16 Super Talent Electronics, Inc. Hybrid storage device
US8255388B1 (en) * 2004-04-30 2012-08-28 Teradata Us, Inc. Providing a progress indicator in a database system
US7644050B2 (en) * 2004-12-02 2010-01-05 International Business Machines Corporation Method and apparatus for annotation-based behavior extensions
US7395258B2 (en) * 2004-07-30 2008-07-01 International Business Machines Corporation System and method for adaptive database caching
EP1810131A4 (en) 2004-08-31 2011-05-11 Ibm ARCHITECTURE ORIENTED SERVICES FOR DATA INTEGRATION SERVICES
US7523098B2 (en) 2004-09-15 2009-04-21 International Business Machines Corporation Systems and methods for efficient data searching, storage and reduction
US20060074872A1 (en) 2004-09-30 2006-04-06 International Business Machines Corporation Adaptive database buffer memory management using dynamic SQL statement cache statistics
US7644083B1 (en) * 2004-09-30 2010-01-05 Teradata Us, Inc. Efficiently performing inequality joins
US7478080B2 (en) * 2004-09-30 2009-01-13 International Business Machines Corporation Canonical abstraction for outerjoin optimization
US20060090164A1 (en) * 2004-10-05 2006-04-27 Microsoft Corporation Object cloning for demand events
US7620953B1 (en) 2004-10-05 2009-11-17 Azul Systems, Inc. System and method for allocating resources of a core space among a plurality of core virtual machines
US7574424B2 (en) * 2004-10-13 2009-08-11 Sybase, Inc. Database system with methodology for parallel schedule generation in a query optimizer
US20060085451A1 (en) * 2004-10-15 2006-04-20 Microsoft Corporation Mapping of schema data into data structures
JP2006119745A (ja) * 2004-10-19 2006-05-11 Hitachi Ltd コンピュータシステム及びコンピュータシステムの制御方法
US8145642B2 (en) * 2004-11-30 2012-03-27 Oracle International Corporation Method and apparatus to support bitmap filtering in a parallel system
US7721292B2 (en) 2004-12-16 2010-05-18 International Business Machines Corporation System for adjusting resource allocation to a logical partition based on rate of page swaps and utilization by changing a boot configuration file
US7415487B2 (en) 2004-12-17 2008-08-19 Amazon Technologies, Inc. Apparatus and method for data warehousing
CN1622095A (zh) * 2004-12-27 2005-06-01 中国科学院软件研究所 可扩展标记语言文件存储及插入关系数据库表的方法
US7882100B2 (en) * 2005-01-24 2011-02-01 Sybase, Inc. Database system with methodology for generating bushy nested loop join trees
US8126870B2 (en) * 2005-03-28 2012-02-28 Sybase, Inc. System and methodology for parallel query optimization using semantic-based partitioning
US7512625B2 (en) * 2005-04-01 2009-03-31 International Business Machines Corporation Method, system and program for joining source table rows with target table rows
US7640230B2 (en) * 2005-04-05 2009-12-29 Microsoft Corporation Query plan selection control using run-time association mechanism
JP4839706B2 (ja) * 2005-07-12 2011-12-21 株式会社日立製作所 データベース管理システムのインデックス運用方法
US20070033247A1 (en) * 2005-08-02 2007-02-08 The Mathworks, Inc. Methods and system for distributing data to technical computing workers
US7475056B2 (en) * 2005-08-11 2009-01-06 Oracle International Corporation Query processing in a parallel single cursor model on multi-instance configurations, using hints
US20090234711A1 (en) * 2005-09-14 2009-09-17 Jorey Ramer Aggregation of behavioral profile data using a monetization platform
US20070067274A1 (en) * 2005-09-16 2007-03-22 International Business Machines Corporation Hybrid push-down/pull-up of unions with expensive operations in a federated query processor
US7814091B2 (en) * 2005-09-27 2010-10-12 Oracle International Corporation Multi-tiered query processing techniques for minus and intersect operators
US7870288B2 (en) * 2005-10-28 2011-01-11 Yahoo! Inc. Sharing data in scalable software blade architecture
JP4795778B2 (ja) * 2005-11-07 2011-10-19 株式会社東芝 データ管理装置、データ管理方法およびプログラム
US20070124274A1 (en) * 2005-11-30 2007-05-31 International Business Machines Corporation Apparatus and method for autonomic adjustment of resources in a logical partition to improve partitioned query performance
US7921132B2 (en) 2005-12-19 2011-04-05 Yahoo! Inc. System for query processing of column chunks in a distributed column chunk data store
US8073929B2 (en) * 2005-12-29 2011-12-06 Panasonic Electric Works Co., Ltd. Systems and methods for managing a provider's online status in a distributed network
US20070174290A1 (en) * 2006-01-19 2007-07-26 International Business Machines Corporation System and architecture for enterprise-scale, parallel data mining
US20070174429A1 (en) 2006-01-24 2007-07-26 Citrix Systems, Inc. Methods and servers for establishing a connection between a client system and a virtual machine hosting a requested computing environment
US7716238B2 (en) 2006-02-15 2010-05-11 Sony Computer Entertainment America Inc. Systems and methods for server management
US9229967B2 (en) * 2006-02-22 2016-01-05 Oracle International Corporation Efficient processing of path related operations on data organized hierarchically in an RDBMS
WO2007099273A1 (en) 2006-03-03 2007-09-07 Arm Limited Monitoring values of signals within an integrated circuit
US20070294692A1 (en) * 2006-06-16 2007-12-20 Microsoft Corporation Task Assignment Among Multiple Devices
US8359297B2 (en) 2006-06-29 2013-01-22 International Business Machines Corporation Multiple source data management using a conflict rule
US8074210B1 (en) * 2006-06-29 2011-12-06 Xilinx, Inc. Method and apparatus for producing optimized matrix triangulation routines
US20080005486A1 (en) * 2006-06-29 2008-01-03 Mannava Phanindra K Coordination of snoop responses in a multi-processor system
US7730119B2 (en) * 2006-07-21 2010-06-01 Sony Computer Entertainment Inc. Sub-task processor distribution scheduling
US7624118B2 (en) * 2006-07-26 2009-11-24 Microsoft Corporation Data processing over very large databases
US7991800B2 (en) 2006-07-28 2011-08-02 Aprimo Incorporated Object oriented system and method for optimizing the execution of marketing segmentations
US20080082644A1 (en) * 2006-09-29 2008-04-03 Microsoft Corporation Distributed parallel computing
US20080091806A1 (en) * 2006-10-11 2008-04-17 Jinmei Shen Dynamic On-Demand Clustering
US8589550B1 (en) * 2006-10-23 2013-11-19 Emc Corporation Asymmetric data storage system for high performance and grid computing
US8185893B2 (en) * 2006-10-27 2012-05-22 Hewlett-Packard Development Company, L.P. Starting up at least one virtual machine in a physical machine by a load balancer
JP4571609B2 (ja) * 2006-11-08 2010-10-27 株式会社日立製作所 リソース割当方法、リソース割当プログラム、および、管理コンピュータ
JP5379693B2 (ja) * 2006-11-13 2013-12-25 アイ・ピー・リザブワー・エル・エル・シー コプロセッサを使った構造化データおよび非構造化データの高性能の統合、処理および探索の方法およびシステム
US7844608B2 (en) * 2006-12-15 2010-11-30 Yahoo! Inc. Clustered query support for a database query engine
EP2114615A1 (de) 2007-02-06 2009-11-11 Siemens Aktiengesellschaft Lotzusammensetzung und hartlötverfahren für superlegierungen
US7657572B2 (en) 2007-03-06 2010-02-02 Microsoft Corporation Selectively utilizing a plurality of disparate solid state storage locations
US20080242315A1 (en) * 2007-03-27 2008-10-02 Gm Global Technology Operations, Inc. Traffic data collection utilizing a cellular communication network and probe units
US20080256549A1 (en) * 2007-04-10 2008-10-16 International Business Machines Corporation System and Method of Planning for Cooperative Information Processing
US8892624B2 (en) * 2007-04-10 2014-11-18 International Business Machines Corporation Method for the interoperation of virtual organizations
US7716183B2 (en) * 2007-04-11 2010-05-11 Dot Hill Systems Corporation Snapshot preserved data cloning
US8706914B2 (en) 2007-04-23 2014-04-22 David D. Duchesneau Computing infrastructure
US8015180B2 (en) * 2007-05-18 2011-09-06 Oracle International Corp. Queries with hard time constraints
CN101093559B (zh) * 2007-06-12 2010-06-23 北京科技大学 一种基于知识发现的专家系统构造方法
US8819080B2 (en) * 2007-06-13 2014-08-26 The Boeing Company System and method for collection, retrieval, and distribution of data
JP5011006B2 (ja) * 2007-07-03 2012-08-29 株式会社日立製作所 リソース割当方法、リソース割当プログラム、および、リソース割当装置
US20090010326A1 (en) * 2007-07-05 2009-01-08 Andreas Rossholm Method and apparatus for parallel video decoding
US7788233B1 (en) * 2007-07-05 2010-08-31 Amazon Technologies, Inc. Data store replication for entity based partition
US20090019103A1 (en) * 2007-07-11 2009-01-15 James Joseph Tommaney Method and system for processing a database query
US7984043B1 (en) * 2007-07-24 2011-07-19 Amazon Technologies, Inc. System and method for distributed query processing using configuration-independent query plans
US7966343B2 (en) 2008-04-07 2011-06-21 Teradata Us, Inc. Accessing data in a column store database based on hardware compatible data structures
US8862625B2 (en) 2008-04-07 2014-10-14 Teradata Us, Inc. Accessing data in a column store database based on hardware compatible indexing and replicated reordered columns
US9424315B2 (en) * 2007-08-27 2016-08-23 Teradata Us, Inc. Methods and systems for run-time scheduling database operations that are executed in hardware
JP5196924B2 (ja) * 2007-09-11 2013-05-15 株式会社東芝 データベース処理装置、方法及びプログラム
US8041773B2 (en) * 2007-09-24 2011-10-18 The Research Foundation Of State University Of New York Automatic clustering for self-organizing grids
EP2056562B1 (en) * 2007-11-02 2016-09-07 Alcatel Lucent Resilient service quality in a managed multimedia delivery network
US20090150511A1 (en) * 2007-11-08 2009-06-11 Rna Networks, Inc. Network with distributed shared memory
US8095512B2 (en) * 2007-11-19 2012-01-10 International Business Machines Corporation Managing database resources used for optimizing query execution on a parallel computer system
US8392404B2 (en) * 2007-11-19 2013-03-05 Teradata Us, Inc. Dynamic query and step routing between systems tuned for different objectives
CN101453398A (zh) * 2007-12-06 2009-06-10 怀特威盛软件公司 一种新型分布式网格超级计算系统及方法
US8150850B2 (en) * 2008-01-07 2012-04-03 Akiban Technologies, Inc. Multiple dimensioned database architecture
US8805949B2 (en) 2008-01-16 2014-08-12 Netapp, Inc. System and method for populating a cache using behavioral adaptive policies
US7925656B2 (en) * 2008-03-07 2011-04-12 International Business Machines Corporation Node level hash join for evaluating a query
US8386540B1 (en) * 2008-03-31 2013-02-26 Amazon Technologies, Inc. Scalable relational database service
EP2112799A1 (en) * 2008-04-25 2009-10-28 Koninklijke KPN N.V. Service integrity handling in an IMS-based system
US7930322B2 (en) 2008-05-27 2011-04-19 Microsoft Corporation Text based schema discovery and information extraction
US8073840B2 (en) 2008-06-17 2011-12-06 Attivio, Inc. Querying joined data within a search engine index
US20100011368A1 (en) * 2008-07-09 2010-01-14 Hiroshi Arakawa Methods, systems and programs for partitioned storage resources and services in dynamically reorganized storage platforms
US8813091B2 (en) 2008-08-04 2014-08-19 Oracle America, Inc. Distribution data structures for locality-guided work stealing
US8214329B2 (en) 2008-08-26 2012-07-03 Zeewise, Inc. Remote data collection systems and methods
US8032707B2 (en) 2008-09-15 2011-10-04 Microsoft Corporation Managing cache data and metadata
US8145806B2 (en) * 2008-09-19 2012-03-27 Oracle International Corporation Storage-side storage request management
CN101685449B (zh) * 2008-09-26 2012-07-11 国际商业机器公司 一种用于连接多个异构分布式数据库中的表的方法和系统
US20100082599A1 (en) * 2008-09-30 2010-04-01 Goetz Graefe Characterizing Queries To Predict Execution In A Database
US7738454B1 (en) 2008-09-30 2010-06-15 Juniper Networks, Inc. Methods and apparatus related to packet classification based on range values
US9069613B2 (en) * 2008-09-30 2015-06-30 Hewlett-Packard Development Company, L.P. Processing batch database workload while avoiding overload
US8505015B2 (en) * 2008-10-29 2013-08-06 Teradata Us, Inc. Placing a group work item into every prioritized work queue of multiple parallel processing units based on preferred placement of the work queues
US8566821B2 (en) * 2008-11-11 2013-10-22 Netapp Inc. Cloning virtual machines
US8214352B2 (en) * 2008-11-26 2012-07-03 Hewlett-Packard Development Company Modular query optimizer
JP4688111B2 (ja) * 2008-11-28 2011-05-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、データベース・システム、情報処理方法、およびプログラム
US8762367B2 (en) 2008-12-08 2014-06-24 Teradata Us, Inc. Accurate and timely enforcement of system resource allocation rules
JP5257843B2 (ja) 2008-12-12 2013-08-07 日本電気株式会社 分散キャッシュシステム、方法、プログラム、及び計算ノード
US8099411B2 (en) * 2008-12-15 2012-01-17 Teradata Us, Inc. System, method, and computer-readable medium for applying conditional resource throttles to facilitate workload management in a database system
US8301650B1 (en) 2008-12-19 2012-10-30 Google, Inc. Bloom filter compaction
JP5273718B2 (ja) 2008-12-22 2013-08-28 花王株式会社 電子写真用トナーの製造方法
US8666966B2 (en) * 2009-01-30 2014-03-04 Hewlett-Packard Development Company, L.P. Providing parallel result streams for database queries
US8762642B2 (en) 2009-01-30 2014-06-24 Twinstrata Inc System and method for secure and reliable multi-cloud data replication
US8055651B2 (en) * 2009-02-10 2011-11-08 International Business Machines Corporation Distribution of join operations on a multi-node computer system
WO2010099513A2 (en) * 2009-02-27 2010-09-02 Coach Wei Adaptive network with automatic scaling
US20100228819A1 (en) * 2009-03-05 2010-09-09 Yottaa Inc System and method for performance acceleration, data protection, disaster recovery and on-demand scaling of computer applications
JP5262864B2 (ja) * 2009-03-10 2013-08-14 富士通株式会社 記憶媒体、検索方法および検索装置
US9207984B2 (en) * 2009-03-31 2015-12-08 Amazon Technologies, Inc. Monitoring and automatic scaling of data volumes
US10163140B2 (en) 2009-04-10 2018-12-25 Shipwire, Inc. Online merchants to third party warehouse providers broker and order fulfillment system
US20100274750A1 (en) * 2009-04-22 2010-10-28 Microsoft Corporation Data Classification Pipeline Including Automatic Classification Rules
US8290972B1 (en) 2009-04-29 2012-10-16 Netapp, Inc. System and method for storing and accessing data using a plurality of probabilistic data structures
US8578076B2 (en) * 2009-05-01 2013-11-05 Citrix Systems, Inc. Systems and methods for establishing a cloud bridge between virtual storage resources
US8161244B2 (en) * 2009-05-13 2012-04-17 Microsoft Corporation Multiple cache directories
US8577892B2 (en) * 2009-06-05 2013-11-05 Microsoft Corporation Utilizing affinity groups to allocate data items and computing resources
US9852011B1 (en) * 2009-06-26 2017-12-26 Turbonomic, Inc. Managing resources in virtualization systems
US20100333116A1 (en) * 2009-06-30 2010-12-30 Anand Prahlad Cloud gateway system for managing data storage to cloud storage sites
US9836504B2 (en) * 2009-06-30 2017-12-05 Hewlett Packard Enterprise Development Lp Query progress estimation based on processed value packets
US8458799B2 (en) * 2009-06-30 2013-06-04 Nokia Corporation Method and apparatus for providing a scalable service platform using a network cache
US8352945B2 (en) * 2009-08-11 2013-01-08 International Business Machines Corporation System, method, and apparatus for scan-sharing for business intelligence queries in an in-memory database
JP5440067B2 (ja) * 2009-09-18 2014-03-12 富士通株式会社 キャッシュメモリ制御装置およびキャッシュメモリ制御方法
US8706715B2 (en) 2009-10-05 2014-04-22 Salesforce.Com, Inc. Methods and systems for joining indexes for query optimization in a multi-tenant database
US8620903B2 (en) * 2009-11-04 2013-12-31 Nec Laboratories America, Inc. Database distribution system and methods for scale-out applications
CN104465318B (zh) 2009-11-06 2018-04-24 株式会社半导体能源研究所 制造半导体器件的方法
US8688683B2 (en) * 2009-11-30 2014-04-01 Business Objects Software Ltd. Query plan reformulation
US8495250B2 (en) 2009-12-16 2013-07-23 International Business Machines Corporation Asynchronous file operations in a scalable multi-node file system cache for a remote cluster file system
US8458239B2 (en) 2009-12-16 2013-06-04 International Business Machines Corporation Directory traversal in a scalable multi-node file system cache for a remote cluster file system
US8200812B2 (en) 2009-12-31 2012-06-12 International Business Machines Corporation Reducing workload on a backend system using client side request throttling
US8631403B2 (en) * 2010-01-04 2014-01-14 Vmware, Inc. Method and system for managing tasks by dynamically scaling centralized virtual center in virtual infrastructure
US20110167033A1 (en) * 2010-01-05 2011-07-07 Strelitz David Allocating resources in a data warehouse
US8621145B1 (en) 2010-01-29 2013-12-31 Netapp, Inc. Concurrent content management and wear optimization for a non-volatile solid-state cache
US8260768B2 (en) * 2010-01-29 2012-09-04 Hewlett-Packard Development Company, L.P. Transformation of directed acyclic graph query plans to linear query plans
US9058334B2 (en) * 2010-02-11 2015-06-16 Emc Corporation Parallel file system processing
US8464255B2 (en) * 2010-03-12 2013-06-11 Microsoft Corporation Managing performance interference effects on cloud computing servers
US8458191B2 (en) * 2010-03-15 2013-06-04 International Business Machines Corporation Method and system to store RDF data in a relational store
US8996563B2 (en) 2010-04-06 2015-03-31 Tokutek, Inc. High-performance streaming dictionary
US8949834B2 (en) * 2010-04-07 2015-02-03 Yahoo! Inc. Modeling and scheduling asynchronous incremental workflows
US8572612B2 (en) * 2010-04-14 2013-10-29 International Business Machines Corporation Autonomic scaling of virtual machines in a cloud computing environment
US9852150B2 (en) * 2010-05-03 2017-12-26 Panzura, Inc. Avoiding client timeouts in a distributed filesystem
US8799413B2 (en) 2010-05-03 2014-08-05 Panzura, Inc. Distributing data for a distributed filesystem across multiple cloud storage systems
US8341363B2 (en) 2010-05-03 2012-12-25 Panzura, Inc. Efficient cloud network attached storage
US8630165B2 (en) * 2010-05-10 2014-01-14 Robert Robinson Scalable reliable failover in a network
CN102243629B (zh) * 2010-05-12 2013-02-27 北京安华金和科技有限公司 一种基于多级视图和触发器的数据库透明加解密方法
US8732473B2 (en) * 2010-06-01 2014-05-20 Microsoft Corporation Claim based content reputation service
US8874853B2 (en) * 2010-06-04 2014-10-28 International Business Machines Corporation Local and global memory request predictor
US8935232B2 (en) * 2010-06-04 2015-01-13 Yale University Query execution systems and methods
US8886631B2 (en) * 2010-06-04 2014-11-11 Yale University Query execution systems and methods
JP5332065B2 (ja) 2010-06-11 2013-11-06 株式会社日立製作所 クラスタ構成管理方法、管理装置及びプログラム
US20110314001A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Performing query expansion based upon statistical analysis of structured data
US8898324B2 (en) * 2010-06-24 2014-11-25 International Business Machines Corporation Data access management in a hybrid memory server
US9075665B2 (en) * 2010-06-29 2015-07-07 International Business Machines Corporation Smoothing peak system load via behavior prediction in collaborative systems with temporal data access patterns
US20120005307A1 (en) 2010-06-30 2012-01-05 Abhik Das Storage virtualization
US8381015B2 (en) 2010-06-30 2013-02-19 International Business Machines Corporation Fault tolerance for map/reduce computing
TWI480738B (zh) 2010-07-01 2015-04-11 Neodana Inc 藉由最佳化叢集特定組態之使用的處理種類來分割叢集間之處理
EP2596430B1 (en) * 2010-07-21 2019-06-19 Sqream Technologies Ltd A system and method for the parallel execution of database queries over cpus and multi core processors
CN101916261B (zh) 2010-07-28 2013-07-17 北京播思软件技术有限公司 一种分布式并行数据库系统的数据分区方法
US8290936B2 (en) * 2010-08-17 2012-10-16 International Business Machines Corporation Executing a query plan with display of intermediate results
JP5556498B2 (ja) 2010-08-17 2014-07-23 富士通株式会社 管理装置,ファイルサーバシステム,処理方法及び管理プログラム
US8832130B2 (en) * 2010-08-19 2014-09-09 Infosys Limited System and method for implementing on demand cloud database
US8775425B2 (en) * 2010-08-24 2014-07-08 International Business Machines Corporation Systems and methods for massive structured data management over cloud aware distributed file system
US8640137B1 (en) * 2010-08-30 2014-01-28 Adobe Systems Incorporated Methods and apparatus for resource management in cluster computing
US20120059817A1 (en) * 2010-09-07 2012-03-08 Teradata Us, Inc. Method for increasing the efficiency of synchronized scans through intelligent query dispatching
US8428087B1 (en) 2010-09-17 2013-04-23 Amazon Technologies, Inc. Framework for stateless packet tunneling
US8661120B2 (en) * 2010-09-21 2014-02-25 Amazon Technologies, Inc. Methods and systems for dynamically managing requests for computing capacity
US9705730B1 (en) * 2013-05-07 2017-07-11 Axcient, Inc. Cloud storage using Merkle trees
EP2442228A1 (en) * 2010-10-13 2012-04-18 Thomas Lippert A computer cluster arrangement for processing a computaton task and method for operation thereof
US9483313B2 (en) * 2010-10-19 2016-11-01 Microsoft Technology Licensing, Llc Availability management for reference data services
US20120101860A1 (en) 2010-10-25 2012-04-26 Ezzat Ahmed K Providing business intelligence
US20120036146A1 (en) * 2010-10-26 2012-02-09 ParElastic Corporation Apparatus for elastic database processing with heterogeneous data
US9645839B2 (en) 2010-10-27 2017-05-09 Microsoft Technology Licensing, Llc Stateful applications operating in a stateless cloud computing environment
US20120109868A1 (en) * 2010-11-01 2012-05-03 Microsoft Corporation Real-Time Adaptive Output
US9253016B2 (en) * 2010-11-02 2016-02-02 International Business Machines Corporation Management of a data network of a computing environment
WO2012061671A2 (en) 2010-11-05 2012-05-10 Albert Brian F Railroad car hand brake release system
US8738570B2 (en) * 2010-11-22 2014-05-27 Hitachi Data Systems Engineering UK Limited File cloning and de-cloning in a data storage system
EP2646928A4 (en) * 2010-12-03 2016-11-09 Hewlett Packard Entpr Dev Lp SYSTEMS AND METHODS FOR PERFORMING INPUT JOIN OPERATION
US8560887B2 (en) 2010-12-09 2013-10-15 International Business Machines Corporation Adding scalability and fault tolerance to generic finite state machine frameworks for use in automated incident management of cloud computing infrastructures
JP5659757B2 (ja) * 2010-12-09 2015-01-28 日本電気株式会社 分散データベース管理システム、分散データベース管理方法
US9058211B2 (en) * 2010-12-09 2015-06-16 Verizon Patent And Licensing Inc. Pre-validation in a computing on demand system
US20120151479A1 (en) 2010-12-10 2012-06-14 Salesforce.Com, Inc. Horizontal splitting of tasks within a homogenous pool of virtual machines
US20120158650A1 (en) * 2010-12-16 2012-06-21 Sybase, Inc. Distributed data cache database architecture
US9395957B2 (en) 2010-12-22 2016-07-19 Microsoft Technology Licensing, Llc Agile communication operator
US8478743B2 (en) * 2010-12-23 2013-07-02 Microsoft Corporation Asynchronous transfer of state information between continuous query plans
KR101473317B1 (ko) * 2010-12-23 2014-12-17 주식회사 케이티 클라우드 컴퓨팅 시스템 및 클라우드 컴퓨팅 시스템에서의 트래픽 분산 방법 및 제어 방법
CN102567378A (zh) * 2010-12-28 2012-07-11 上海杉达学院 基于异构数据的信息检索系统
US8527497B2 (en) 2010-12-30 2013-09-03 Facebook, Inc. Composite term index for graph data
EP2663891A4 (en) * 2011-01-10 2017-07-19 Storone Ltd. Large scale storage system
US8768878B2 (en) * 2011-01-21 2014-07-01 International Business Machines Corporation Characterizing business intelligence workloads
US8538954B2 (en) * 2011-01-25 2013-09-17 Hewlett-Packard Development Company, L.P. Aggregate function partitions for distributed processing
US8886742B2 (en) * 2011-01-28 2014-11-11 Level 3 Communications, Llc Content delivery network with deep caching infrastructure
US20120204187A1 (en) 2011-02-08 2012-08-09 International Business Machines Corporation Hybrid Cloud Workload Management
US8516355B2 (en) 2011-02-16 2013-08-20 Invensys Systems, Inc. System and method for fault tolerant computing using generic hardware
US20130205028A1 (en) 2012-02-07 2013-08-08 Rackspace Us, Inc. Elastic, Massively Parallel Processing Data Warehouse
US20120233315A1 (en) 2011-03-11 2012-09-13 Hoffman Jason A Systems and methods for sizing resources in a cloud-based environment
EP2686764A4 (en) * 2011-03-17 2015-06-03 Hewlett Packard Development Co DATA SOURCE ANALYTICS
CN102693168B (zh) 2011-03-22 2014-12-31 中兴通讯股份有限公司 一种数据备份恢复的方法、系统和服务节点
JP2012198843A (ja) 2011-03-23 2012-10-18 Fuji Xerox Co Ltd 仮想サーバ調整システム、仮想サーバ制御装置及びプログラム
US9292523B1 (en) * 2011-03-23 2016-03-22 Emc Corporation Managing data storage
US8983960B1 (en) * 2011-03-28 2015-03-17 Google Inc. Opportunistic job processing
JP5843459B2 (ja) * 2011-03-30 2016-01-13 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理システム、情報処理装置、スケーリング方法、プログラムおよび記録媒体
US8789062B2 (en) * 2011-04-05 2014-07-22 Teradata Us, Inc. Workload management of a concurrently accessed database server
US8806159B2 (en) 2011-04-08 2014-08-12 Symantec Corporation Data storage resource management systems and methods
JP5939740B2 (ja) 2011-04-11 2016-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 動的にリソースを割り当てる方法、システム及びプログラム
US20120265881A1 (en) 2011-04-14 2012-10-18 Yuan Chen Provisioning data center resources
US20120284307A1 (en) 2011-05-06 2012-11-08 Gopogo, Llc String Searching Systems and Methods Thereof
CN102779114B (zh) * 2011-05-12 2018-06-29 商业对象软件有限公司 利用自动规则生成的非结构化数据支持
CN103931156B (zh) 2011-05-14 2019-01-01 比特卡萨公司 具有用户不可知加密文件的服务器侧去重的云文件系统
JP5610227B2 (ja) 2011-05-18 2014-10-22 株式会社日立製作所 計算機及び識別子管理方法
CN103688259B (zh) 2011-05-19 2017-11-17 甲骨文国际公司 用于通过压缩和纵列存储进行自动数据放置的方法
US20120303633A1 (en) * 2011-05-26 2012-11-29 International Business Machines Corporation Systems and methods for querying column oriented databases
US10380269B2 (en) * 2011-06-07 2019-08-13 Entit Software Llc Sideways information passing
JP5508346B2 (ja) * 2011-06-13 2014-05-28 日本電信電話株式会社 分散データ管理システム、分散データ管理方法及び分散データ管理プログラム
US20120323971A1 (en) 2011-06-14 2012-12-20 Sybase, Inc. Optimizing data storage and access of an in-memory database
US8645958B2 (en) * 2011-06-16 2014-02-04 uCIRRUS Software virtual machine for content delivery
US20120324456A1 (en) * 2011-06-16 2012-12-20 Microsoft Corporation Managing nodes in a high-performance computing system using a node registrar
US8725875B2 (en) 2011-06-21 2014-05-13 Intel Corporation Native cloud computing via network segmentation
US9450838B2 (en) * 2011-06-27 2016-09-20 Microsoft Technology Licensing, Llc Resource management for cloud computing platforms
US8997107B2 (en) 2011-06-28 2015-03-31 Microsoft Technology Licensing, Llc Elastic scaling for cloud-hosted batch applications
WO2013006157A1 (en) 2011-07-01 2013-01-10 Hewlett-Packard Development Company, L.P. Method of and system for managing computing resources
CN102868542B (zh) * 2011-07-04 2018-02-16 中兴通讯股份有限公司 一种服务分发网络中服务质量的控制方法及系统
US20130013585A1 (en) * 2011-07-08 2013-01-10 Goetz Graefe Hash join and hash aggregation integration system
US10291721B2 (en) * 2011-07-15 2019-05-14 Vmware, Inc. Remote document signing
US8635411B2 (en) * 2011-07-18 2014-01-21 Arm Limited Data processing apparatus and method for managing coherency of cached data
US8676951B2 (en) 2011-07-27 2014-03-18 Hitachi, Ltd. Traffic reduction method for distributed key-value store
US10853306B2 (en) 2011-08-02 2020-12-01 Ajay JADHAV Cloud-based distributed persistence and cache data model
WO2012083705A1 (zh) * 2011-08-11 2012-06-28 华为技术有限公司 一种实现对称多处理系统的节点聚合系统
WO2013025556A1 (en) * 2011-08-12 2013-02-21 Splunk Inc. Elastic scaling of data volume
JP5342615B2 (ja) 2011-08-15 2013-11-13 株式会社日立システムズ 仮想サーバ制御システム及びプログラム
US8631131B2 (en) * 2011-09-07 2014-01-14 Red Hat Israel, Ltd. Virtual machine pool cache
US9298773B2 (en) * 2011-09-12 2016-03-29 Hewlett Packard Enterprise Development Lp Nested complex sequence pattern queries over event streams
US9043310B2 (en) * 2011-11-08 2015-05-26 International Business Machines Corporation Accessing a dimensional data model when processing a query
ES2427645B1 (es) 2011-11-15 2014-09-02 Telefónica, S.A. Método para gestionar el rendimiento en aplicaciones de múltiples capas implantadas en una infraestructura de tecnología de información
US20130124545A1 (en) 2011-11-15 2013-05-16 Business Objects Software Limited System and method implementing a text analysis repository
US20130124674A1 (en) * 2011-11-15 2013-05-16 Hitachi, Ltd. Computer system and data migration method
US8812895B2 (en) * 2011-11-21 2014-08-19 Verizon Patent And Licensing Inc. System redundancy and site recovery
US9122535B2 (en) * 2011-11-22 2015-09-01 Netapp, Inc. Optimizing distributed data analytics for shared storage
US9483491B2 (en) 2011-11-29 2016-11-01 Egnyte, Inc. Flexible permission management framework for cloud attached file systems
US8824787B2 (en) 2011-12-07 2014-09-02 Dunlop Sports Co., Ltd. Silhouette correction method and system and silhouette extraction method and system
CN102496060A (zh) 2011-12-07 2012-06-13 高汉中 基于神经网络的云端智能机系统
TWI461929B (zh) 2011-12-09 2014-11-21 Promise Tecnnology Inc 雲端數據儲存系統
US9313083B2 (en) 2011-12-09 2016-04-12 Empire Technology Development Llc Predictive caching of game content data
WO2013096887A1 (en) * 2011-12-23 2013-06-27 Amiato, Inc. Scalable analysis platform for semi-structured data
US8938475B2 (en) * 2011-12-27 2015-01-20 Sap Se Managing business objects data sources
US9110947B1 (en) * 2011-12-30 2015-08-18 Teradata Us, Inc. Column-oriented task execution in a row-partitioned database system
US8756609B2 (en) 2011-12-30 2014-06-17 International Business Machines Corporation Dynamically scaling multi-tier applications vertically and horizontally in a cloud environment
US8904008B2 (en) 2012-01-09 2014-12-02 Microsoft Corporation Assignment of resources in virtual machine pools
US20130185729A1 (en) 2012-01-13 2013-07-18 Rutgers, The State University Of New Jersey Accelerating resource allocation in virtualized environments using workload classes and/or workload signatures
US8732118B1 (en) * 2012-01-13 2014-05-20 Amazon Technologies, Inc. Distributed performance of data aggregation operations
US9009319B2 (en) * 2012-01-18 2015-04-14 Rackspace Us, Inc. Optimizing allocation of on-demand resources using performance
US9239851B1 (en) * 2012-07-12 2016-01-19 Cross Commerce Media, Inc. Advanced database systems and methods
JP5817558B2 (ja) 2012-01-27 2015-11-18 富士通株式会社 情報処理装置、分散処理システム、キャッシュ管理プログラムおよび分散処理方法
US9116812B2 (en) * 2012-01-27 2015-08-25 Intelligent Intellectual Property Holdings 2 Llc Systems and methods for a de-duplication cache
US9053029B2 (en) 2012-02-06 2015-06-09 Empire Technology Development Llc Multicore computer system with cache use based adaptive scheduling
US8553552B2 (en) * 2012-02-08 2013-10-08 Radisys Corporation Stateless load balancer in a multi-node system for transparent processing with packet preservation
US20130218837A1 (en) 2012-02-16 2013-08-22 Verizon Patent And Licensing Inc. Cloud data synchronization with local data
US9946563B2 (en) * 2012-02-21 2018-04-17 Disney Enterprises, Inc. Batch scheduler management of virtual machines
US9268590B2 (en) 2012-02-29 2016-02-23 Vmware, Inc. Provisioning a cluster of distributed computing platform based on placement strategy
JP5957965B2 (ja) * 2012-03-02 2016-07-27 日本電気株式会社 仮想化システム、負荷分散装置、負荷分散方法、及び負荷分散プログラム
US10031783B2 (en) * 2012-03-02 2018-07-24 Vmware, Inc. Execution of a distributed deployment plan for a multi-tier application in a cloud infrastructure
JP2013196421A (ja) 2012-03-21 2013-09-30 Nec Corp 仮想化システム、仮想サーバ、メモリ管理方法及びメモリ管理プログラム
EP2828742A4 (en) * 2012-03-22 2016-05-18 Tier 3 Inc SUPPLY IN FLEXIBLE MEMORY
US20130263117A1 (en) * 2012-03-28 2013-10-03 International Business Machines Corporation Allocating resources to virtual machines via a weighted cost ratio
US8595262B1 (en) * 2012-03-29 2013-11-26 Amazon Technologies, Inc. Resource resolution in computing environments using directed graphs
US9020890B2 (en) * 2012-03-30 2015-04-28 Commvault Systems, Inc. Smart archiving and data previewing for mobile devices
US9639575B2 (en) * 2012-03-30 2017-05-02 Khalifa University Of Science, Technology And Research Method and system for processing data queries
US20130262433A1 (en) * 2012-04-02 2013-10-03 James Qiu Filtering a Distributed Join
US9501550B2 (en) * 2012-04-18 2016-11-22 Renmin University Of China OLAP query processing method oriented to database and HADOOP hybrid platform
US9465829B2 (en) 2012-04-30 2016-10-11 Sap Se Partial merge
US9124612B2 (en) * 2012-05-15 2015-09-01 Splunk Inc. Multi-site clustering
US8954419B2 (en) * 2012-05-22 2015-02-10 Oracle International Corporation Method for serial and condition-based execution of operators by parallel processes
US8904402B2 (en) * 2012-05-30 2014-12-02 Red Hat, Inc. Controlling capacity in a multi-tenant platform-as-a-service environment in a cloud computing system
US8965921B2 (en) * 2012-06-06 2015-02-24 Rackspace Us, Inc. Data management and indexing across a distributed database
US10341435B2 (en) 2012-06-12 2019-07-02 Centurylink Intellectual Property Llc High performance cloud storage
US9355146B2 (en) * 2012-06-29 2016-05-31 International Business Machines Corporation Efficient partitioned joins in a database with column-major layout
US10339056B2 (en) 2012-07-03 2019-07-02 Sandisk Technologies Llc Systems, methods and apparatus for cache transfers
EP2682878A1 (en) * 2012-07-04 2014-01-08 Software AG Method of processing relational queries in a database system and corresponding database system
US9396008B2 (en) * 2012-07-13 2016-07-19 Ca, Inc. System and method for continuous optimization of computing systems with automated assignment of virtual machines and physical machines to hosts
US9529808B1 (en) * 2012-07-16 2016-12-27 Tintri Inc. Efficient and flexible organization and management of file metadata
US10528262B1 (en) * 2012-07-26 2020-01-07 EMC IP Holding Company LLC Replication-based federation of scalable data across multiple sites
CN104756078B (zh) * 2012-08-20 2018-07-13 唐纳德·凯文·卡梅伦 处理资源分配的装置和方法
US9563480B2 (en) 2012-08-21 2017-02-07 Rackspace Us, Inc. Multi-level cloud computing system
WO2014031618A2 (en) * 2012-08-22 2014-02-27 Bitvore Corp. Data relationships storage platform
US9396231B2 (en) * 2012-09-04 2016-07-19 Salesforce.Com, Inc. Facilitating dynamically controlled fetching of data at client computing devices in an on-demand services environment
US20140067852A1 (en) * 2012-09-06 2014-03-06 salesforce.com,inc. Mechanism for facilitating scaling and efficient management of database systems and resources in an on-demand services environment
US9164702B1 (en) * 2012-09-07 2015-10-20 Google Inc. Single-sided distributed cache system
US10169446B1 (en) 2012-09-10 2019-01-01 Amazon Technologies, Inc. Relational modeler and renderer for non-relational data
US10768983B2 (en) * 2012-09-12 2020-09-08 Salesforce.Com, Inc. Mechanism for facilitating a quorum-based coordination of broker health for management of resources for application servers in an on-demand services environment
US9106721B2 (en) 2012-10-02 2015-08-11 Nextbit Systems Application state synchronization across multiple devices
US9292568B2 (en) * 2012-10-10 2016-03-22 Dell Products L.P. Method and system for dynamically optimizing client queries to read-mostly servers
US9405579B2 (en) 2012-10-11 2016-08-02 International Business Machines Corporation Seamless extension of local computing power
TW201416873A (zh) 2012-10-19 2014-05-01 Apacer Technology Inc 網路儲存系統的檔案分享方法
US9514208B2 (en) * 2012-10-30 2016-12-06 Vekatachary Srinivasan Method and system of stateless data replication in a distributed database system
US9449040B2 (en) * 2012-11-26 2016-09-20 Amazon Technologies, Inc. Block restore ordering in a streaming restore system
US9847907B2 (en) * 2012-11-26 2017-12-19 Amazon Technologies, Inc. Distributed caching cluster management
US8793373B2 (en) 2012-12-06 2014-07-29 Hitachi, Ltd. Network system and method for operating the same
US9847917B2 (en) * 2012-12-13 2017-12-19 Level 3 Communications, Llc Devices and methods supporting content delivery with adaptation services with feedback
US9268834B2 (en) * 2012-12-13 2016-02-23 Microsoft Technology Licensing, Llc Distributed SQL query processing using key-value storage system
US9189285B2 (en) * 2012-12-14 2015-11-17 Microsoft Technology Licensing, Llc Scalable services deployment
US9152642B2 (en) * 2012-12-21 2015-10-06 Zetta, Inc. Systems and methods for on-demand data storage
US9021452B2 (en) * 2012-12-27 2015-04-28 Commvault Systems, Inc. Automatic identification of storage requirements, such as for use in selling data storage management solutions
US10346259B2 (en) * 2012-12-28 2019-07-09 Commvault Systems, Inc. Data recovery using a cloud-based remote data recovery center
US9081826B2 (en) * 2013-01-07 2015-07-14 Facebook, Inc. System and method for distributed database query engines
US20140196039A1 (en) * 2013-01-08 2014-07-10 Commvault Systems, Inc. Virtual machine categorization system and method
US9158812B2 (en) * 2013-01-30 2015-10-13 Oracle International Corporation Enhancing parallelism in evaluation ranking/cumulative window functions
US9665477B2 (en) * 2013-02-01 2017-05-30 International Business Machines Corporation Allocating additional requested storage space for a data set in a first managed space in a second managed space
US9553773B2 (en) 2013-02-05 2017-01-24 Cisco Technology, Inc. Learning machine based computation of network join times
US9336272B1 (en) * 2013-02-13 2016-05-10 Amazon Technologies, Inc. Global query hint specification
US10339157B2 (en) * 2013-02-13 2019-07-02 Facebook, Inc. Hive table links
US9928287B2 (en) * 2013-02-24 2018-03-27 Technion Research & Development Foundation Limited Processing query to graph database
US9805053B1 (en) * 2013-02-25 2017-10-31 EMC IP Holding Company LLC Pluggable storage system for parallel query engines
US9275110B2 (en) * 2013-03-01 2016-03-01 Paraccel Llc Disk-based hash join process
US9049193B2 (en) * 2013-03-05 2015-06-02 Vmware, Inc. Method and system for distributing resource-availability information within a distrubited computer system
US9773041B2 (en) * 2013-03-06 2017-09-26 Oracle International Corporation Methods and apparatus of shared expression evaluation across RDBMS and storage layer
US10248670B1 (en) * 2013-03-14 2019-04-02 Open Text Corporation Method and system for migrating content between enterprise content management systems
US9639562B2 (en) * 2013-03-15 2017-05-02 Oracle International Corporation Automatically determining an optimal database subsection
US10019481B2 (en) * 2013-03-15 2018-07-10 Oracle International Corporation Adaptive selection of a distribution method during execution of parallel join operations
US20140280964A1 (en) * 2013-03-15 2014-09-18 Gravitant, Inc. Systems, methods and computer readable mediums for implementing cloud service brokerage platform functionalities
US9118538B1 (en) * 2013-03-15 2015-08-25 Emc Corporation Method and system for configuring resources to enable resource monitoring
US10296462B2 (en) 2013-03-15 2019-05-21 Oracle International Corporation Method to accelerate queries using dynamically generated alternate data formats in flash cache
US9176895B2 (en) * 2013-03-16 2015-11-03 Intel Corporation Increased error correction for cache memories through adaptive replacement policies
WO2014165538A2 (en) * 2013-04-01 2014-10-09 Nebula, Inc. Update management for a distributed computing system
US9172621B1 (en) * 2013-04-01 2015-10-27 Amazon Technologies, Inc. Unified account metadata management
US9495395B2 (en) * 2013-04-11 2016-11-15 Oracle International Corporation Predictive diagnosis of SLA violations in cloud services by seasonal trending and forecasting with thread intensity analytics
US9304663B1 (en) * 2013-04-12 2016-04-05 Groupon, Inc. Centralized, scalable, resource monitoring system
US9213726B2 (en) * 2013-04-15 2015-12-15 Amazon Technologies, Inc. Database cost tracing and analysis
US9690829B2 (en) 2013-04-15 2017-06-27 Vmware, Inc. Dynamic load balancing during distributed query processing using query operator motion
US9448966B2 (en) * 2013-04-26 2016-09-20 Futurewei Technologies, Inc. System and method for creating highly scalable high availability cluster in a massively parallel processing cluster of machines in a network
US9208032B1 (en) * 2013-05-15 2015-12-08 Amazon Technologies, Inc. Managing contingency capacity of pooled resources in multiple availability zones
US9582297B2 (en) * 2013-05-16 2017-02-28 Vmware, Inc. Policy-based data placement in a virtualized computing environment
CN203261358U (zh) 2013-05-28 2013-10-30 马传志 一种基于遗传算法的云计算服务器群
CN103279351B (zh) * 2013-05-31 2016-06-29 北京高森明晨信息科技有限公司 一种任务调度的方法及装置
US9280551B2 (en) * 2013-06-03 2016-03-08 International Business Machines Corporation De-duplication deployment planning
US8849764B1 (en) * 2013-06-13 2014-09-30 DataGravity, Inc. System and method of data intelligent storage
US9146979B2 (en) * 2013-06-13 2015-09-29 Sap Se Optimization of business warehouse queries by calculation engines
US9213706B2 (en) * 2013-06-13 2015-12-15 DataGravity, Inc. Live restore for a data intelligent storage system
US20140379725A1 (en) * 2013-06-19 2014-12-25 Microsoft Corporation On demand parallelism for columnstore index build
WO2014203023A1 (en) * 2013-06-19 2014-12-24 Hitachi Data Systems Engineering UK Limited Decentralized distributed computing system
US9600500B1 (en) * 2013-06-21 2017-03-21 Amazon Technologies, Inc. Single phase transaction commits for distributed database transactions
US10282350B1 (en) * 2013-06-21 2019-05-07 Amazon Technologies, Inc. Data store optimizer
US20140379691A1 (en) * 2013-06-21 2014-12-25 Microsoft Corporation Database query processing with reduce function configuration
GB2515501A (en) * 2013-06-25 2014-12-31 Ibm Replication for on-line hot-standby database
US20150006254A1 (en) * 2013-06-26 2015-01-01 Landvoice Data, LLC Systems apparatus and methods for real estate sales lead generation
US8706798B1 (en) * 2013-06-28 2014-04-22 Pepperdata, Inc. Systems, methods, and devices for dynamic resource monitoring and allocation in a cluster system
JP6291573B2 (ja) * 2013-07-02 2018-03-14 コンヴィーダ ワイヤレス, エルエルシー セマンティクス公表および発見のための機構
US9256631B2 (en) * 2013-07-31 2016-02-09 Oracle International Corporation Building a hash table using vectorized instructions
US9659046B2 (en) * 2013-07-31 2017-05-23 Oracle Inernational Corporation Probing a hash table using vectorized instructions
US9338226B2 (en) * 2013-08-12 2016-05-10 Fred Korangy Actor system and method for analytics and processing of big data
US10133797B1 (en) * 2013-08-16 2018-11-20 Amazon Technologies, Inc. Distributed heterogeneous system for data warehouse management
US10089142B2 (en) * 2013-08-21 2018-10-02 Hasso-Plattner-Institut Fur Softwaresystemtechnik Gmbh Dynamic task prioritization for in-memory databases
US9489423B1 (en) * 2013-08-22 2016-11-08 Amazon Technologies, Inc. Query data acquisition and analysis
US11423377B1 (en) * 2013-08-26 2022-08-23 Amazon Technologies, Inc. Lendable computing resources
US9870269B1 (en) * 2013-09-05 2018-01-16 Amazon Technologies, Inc. Job allocation in a clustered environment
US9471711B2 (en) * 2013-09-23 2016-10-18 Teradata Us, Inc. Schema-less access to stored data
US9424300B2 (en) * 2013-09-25 2016-08-23 International Business Machines Corporation Data allocation containers in a partitioned table of a computer database system for holding data based on usage
US9379982B1 (en) * 2013-09-30 2016-06-28 Juniper Networks, Inc. Adaptive stateless load balancing
US10031761B2 (en) * 2013-10-11 2018-07-24 International Business Machines Corporation Pluggable cloud enablement boot device and method
US9740797B2 (en) 2013-10-14 2017-08-22 Inha-Industry Partnership Institute Counting bloom filter
US10552745B2 (en) * 2013-10-18 2020-02-04 Netflix, Inc. Predictive auto scaling engine
US10642800B2 (en) 2013-10-25 2020-05-05 Vmware, Inc. Multi-tenant distributed computing and database
US20150120555A1 (en) * 2013-10-29 2015-04-30 Elwha Llc Exchange authorization analysis infused with network-acquired data stream information
US20150120224A1 (en) * 2013-10-29 2015-04-30 C3 Energy, Inc. Systems and methods for processing data relating to energy usage
US9880933B1 (en) * 2013-11-20 2018-01-30 Amazon Technologies, Inc. Distributed in-memory buffer cache system using buffer cache nodes
US10776325B2 (en) * 2013-11-26 2020-09-15 Ab Initio Technology Llc Parallel access to data in a distributed file system
US10198292B2 (en) * 2013-11-27 2019-02-05 Actian Sub Iii, Inc. Scheduling database queries based on elapsed time of queries
US20150163721A1 (en) * 2013-12-11 2015-06-11 Jdsu Uk Limited Method and apparatus for processing data
US20150172204A1 (en) * 2013-12-13 2015-06-18 International Business Machines Corporation Dynamically Change Cloud Environment Configurations Based on Moving Workloads
US9471510B2 (en) * 2013-12-20 2016-10-18 Netapp, Inc. System and method for cache monitoring in storage systems
US9569493B2 (en) * 2013-12-31 2017-02-14 International Business Machines Corporatin Avoidance of intermediate data skew in a massive parallel processing environment
US9256534B2 (en) * 2014-01-06 2016-02-09 International Business Machines Corporation Data shuffling in a non-uniform memory access device
US9514184B2 (en) * 2014-01-14 2016-12-06 Dropbox, Inc. Systems and methods for a high speed query infrastructure
US9535956B2 (en) * 2014-01-31 2017-01-03 Oracle International Corporation Efficient set operation execution using a single group-by operation
US9870390B2 (en) * 2014-02-18 2018-01-16 Oracle International Corporation Selecting from OR-expansion states of a query
US10108686B2 (en) 2014-02-19 2018-10-23 Snowflake Computing Inc. Implementation of semi-structured data as a first-class database element
US10120902B2 (en) * 2014-02-20 2018-11-06 Citus Data Bilgi Islemleri Ticaret A.S. Apparatus and method for processing distributed relational algebra operators in a distributed database
US9792328B2 (en) * 2014-03-13 2017-10-17 Sybase, Inc. Splitting of a join operation to allow parallelization
US9836505B2 (en) * 2014-03-13 2017-12-05 Sybase, Inc. Star and snowflake join query performance
US9454574B2 (en) * 2014-03-28 2016-09-27 Sybase, Inc. Bloom filter costing estimation
US10387449B2 (en) * 2014-05-30 2019-08-20 Hitachi Vantara Corporation Metadata favored replication in active topologies
US9996597B2 (en) * 2014-06-06 2018-06-12 The Mathworks, Inc. Unified mapreduce framework for large-scale data processing
CN106537345B (zh) * 2014-06-13 2020-10-13 皮沃塔尔软件公司 在多进程计算环境中精确跟踪内存使用
US10860237B2 (en) * 2014-06-24 2020-12-08 Oracle International Corporation Storage integrated snapshot cloning for database
US9705815B2 (en) * 2014-06-27 2017-07-11 Juniper Networks, Inc. Graph database for services planning and configuration in network services domain
US9335989B2 (en) * 2014-07-13 2016-05-10 International Business Machines Corporation Building a pattern to define a topology and application environment using software components and software updates/fixes from external repositories from multiple vendors
US9621354B2 (en) * 2014-07-17 2017-04-11 Cisco Systems, Inc. Reconstructable content objects
US9747331B2 (en) * 2014-10-06 2017-08-29 International Business Machines Corporation Limiting scans of loosely ordered and/or grouped relations in a database
US9922103B2 (en) * 2014-10-21 2018-03-20 Bank Of America Corporation Copying datasets between data integration systems
US9628350B2 (en) * 2014-11-05 2017-04-18 Amazon Technologies, Inc. Dynamic scaling of storage volumes for storage client file systems
US9256467B1 (en) * 2014-11-11 2016-02-09 Amazon Technologies, Inc. System for managing and scheduling containers
US9417897B1 (en) * 2014-12-05 2016-08-16 Amazon Technologies, Inc. Approaches for managing virtual instance data
US9984081B2 (en) * 2015-01-30 2018-05-29 Oracle International Corporation Workload aware data placement for join-based query processing in a cluster
US10574745B2 (en) * 2015-03-31 2020-02-25 Western Digital Technologies, Inc. Syncing with a local paired device to obtain data from a remote server using point-to-point communication
US9632846B2 (en) 2015-04-02 2017-04-25 Microsoft Technology Licensing, Llc Complex event processor for historic/live/replayed data
US9990392B2 (en) * 2015-04-07 2018-06-05 Sap Se Distributed transaction processing in MPP databases
US9848041B2 (en) * 2015-05-01 2017-12-19 Amazon Technologies, Inc. Automatic scaling of resource instance groups within compute clusters
US20160373405A1 (en) * 2015-06-16 2016-12-22 Amazon Technologies, Inc. Managing dynamic ip address assignments
US9798526B2 (en) * 2015-12-22 2017-10-24 Sap Se Software development using multi-domain decision management
US10585889B2 (en) * 2015-12-23 2020-03-10 Intel Corporation Optimizing skewed joins in big data
US20170270154A1 (en) * 2016-03-18 2017-09-21 At&T Intellectual Property I, L.P. Methods and apparatus to manage database metadata
US10055305B2 (en) * 2016-04-28 2018-08-21 Netapp, Inc. Techniques to perform system management processing for database systems
US10735394B2 (en) * 2016-08-05 2020-08-04 Oracle International Corporation Caching framework for a multi-tenant identity and data security management cloud service
US10325021B2 (en) 2017-06-19 2019-06-18 GM Global Technology Operations LLC Phrase extraction text analysis method and system
US10380112B2 (en) * 2017-07-31 2019-08-13 International Business Machines Corporation Joining two data tables on a join attribute
US10379942B2 (en) * 2017-09-27 2019-08-13 International Business Machines Corporation Efficient transfer of objects between containers on the same vault
US10397317B2 (en) * 2017-09-29 2019-08-27 Oracle International Corporation Boomerang join: a network efficient, late-materialized, distributed join technique
US20220335005A1 (en) * 2021-04-20 2022-10-20 Pure Storage, Inc. Storage-deferred copying between different file systems

Also Published As

Publication number Publication date
US11294933B2 (en) 2022-04-05
US20220156282A1 (en) 2022-05-19
US20200257701A1 (en) 2020-08-13
CA3025939A1 (en) 2017-12-07
DE202015009779U1 (de) 2020-02-06
EP3108369A4 (en) 2017-08-09
US20200201883A1 (en) 2020-06-25
US20200151193A1 (en) 2020-05-14
US20160275160A1 (en) 2016-09-22
US10534794B2 (en) 2020-01-14
US20220292111A1 (en) 2022-09-15
US11238061B2 (en) 2022-02-01
US11734307B2 (en) 2023-08-22
WO2015126968A3 (en) 2015-10-15
US20210042326A1 (en) 2021-02-11
EP3926474A1 (en) 2021-12-22
JP7163268B2 (ja) 2022-10-31
US9665633B2 (en) 2017-05-30
EP3910480A1 (en) 2021-11-17
US20210326356A1 (en) 2021-10-21
US20150234914A1 (en) 2015-08-20
US11475044B2 (en) 2022-10-18
US10891306B2 (en) 2021-01-12
US9842152B2 (en) 2017-12-12
EP3108386B1 (en) 2021-06-23
EP3108364A4 (en) 2017-11-22
US11573978B2 (en) 2023-02-07
WO2015126973A2 (en) 2015-08-27
US20150237137A1 (en) 2015-08-20
DE202015009785U1 (de) 2020-02-12
US10846304B2 (en) 2020-11-24
US20220156283A1 (en) 2022-05-19
US20200257703A1 (en) 2020-08-13
DE202017007211U1 (de) 2020-02-04
EP3108375A1 (en) 2016-12-28
US20200364237A1 (en) 2020-11-19
JP2017512339A (ja) 2017-05-18
US20220114194A1 (en) 2022-04-14
US20170123854A1 (en) 2017-05-04
US11269919B2 (en) 2022-03-08
US20200201881A1 (en) 2020-06-25
US20210103600A1 (en) 2021-04-08
US11782950B2 (en) 2023-10-10
DE202015009777U1 (de) 2020-02-05
US11163794B2 (en) 2021-11-02
US11269921B2 (en) 2022-03-08
US11507598B2 (en) 2022-11-22
US11755617B2 (en) 2023-09-12
US20150234688A1 (en) 2015-08-20
US20200201880A1 (en) 2020-06-25
US11132380B2 (en) 2021-09-28
CN109564564A (zh) 2019-04-02
AU2015219117A1 (en) 2016-09-01
EP3108386A4 (en) 2017-08-02
EP3465485A4 (en) 2019-12-25
US11334597B2 (en) 2022-05-17
CN106104526B (zh) 2020-02-04
US20210271690A1 (en) 2021-09-02
CA2939905C (en) 2023-09-12
CN106233275A (zh) 2016-12-14
US20230042949A1 (en) 2023-02-09
US20230046201A1 (en) 2023-02-16
AU2015219106A1 (en) 2016-09-01
EP3828723B1 (en) 2023-10-25
JP2017507424A (ja) 2017-03-16
US11238060B2 (en) 2022-02-01
US10366102B2 (en) 2019-07-30
US20210232598A1 (en) 2021-07-29
US20170235750A1 (en) 2017-08-17
CA2939947C (en) 2022-07-12
US11010407B2 (en) 2021-05-18
US11354334B2 (en) 2022-06-07
CA2939904C (en) 2022-08-30
CA2939905A1 (en) 2015-08-27
US11341162B2 (en) 2022-05-24
WO2015126961A1 (en) 2015-08-27
US20210034640A1 (en) 2021-02-04
AU2017274448B2 (en) 2020-02-20
EP3108374A4 (en) 2017-12-13
US10055472B2 (en) 2018-08-21
US20240111787A1 (en) 2024-04-04
US11645305B2 (en) 2023-05-09
CA2939904A1 (en) 2015-08-27
US11599556B2 (en) 2023-03-07
US20210326354A1 (en) 2021-10-21
EP3722958B1 (en) 2023-04-05
US11500900B2 (en) 2022-11-15
JP6697392B2 (ja) 2020-05-20
US20200218733A1 (en) 2020-07-09
US10776389B2 (en) 2020-09-15
US20210390115A1 (en) 2021-12-16
US20210390117A1 (en) 2021-12-16
US10997201B2 (en) 2021-05-04
CA2939908A1 (en) 2015-08-27
US20200226147A1 (en) 2020-07-16
US20210049187A1 (en) 2021-02-18
US20220121681A1 (en) 2022-04-21
CN106104526A (zh) 2016-11-09
CN106233255A (zh) 2016-12-14
US20180349457A1 (en) 2018-12-06
EP3108385A4 (en) 2017-10-04
US20200201882A1 (en) 2020-06-25
US11048721B2 (en) 2021-06-29
US20150234894A1 (en) 2015-08-20
US20240012836A1 (en) 2024-01-11
DE202015009875U1 (de) 2020-12-23
AU2015219117B2 (en) 2020-07-09
EP3916562A1 (en) 2021-12-01
JP2020053071A (ja) 2020-04-02
US20200257702A1 (en) 2020-08-13
WO2015126968A2 (en) 2015-08-27
AU2015219105A1 (en) 2016-09-01
CA2939906C (en) 2022-10-25
US20150234902A1 (en) 2015-08-20
EP3108369B1 (en) 2021-05-12
AU2017274448A1 (en) 2018-12-13
JP7130600B2 (ja) 2022-09-05
JP2017506396A (ja) 2017-03-02
US10762106B2 (en) 2020-09-01
US20200210448A1 (en) 2020-07-02
JP6901504B2 (ja) 2021-07-14
US11086900B2 (en) 2021-08-10
US20200364238A1 (en) 2020-11-19
DE202015009778U1 (de) 2020-02-06
JP2017507426A (ja) 2017-03-16
EP3809270A1 (en) 2021-04-21
US11157516B2 (en) 2021-10-26
US11126640B2 (en) 2021-09-21
US20210342365A1 (en) 2021-11-04
US20200278983A1 (en) 2020-09-03
EP3108364A2 (en) 2016-12-28
JP6882893B2 (ja) 2021-06-02
US11263234B2 (en) 2022-03-01
US20200327144A1 (en) 2020-10-15
US11151160B2 (en) 2021-10-19
CA2939903A1 (en) 2015-08-27
CA2939906A1 (en) 2015-08-27
US20220067067A1 (en) 2022-03-03
WO2017210477A1 (en) 2017-12-07
US20210205120A1 (en) 2021-07-08
US11809451B2 (en) 2023-11-07
EP3108369A1 (en) 2016-12-28
JP6643242B2 (ja) 2020-02-12
CN106233253A (zh) 2016-12-14
US10838978B2 (en) 2020-11-17
JP2019522844A (ja) 2019-08-15
WO2015126962A1 (en) 2015-08-27
JP2017506394A (ja) 2017-03-02
EP3722958A1 (en) 2020-10-14
JP2019194882A (ja) 2019-11-07
WO2015126957A1 (en) 2015-08-27
DE202015009784U1 (de) 2020-02-12
CN106233255B (zh) 2019-12-20
CN106233263A (zh) 2016-12-14
US11409768B2 (en) 2022-08-09
DE202015009873U1 (de) 2020-12-11
US10956445B1 (en) 2021-03-23
EP3828723A1 (en) 2021-06-02
US20220027385A1 (en) 2022-01-27
US20230297589A1 (en) 2023-09-21
US20210049188A1 (en) 2021-02-18
EP3108385A1 (en) 2016-12-28
US11216485B2 (en) 2022-01-04
JP2022166198A (ja) 2022-11-01
US11250023B2 (en) 2022-02-15
EP3465485A1 (en) 2019-04-10
AU2015219112B2 (en) 2019-11-21
US10776391B1 (en) 2020-09-15
US10733208B1 (en) 2020-08-04
US11544287B2 (en) 2023-01-03
US11734304B2 (en) 2023-08-22
US20230244693A1 (en) 2023-08-03
US20210357425A1 (en) 2021-11-18
US20220035835A1 (en) 2022-02-03
EP3108374B1 (en) 2020-12-16
US20210049189A1 (en) 2021-02-18
US11429639B2 (en) 2022-08-30
US11347770B2 (en) 2022-05-31
US20200151194A1 (en) 2020-05-14
US10776388B2 (en) 2020-09-15
US11042566B2 (en) 2021-06-22
US11397747B2 (en) 2022-07-26
US20190303389A1 (en) 2019-10-03
US11928129B1 (en) 2024-03-12
EP3108375A4 (en) 2017-12-06
US11687563B2 (en) 2023-06-27
US20210073245A1 (en) 2021-03-11
AU2015219105B2 (en) 2020-03-19
US10534793B2 (en) 2020-01-14
US20220035834A1 (en) 2022-02-03
US11397748B2 (en) 2022-07-26
EP3108363A4 (en) 2017-12-13
US10831781B2 (en) 2020-11-10
US11321352B2 (en) 2022-05-03
US20220050857A1 (en) 2022-02-17
US20210124761A1 (en) 2021-04-29
US11748375B2 (en) 2023-09-05
AU2015219101A1 (en) 2016-09-01
AU2015219103B2 (en) 2020-04-02
US20230185824A1 (en) 2023-06-15
US20210157820A1 (en) 2021-05-27
US10838979B2 (en) 2020-11-17
EP3108385B1 (en) 2021-06-30
US20200364236A1 (en) 2020-11-19
US11093524B2 (en) 2021-08-17
DE202015009861U1 (de) 2020-10-23
US20220284037A1 (en) 2022-09-08
US20190236080A1 (en) 2019-08-01
DE202015009772U1 (de) 2020-02-06
DE202015009783U1 (de) 2020-02-12
CN110308994A (zh) 2019-10-08
US20200210450A1 (en) 2020-07-02
AU2015219112A1 (en) 2016-09-01
DE202015009874U1 (de) 2020-12-21
DE202015009860U1 (de) 2020-10-22
AU2015219103A1 (en) 2016-09-01
CN106233275B (zh) 2019-07-12
US11216484B2 (en) 2022-01-04
US20210103602A1 (en) 2021-04-08
EP3910480B1 (en) 2024-04-03
JP2017512338A (ja) 2017-05-18
US11494407B2 (en) 2022-11-08
US20200210449A1 (en) 2020-07-02
US10534792B2 (en) 2020-01-14
EP3108363A1 (en) 2016-12-28
US11734303B2 (en) 2023-08-22
US11204943B2 (en) 2021-12-21
EP3108374A2 (en) 2016-12-28
US20220129480A1 (en) 2022-04-28
CA2939903C (en) 2022-08-30
US11615114B2 (en) 2023-03-28
US11232130B2 (en) 2022-01-25
CN110297799A (zh) 2019-10-01
CN109564564B (zh) 2024-04-05
US20200265066A1 (en) 2020-08-20
US10795914B2 (en) 2020-10-06
US20230289367A1 (en) 2023-09-14
US11176168B2 (en) 2021-11-16
US20200327143A1 (en) 2020-10-15
CA2939919A1 (en) 2015-08-27
US10325032B2 (en) 2019-06-18
CA2939947A1 (en) 2015-08-27
JP2017509066A (ja) 2017-03-30
CN106030573A (zh) 2016-10-12
DE202015009859U1 (de) 2020-10-20
EP3108386A1 (en) 2016-12-28
US20200226148A1 (en) 2020-07-16
US20220129479A1 (en) 2022-04-28
WO2015127076A1 (en) 2015-08-27
US10866966B2 (en) 2020-12-15
US20210248160A1 (en) 2021-08-12
US20220374451A1 (en) 2022-11-24
US20210286825A1 (en) 2021-09-16
US20230205783A1 (en) 2023-06-29
US20210191954A1 (en) 2021-06-24
WO2015126973A3 (en) 2015-11-12
US9576039B2 (en) 2017-02-21
AU2015219101B2 (en) 2020-07-09
US20220138224A1 (en) 2022-05-05
US20200380014A1 (en) 2020-12-03
US11853323B2 (en) 2023-12-26
US20200151192A1 (en) 2020-05-14
CN106233253B (zh) 2019-12-24
CA2939919C (en) 2024-01-30
US20150234682A1 (en) 2015-08-20
US11188562B2 (en) 2021-11-30
CN106233277A (zh) 2016-12-14
US11868369B2 (en) 2024-01-09
JP6730189B2 (ja) 2020-07-29
US20210103601A1 (en) 2021-04-08
US20200320096A1 (en) 2020-10-08
US20210089554A1 (en) 2021-03-25
AU2015218936B2 (en) 2020-05-21
CN106233263B (zh) 2019-12-24
CN106233277B (zh) 2019-07-12
US20210279252A1 (en) 2021-09-09
US11429638B2 (en) 2022-08-30
US20220019599A1 (en) 2022-01-20
US10776390B2 (en) 2020-09-15
JP7163430B2 (ja) 2022-10-31
US20220358139A1 (en) 2022-11-10
AU2015219106B2 (en) 2020-03-26
CN106030573B (zh) 2019-12-24
US20220277021A1 (en) 2022-09-01
US10949446B2 (en) 2021-03-16
US11620308B2 (en) 2023-04-04
US11487786B2 (en) 2022-11-01
US20230376504A1 (en) 2023-11-23
JP2021077406A (ja) 2021-05-20
US20220156281A1 (en) 2022-05-19
US11372888B2 (en) 2022-06-28
US20220207054A1 (en) 2022-06-30
US11238062B2 (en) 2022-02-01
US20240020315A1 (en) 2024-01-18
CA3025939C (en) 2023-08-01
US10108686B2 (en) 2018-10-23
JP7431902B2 (ja) 2024-02-15
US11269920B2 (en) 2022-03-08
US10019454B2 (en) 2018-07-10
US11036758B2 (en) 2021-06-15
CA2939908C (en) 2023-08-29
US11106696B2 (en) 2021-08-31
WO2015126959A1 (en) 2015-08-27
US20220067068A1 (en) 2022-03-03
US20220129478A1 (en) 2022-04-28
US20150234922A1 (en) 2015-08-20
US11042567B1 (en) 2021-06-22
US20220292109A1 (en) 2022-09-15
US20150234896A1 (en) 2015-08-20
AU2015218936A1 (en) 2016-09-01
US11157515B2 (en) 2021-10-26
US20150234931A1 (en) 2015-08-20

Similar Documents

Publication Publication Date Title
JP7130600B2 (ja) ファーストクラスデータベース要素としての半構造データの実装
US11580070B2 (en) Utilizing metadata to prune a data set
US11797483B2 (en) Data pruning based on metadata

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190514

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190613

R150 Certificate of patent or registration of utility model

Ref document number: 6542785

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250