JP6581108B2 - 複数ソースからのデータの処理 - Google Patents
複数ソースからのデータの処理 Download PDFInfo
- Publication number
- JP6581108B2 JP6581108B2 JP2016562015A JP2016562015A JP6581108B2 JP 6581108 B2 JP6581108 B2 JP 6581108B2 JP 2016562015 A JP2016562015 A JP 2016562015A JP 2016562015 A JP2016562015 A JP 2016562015A JP 6581108 B2 JP6581108 B2 JP 6581108B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- hadoop cluster
- data processing
- processing engine
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 220
- 238000000034 method Methods 0.000 claims description 90
- 230000009471 action Effects 0.000 claims description 32
- 238000013500 data storage Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 description 54
- 230000008569 process Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000002085 persistent effect Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 241001522296 Erithacus rubecula Species 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/13—File access structures, e.g. distributed indices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/1734—Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5066—Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Hardware Redundancy (AREA)
Description
Claims (43)
- Hadoopクラスタのノードであって、データの第1の部分をHDFSデータストレージに記憶するノードにおいて、
前記Hadoopクラスタ外部のデータソースからデータを受信することが可能なデータ処理エンジンの第1のインスタンスを実行することと、
前記データ処理エンジンによって、a)前記Hadoopクラスタを表す少なくとも1つのコンポーネントと、b)前記Hadoopクラスタ外部の前記データソースを表す少なくとも1つのコンポーネントと、c)データ処理動作に関連付けられた少なくとも1つのデータフローを表す少なくとも1つのリンクを含むデータフローグラフを受信することと、
前記データ処理エンジンの前記第1のインスタンスによって前記データフローグラフの少なくとも一部を実行することと、
前記データ処理エンジンによって前記外部データソースからデータの第2の部分を受信することと、
前記データ処理エンジンによって、少なくとも前記データの第1の部分および前記データの第2の部分を使用する前記データ処理動作を行うことと、を含む方法。 - 前記Hadoopクラスタは各々が前記データ処理エンジンのインスタンスを実行するノードを含み、前記データ処理エンジンの前記インスタンスは、a)前記データの第1の部分を含むデータの第1の本体であって、前記Hadoopクラスタの他のノードによって処理されるデータの他の部分も含む、データの第1の本体に対して、および、b)前記データの第2の部分を含むデータの第2の本体であって、関係データベースシステムに固有の形式で記憶され、前記Hadoopクラスタの前記ノードの揮発性メモリに各々が記憶可能な部分に分割されるデータの第2の本体に対して、共に並列でデータ処理動作を実行するために、同時に動く、請求項1に記載の方法。
- 前記データフローグラフの少なくとも1つのコンポーネントは前記Hadoopクラスタからのデータフローを表すリンクに接続され、前記少なくとも1つのコンポーネントは前記データの第2の部分の前記ソースからのデータフローを表すリンクに接続される、請求項1に記載の方法。
- 前記データ処理エンジンはMapReduceプログラミングモデルを実装していない、請求項1に記載の方法。
- 前記データの第2の部分は揮発性メモリに記憶される、請求項1に記載の方法。
- データベースクエリを受信することを含み、前記データベースクエリは前記Hadoopクラスタを含む少なくとも1つのデータソースから受信されたデータに対して行われるべき少なくとも1つの動作を含み、
前記データフローグラフは前記データベースクエリに対応する動作を表すコンポーネントを含み、前記データフローグラフは、前記少なくとも1つのデータソースを表す少なくとも1つのコンポーネントと、少なくとも1つのデータソースから受信されたデータに対して行われるべき前記動作に関連付けられた少なくとも1つのデータフローを表す少なくとも1つのリンクとを含む、請求項1に記載の方法。 - 前記データの第2の部分は前記データの第1の部分の特徴に基づいて選択された、請求項1に記載の方法。
- 前記データの第2の部分は関係データベースの行のサブセットを含み、前記データの第2の部分は前記関係データベースの列のサブセットを含む、請求項1に記載の方法。
- 前記データの第2の部分は、前記外部データソースから前記Hadoopクラスタの第2のノードで受信されたデータの第3の部分とは別個である、請求項1に記載の方法。
- 前記Hadoopクラスタの外側の前記データ処理エンジンの第2のインスタンスによって実行される前記データフローグラフの少なくとも一部のインスタンスと通信することを含む、請求項1に記載の方法。
- 前記Hadoopクラスタの外側の前記データ処理エンジンの第2のインスタンスによって前記データフローグラフの少なくとも一部を実行することを含む、請求項1に記載の方法。
- データの第1の部分をHDFSデータストレージに記憶するHadoopクラスタのノードに、
前記Hadoopクラスタ外部のデータソースからデータを受信することが可能なデータ処理エンジンの第1のインスタンスを実行すること、
前記データ処理エンジンによって、a)前記Hadoopクラスタを表す少なくとも1つのコンポーネントと、b)前記Hadoopクラスタ外部の前記データソースを表す少なくとも1つのコンポーネントと、c)データ処理動作に関連付けられた少なくとも1つのデータフローを表す少なくとも1つのリンクを含むデータフローグラフを受信すること、
前記データ処理エンジンの前記第1のインスタンスによって前記データフローグラフの少なくとも一部を実行すること、
前記データ処理エンジンによって前記外部データソースからデータの第2の部分を受信すること、ならびに、
前記データ処理エンジンによって、少なくとも前記データの第1の部分および前記データの第2の部分を使用する前記データ処理動作を行うこと、を含む動作を実施させるための命令を含む、コンピュータ可読ストレージデバイス。 - データの第1の部分をHDFSストレージに記憶する、Hadoopクラスタのノードであって、
前記Hadoopクラスタ外部のデータソースからデータを受信することが可能なデータ処理エンジンの第1のインスタンスを実行すること、
前記データ処理エンジンによって、a)前記Hadoopクラスタを表す少なくとも1つのコンポーネントと、b)前記Hadoopクラスタ外部の前記データソースを表す少なくとも1つのコンポーネントと、c)データ処理動作に関連付けられた少なくとも1つのデータフローを表す少なくとも1つのリンクを含むデータフローグラフを受信すること、
前記データ処理エンジンの前記第1のインスタンスによって前記データフローグラフの少なくとも一部を実行すること、
前記データ処理エンジンによって前記外部データソースからデータの第2の部分を受信すること、ならびに、
前記データ処理エンジンによって、少なくとも前記データの第1の部分および前記データの第2の部分を使用する前記データ処理動作を行うこと、を含む動作を実施するように構成されたコンピュータ処理デバイスを含む、
Hadoopクラスタのノード。 - データの第1の部分をHDFSストレージに記憶する、Hadoopクラスタのノードであって、
前記Hadoopクラスタ外部のデータソースからデータを受信することが可能なデータ処理エンジンの第1のインスタンスを実行するための手段と、
前記データ処理エンジンによって、a)前記Hadoopクラスタを表す少なくとも1つのコンポーネントと、b)前記Hadoopクラスタ外部の前記データソースを表す少なくとも1つのコンポーネントと、c)データ処理動作に関連付けられた少なくとも1つのデータフローを表す少なくとも1つのリンクを含むデータフローグラフを受信するための手段と、
前記データ処理エンジンの前記第1のインスタンスによって前記データフローグラフの少なくとも一部を実行するための手段と、
前記データ処理エンジンによって前記外部データソースからデータの第2の部分を受信するための手段と、
前記データ処理エンジンによって、少なくとも前記データの第1の部分および前記データの第2の部分を使用する前記データ処理動作を行うための手段と、
を含む、Hadoopクラスタのノード。 - ノードのクラスタのノードで、前記ノードはデータの第1の部分を記憶し、前記ノードのクラスタと共に1つまたは複数のデータ処理動作を実行するように構成され、前記クラスタは前記ノード全体からのデータの集合を記憶し、前記ノードは前記データの集合に対して並列に動作するように構成され、前記データの集合は複数の部分に分割され、各部分に対して前記クラスタのそれぞれの部分が動作し、
前記クラスタ外部のデータソースからデータを受信することが可能なデータ処理エンジンの第1のインスタンスを実行すること、
前記データ処理エンジンによって、a)Hadoopクラスタを表す少なくとも1つのコンポーネントと、b)前記Hadoopクラスタ外部の前記データソースを表す少なくとも1つのコンポーネントと、c)データ処理動作に関連付けられた少なくとも1つのデータフローを表す少なくとも1つのリンクを含むデータフローグラフを受信すること、
前記データ処理エンジンの前記第1のインスタンスによって前記データフローグラフの少なくとも一部を実行すること、
前記データの第1の部分の特徴に基づいて、前記データ処理エンジンによってデータの第2の部分を要求すること、
前記データ処理エンジンによって前記外部データソースから前記データの第2の部分を受信すること、
前記データの第2の部分を前記ノードの揮発性メモリに記憶すること、ならびに、
前記データ処理エンジンによって、少なくとも前記データの第1の部分および前記データの第2の部分を使用する前記データ処理動作を行うこと、
を含む、方法。 - Hadoopクラスタのノードのデータ処理エンジンで、前記データ処理エンジンによって実行される、a)前記Hadoopクラスタを表す少なくとも1つのコンポーネントと、b)前記Hadoopクラスタ外部のデータソースを表す少なくとも1つのコンポーネントと、c)データ処理動作に関連付けられた少なくとも1つのデータフローを表す少なくとも1つのリンクを含むデータフローグラフによって識別されたデータ処理動作を行うことを含む方法であって、前記データ処理動作は、前記ノードのHDFSデータストレージに記憶されたデータの少なくとも第1の部分、および前記Hadoopクラスタ外部のデータソースから受信されたデータの少なくとも第2の部分を使用して行われる、方法。
- Hadoopクラスタおよび関係データベースを含むデータソースを指定するSQLクエリを受信すること、
前記SQLクエリに対応する、a)前記Hadoopクラスタを表す少なくとも1つのコンポーネントと、b)前記Hadoopクラスタ外部の前記データソースを表す少なくとも1つのコンポーネントと、c)データ処理動作に関連付けられた少なくとも1つのデータフローを表す少なくとも1つのリンクを含むデータフローグラフを生成すること、
前記Hadoopクラスタのノードのデータ処理エンジンで前記データフローグラフを実行すること、ならびに、
前記データ処理エンジンによって少なくとも前記Hadoopクラスタのデータおよび前記関係データベースのデータを使用する前記データ処理動作を行うこと、
を含む、方法。 - Hadoopクラスタは前記データ処理エンジンのインスタンスを各々が実行するノードを含み、前記データ処理エンジンの前記インスタンスは、a)前記データの第1の部分を含み、前記Hadoopクラスタの他のノードにより処理されるデータの他の部分も含むデータの第1の本体に対して、および、b)前記データの第2の部分を含み、関係データベースシステムに固有の形式で記憶され、前記Hadoopクラスタの前記ノードの揮発性メモリに各々が記憶可能な部分に分割されるデータの第2の本体に対して、共に並列で前記データ処理動作を実行する、請求項12に記載のコンピュータ可読ストレージデバイス。
- 前記データフローグラフの少なくとも1つのコンポーネントは前記Hadoopクラスタからのデータフローを表すリンクに接続され、前記少なくとも1つのコンポーネントは前記データの第2の部分の前記外部データソースからのデータフローを表すリンクに接続される、請求項12に記載のコンピュータ可読ストレージデバイス。
- 前記データ処理エンジンはMapReduceプログラミングモデルを実装していない、請求項12に記載のコンピュータ可読ストレージデバイス。
- 前記データの第2の部分は揮発性メモリに記憶される、請求項12に記載のコンピュータ可読ストレージデバイス。
- 前記動作は、
データベースクエリを受信することを含み、前記データベースクエリは前記Hadoopクラスタを含む少なくとも1つのデータソースから受信されたデータに対して行われるべき少なくとも1つの動作を含み、
前記データフローグラフは、前記データベースクエリに対応する動作を表すコンポーネントを含み、前記データフローグラフは、前記少なくとも1つのデータソースを表す少なくとも1つのコンポーネントと、少なくとも1つのデータソースから受信されたデータに対して行われるべき前記動作に関連付けられる少なくとも1つのデータフローを表す少なくとも1つのリンクとを含む、
請求項12に記載のコンピュータ可読ストレージデバイス。 - 前記データの第2の部分は前記データの第1の部分の特徴に基づいて選択された、請求項12に記載のコンピュータ可読ストレージデバイス。
- 前記データの第2の部分は関係データベースの行のサブセットを含み、前記データの第2の部分は前記関係データベースの列のサブセットを含む、請求項12に記載のコンピュータ可読ストレージデバイス。
- 前記データの第2の部分は、前記外部データソースから前記Hadoopクラスタの第2のノードで受信されたデータの第3の部分とは別個である、請求項12に記載のコンピュータ可読ストレージデバイス。
- 前記動作は、Hadoopクラスタの外側の前記データ処理エンジンの第2のインスタンスによって実行される前記データフローグラフの少なくとも一部のインスタンスと通信することを含む、請求項12に記載のコンピュータ可読ストレージデバイス。
- 前記動作は、前記Hadoopクラスタの外側の前記データ処理エンジンの第2のインスタンスによって前記データフローグラフの少なくとも一部を実行することを含む、請求項12に記載のコンピュータ可読ストレージデバイス。
- Hadoopクラスタは前記データ処理エンジンのインスタンスを各々が実行するノードを含み、前記データ処理エンジンの前記インスタンスは、a)前記データの第1の部分を含み、前記Hadoopクラスタの他のノードにより処理されるデータの他の部分も含むデータの第1の本体に対して、および、b)前記データの第2の部分を含み、関係データベースシステムに固有の形式で記憶され、前記Hadoopクラスタの前記ノードの揮発性メモリに各々が記憶可能な部分に分割されるデータの第2の本体に対して、共に並列で前記データ処理動作を実行する、請求項13に記載のノード。
- 前記データフローグラフの少なくとも1つのコンポーネントは前記Hadoopクラスタからのデータフローを表すリンクに接続され、前記少なくとも1つのコンポーネントは前記データの第2の部分の前記外部データソースからのデータフローを表すリンクに接続される、請求項13に記載のノード。
- 前記データ処理エンジンはMapReduceプログラミングモデルを実装していない、請求項13に記載のノード。
- 前記データの第2の部分は揮発性メモリに記憶される、請求項13に記載のノード。
- 前記動作は、
データベースクエリを受信することを含み、前記データベースクエリは前記Hadoopクラスタを含む少なくとも1つのデータソースから受信されたデータに対して行われるべき少なくとも1つの動作を含み、
前記データフローグラフは、前記データベースクエリに対応する動作を表すコンポーネントを含み、前記データフローグラフは、前記少なくとも1つのデータソースを表す少なくとも1つのコンポーネントと、少なくとも1つのデータソースから受信されたデータに対して行われるべき前記動作に関連付けられる少なくとも1つのデータフローを表す少なくとも1つのリンクとを含む、
請求項13に記載のノード。 - 前記データの第2の部分は前記データの第1の部分の特徴に基づいて選択された、請求項13に記載のノード。
- 前記データの第2の部分は関係データベースの行のサブセットを含み、前記データの第2の部分は前記関係データベースの列のサブセットを含む、請求項13に記載のノード。
- 前記データの第2の部分は、前記外部データソースから前記Hadoopクラスタの第2のノードで受信されたデータの第3の部分とは別個である、請求項13に記載のノード。
- 前記動作は、Hadoopクラスタの外側の前記データ処理エンジンの第2のインスタンスによって実行される前記データフローグラフの少なくとも一部のインスタンスと通信することを含む、請求項13に記載のノード。
- 前記動作は、前記Hadoopクラスタの外側の前記データ処理エンジンの第2のインスタンスによって前記データフローグラフの少なくとも一部を実行することを含む、請求項13に記載のノード。
- Hadoopクラスタは前記データ処理エンジンのインスタンスを各々が実行するノードを含み、前記データ処理エンジンの前記インスタンスは、a)前記データの第1の部分を含み、前記Hadoopクラスタの他のノードにより処理されるデータの他の部分も含むデータの第1の本体に対して、および、b)前記データの第2の部分を含み、関係データベースシステムに固有の形式で記憶され、前記Hadoopクラスタの前記ノードの揮発性メモリに各々が記憶可能な部分に分割されるデータの第2の本体に対して、共に並列で前記データ処理動作を実行する、請求項15に記載の方法。
- 前記データフローグラフの少なくとも1つのコンポーネントは前記Hadoopクラスタからのデータフローを表すリンクに接続され、前記少なくとも1つのコンポーネントは前記データの第2の部分の前記外部データソースからのデータフローを表すリンクに接続される、請求項15に記載の方法。
- Hadoopクラスタは前記データ処理エンジンのインスタンスを各々が実行するノードを含み、前記データ処理エンジンの前記インスタンスは、a)前記データの第1の部分を含み、前記Hadoopクラスタの他のノードにより処理されるデータの他の部分も含むデータの第1の本体に対して、および、b)前記データの第2の部分を含み、関係データベースシステムに固有の形式で記憶され、前記Hadoopクラスタの前記ノードの揮発性メモリに各々が記憶可能な部分に分割されるデータの第2の本体に対して、共に並列で前記データ処理動作を実行する、請求項16に記載の方法。
- 前記データフローグラフの少なくとも1つのコンポーネントは前記Hadoopクラスタからのデータフローを表すリンクに接続され、前記少なくとも1つのコンポーネントは前記データの第2の部分の前記外部データソースからのデータフローを表すリンクに接続される、請求項16に記載の方法。
- Hadoopクラスタは前記データ処理エンジンのインスタンスを各々が実行するノードを含み、前記データ処理エンジンの前記インスタンスは、a)前記データの第1の部分を含み、前記Hadoopクラスタの他のノードにより処理されるデータの他の部分も含むデータの第1の本体に対して、および、b)前記データの第2の部分を含み、関係データベースシステムに固有の形式で記憶され、前記Hadoopクラスタの前記ノードの揮発性メモリに各々が記憶可能な部分に分割されるデータの第2の本体に対して、共に並列で前記データ処理動作を実行する、請求項17に記載の方法。
- 前記データフローグラフの少なくとも1つのコンポーネントは前記Hadoopクラスタからのデータフローを表すリンクに接続され、前記少なくとも1つのコンポーネントは前記関係データベースからのデータフローを表すリンクに接続される、請求項17に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/255,579 US9607073B2 (en) | 2014-04-17 | 2014-04-17 | Processing data from multiple sources |
US14/255,579 | 2014-04-17 | ||
PCT/US2015/026088 WO2015161025A1 (en) | 2014-04-17 | 2015-04-16 | Processing data from multiple sources |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019156723A Division JP6815456B2 (ja) | 2014-04-17 | 2019-08-29 | 複数ソースからのデータの処理 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017518561A JP2017518561A (ja) | 2017-07-06 |
JP2017518561A5 JP2017518561A5 (ja) | 2018-05-31 |
JP6581108B2 true JP6581108B2 (ja) | 2019-09-25 |
Family
ID=53016776
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016562015A Active JP6581108B2 (ja) | 2014-04-17 | 2015-04-16 | 複数ソースからのデータの処理 |
JP2019156723A Active JP6815456B2 (ja) | 2014-04-17 | 2019-08-29 | 複数ソースからのデータの処理 |
JP2020211908A Active JP6983990B2 (ja) | 2014-04-17 | 2020-12-22 | 複数ソースからのデータの処理 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019156723A Active JP6815456B2 (ja) | 2014-04-17 | 2019-08-29 | 複数ソースからのデータの処理 |
JP2020211908A Active JP6983990B2 (ja) | 2014-04-17 | 2020-12-22 | 複数ソースからのデータの処理 |
Country Status (7)
Country | Link |
---|---|
US (4) | US9607073B2 (ja) |
EP (1) | EP3132348B1 (ja) |
JP (3) | JP6581108B2 (ja) |
AU (2) | AU2015247639B2 (ja) |
CA (1) | CA2946118A1 (ja) |
SG (2) | SG10201906917QA (ja) |
WO (1) | WO2015161025A1 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9607073B2 (en) | 2014-04-17 | 2017-03-28 | Ab Initio Technology Llc | Processing data from multiple sources |
US10672078B1 (en) * | 2014-05-19 | 2020-06-02 | Allstate Insurance Company | Scoring of insurance data |
CN105205082A (zh) * | 2014-06-27 | 2015-12-30 | 国际商业机器公司 | 用于处理hdfs中的文件存储的方法和系统 |
US10599648B2 (en) * | 2014-09-26 | 2020-03-24 | Applied Materials, Inc. | Optimized storage solution for real-time queries and data modeling |
US10120904B2 (en) * | 2014-12-31 | 2018-11-06 | Cloudera, Inc. | Resource management in a distributed computing environment |
US10505863B1 (en) | 2015-04-06 | 2019-12-10 | EMC IP Holding Company LLC | Multi-framework distributed computation |
US10541938B1 (en) | 2015-04-06 | 2020-01-21 | EMC IP Holding Company LLC | Integration of distributed data processing platform with one or more distinct supporting platforms |
US10366111B1 (en) * | 2015-04-06 | 2019-07-30 | EMC IP Holding Company LLC | Scalable distributed computations utilizing multiple distinct computational frameworks |
US10509684B2 (en) | 2015-04-06 | 2019-12-17 | EMC IP Holding Company LLC | Blockchain integration for scalable distributed computations |
US10515097B2 (en) * | 2015-04-06 | 2019-12-24 | EMC IP Holding Company LLC | Analytics platform for scalable distributed computations |
US10511659B1 (en) * | 2015-04-06 | 2019-12-17 | EMC IP Holding Company LLC | Global benchmarking and statistical analysis at scale |
US10860622B1 (en) | 2015-04-06 | 2020-12-08 | EMC IP Holding Company LLC | Scalable recursive computation for pattern identification across distributed data processing nodes |
US10496926B2 (en) | 2015-04-06 | 2019-12-03 | EMC IP Holding Company LLC | Analytics platform for scalable distributed computations |
US10348810B1 (en) * | 2015-04-06 | 2019-07-09 | EMC IP Holding Company LLC | Scalable distributed computations utilizing multiple distinct clouds |
US10528875B1 (en) | 2015-04-06 | 2020-01-07 | EMC IP Holding Company LLC | Methods and apparatus implementing data model for disease monitoring, characterization and investigation |
US10776404B2 (en) | 2015-04-06 | 2020-09-15 | EMC IP Holding Company LLC | Scalable distributed computations utilizing multiple distinct computational frameworks |
US10404787B1 (en) | 2015-04-06 | 2019-09-03 | EMC IP Holding Company LLC | Scalable distributed data streaming computations across multiple data processing clusters |
US10706970B1 (en) | 2015-04-06 | 2020-07-07 | EMC IP Holding Company LLC | Distributed data analytics |
US10541936B1 (en) * | 2015-04-06 | 2020-01-21 | EMC IP Holding Company LLC | Method and system for distributed analysis |
US10791063B1 (en) | 2015-04-06 | 2020-09-29 | EMC IP Holding Company LLC | Scalable edge computing using devices with limited resources |
US10812341B1 (en) | 2015-04-06 | 2020-10-20 | EMC IP Holding Company LLC | Scalable recursive computation across distributed data processing nodes |
US10270707B1 (en) | 2015-04-06 | 2019-04-23 | EMC IP Holding Company LLC | Distributed catalog service for multi-cluster data processing platform |
US10425350B1 (en) | 2015-04-06 | 2019-09-24 | EMC IP Holding Company LLC | Distributed catalog service for data processing platform |
US11222072B1 (en) * | 2015-07-17 | 2022-01-11 | EMC IP Holding Company LLC | Graph database management system and method for a distributed computing environment |
US10929417B2 (en) * | 2015-09-11 | 2021-02-23 | International Business Machines Corporation | Transforming and loading data utilizing in-memory processing |
US11403318B2 (en) * | 2015-10-01 | 2022-08-02 | Futurewei Technologies, Inc. | Apparatus and method for managing storage of a primary database and a replica database |
US10656861B1 (en) | 2015-12-29 | 2020-05-19 | EMC IP Holding Company LLC | Scalable distributed in-memory computation |
US10374968B1 (en) | 2016-12-30 | 2019-08-06 | EMC IP Holding Company LLC | Data-driven automation mechanism for analytics workload distribution |
CN106941524A (zh) * | 2017-03-14 | 2017-07-11 | 郑州云海信息技术有限公司 | 一种hdfs的web文件配置方法 |
US10338963B2 (en) * | 2017-05-10 | 2019-07-02 | Atlantic Technical Organization, Llc | System and method of schedule validation and optimization of machine learning flows for cloud computing |
US10776121B2 (en) * | 2017-05-10 | 2020-09-15 | Atlantic Technical Organization | System and method of execution map generation for schedule optimization of machine learning flows |
US10437643B2 (en) | 2017-11-10 | 2019-10-08 | Bank Of America Corporation | Independent storage and processing of data with centralized event control |
US11030204B2 (en) | 2018-05-23 | 2021-06-08 | Microsoft Technology Licensing, Llc | Scale out data storage and query filtering using data pools |
US20190361999A1 (en) * | 2018-05-23 | 2019-11-28 | Microsoft Technology Licensing, Llc | Data analysis over the combination of relational and big data |
US20190362016A1 (en) * | 2018-05-25 | 2019-11-28 | Salesforce.Com, Inc. | Frequent pattern analysis for distributed systems |
JP7313123B2 (ja) * | 2018-05-25 | 2023-07-24 | ヤフー株式会社 | 演算システムおよび演算方法 |
US11714992B1 (en) * | 2018-12-13 | 2023-08-01 | Amazon Technologies, Inc. | Neural network processing based on subgraph recognition |
US11782706B1 (en) | 2021-06-29 | 2023-10-10 | Amazon Technologies, Inc. | Reconfigurable neural network processing based on subgraph recognition |
Family Cites Families (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5226159A (en) | 1989-05-15 | 1993-07-06 | International Business Machines Corporation | File lock management in a distributed data processing system |
US6446070B1 (en) | 1998-02-26 | 2002-09-03 | Sun Microsystems, Inc. | Method and apparatus for dynamic distributed computing over a network |
US5966072A (en) * | 1996-07-02 | 1999-10-12 | Ab Initio Software Corporation | Executing computations expressed as graphs |
US5897638A (en) | 1997-06-16 | 1999-04-27 | Ab Initio Software Corporation | Parallel virtual file system |
US6389420B1 (en) | 1999-09-30 | 2002-05-14 | Emc Corporation | File manager providing distributed locking and metadata management for shared data access by clients relinquishing locks after time period expiration |
US7587467B2 (en) | 1999-12-02 | 2009-09-08 | Western Digital Technologies, Inc. | Managed peer-to-peer applications, systems and methods for distributed data access and storage |
US7146524B2 (en) | 2001-08-03 | 2006-12-05 | Isilon Systems, Inc. | Systems and methods for providing a distributed file system incorporating a virtual hot spare |
US7200747B2 (en) | 2001-10-31 | 2007-04-03 | Hewlett-Packard Development Company, L.P. | System for ensuring data privacy and user differentiation in a distributed file system |
US7340452B2 (en) * | 2003-12-16 | 2008-03-04 | Oracle International Corporation | Parallel single cursor model on multiple-server configurations |
US7315926B2 (en) | 2004-09-21 | 2008-01-01 | Emc Corporation | Lock management for concurrent access to a single file from multiple data mover computers |
US7716630B2 (en) * | 2005-06-27 | 2010-05-11 | Ab Initio Technology Llc | Managing parameters for graph-based computations |
US8244718B2 (en) * | 2006-08-25 | 2012-08-14 | Teradata Us, Inc. | Methods and systems for hardware acceleration of database operations and queries |
US8069190B2 (en) * | 2007-12-27 | 2011-11-29 | Cloudscale, Inc. | System and methodology for parallel stream processing |
JP5557430B2 (ja) | 2008-04-11 | 2014-07-23 | 日東電工株式会社 | プロトン伝導性高分子電解質膜およびその製造方法ならびにそれを用いた膜−電極接合体および高分子電解質型燃料電池 |
CN102197406B (zh) * | 2008-10-23 | 2014-10-15 | 起元技术有限责任公司 | 模糊数据操作 |
US8209664B2 (en) * | 2009-03-18 | 2012-06-26 | Microsoft Corporation | High level programming extensions for distributed data parallel processing |
US8239847B2 (en) * | 2009-03-18 | 2012-08-07 | Microsoft Corporation | General distributed reduction for data parallel computing |
EP2438545A2 (en) * | 2009-06-02 | 2012-04-11 | Vector Fabrics B.V. | Improvements in embedded system development |
KR101631978B1 (ko) * | 2009-09-16 | 2016-06-20 | 아브 이니티오 테크놀로지 엘엘시 | 데이터세트 요소의 매핑 |
CA2782414C (en) * | 2009-12-14 | 2021-08-03 | Ab Initio Technology Llc | Specifying user interface elements |
US8539192B2 (en) * | 2010-01-08 | 2013-09-17 | International Business Machines Corporation | Execution of dataflow jobs |
US8918388B1 (en) * | 2010-02-26 | 2014-12-23 | Turn Inc. | Custom data warehouse on top of mapreduce |
US8555265B2 (en) | 2010-05-04 | 2013-10-08 | Google Inc. | Parallel processing of data |
US9495427B2 (en) * | 2010-06-04 | 2016-11-15 | Yale University | Processing of data using a database system in communication with a data processing framework |
US8260840B1 (en) * | 2010-06-28 | 2012-09-04 | Amazon Technologies, Inc. | Dynamic scaling of a cluster of computing nodes used for distributed execution of a program |
US9727438B2 (en) * | 2010-08-25 | 2017-08-08 | Ab Initio Technology Llc | Evaluating dataflow graph characteristics |
US9552206B2 (en) * | 2010-11-18 | 2017-01-24 | Texas Instruments Incorporated | Integrated circuit with control node circuitry and processing circuitry |
KR20120067133A (ko) * | 2010-12-15 | 2012-06-25 | 한국전자통신연구원 | 서비스 제공 방법 및 장치 |
US20120239612A1 (en) | 2011-01-25 | 2012-09-20 | Muthian George | User defined functions for data loading |
US9116955B2 (en) * | 2011-05-02 | 2015-08-25 | Ab Initio Technology Llc | Managing data queries |
US8661449B2 (en) * | 2011-06-17 | 2014-02-25 | Microsoft Corporation | Transactional computation on clusters |
US8954568B2 (en) | 2011-07-21 | 2015-02-10 | Yahoo! Inc. | Method and system for building an elastic cloud web server farm |
US8356050B1 (en) * | 2011-11-21 | 2013-01-15 | Yahoo! Inc. | Method or system for spilling in query environments |
US20130198120A1 (en) * | 2012-01-27 | 2013-08-01 | MedAnalytics, Inc. | System and method for professional continuing education derived business intelligence analytics |
US9172608B2 (en) * | 2012-02-07 | 2015-10-27 | Cloudera, Inc. | Centralized configuration and monitoring of a distributed computing cluster |
US9268590B2 (en) | 2012-02-29 | 2016-02-23 | Vmware, Inc. | Provisioning a cluster of distributed computing platform based on placement strategy |
US9367601B2 (en) | 2012-03-26 | 2016-06-14 | Duke University | Cost-based optimization of configuration parameters and cluster sizing for hadoop |
US9158843B1 (en) * | 2012-03-30 | 2015-10-13 | Emc Corporation | Addressing mechanism for data at world wide scale |
US10169083B1 (en) * | 2012-03-30 | 2019-01-01 | EMC IP Holding Company LLC | Scalable method for optimizing information pathway |
US20130325814A1 (en) | 2012-05-30 | 2013-12-05 | Spectra Logic Corporation | System and method for archive in a distributed file system |
US9235446B2 (en) | 2012-06-22 | 2016-01-12 | Microsoft Technology Licensing, Llc | Parallel computing execution plan optimization |
US9182957B2 (en) * | 2012-07-10 | 2015-11-10 | Loring Craymer | Method and system for automated improvement of parallelism in program compilation |
JP6338579B2 (ja) * | 2012-07-24 | 2018-06-06 | アビニシオ テクノロジー エルエルシー | データモデルにおけるエンティティのマッピング |
US9201638B2 (en) | 2012-08-07 | 2015-12-01 | Nec Laboratories America, Inc. | Compiler-guided software accelerator for iterative HADOOP® jobs |
CN103714073B (zh) | 2012-09-29 | 2017-04-12 | 国际商业机器公司 | 数据查询的方法和装置 |
US9411558B2 (en) * | 2012-10-20 | 2016-08-09 | Luke Hutchison | Systems and methods for parallelization of program code, interactive data visualization, and graphically-augmented code editing |
US10459920B2 (en) * | 2012-10-31 | 2019-10-29 | Hewlett-Packard Development Company, L.P. | Support actual and virtual SQL dataflow by streaming infrastructure |
US20140149715A1 (en) * | 2012-11-28 | 2014-05-29 | Los Alamos National Security, Llc | Scalable and programmable computer systems |
US9264346B2 (en) * | 2012-12-31 | 2016-02-16 | Advanced Micro Devices, Inc. | Resilient duplicate link aggregation emulation |
US9342557B2 (en) * | 2013-03-13 | 2016-05-17 | Cloudera, Inc. | Low latency query engine for Apache Hadoop |
US9292373B2 (en) * | 2013-03-15 | 2016-03-22 | International Business Machines Corporation | Query rewrites for data-intensive applications in presence of run-time errors |
US9256460B2 (en) * | 2013-03-15 | 2016-02-09 | International Business Machines Corporation | Selective checkpointing of links in a data flow based on a set of predefined criteria |
US20140304545A1 (en) * | 2013-04-05 | 2014-10-09 | Hewlett-Packard Development Company, L.P. | Recovering a failure in a data processing system |
US20140304549A1 (en) * | 2013-04-05 | 2014-10-09 | Hewlett-Packard Development Company, L.P. | Recovering a failure in a data processing system |
US9113299B2 (en) | 2013-05-17 | 2015-08-18 | Xerox Corporation | Method and apparatus for automatic mobile endpoint device configuration management based on user status or activity |
US10133800B2 (en) * | 2013-09-11 | 2018-11-20 | Microsoft Technology Licensing, Llc | Processing datasets with a DBMS engine |
US20150127880A1 (en) | 2013-11-01 | 2015-05-07 | Cognitive Electronics, Inc. | Efficient implementations for mapreduce systems |
US10776325B2 (en) * | 2013-11-26 | 2020-09-15 | Ab Initio Technology Llc | Parallel access to data in a distributed file system |
KR20150092586A (ko) * | 2014-02-05 | 2015-08-13 | 한국전자통신연구원 | 데이터 플로 기반 대규모 데이터 스트림 처리 방법 및 장치 |
US10325032B2 (en) * | 2014-02-19 | 2019-06-18 | Snowflake Inc. | Resource provisioning systems and methods |
US9607073B2 (en) | 2014-04-17 | 2017-03-28 | Ab Initio Technology Llc | Processing data from multiple sources |
US9679041B2 (en) * | 2014-12-22 | 2017-06-13 | Franz, Inc. | Semantic indexing engine |
US10191948B2 (en) * | 2015-02-27 | 2019-01-29 | Microsoft Technology Licensing, Llc | Joins and aggregations on massive graphs using large-scale graph processing |
-
2014
- 2014-04-17 US US14/255,579 patent/US9607073B2/en active Active
-
2015
- 2015-04-16 AU AU2015247639A patent/AU2015247639B2/en active Active
- 2015-04-16 CA CA2946118A patent/CA2946118A1/en active Pending
- 2015-04-16 JP JP2016562015A patent/JP6581108B2/ja active Active
- 2015-04-16 EP EP15719559.5A patent/EP3132348B1/en active Active
- 2015-04-16 WO PCT/US2015/026088 patent/WO2015161025A1/en active Application Filing
- 2015-04-16 SG SG10201906917QA patent/SG10201906917QA/en unknown
- 2015-04-16 SG SG11201608186RA patent/SG11201608186RA/en unknown
-
2017
- 2017-02-14 US US15/431,984 patent/US10642850B2/en active Active
-
2019
- 2019-08-29 JP JP2019156723A patent/JP6815456B2/ja active Active
-
2020
- 2020-05-04 US US16/865,975 patent/US11403308B2/en active Active
- 2020-05-13 AU AU2020203145A patent/AU2020203145B2/en active Active
- 2020-12-22 JP JP2020211908A patent/JP6983990B2/ja active Active
-
2022
- 2022-08-01 US US17/878,106 patent/US11720583B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20200265047A1 (en) | 2020-08-20 |
EP3132348A1 (en) | 2017-02-22 |
EP3132348B1 (en) | 2022-09-21 |
US9607073B2 (en) | 2017-03-28 |
JP2019200819A (ja) | 2019-11-21 |
AU2015247639A1 (en) | 2016-10-20 |
US11720583B2 (en) | 2023-08-08 |
SG10201906917QA (en) | 2019-09-27 |
US20220365928A1 (en) | 2022-11-17 |
JP2021057072A (ja) | 2021-04-08 |
US20150302075A1 (en) | 2015-10-22 |
WO2015161025A1 (en) | 2015-10-22 |
AU2015247639B2 (en) | 2020-03-19 |
SG11201608186RA (en) | 2016-10-28 |
JP6815456B2 (ja) | 2021-01-20 |
US11403308B2 (en) | 2022-08-02 |
JP2017518561A (ja) | 2017-07-06 |
AU2020203145B2 (en) | 2022-02-10 |
CA2946118A1 (en) | 2015-10-22 |
JP6983990B2 (ja) | 2021-12-17 |
US20170220646A1 (en) | 2017-08-03 |
US10642850B2 (en) | 2020-05-05 |
AU2020203145A1 (en) | 2020-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6983990B2 (ja) | 複数ソースからのデータの処理 | |
JP6697392B2 (ja) | 半構造データスキーマのトランスペアレントディスカバリ | |
Dobre et al. | Parallel programming paradigms and frameworks in big data era | |
CN102982075B (zh) | 支持访问异构数据源的系统和方法 | |
CN107003868B (zh) | 处理包含联合类型操作的查询 | |
JP2020126656A (ja) | ワークロード自動化およびデータ系統分析 | |
US11036608B2 (en) | Identifying differences in resource usage across different versions of a software application | |
Verma et al. | Big Data representation for grade analysis through Hadoop framework | |
AU2017327824A1 (en) | Data integration job conversion | |
da Silva Veith et al. | Apache Spark | |
Channapattan et al. | Serving Hybrid-Cloud SQL Interactive Queries at Twitter | |
Yang | Big Data Process Mining in Python | |
Jayalath | Geo-distributed big data processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180416 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180416 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190701 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190731 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190829 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6581108 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |