JP2017506373A - 分散ファイルシステム内のデータへの並列アクセス - Google Patents
分散ファイルシステム内のデータへの並列アクセス Download PDFInfo
- Publication number
- JP2017506373A JP2017506373A JP2016530184A JP2016530184A JP2017506373A JP 2017506373 A JP2017506373 A JP 2017506373A JP 2016530184 A JP2016530184 A JP 2016530184A JP 2016530184 A JP2016530184 A JP 2016530184A JP 2017506373 A JP2017506373 A JP 2017506373A
- Authority
- JP
- Japan
- Prior art keywords
- data
- processes
- computing system
- distributed
- designation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 298
- 230000008569 process Effects 0.000 claims description 190
- 238000012545 processing Methods 0.000 claims description 139
- 238000003860 storage Methods 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 description 34
- 230000006870 function Effects 0.000 description 15
- 238000013459 approach Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 8
- 238000012546 transfer Methods 0.000 description 7
- 238000013500 data storage Methods 0.000 description 6
- 230000026676 system process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/1858—Parallel file systems, i.e. file systems supporting multiple processors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer And Data Communications (AREA)
- User Interface Of Digital Computer (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
Abstract
Description
本出願は、2013年11月26日に出願した米国特許出願第14/090,434号明細書の優先権を主張するものである。
Claims (24)
- データを処理するための方法であって、
分散処理システムの分散ファイルシステムに記憶された1又は2以上の命名されたユニットの指定を受信するステップと、
前記分散処理システムとは別々の計算システムへのデータ接続を確立するための指定を受信するステップと、
前記分散処理システム上の第1の複数のプロセスを呼び出すステップであって、前記第1の複数のプロセスの各プロセスが、前記分散ファイルシステム内の前記命名されたユニットの対応する部分にアクセスするために前記分散ファイルシステムのストレージ要素とのデータ接続を確立する、ステップと、
前記分散処理システムと前記計算システムとの間の複数のデータ接続を形成するために前記データ接続を確立するための前記指定を用いるステップであって、少なくとも1つのデータ接続が、前記第1の複数のプロセスの各プロセスと前記計算システムとの間で形成される、ステップと、
前記分散処理システムから前記計算システムに前記複数のデータ接続を介して同時にデータを渡すステップとを含む、方法。 - 同時にデータを渡すステップが、第1の複数のプロセスのプロセスによってファイルシステムからデータを抽出するステップと、抽出されたデータを、分散ファイルシステムにさらに記憶することなく前記プロセスから計算システムに送信するステップとを含む請求項1に記載の方法。
- 命名されたユニットの指定を受領することが、前記命名されたユニットのテキストのファイル名を受領することを含む請求項1に記載の方法。
- 命名されたユニットの部分が、命名されていない請求項1に記載の方法。
- データ接続を確立するための指定を受領することが、ブローカの指定を受領することを含み、前記データ接続を形成することが、第1の複数のプロセスの各プロセスが前記ブローカと通信して計算システムとのデータ接続を確立するためのさらなる指定を決定することを含む請求項1に記載の方法。
- データ接続を確立するための指定を受領することが、計算システムへのブロードキャストのための指定を受領することを含む請求項1に記載の方法。
- 計算システムが、第2の複数のプロセスを含み、第1の複数のプロセスの各プロセスと前記計算システムとの間のデータ接続を形成することが、前記第1の複数のプロセスのプロセスと前記第2の複数のプロセスのプロセスとの間のデータ接続を形成することを含む請求項1に記載の方法。
- 計算システムの第2の複数のプロセスのプロセスを呼び出すステップをさらに含む請求項7に記載の方法。
- 第1の複数のプロセスの少なくとも一部及び第2の複数のプロセスの少なくとも一部が、プロセッサの共通の組で実行される請求項7に記載の方法。
- 分散処理システム及び計算システムが、データネットワークを介して結合されるはっきりと異なる計算リソースを使用する請求項1に記載の方法。
- 分散処理システム及び計算システムが、計算リソースを共有する請求項1に記載の方法。
- データを処理するための、非一時的コンピュータ可読媒体上に記憶されたソフトウェアであって、システムに、
分散処理システムの分散ファイルシステムに記憶された1又は2以上の命名されたユニットの指定を受信することと、
前記分散処理システムとは別々の計算システムへのデータ接続を確立するための指定を受信することと、
前記分散処理システム上の第1の複数のプロセスを呼び出すことであって、前記第1の複数のプロセスの各プロセスが、前記分散ファイルシステム内の前記命名されたユニットの対応する部分にアクセスするために前記分散ファイルシステムのストレージ要素とのデータ接続を確立する、呼び出すことと、
前記分散処理システムと前記計算システムとの間の複数のデータ接続を形成するために前記データ接続を確立するための前記指定を用いることであって、少なくとも1つのデータ接続が、前記第1の複数のプロセスの各プロセスと前記計算システムとの間で形成される、用いることと、
前記分散処理システムから前記計算システムに前記複数のデータ接続を介して同時にデータを渡すこととを行わせるための命令を含む、ソフトウェア。 - データを処理するためのシステムであって、
分散ファイルシステムを含む分散処理システムと、
前記分散処理システムとは別々の計算システムとを含み、
前記分散処理システムが、
前記分散ファイルシステムに記憶された1又は2以上の命名されたユニットの指定を受信すること、
前記計算システムへのデータ接続を確立するための指定を受信すること、
第1の複数のプロセスを呼び出すことであって、前記第1の複数のプロセスの各プロセスが、前記分散ファイルシステム内の前記命名されたユニットの対応する部分にアクセスするために前記分散ファイルシステムのストレージ要素とのデータ接続を確立する、呼び出すこと、
前記分散処理システムと前記計算システムとの間の複数のデータ接続を形成するために前記データ接続を確立するための前記指定を用いることであって、少なくとも1つのデータ接続が、前記第1の複数のプロセスの各プロセスと前記計算システムとの間で形成される、用いること、及び
前記計算システムに前記複数のデータ接続を介して同時にデータを渡すことを行うように構成される、システム。 - データを処理するための方法であって、
分散ファイルシステムに記憶された1又は2以上の命名されたユニットの指定を提供するステップと、
計算システムとのデータ接続を確立するための指定を提供するステップと、
分散処理システム上での呼び出しのために第1の複数のプロセスのプロセスに関する指定を提供するステップであって、前記第1の複数のプロセスの各プロセスが、前記分散ファイルシステム内の前記命名されたユニットの対応する部分にアクセスするために前記分散ファイルシステムのストレージ要素とのデータ接続を確立するために指定される、ステップと、
前記分散処理システムと前記計算システムとの間の複数のデータ接続を形成する要求を受信し、前記第1の複数のプロセスの各プロセスと前記計算システムとの間にある少なくとも1つのデータ接続を形成するための情報を提供するステップと、
前記計算システムにおいて前記第1の複数のプロセスから前記複数のデータ接続を介して同時にデータを受信するステップとを含む、方法。 - 計算システムにおいて第2の複数のプロセスを呼び出すステップであって、データ接続が第1の複数のプロセスのプロセスと前記第2の複数のプロセスのプロセスとの間で形成される、ステップをさらに含む請求項14に記載の方法。
- 第2の複数のプロセスを呼び出すステップが、第1の複数のプロセスをホストするプロセッサ上で前記プロセスの少なくとも一部を呼び出すステップを含み、データ接続の少なくとも一部が、前記プロセッサのローカルにある請求項15に記載の方法。
- データ接続を形成するための情報を提供するステップが、要求元のプロセスの位置及び複数の利用可能なエンドポイントの位置に従って前記利用可能なエンドポイントから前記データ接続のためのエンドポイントを選択するステップを含む請求項14に記載の方法。
- データを処理するための、非一時的コンピュータ可読媒体上に記憶されたソフトウェアであって、システムに、
分散ファイルシステムに記憶された1又は2以上の命名されたユニットの指定を提供することと、
計算システムとのデータ接続を確立するための指定を提供することと、
分散処理システム上での呼び出しのために第1の複数のプロセスのプロセスに関する指定を提供することであって、前記第1の複数のプロセスの各プロセスが、前記分散ファイルシステム内の前記命名されたユニットの対応する部分にアクセスするために前記分散ファイルシステムのストレージ要素とのデータ接続を確立するために指定される、提供することと、
前記分散処理システムと前記計算システムとの間の複数のデータ接続を形成する要求を受信し、前記第1の複数のプロセスの各プロセスと前記計算システムとの間にある少なくとも1つのデータ接続を形成するための情報を提供することと、
前記計算システムにおいて前記第1の複数のプロセスから前記複数のデータ接続を介して同時にデータを受信することとを行わせるための命令を含む、ソフトウェア。 - データを処理するためのシステムであって、
分散ファイルシステムと、
分散処理システムと、
計算システムと、
前記分散処理システムのクライアントであって、
前記分散ファイルシステムに記憶された1又は2以上の命名されたユニットの指定を提供すること、
前記計算システムとのデータ接続を確立するための指定を提供すること、
前記分散処理システム上での呼び出しのために第1の複数のプロセスのプロセスに関する指定を提供することであって、前記第1の複数のプロセスの各プロセスが、前記分散ファイルシステム内の前記命名されたユニットの対応する部分にアクセスするために前記分散ファイルシステムのストレージ要素とのデータ接続を確立するために指定される、提供すること、
前記分散処理システムと前記計算システムとの間の複数のデータ接続を形成する要求を受信し、前記第1の複数のプロセスの各プロセスと前記計算システムとの間にある少なくとも1つのデータ接続を形成するための情報を提供すること、及び
前記計算システムにおいて前記第1の複数のプロセスから前記複数のデータ接続を介して同時にデータを受信することを行うように構成された、クライアントとを含む、システム。 - マップ−リデュースデータ処理フレームワークを実装する分散処理システムから提供されるデータを処理するための方法であって、
前記分散処理システム上での呼び出しのためにマッププロシージャに関する指定を前記分散処理システムに提供するステップであって、前記マッププロシージャの前記指定が、処理するための分散ファイルシステム内の1又は2以上の命名されたユニットを特定し、前記分散処理システムとは別々の計算システムとのデータ接続を確立するための指定を含む、ステップと、
前記分散処理システム上で前記マッププロシージャの複数のインスタンスの実行を引き起こすステップと、
前記マッププロシージャの実行されるインスタンスと前記計算システムとの間の複数のデータフロー接続を形成する要求を受信し、前記マッププロシージャのそれぞれの実行されるインスタンスと前記計算システムとの間にある少なくとも1つのデータフロー接続を形成するための情報を提供するステップと、
前記複数のデータフロー接続を介して同時にデータを受信し、受信されたデータを前記計算システムにおいて処理するステップとを含む、方法。 - 分散処理システムが、Apache Hadoop(登録商標)システムを含む請求項20に記載の方法。
- データフロー接続が、トランスポートレイヤデータネットワーク通信接続を含む請求項20に記載の方法。
- マップ−リデュースデータ処理フレームワークを実装する分散処理システムから提供されるデータを処理するための、非一時的コンピュータ可読媒体上に記憶されたソフトウェアであって、システムに、
前記分散処理システム上での呼び出しのためにマッププロシージャに関する指定を前記分散処理システムに提供することであって、前記マッププロシージャの前記指定が、処理するための分散ファイルシステム内の1又は2以上の命名されたユニットを特定し、前記分散処理システムとは別々の計算システムとのデータ接続を確立するための指定を含む、提供することと、
前記分散処理システム上で前記マッププロシージャの複数のインスタンスの実行を引き起こすことと、
前記マッププロシージャの実行されるインスタンスと前記計算システムとの間の複数のデータフロー接続を形成する要求を受信し、前記マッププロシージャのそれぞれの実行されるインスタンスと前記計算システムとの間にある少なくとも1つのデータフロー接続を形成するための情報を提供することと、
前記複数のデータフロー接続を介して同時にデータを受信し、受信されたデータを前記計算システムにおいて処理することとを行わせるための命令を含む、ソフトウェア。 - データを処理するためのシステムであって、
分散ファイルシステムと、
分散処理システムと、
前記分散処理システムとは別々の計算システムと、
前記分散処理システムのクライアントであって、
前記分散処理システム上での呼び出しのためにマッププロシージャに関する指定を前記分散処理システムに提供することであって、前記マッププロシージャの前記指定が、処理するための分散ファイルシステム内の1又は2以上の命名されたユニットを特定し、前記計算システムとのデータ接続を確立するための指定を含む、提供すること、
前記分散処理システム上で前記マッププロシージャの複数のインスタンスの実行を引き起こすこと、
前記マッププロシージャの実行されるインスタンスと前記計算システムとの間の複数のデータフロー接続を形成する要求を受信し、前記マッププロシージャのそれぞれの実行されるインスタンスと前記計算システムとの間にある少なくとも1つのデータフロー接続を形成するための情報を提供すること、及び
前記複数のデータフロー接続を介して同時にデータを受信し、受信されたデータを前記計算システムにおいて処理することを行うように構成された、クライアントとを含む、システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/090,434 US10776325B2 (en) | 2013-11-26 | 2013-11-26 | Parallel access to data in a distributed file system |
US14/090,434 | 2013-11-26 | ||
PCT/US2014/066781 WO2015080962A1 (en) | 2013-11-26 | 2014-11-21 | Parallel access to data in a distributed file system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017506373A true JP2017506373A (ja) | 2017-03-02 |
JP6580566B2 JP6580566B2 (ja) | 2019-09-25 |
Family
ID=52021459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016530184A Active JP6580566B2 (ja) | 2013-11-26 | 2014-11-21 | 分散ファイルシステム内のデータへの並列アクセス |
Country Status (8)
Country | Link |
---|---|
US (2) | US10776325B2 (ja) |
EP (1) | EP3074887B1 (ja) |
JP (1) | JP6580566B2 (ja) |
KR (1) | KR102361156B1 (ja) |
CN (1) | CN105765578B (ja) |
AU (2) | AU2014354970B2 (ja) |
CA (1) | CA2929618C (ja) |
WO (1) | WO2015080962A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022522464A (ja) * | 2019-03-01 | 2022-04-19 | アイオー タホ エルエルシー | 分散データソースに存在するデータストリームの連続処理のためのコンピュータ実装方法 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7590620B1 (en) * | 2004-06-18 | 2009-09-15 | Google Inc. | System and method for analyzing data records |
US10776325B2 (en) | 2013-11-26 | 2020-09-15 | Ab Initio Technology Llc | Parallel access to data in a distributed file system |
US10325032B2 (en) | 2014-02-19 | 2019-06-18 | Snowflake Inc. | Resource provisioning systems and methods |
US9607073B2 (en) | 2014-04-17 | 2017-03-28 | Ab Initio Technology Llc | Processing data from multiple sources |
US10013443B2 (en) * | 2015-06-25 | 2018-07-03 | Bank Of America Corporation | Comparing data stores using hash sums on disparate parallel systems |
TWI547822B (zh) * | 2015-07-06 | 2016-09-01 | 緯創資通股份有限公司 | 資料處理方法及系統 |
US10506016B2 (en) | 2016-05-19 | 2019-12-10 | Oracle International Corporation | Graph analytic engine that implements efficient transparent remote access over representational state transfer |
CN106383738B (zh) * | 2016-09-30 | 2019-10-11 | 北京百度网讯科技有限公司 | 任务处理方法和分布式计算框架 |
US10318355B2 (en) | 2017-01-24 | 2019-06-11 | Oracle International Corporation | Distributed graph processing system featuring interactive remote control mechanism including task cancellation |
US10534657B2 (en) | 2017-05-30 | 2020-01-14 | Oracle International Corporation | Distributed graph processing system that adopts a faster data loading technique that requires low degree of communication |
US9934287B1 (en) | 2017-07-25 | 2018-04-03 | Capital One Services, Llc | Systems and methods for expedited large file processing |
CN107885779A (zh) * | 2017-10-12 | 2018-04-06 | 北京人大金仓信息技术股份有限公司 | 一种Spark并行访问MPP数据库的方法 |
US11436003B2 (en) * | 2019-03-26 | 2022-09-06 | Flowfinity Wireless, Inc. | Non-stop internet-of-things (IoT) controllers |
US11461130B2 (en) | 2020-05-26 | 2022-10-04 | Oracle International Corporation | Methodology for fast and seamless task cancelation and error handling in distributed processing of large graph data |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002505462A (ja) * | 1998-02-26 | 2002-02-19 | サンマイクロシステムズ インコーポレーテッド | ネットワーク上における動的分散型計算のための方法及び装置 |
JP2008547134A (ja) * | 2005-06-27 | 2008-12-25 | エービー イニティオ ソフトウェア コーポレーション | グラフ型計算のためのパラメータ管理 |
WO2011074699A1 (ja) * | 2009-12-18 | 2011-06-23 | 日本電気株式会社 | 分散処理管理サーバ、分散システム、分散処理管理プログラム及び分散処理管理方法 |
US20110276962A1 (en) * | 2010-05-04 | 2011-11-10 | Google Inc. | Parallel processing of data |
JP2013167942A (ja) * | 2012-02-14 | 2013-08-29 | Nec Corp | 分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラム |
Family Cites Families (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5226159A (en) * | 1989-05-15 | 1993-07-06 | International Business Machines Corporation | File lock management in a distributed data processing system |
US6446070B1 (en) * | 1998-02-26 | 2002-09-03 | Sun Microsystems, Inc. | Method and apparatus for dynamic distributed computing over a network |
US5966072A (en) * | 1996-07-02 | 1999-10-12 | Ab Initio Software Corporation | Executing computations expressed as graphs |
US6237009B1 (en) | 1996-10-11 | 2001-05-22 | Sun Microsystems, Inc. | Lease renewal service |
US5897638A (en) * | 1997-06-16 | 1999-04-27 | Ab Initio Software Corporation | Parallel virtual file system |
US6389420B1 (en) * | 1999-09-30 | 2002-05-14 | Emc Corporation | File manager providing distributed locking and metadata management for shared data access by clients relinquishing locks after time period expiration |
US7587467B2 (en) * | 1999-12-02 | 2009-09-08 | Western Digital Technologies, Inc. | Managed peer-to-peer applications, systems and methods for distributed data access and storage |
US7146524B2 (en) * | 2001-08-03 | 2006-12-05 | Isilon Systems, Inc. | Systems and methods for providing a distributed file system incorporating a virtual hot spare |
US7200747B2 (en) * | 2001-10-31 | 2007-04-03 | Hewlett-Packard Development Company, L.P. | System for ensuring data privacy and user differentiation in a distributed file system |
US7487353B2 (en) * | 2004-05-20 | 2009-02-03 | International Business Machines Corporation | System, method and program for protecting communication |
US7315926B2 (en) * | 2004-09-21 | 2008-01-01 | Emc Corporation | Lock management for concurrent access to a single file from multiple data mover computers |
US8775647B2 (en) * | 2007-12-10 | 2014-07-08 | Deluxe Media Inc. | Method and system for use in coordinating multimedia devices |
KR100907533B1 (ko) * | 2007-12-17 | 2009-07-14 | 한국전자통신연구원 | 작업 분산 병렬 처리 시스템 및 방법 |
JP5557430B2 (ja) * | 2008-04-11 | 2014-07-23 | 日東電工株式会社 | プロトン伝導性高分子電解質膜およびその製造方法ならびにそれを用いた膜−電極接合体および高分子電解質型燃料電池 |
CN101398771B (zh) | 2008-11-18 | 2010-08-18 | 中国科学院软件研究所 | 一种基于构件的分布式系统访问控制方法及访问控制系统 |
US9054913B1 (en) * | 2009-11-30 | 2015-06-09 | Dell Software Inc. | Network protocol proxy |
KR101285078B1 (ko) * | 2009-12-17 | 2013-07-17 | 한국전자통신연구원 | 스트림 데이터에 대한 점진적인 맵리듀스 기반 분산 병렬 처리 시스템 및 방법 |
US8539192B2 (en) | 2010-01-08 | 2013-09-17 | International Business Machines Corporation | Execution of dataflow jobs |
US9805101B2 (en) * | 2010-02-26 | 2017-10-31 | Ebay Inc. | Parallel data stream processing system |
US8918388B1 (en) | 2010-02-26 | 2014-12-23 | Turn Inc. | Custom data warehouse on top of mapreduce |
US8386621B2 (en) * | 2010-03-12 | 2013-02-26 | Netflix, Inc. | Parallel streaming |
US9495427B2 (en) | 2010-06-04 | 2016-11-15 | Yale University | Processing of data using a database system in communication with a data processing framework |
US8751682B2 (en) * | 2010-09-27 | 2014-06-10 | Z124 | Data transfer using high speed connection, high integrity connection, and descriptor |
US20120239612A1 (en) | 2011-01-25 | 2012-09-20 | Muthian George | User defined functions for data loading |
KR101231294B1 (ko) * | 2011-05-31 | 2013-02-07 | 삼성에스디에스 주식회사 | 데이터의 병렬 수신을 위한 스트림 제어 방법 및 장치 |
US8954568B2 (en) | 2011-07-21 | 2015-02-10 | Yahoo! Inc. | Method and system for building an elastic cloud web server farm |
US8356050B1 (en) | 2011-11-21 | 2013-01-15 | Yahoo! Inc. | Method or system for spilling in query environments |
US9172608B2 (en) | 2012-02-07 | 2015-10-27 | Cloudera, Inc. | Centralized configuration and monitoring of a distributed computing cluster |
US9268590B2 (en) | 2012-02-29 | 2016-02-23 | Vmware, Inc. | Provisioning a cluster of distributed computing platform based on placement strategy |
US9195684B2 (en) | 2012-03-02 | 2015-11-24 | Cleversafe, Inc. | Redundant task execution in a distributed storage and task network |
US9367601B2 (en) | 2012-03-26 | 2016-06-14 | Duke University | Cost-based optimization of configuration parameters and cluster sizing for hadoop |
US9158843B1 (en) | 2012-03-30 | 2015-10-13 | Emc Corporation | Addressing mechanism for data at world wide scale |
US9081772B1 (en) * | 2012-04-26 | 2015-07-14 | Pivotal Software, Inc. | Method and apparatus for acid validation within a distributed relational database under controlled concurrent workloads |
US20130325814A1 (en) | 2012-05-30 | 2013-12-05 | Spectra Logic Corporation | System and method for archive in a distributed file system |
US9235446B2 (en) * | 2012-06-22 | 2016-01-12 | Microsoft Technology Licensing, Llc | Parallel computing execution plan optimization |
US9201638B2 (en) | 2012-08-07 | 2015-12-01 | Nec Laboratories America, Inc. | Compiler-guided software accelerator for iterative HADOOP® jobs |
KR101245994B1 (ko) * | 2012-08-31 | 2013-03-20 | 케이씨씨시큐리티주식회사 | 대용량 데이터의 분산 병렬 처리 시스템 및 방법 |
CN103714073B (zh) | 2012-09-29 | 2017-04-12 | 国际商业机器公司 | 数据查询的方法和装置 |
US8805835B2 (en) * | 2012-12-20 | 2014-08-12 | Clipcard Inc. | Systems and methods for integrated management of large data sets |
US10476915B2 (en) * | 2013-02-04 | 2019-11-12 | Oracle International Corporation | Real-time communication signaling gateway |
US9342557B2 (en) | 2013-03-13 | 2016-05-17 | Cloudera, Inc. | Low latency query engine for Apache Hadoop |
US9292373B2 (en) | 2013-03-15 | 2016-03-22 | International Business Machines Corporation | Query rewrites for data-intensive applications in presence of run-time errors |
US9113299B2 (en) * | 2013-05-17 | 2015-08-18 | Xerox Corporation | Method and apparatus for automatic mobile endpoint device configuration management based on user status or activity |
CN103441996B (zh) | 2013-08-16 | 2016-09-28 | 上海理工大学 | 并发传输文件的方法及系统 |
US10133800B2 (en) | 2013-09-11 | 2018-11-20 | Microsoft Technology Licensing, Llc | Processing datasets with a DBMS engine |
US20150127880A1 (en) * | 2013-11-01 | 2015-05-07 | Cognitive Electronics, Inc. | Efficient implementations for mapreduce systems |
US10776325B2 (en) | 2013-11-26 | 2020-09-15 | Ab Initio Technology Llc | Parallel access to data in a distributed file system |
-
2013
- 2013-11-26 US US14/090,434 patent/US10776325B2/en active Active
-
2014
- 2014-11-21 JP JP2016530184A patent/JP6580566B2/ja active Active
- 2014-11-21 CA CA2929618A patent/CA2929618C/en active Active
- 2014-11-21 KR KR1020167016421A patent/KR102361156B1/ko active IP Right Grant
- 2014-11-21 EP EP14810094.4A patent/EP3074887B1/en active Active
- 2014-11-21 AU AU2014354970A patent/AU2014354970B2/en active Active
- 2014-11-21 WO PCT/US2014/066781 patent/WO2015080962A1/en active Application Filing
- 2014-11-21 CN CN201480064544.2A patent/CN105765578B/zh active Active
-
2020
- 2020-08-10 AU AU2020217330A patent/AU2020217330B2/en active Active
- 2020-08-31 US US17/007,368 patent/US11599509B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002505462A (ja) * | 1998-02-26 | 2002-02-19 | サンマイクロシステムズ インコーポレーテッド | ネットワーク上における動的分散型計算のための方法及び装置 |
JP2008547134A (ja) * | 2005-06-27 | 2008-12-25 | エービー イニティオ ソフトウェア コーポレーション | グラフ型計算のためのパラメータ管理 |
WO2011074699A1 (ja) * | 2009-12-18 | 2011-06-23 | 日本電気株式会社 | 分散処理管理サーバ、分散システム、分散処理管理プログラム及び分散処理管理方法 |
US20110276962A1 (en) * | 2010-05-04 | 2011-11-10 | Google Inc. | Parallel processing of data |
JP2013167942A (ja) * | 2012-02-14 | 2013-08-29 | Nec Corp | 分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022522464A (ja) * | 2019-03-01 | 2022-04-19 | アイオー タホ エルエルシー | 分散データソースに存在するデータストリームの連続処理のためのコンピュータ実装方法 |
JP7508725B2 (ja) | 2019-03-01 | 2024-07-02 | ヒタチ ヴァンタラ エルエルシー | 分散データソースに存在するデータストリームの連続処理のためのコンピュータによる処理方法 |
Also Published As
Publication number | Publication date |
---|---|
US11599509B2 (en) | 2023-03-07 |
JP6580566B2 (ja) | 2019-09-25 |
CN105765578A (zh) | 2016-07-13 |
KR20160090840A (ko) | 2016-08-01 |
AU2020217330A1 (en) | 2020-09-03 |
EP3074887B1 (en) | 2021-01-06 |
AU2020217330B2 (en) | 2022-03-03 |
AU2014354970B2 (en) | 2020-05-21 |
AU2014354970A1 (en) | 2016-05-26 |
US20210089503A1 (en) | 2021-03-25 |
US20150149503A1 (en) | 2015-05-28 |
EP3074887A1 (en) | 2016-10-05 |
US10776325B2 (en) | 2020-09-15 |
CN105765578B (zh) | 2020-04-17 |
KR102361156B1 (ko) | 2022-02-09 |
WO2015080962A1 (en) | 2015-06-04 |
CA2929618A1 (en) | 2015-06-04 |
CA2929618C (en) | 2022-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11599509B2 (en) | Parallel access to data in a distributed file system | |
US9870262B2 (en) | Processing element management in a streaming data system | |
US10824474B1 (en) | Dynamically allocating resources for interdependent portions of distributed data processing programs | |
US8572236B2 (en) | Distributing services in graph-based computations | |
US11601495B2 (en) | Mechanism for a work node scan process to facilitate cluster scaling | |
US20220279049A1 (en) | Dynamically routing code for executing | |
US11706312B2 (en) | Distributed data stream programming and processing | |
WO2013030683A1 (en) | Invalidating streams in operator graph | |
WO2022257247A1 (zh) | 数据处理方法、装置及计算机可读存储介质 | |
US20160088067A1 (en) | Dynamic management of restful endpoints | |
US11757959B2 (en) | Dynamic data stream processing for Apache Kafka using GraphQL | |
US11899679B2 (en) | Remote data gateway for use with a data analytics warehouse | |
US20150331828A1 (en) | Computer-implemented gateway | |
US9639630B1 (en) | System for business intelligence data integration | |
Estrada et al. | The broker: Apache kafka | |
Singh et al. | MCC and Big Data Integration for Various Technological Frameworks | |
US12086141B1 (en) | Coordination of services using PartiQL queries | |
Chawla et al. | Implementing microservices | |
Cushing | Data-centric computing on distributed resources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180808 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181031 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190613 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190805 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6580566 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |