JP2018508887A - データ処理システム、計算ノードおよびデータ処理方法 - Google Patents
データ処理システム、計算ノードおよびデータ処理方法 Download PDFInfo
- Publication number
- JP2018508887A JP2018508887A JP2017541356A JP2017541356A JP2018508887A JP 2018508887 A JP2018508887 A JP 2018508887A JP 2017541356 A JP2017541356 A JP 2017541356A JP 2017541356 A JP2017541356 A JP 2017541356A JP 2018508887 A JP2018508887 A JP 2018508887A
- Authority
- JP
- Japan
- Prior art keywords
- data
- data block
- node
- intermediate result
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 669
- 238000003672 processing method Methods 0.000 title claims abstract description 42
- 238000004364 calculation method Methods 0.000 title description 74
- 239000011159 matrix material Substances 0.000 claims description 417
- 238000000034 method Methods 0.000 claims description 298
- 239000013598 vector Substances 0.000 claims description 257
- 230000008569 process Effects 0.000 claims description 205
- 230000009467 reduction Effects 0.000 abstract description 21
- 238000010586 diagram Methods 0.000 description 34
- 230000006870 function Effects 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 230000017105 transposition Effects 0.000 description 8
- 238000007418 data mining Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000011946 reduction process Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 238000004134 energy conservation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- ZLIBICFPKPWGIZ-UHFFFAOYSA-N pyrimethanil Chemical compound CC1=CC(C)=NC(NC=2C=CC=CC=2)=N1 ZLIBICFPKPWGIZ-UHFFFAOYSA-N 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 101100481876 Danio rerio pbk gene Proteins 0.000 description 2
- 235000008694 Humulus lupulus Nutrition 0.000 description 2
- 101100481878 Mus musculus Pbk gene Proteins 0.000 description 2
- 241001596784 Pegasus Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012854 evaluation process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- OGJPXUAPXNRGGI-UHFFFAOYSA-N norfloxacin Chemical compound C1=C2N(CC)C=C(C(O)=O)C(=O)C2=CC(F)=C1N1CCNCC1 OGJPXUAPXNRGGI-UHFFFAOYSA-N 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/544—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices for evaluating functions by calculation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1023—Server selection for load balancing based on a hash applied to IP addresses or costs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
- G06F16/184—Distributed file systems implemented as replicated file system
- G06F16/1844—Management specifically adapted to replicated file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1012—Server selection for load balancing based on compliance of requirements or conditions with available server resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2207/00—Indexing scheme relating to methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F2207/38—Indexing scheme relating to groups G06F7/38 - G06F7/575
- G06F2207/48—Indexing scheme relating to groups G06F7/48 - G06F7/575
- G06F2207/4802—Special implementations
- G06F2207/4818—Threshold devices
- G06F2207/4824—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/83—Admission control; Resource allocation based on usage prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1074—Peer-to-peer [P2P] networks for supporting data block transmission mechanisms
- H04L67/1078—Resource delivery mechanisms
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Multi Processors (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Complex Calculations (AREA)
Abstract
Description
管理ノードは、第1の処理タスクを、FCxを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FCxは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理し、
計算ノードFCxは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得し、
データブロックMxおよびデータブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’xを取得するように構成され、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
管理ノードは、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
計算ノードSCyは、
第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するように構成され、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果であり、ここで、第2の中間結果V’’yは、m次元データを含むベクトルであり、
管理ノードは、
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
管理ノードは、第1の処理タスクを、FCxを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FCxは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理し、
計算ノードFCxは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得し、
データブロックM1xおよびデータブロックM2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’xを取得するように構成され、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードは、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
計算ノードSCyは、
第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するように構成され、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果であり、ここで、第2の中間結果M’’yは、m行p列のデータを含む行列であり、
管理ノードは、
第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、ここで、データ処理システムは、計算ノードおよび管理ノードを含む、受信モジュールと、
管理ノードによって割り当てられ、受信モジュールによって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するように構成される取得モジュールであって、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュールと、
データブロックMxおよびデータブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’xを取得するように構成される処理モジュールであって、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、ここで、データ処理システムは、計算ノードおよび管理ノードを含む、受信モジュールと、
管理ノードによって割り当てられ、受信モジュールによって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するように構成される取得モジュールであって、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュールと、
データブロックM1xおよびデータブロックM2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’xを取得するように構成される処理モジュールであって、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードによって、第1の処理タスクを、FCxを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、ここで、FCxは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する、ステップと、
計算ノードFCxによって、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するステップであって、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、ステップと、
計算ノードFCxによって、データブロックMxおよびデータブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’xを取得するステップであって、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとを含む。
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSCyによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
計算ノードSCyによって、SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するステップであって、ここで、第2の中間結果V’’yは、m次元データを含むベクトルである、ステップと、
管理ノードによって、第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSCyによって、第3の処理タスクに従って、データセット内のデータブロックV2xを取得するステップと、
計算ノードSCyによって、SCyによって取得された第2の中間結果V’’yおよびデータブロックV2xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、第1の処理タスクを、FCxを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、ここで、FCxは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する、ステップと、
計算ノードFCxによって、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するステップであって、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、ステップと、
計算ノードFCxによって、データブロックM1xおよびデータブロックM2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’xを取得するステップであって、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとを含む。
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSCyによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果である、ステップと、
計算ノードSCyによって、SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するステップであって、ここで、第2の中間結果M’’yは、m行p列のデータを含む行列である、ステップと、
管理ノードによって、第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSCyによって、第3の処理タスクに従って、データセット内のデータブロックM3xを取得するステップと、
計算ノードSCyによって、SCyによって取得された第2の中間結果M’’yおよびデータブロックM3xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
1. combine2(Mij,Vj): MijとVjに対して結合操作が実行されて、中間結果xjを取得する;
2. combineAll(x1,..., xn): 行列の行のための中間結果x1, …,およびxnに対して結合操作が実行されて、中間結果
3.
データブロックMxおよびデータブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’xを取得するように構成され、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である。
第2の処理タスクに従って、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するように構成され、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果であり、ここで、第2の中間結果V’’yは、m次元データを含むベクトルである。
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
SCyによって取得された第2の中間結果V’’yおよびデータブロックV2xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
V3=α*M*V1+β*V2 (公式4)
として表現されてよく、ここで、αおよびβは数値であり、公式4は、既存のGIMVモデルと比較して、本発明の本実施形態におけるデータ処理システム100によって取得される結果ベクトルV3に重みV2が導入されることを示し、その結果、assign処理はもはや乗算のために使用されるベクトルに限定されず、非正方行列に対する行列乗算操作がサポートされることができ、行列-ベクトル乗算操作の表現範囲を拡張する。
第1のクラスの計算ノード320内の少なくとも2つの計算ノードは、管理ノード310によって割り当てられた第1の処理タスクを同時に処理する。
データブロックM1xおよびデータブロックM2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’xを取得するように構成され、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である。
第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するように構成され、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果であり、ここで、第2の中間結果M’’yは、m行p列のデータを含む行列である。
第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するように構成される。
SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成される。
第3の処理タスクに従って、データセット内のデータブロックM3xを取得し、
SCyによって取得された第2の中間結果M’’yおよびデータブロックM3xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュール501と、
管理ノードによって割り当てられ、受信モジュール501によって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するように構成される取得モジュール502であって、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュール502と、
データブロックMxおよびデータブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’xを取得するように構成される処理モジュール503であって、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュール601と、
管理ノードによって割り当てられ、受信モジュール601によって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するように構成される取得モジュール602であって、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュール602と、
データブロックM1xおよびデータブロックM2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’xを取得するように構成される処理モジュール603であって、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードによって割り当てられた第1の処理タスクを受信し、
管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するように構成され、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である。
データブロックMxおよびデータブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’xを取得するように構成され、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
管理ノードによって割り当てられた第1の処理タスクを受信し、
管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するように構成され、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である。
データブロックM1xおよびデータブロックM2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’xを取得するように構成され、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSCyによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
計算ノードSCyによって、SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するステップであって、ここで、第2の中間結果V’’yは、m次元データを含むベクトルである、ステップと、
管理ノードによって、第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSCyによって、第3の処理タスクに従って、データセット内のデータブロックV2xを取得するステップと、
計算ノードSCyによって、SCyによって取得された第2の中間結果V’’yおよびデータブロックV2xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSCyによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果である、ステップと、
計算ノードSCyによって、SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するステップであって、ここで、第2の中間結果M’’yは、m行p列のデータを含む行列である、ステップと、
管理ノードによって、第2のクラスの計算結果内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSCyによって、第3の処理タスクに従って、データセット内のデータブロックM3xを取得するステップと、
計算ノードSCyによって、SCyによって取得された第2の中間結果M’’yおよびデータブロックM3xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
110 管理ノード
120 第1のクラスの計算ノード
121 計算ノード
300 データ処理システム
310 管理ノード
320 第1のクラスの計算ノード
321 計算ノード
500 計算ノード
501 受信モジュール
502 取得モジュール
503 処理モジュール
600 計算ノード
601 受信モジュール
602 取得モジュール
603 処理モジュール
700 計算ノード
701 プロセッサ
702 メモリ
703 バスシステム
704 トランシーバ
800 計算ノード
801 プロセッサ
802 メモリ
803 バスシステム
804 トランシーバ
管理ノードは、第1の処理タスクを、FCxを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FCxは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理し、
計算ノードFCxは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得し、
データブロックMxおよびデータブロックV1xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果V’xを取得するように構成され、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
管理ノードは、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
計算ノードSCyは、
第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するように構成され、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果であり、ここで、第2の中間結果V’’yは、m次元データを含むベクトルであり、
管理ノードは、
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
管理ノードは、第1の処理タスクを、FCxを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、ここで、FCxは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理し、
計算ノードFCxは、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得し、
データブロックM1xおよびデータブロックM2xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果M’xを取得するように構成され、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードは、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
計算ノードSCyは、
第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するように構成され、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果であり、ここで、第2の中間結果M’’yは、m行p列のデータを含む行列であり、
管理ノードは、
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、ここで、データ処理システムは、計算ノードおよび管理ノードを含む、受信モジュールと、
管理ノードによって割り当てられ、受信モジュールによって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するように構成される取得モジュールであって、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュールと、
データブロックMxおよびデータブロックV1xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果V’xを取得するように構成される処理モジュールであって、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、ここで、データ処理システムは、計算ノードおよび管理ノードを含む、受信モジュールと、
管理ノードによって割り当てられ、受信モジュールによって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するように構成される取得モジュールであって、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュールと、
データブロックM1xおよびデータブロックM2xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果M’xを取得するように構成される処理モジュールであって、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードによって、第1の処理タスクを、FCxを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、ここで、FCxは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する、ステップと、
計算ノードFCxによって、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するステップであって、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、ステップと、
計算ノードFCxによって、データブロックMxおよびデータブロックV1xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果V’xを取得するステップであって、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとを含む。
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSCyによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
計算ノードSCyによって、SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するステップであって、ここで、第2の中間結果V’’yは、m次元データを含むベクトルである、ステップと、
管理ノードによって、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSCyによって、第3の処理タスクに従って、データセット内のデータブロックV2xを取得するステップと、
計算ノードSCyによって、SCyによって取得された第2の中間結果V’’yおよびデータブロックV2xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、第1の処理タスクを、FCxを含み、第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、ここで、FCxは少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、第1のクラスの計算ノード内の少なくとも2つの計算ノードは、管理ノードによって割り当てられた第1の処理タスクを同時に処理する、ステップと、
計算ノードFCxによって、管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するステップであって、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、ステップと、
計算ノードFCxによって、データブロックM1xおよびデータブロックM2xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果M’xを取得するステップであって、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとを含む。
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSCyによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果である、ステップと、
計算ノードSCyによって、SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するステップであって、ここで、第2の中間結果M’’yは、m行p列のデータを含む行列である、ステップと、
管理ノードによって、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSCyによって、第3の処理タスクに従って、データセット内のデータブロックM3xを取得するステップと、
計算ノードSCyによって、SCyによって取得された第2の中間結果M’’yおよびデータブロックM3xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
1. combine2(Mij,Vj): MijとVjに対して結合操作が実行されて、中間結果xjを取得する;
2. combineAll(x1,..., xn): 行列の行のための中間結果x1, …,およびxnに対して結合操作が実行されて、中間結果
3.
データブロックMxおよびデータブロックV1xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果V’xを取得するように構成され、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である。
第2の処理タスクに従って、第1のクラスの計算ノード120内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するように構成され、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果であり、ここで、第2の中間結果V’’yは、m次元データを含むベクトルである。
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
SCyによって取得された第2の中間結果V’’yおよびデータブロックV2xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
V3=α*M*V1+β*V2 (公式4)
として表現されてよく、ここで、αおよびβは数値であり、公式4は、既存のGIMVモデルと比較して、本発明の本実施形態におけるデータ処理システム100によって取得される結果ベクトルV3に重みV2が導入されることを示し、その結果、assign処理はもはや乗算のために使用されるベクトルに限定されず、非正方行列に対する行列-ベクトル乗算操作がサポートされることができ、行列-ベクトル乗算操作の表現範囲を拡張する。
第1のクラスの計算ノード320内の少なくとも2つの計算ノードは、管理ノード310によって割り当てられた第1の処理タスクを同時に処理する。
データブロックM1xおよびデータブロックM2xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果M’xを取得するように構成され、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である。
第2の処理タスクに従って、第1のクラスの計算ノード320内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得し、
SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するように構成され、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果であり、ここで、第2の中間結果M’’yは、m行p列のデータを含む行列である。
第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するように構成される。
SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成される。
第3の処理タスクに従って、データセット内のデータブロックM3xを取得し、
SCyによって取得された第2の中間結果M’’yおよびデータブロックM3xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するようにさらに構成される。
管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュール501と、
管理ノードによって割り当てられ、受信モジュール501によって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するように構成される取得モジュール502であって、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュール502と、
データブロックMxおよびデータブロックV1xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果V’xを取得するように構成される処理モジュール503であって、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュール601と、
管理ノードによって割り当てられ、受信モジュール601によって受信された第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するように構成される取得モジュール602であって、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュール602と、
データブロックM1xおよびデータブロックM2xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果M’xを取得するように構成される処理モジュール603であって、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードによって割り当てられた第1の処理タスクを受信し、
管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するように構成され、ここで、データブロックMxは、m行n列のデータを含む行列であり、データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である。
データブロックMxおよびデータブロックV1xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果V’xを取得するように構成され、ここで、第1の中間結果V’xは、m次元データを含むベクトルであり、第1の中間結果V’xは、要素
管理ノードによって割り当てられた第1の処理タスクを受信し、
管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するように構成され、ここで、データブロックM1xは、m行n列のデータを含む行列であり、データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である。
データブロックM1xおよびデータブロックM2xに対して結合2(combine2)操作および削減2(reduce2)操作を実行して、第1の中間結果M’xを取得するように構成され、ここで、第1の中間結果M’xは、m行p列のデータを含む行列であり、第1の中間結果M’xは、要素
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSCyによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
計算ノードSCyによって、SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するステップであって、ここで、第2の中間結果V’’yは、m次元データを含むベクトルである、ステップと、
管理ノードによって、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSCyによって、第3の処理タスクに従って、データセット内のデータブロックV2xを取得するステップと、
計算ノードSCyによって、SCyによって取得された第2の中間結果V’’yおよびデータブロックV2xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果に従って、第2の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、ここで、SCyは少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
計算ノードSCyによって、第2の処理タスクに従って、第1のクラスの計算ノード内の少なくとも2つの計算ノードによって取得された第1の中間結果を取得するステップであって、ここで、SCyによって取得された第1の中間結果は、処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果である、ステップと、
計算ノードSCyによって、SCyによって取得された第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するステップであって、ここで、第2の中間結果M’’yは、m行p列のデータを含む行列である、ステップと、
管理ノードによって、第2のクラスの計算ノード内の少なくとも1つの計算ノードによって取得された第2の中間結果に従って、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
管理ノードによって、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードによって取得された第2の中間結果に従って、第3の処理タスクを、SCyを含み、第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップと、
計算ノードSCyによって、第3の処理タスクに従って、データセット内のデータブロックM3xを取得するステップと、
計算ノードSCyによって、SCyによって取得された第2の中間結果M’’yおよびデータブロックM3xに対して、割り当てassign操作を実行して、処理されるべきデータセットのための処理結果を取得するステップとをさらに含む。
110 管理ノード
120 第1のクラスの計算ノード
121 計算ノード
300 データ処理システム
310 管理ノード
320 第1のクラスの計算ノード
321 計算ノード
500 計算ノード
501 受信モジュール
502 取得モジュール
503 処理モジュール
600 計算ノード
601 受信モジュール
602 取得モジュール
603 処理モジュール
700 計算ノード
701 プロセッサ
702 メモリ
703 バスシステム
704 トランシーバ
800 計算ノード
801 プロセッサ
802 メモリ
803 バスシステム
804 トランシーバ
Claims (30)
- 管理ノードと第1のクラスの計算ノードとを含むデータ処理システムであって、
前記管理ノードは、第1の処理タスクを、FCxを含み、前記第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、前記FCxは前記少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた前記第1の処理タスクを同時に処理し、
前記計算ノードFCxは、前記管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得し、
前記データブロックMxおよび前記データブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’xを取得するように構成され、前記データブロックMxは、m行n列のデータを含む行列であり、前記データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上であり、前記第1の中間結果V’xは、m次元データを含むベクトルであり、前記第1の中間結果V’xは、要素
前記管理ノードは、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された第1の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、データ処理システム。 - 前記データ処理システムは、第2のクラスの計算ノードをさらに含み、前記管理ノードは、
前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果に従って、第2の処理タスクを、SCyを含み、前記第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、前記SCyは前記少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
前記計算ノードSCyは、
前記第2の処理タスクに従って、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果を取得し、
前記SCyによって取得された前記第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するように構成され、前記SCyによって取得された前記第1の中間結果は、前記処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果であり、前記第2の中間結果V’’yは、m次元データを含むベクトルであり、
前記管理ノードは、
前記第2のクラスの計算ノード内の前記少なくとも1つの計算ノードによって取得された第2の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、請求項1に記載のデータ処理システム。 - 前記データセットは、データブロックV2xをさらに含み、前記データブロックV2xは、m次元データを含むベクトルであり、前記管理ノードは、
前記SCyを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードによって取得された前記第2の中間結果に従って、第3の処理タスクを、前記SCyを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードに割り当てるようにさらに構成され、
前記計算ノードSCyは、
前記第3の処理タスクに従って、前記データセット内の前記データブロックV2xを取得し、
前記SCyによって取得された前記第2の中間結果V’’yおよび前記データブロックV2xに対して、割り当てassign操作を実行して、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、請求項2に記載のデータ処理システム。 - m=nであり、前記データブロックV1xと前記データブロックV2xは同じデータブロックである、請求項3に記載のデータ処理システム。
- 前記第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、前記第2のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた第2の処理タスクを同時に処理する、請求項2乃至4のいずれか1項に記載のデータ処理システム。
- 前記管理ノード、前記第1のクラスの計算ノードおよび前記第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUを含む、請求項2乃至5のいずれか1項に記載のデータ処理システム。
- 管理ノードと第1のクラスの計算ノードとを含むデータ処理システムであって、
前記管理ノードは、第1の処理タスクを、FCxを含み、前記第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるように構成され、前記FCxは前記少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、
前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた前記第1の処理タスクを同時に処理し、
前記計算ノードFCxは、前記管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得し、
前記データブロックM1xおよび前記データブロックM2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’xを取得するように構成され、前記データブロックM1xは、m行n列のデータを含む行列であり、前記データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上であり、前記第1の中間結果M’xは、m行p列のデータを含む行列であり、前記第1の中間結果M’xは、要素
前記管理ノードは、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された第1の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、データ処理システム。 - 前記データ処理システムは、第2のクラスの計算ノードをさらに含み、前記管理ノードは、
前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果に従って、第2の処理タスクを、SCyを含み、前記第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるようにさらに構成され、前記SCyは前記少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数であり、
前記計算ノードSCyは、
前記第2の処理タスクに従って、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果を取得し、
前記SCyによって取得された前記第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するように構成され、前記SCyによって取得された前記第1の中間結果は、前記処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果であり、前記第2の中間結果M’’yは、m行p列のデータを含む行列であり、
前記管理ノードは、
前記第2のクラスの計算結果内の前記少なくとも1つの計算ノードによって取得された第2の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、請求項7に記載のデータ処理システム。 - 前記データセットは、データブロックM3xをさらに含み、前記データブロックM3xは、m行p列のデータを含む行列であり、前記管理ノードは、
前記SCyを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードによって取得された前記第2の中間結果に従って、第3の処理タスクを、前記SCyを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードに割り当てるようにさらに構成され、
前記計算ノードSCyは、
前記第3の処理タスクに従って、前記データセット内の前記データブロックM3xを取得し、
前記SCyによって取得された前記第2の中間結果M’’yおよび前記データブロックM3xに対して、割り当てassign操作を実行して、前記処理されるべきデータセットのための処理結果を取得するようにさらに構成される、請求項8に記載のデータ処理システム。 - n=mであり、前記データブロックM2xと前記データブロックM3xは同じデータブロックである、請求項9に記載のデータ処理システム。
- n=pであり、前記データブロックM1xと前記データブロックM3xは同じデータブロックである、請求項9に記載のデータ処理システム。
- 前記第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、前記第2のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた第2の処理タスクを同時に処理する、請求項8乃至11のいずれか1項に記載のデータ処理システム。
- 前記管理ノード、前記第1のクラスの計算ノードおよび前記第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUを含む、請求項7乃至12のいずれか1項に記載のデータ処理システム。
- 計算ノードであって、
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールと、
前記管理ノードによって割り当てられ、前記受信モジュールによって受信された前記第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するように構成される取得モジュールであって、前記データブロックMxは、m行n列のデータを含む行列であり、前記データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、取得モジュールと、
前記データブロックMxおよび前記データブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’xを取得するように構成される処理モジュールであって、前記第1の中間結果V’xは、m次元データを含むベクトルであり、前記第1の中間結果V’xは、要素
- 前記計算ノードは、物理マシン、仮想マシンまたは中央処理装置CPUである、請求項14に記載の計算ノード。
- 計算ノードであって、
データ処理システム内の管理ノードによって割り当てられた第1の処理タスクを受信するように構成される受信モジュールであって、前記データ処理システムは、前記計算ノードおよび前記管理ノードを含む、受信モジュールと、
前記管理ノードによって割り当てられ、前記受信モジュールによって受信された前記第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するように構成される取得モジュールであって、前記データブロックM1xは、m行n列のデータを含む行列であり、前記データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、取得モジュールと、
前記データブロックM1xおよび前記データブロックM2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’xを取得するように構成される処理モジュールであって、前記第1の中間結果M’xは、m行p列のデータを含む行列であり、前記第1の中間結果M’xは、要素
- 前記計算ノードは、物理マシン、仮想マシンまたは中央処理装置CPUである、請求項14に記載の計算ノード。
- データ処理方法であって、前記方法はデータ処理システムに適用され、前記データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、前記方法は、
前記管理ノードによって、第1の処理タスクを、FCxを含み、前記第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、前記FCxは前記少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた前記第1の処理タスクを同時に処理する、ステップと、
前記計算ノードFCxによって、前記管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックMxおよびデータブロックV1xを取得するステップであって、前記データブロックMxは、m行n列のデータを含む行列であり、前記データブロックV1xは、n次元データを含むベクトルであり、mおよびnは正の整数であり、nの値は2以上である、ステップと、
前記計算ノードFCxによって、前記データブロックMxおよび前記データブロックV1xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果V’xを取得するステップであって、前記第1の中間結果V’xは、m次元データを含むベクトルであり、前記第1の中間結果V’xは、要素
前記管理ノードによって、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された第1の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するステップとを含む方法。 - 前記データ処理システムは、第2のクラスの計算ノードのうちの少なくとも1つをさらに含み、前記方法は、
前記管理ノードによって、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果に従って、第2の処理タスクを、SCyを含み、前記第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、前記SCyは前記少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
前記計算ノードSCyによって、前記第2の処理タスクに従って、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果を取得するステップであって、前記SCyによって取得された前記第1の中間結果は、前記処理されるべきデータセット内の1行のデータブロックに従って取得された第1の中間結果である、ステップと、
前記計算ノードSCyによって、前記SCyによって取得された前記第1の中間結果に対してreduce2操作を実行して、第2の中間結果V’’yを取得するステップであって、前記第2の中間結果V’’yは、m次元データを含むベクトルである、ステップと、
前記管理ノードによって、前記第2のクラスの計算結果内の前記少なくとも1つの計算ノードによって取得された第2の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するステップとをさらに含む、請求項18に記載の方法。 - 前記データセットは、データブロックV2xをさらに含み、前記データブロックV2xは、m次元データを含むベクトルであり、前記方法は、
前記管理ノードによって、前記SCyを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードによって取得された前記第2の中間結果に従って、第3の処理タスクを、前記SCyを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードに割り当てるステップと、
前記計算ノードSCyによって、前記第3の処理タスクに従って、前記データセット内の前記データブロックV2xを取得するステップと、
前記計算ノードSCyによって、前記SCyによって取得された前記第2の中間結果V’’yおよび前記データブロックV2xに対して、割り当てassign操作を実行して、前記処理されるべきデータセットのための処理結果を取得するステップとをさらに含む、請求項19に記載の方法。 - m=nであり、前記データブロックV1xと前記データブロックV2xは同じデータブロックである、請求項20に記載の方法。
- 前記第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、前記第2のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた第2の処理タスクを同時に処理する、請求項19乃至21のいずれか1項に記載の方法。
- 前記管理ノード、前記第1のクラスの計算ノードおよび前記第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUを含む、請求項18乃至22のいずれか1項に記載の方法。
- データ処理方法であって、前記方法はデータ処理システムに適用され、前記データ処理システムは、管理ノードと第1のクラスの計算ノードとを含み、前記方法は、
前記管理ノードによって、第1の処理タスクを、FCxを含み、前記第1のクラスの計算ノード内にある少なくとも2つの計算ノードに割り当てるステップであって、前記FCxは前記少なくとも2つの計算ノード内の第xの計算ノードであり、xは正の整数であり、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた前記第1の処理タスクを同時に処理する、ステップと、
前記計算ノードFCxによって、前記管理ノードによって割り当てられた第1の処理タスクに従って、処理されるべきデータセット内にあるデータブロックM1xおよびデータブロックM2xを取得するステップであって、前記データブロックM1xは、m行n列のデータを含む行列であり、前記データブロックM2xは、n行p列のデータを含む行列であり、m、nおよびpは正の整数であり、nの値は2以上である、ステップと、
前記計算ノードFCxによって、前記データブロックM1xおよび前記データブロックM2xに対して結合combine2操作および削減reduce2操作を実行して、第1の中間結果M’xを取得するステップであって、前記第1の中間結果M’xは、m行p列のデータを含む行列であり、前記第1の中間結果M’xは、要素
前記管理ノードによって、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された第1の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するステップとを含む方法。 - 前記データ処理システムは、第2のクラスの計算ノードをさらに含み、前記方法は、
前記管理ノードによって、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果に従って、第2の処理タスクを、SCyを含み、前記第2のクラスの計算ノード内にある少なくとも1つの計算ノードに割り当てるステップであって、前記SCyは前記少なくとも1つの計算ノード内の第yの計算ノードであり、yは正の整数である、ステップと、
前記計算ノードSCyによって、前記第2の処理タスクに従って、前記第1のクラスの計算ノード内の前記少なくとも2つの計算ノードによって取得された前記第1の中間結果を取得するステップであって、前記SCyによって取得された前記第1の中間結果は、前記処理されるべきデータセット内にある1行のデータブロックM1xおよび1列のデータブロックM2xに従って取得された第1の中間結果である、ステップと、
前記計算ノードSCyによって、前記SCyによって取得された前記第1の中間結果に対してreduce2操作を実行して、第2の中間結果M’’yを取得するステップであって、前記第2の中間結果M’’yは、m行p列のデータを含む行列である、ステップと、
前記管理ノードによって、前記第2のクラスの計算結果内の前記少なくとも1つの計算ノードによって取得された第2の中間結果に従って、前記処理されるべきデータセットのための処理結果を取得するステップとをさらに含む、請求項24に記載の方法。 - 前記データセットは、データブロックM3xをさらに含み、前記データブロックM3xは、m行p列のデータを含む行列であり、前記方法は、
前記管理ノードによって、前記SCyを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードによって取得された前記第2の中間結果に従って、第3の処理タスクを、前記SCyを含み、前記第2のクラスの計算ノード内にある前記少なくとも1つの計算ノードに割り当てるステップと、
前記計算ノードSCyによって、前記第3の処理タスクに従って、前記データセット内の前記データブロックM3xを取得するステップと、
前記計算ノードSCyによって、前記SCyによって取得された前記第2の中間結果M’’yおよび前記データブロックM3xに対して、割り当てassign操作を実行して、前記処理されるべきデータセットのための処理結果を取得するステップとをさらに含む、請求項25に記載の方法。 - n=mであり、前記データブロックM2xと前記データブロックM3xは同じデータブロックである、請求項26に記載の方法。
- n=pであり、前記データブロックM1xと前記データブロックM3xは同じデータブロックである、請求項26に記載の方法。
- 前記第2のクラスの計算ノードが少なくとも2つの計算ノードを含むとき、前記第2のクラスの計算ノード内の前記少なくとも2つの計算ノードは、前記管理ノードによって割り当てられた第2の処理タスクを同時に処理する、請求項25乃至28のいずれか1項に記載の方法。
- 前記管理ノード、前記第1のクラスの計算ノードおよび前記第2のクラスの計算ノードはそれぞれ、物理マシン、仮想マシンまたは中央処理装置CPUを含む、請求項24乃至29のいずれか1項に記載の方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2015/072451 WO2016123808A1 (zh) | 2015-02-06 | 2015-02-06 | 数据处理系统、计算节点和数据处理的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018508887A true JP2018508887A (ja) | 2018-03-29 |
JP6508661B2 JP6508661B2 (ja) | 2019-05-08 |
Family
ID=56563349
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017541356A Active JP6508661B2 (ja) | 2015-02-06 | 2015-02-06 | データ処理システム、計算ノードおよびデータ処理方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10567494B2 (ja) |
EP (1) | EP3239853A4 (ja) |
JP (1) | JP6508661B2 (ja) |
KR (1) | KR101999639B1 (ja) |
CN (1) | CN106062732B (ja) |
WO (1) | WO2016123808A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11748625B2 (en) | 2016-12-30 | 2023-09-05 | Intel Corporation | Distributed convolution for neural networks |
US10169296B2 (en) * | 2016-12-30 | 2019-01-01 | Intel Corporation | Distributed matrix multiplication for neural networks |
US10540398B2 (en) * | 2017-04-24 | 2020-01-21 | Oracle International Corporation | Multi-source breadth-first search (MS-BFS) technique and graph processing system that applies it |
CN107273339A (zh) * | 2017-06-21 | 2017-10-20 | 郑州云海信息技术有限公司 | 一种任务处理方法及装置 |
CN107590254B (zh) * | 2017-09-19 | 2020-03-17 | 华南理工大学 | 具有合并处理方法的大数据支撑平台 |
US11636327B2 (en) * | 2017-12-29 | 2023-04-25 | Intel Corporation | Machine learning sparse computation mechanism for arbitrary neural networks, arithmetic compute microarchitecture, and sparsity for training mechanism |
CN108764490A (zh) * | 2018-08-28 | 2018-11-06 | 合肥本源量子计算科技有限责任公司 | 一种量子虚拟机 |
CN113678124A (zh) * | 2019-02-01 | 2021-11-19 | 光子智能股份有限公司 | 处理速率受限系统的矩阵操作 |
CN110489448A (zh) * | 2019-07-24 | 2019-11-22 | 西安理工大学 | 基于Hadoop的大数据关联规则的挖掘方法 |
CN110727836B (zh) * | 2019-12-17 | 2020-04-07 | 南京华飞数据技术有限公司 | 基于Spark GraphX的社交网络分析系统及其实现方法 |
CN112667679B (zh) * | 2020-12-17 | 2024-02-13 | 中国工商银行股份有限公司 | 数据关系的确定方法、装置和服务器 |
CN113872752B (zh) * | 2021-09-07 | 2023-10-13 | 哲库科技(北京)有限公司 | 安全引擎模组、安全引擎装置和通信设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05181895A (ja) * | 1991-12-27 | 1993-07-23 | Hitachi Ltd | 並列計算行列解法 |
JPH05324700A (ja) * | 1992-05-19 | 1993-12-07 | N T T Data Tsushin Kk | 行列乗算装置 |
JPH06175986A (ja) * | 1992-12-10 | 1994-06-24 | Nippon Telegr & Teleph Corp <Ntt> | 行列演算の並列処理方法 |
US20090094310A1 (en) * | 2007-10-03 | 2009-04-09 | Fuji Xerox Co., Ltd. | Parallel computing system and parallel computing method |
US20140201450A1 (en) * | 2011-09-15 | 2014-07-17 | Kjetil B. Haugen | Optimized Matrix and Vector Operations In Instruction Limited Algorithms That Perform EOS Calculations |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6282583B1 (en) * | 1991-06-04 | 2001-08-28 | Silicon Graphics, Inc. | Method and apparatus for memory access in a matrix processor computer |
US7072960B2 (en) * | 2002-06-10 | 2006-07-04 | Hewlett-Packard Development Company, L.P. | Generating automated mappings of service demands to server capacities in a distributed computer system |
US20080147821A1 (en) * | 2006-12-19 | 2008-06-19 | Dietrich Bradley W | Managed peer-to-peer content backup service system and method using dynamic content dispersal to plural storage nodes |
US7925842B2 (en) * | 2007-12-18 | 2011-04-12 | International Business Machines Corporation | Allocating a global shared memory |
US7921261B2 (en) * | 2007-12-18 | 2011-04-05 | International Business Machines Corporation | Reserving a global address space |
JP5672902B2 (ja) * | 2010-09-27 | 2015-02-18 | 富士通株式会社 | ordering生成方法、プログラム及び共有メモリ型スカラ並列計算機 |
US9552206B2 (en) * | 2010-11-18 | 2017-01-24 | Texas Instruments Incorporated | Integrated circuit with control node circuitry and processing circuitry |
CN103136244A (zh) * | 2011-11-29 | 2013-06-05 | 中国电信股份有限公司 | 基于云计算平台的并行数据挖掘方法及系统 |
GB2500444B (en) * | 2012-03-21 | 2015-09-16 | Broadcom Corp | Data processing |
CN102831102A (zh) * | 2012-07-30 | 2012-12-19 | 北京亿赞普网络技术有限公司 | 一种在计算机集群上进行矩阵乘积运算的方法和系统 |
US20140331014A1 (en) * | 2013-05-01 | 2014-11-06 | Silicon Graphics International Corp. | Scalable Matrix Multiplication in a Shared Memory System |
CN103345514B (zh) * | 2013-07-09 | 2016-06-08 | 焦点科技股份有限公司 | 大数据环境下的流式数据处理方法 |
US20150095747A1 (en) * | 2013-09-30 | 2015-04-02 | Itzhak Tamo | Method for data recovery |
CN103544328A (zh) * | 2013-11-15 | 2014-01-29 | 南京大学 | 一种基于Hadoop的并行k均值聚类方法 |
US9916188B2 (en) * | 2014-03-14 | 2018-03-13 | Cask Data, Inc. | Provisioner for cluster management system |
WO2016037351A1 (en) * | 2014-09-12 | 2016-03-17 | Microsoft Corporation | Computing system for training neural networks |
-
2015
- 2015-02-06 KR KR1020177022612A patent/KR101999639B1/ko active IP Right Grant
- 2015-02-06 CN CN201580001137.1A patent/CN106062732B/zh active Active
- 2015-02-06 WO PCT/CN2015/072451 patent/WO2016123808A1/zh active Application Filing
- 2015-02-06 EP EP15880764.4A patent/EP3239853A4/en not_active Withdrawn
- 2015-02-06 JP JP2017541356A patent/JP6508661B2/ja active Active
-
2017
- 2017-08-03 US US15/667,634 patent/US10567494B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05181895A (ja) * | 1991-12-27 | 1993-07-23 | Hitachi Ltd | 並列計算行列解法 |
JPH05324700A (ja) * | 1992-05-19 | 1993-12-07 | N T T Data Tsushin Kk | 行列乗算装置 |
JPH06175986A (ja) * | 1992-12-10 | 1994-06-24 | Nippon Telegr & Teleph Corp <Ntt> | 行列演算の並列処理方法 |
US20090094310A1 (en) * | 2007-10-03 | 2009-04-09 | Fuji Xerox Co., Ltd. | Parallel computing system and parallel computing method |
US20140201450A1 (en) * | 2011-09-15 | 2014-07-17 | Kjetil B. Haugen | Optimized Matrix and Vector Operations In Instruction Limited Algorithms That Perform EOS Calculations |
Also Published As
Publication number | Publication date |
---|---|
CN106062732B (zh) | 2019-03-01 |
WO2016123808A1 (zh) | 2016-08-11 |
EP3239853A4 (en) | 2018-05-02 |
EP3239853A1 (en) | 2017-11-01 |
JP6508661B2 (ja) | 2019-05-08 |
CN106062732A (zh) | 2016-10-26 |
US20170331886A1 (en) | 2017-11-16 |
KR20170103949A (ko) | 2017-09-13 |
KR101999639B1 (ko) | 2019-07-12 |
US10567494B2 (en) | 2020-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6508661B2 (ja) | データ処理システム、計算ノードおよびデータ処理方法 | |
US10936765B2 (en) | Graph centrality calculation method and apparatus, and storage medium | |
Peng et al. | Parallel and distributed sparse optimization | |
JP5922667B2 (ja) | 製品情報の伝送 | |
Trifunović et al. | Parallel multilevel algorithms for hypergraph partitioning | |
US9996391B2 (en) | Parallel computer system, method of controlling parallel computer system, and recording medium | |
CN102298650B (zh) | 一种海量数字信息的分布式推荐方法 | |
US20180114028A1 (en) | Secure multi-party information retrieval | |
US20200084019A1 (en) | Blockchain Ranking Engine | |
WO2023087914A1 (zh) | 推荐内容的选择方法、装置、设备、存储介质及程序产品 | |
Chakaravarthy et al. | On optimizing distributed tucker decomposition for sparse tensors | |
Acer et al. | Improving medium-grain partitioning for scalable sparse tensor decomposition | |
CN109710403B (zh) | 应用进程映射方法、电子装置及计算机可读存储介质 | |
US8874615B2 (en) | Method and apparatus for implementing a learning model for facilitating answering a query on a database | |
Le Borne et al. | Domain decomposition methods in scattered data interpolation with conditionally positive definite radial basis functions | |
CN105989154B (zh) | 相似性度量的方法及设备 | |
US20160092595A1 (en) | Systems And Methods For Processing Graphs | |
KR101946692B1 (ko) | 그래프 랭킹 수행 방법 및 장치 | |
Ibeid et al. | A performance model for the communication in fast multipole methods on high-performance computing platforms | |
CN106919946B (zh) | 一种受众选择的方法及装置 | |
US9218389B2 (en) | Fast distributed database frequency summarization | |
JP6348915B2 (ja) | データ処理方法、データ処理装置及びデータ処理プログラム | |
KR102185980B1 (ko) | 테이블 처리 방법 및 장치 | |
US20180322304A1 (en) | Data allocation based on secure information retrieval | |
CN115114283A (zh) | 数据处理方法、装置、计算机可读介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190311 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190326 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6508661 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |