JP6607078B2 - 並列計算機、並列lu分解方法及び並列lu分解プログラム - Google Patents
並列計算機、並列lu分解方法及び並列lu分解プログラム Download PDFInfo
- Publication number
- JP6607078B2 JP6607078B2 JP2016032299A JP2016032299A JP6607078B2 JP 6607078 B2 JP6607078 B2 JP 6607078B2 JP 2016032299 A JP2016032299 A JP 2016032299A JP 2016032299 A JP2016032299 A JP 2016032299A JP 6607078 B2 JP6607078 B2 JP 6607078B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- communication
- size
- time
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/12—Simultaneous equations, e.g. systems of linear equations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Operations Research (AREA)
- Complex Calculations (AREA)
Description
LU分解を並列で実行する複数の処理部
を有し、
前記複数の処理部の各々が、
第1サイズの行列での行列積が完了してから前記複数の処理部のうち他の処理部との通信が完了するまでの時間である第1の時間を計測する計測部と、
前記計測部により計測された前記第1の時間が所定時間以上である場合、行列積に使用する行列のサイズを、前記第1サイズより小さい第2サイズに変更する変更部と、
を有する並列計算機。
前記複数の処理部の各々が、
行列積を実行する計算部と、
前記他の処理部との通信を、前記計算部による行列積と並列で実行する通信部と、
前記計算部による行列積が終了するたびに、前記通信部による通信の進行を継続させるための処理を実行する通信制御部と、
をさらに有する付記1記載の並列計算機。
前記他の処理部との通信は、
次の行列積に使用する行列及び当該行列のパネル分解時に取得したピボットデータを前記他の処理部から受信するための通信、および、前記次の行列積に使用する行列及び当該行列のパネル分解時に取得したピボットデータを前記他の処理部に送信するための通信の少なくともいずれかを含む、
付記1又は2記載の並列計算機。
前記変更部は、
行方向のサイズ及び列方向のサイズの少なくともいずれかを小さくすることにより、行列のサイズを前記第1サイズから前記第2サイズに変更する、
付記1乃至3のいずれか1つ記載の並列計算機。
前記計測部は、
前記第1の時間を計測した後、前記第1サイズの行列で次の行列積演算を完了してから前記他の処理部との通信が完了までの時間である第2の時間をさらに計測し、
前記変更部は、
前記計測部により計測された前記第1の時間が前記所定時間以上であり且つ前記計測部により計測された前記第2の時間が前記所定時間以上である場合、行列積に使用する行列のサイズを前記第2サイズに変更する、
付記1記載の並列計算機。
LU分解を並列で実行する複数の処理部を有する並列計算機において実行される、並列LU分解方法であって、
前記複数の処理部の各々が、
第1サイズの行列での行列積が完了してから前記複数の処理部のうち他の処理部との通信が完了するまでの時間である第1の時間を計測し
計測された前記第1の時間が所定時間以上である場合、行列積に使用する行列のサイズを、前記第1サイズより小さい第2サイズに変更する、
処理を実行する並列LU分解方法。
プロセッサに、
第1サイズの行列での行列積が完了してから他のプロセッサとの通信が完了するまでの時間である第1の時間を計測し、
計測された前記第1の時間が所定時間以上である場合、行列積に使用する行列のサイズを、前記第1サイズより小さい第2サイズに変更する、
処理を実行させる並列LU分解プログラム。
n0,n1,n2,n3,n4,n5,n6,n7 ノード
101 CPU 102 メモリ
103 通信部 104 バス
151 計測部 152 変更部
153 計算部 154 通信制御部
Claims (7)
- LU分解を並列で実行する複数の処理部
を有し、
前記複数の処理部の各々が、
第1サイズの行列での行列積が完了してから前記複数の処理部のうち他の処理部との通信が完了するまでの時間である第1の時間を計測する計測部と、
前記計測部により計測された前記第1の時間が所定時間以上である場合、行列積に使用する行列のサイズを、前記第1サイズより小さい第2サイズに変更する変更部と、
を有する並列計算機。 - 前記複数の処理部の各々が、
行列積を実行する計算部と、
前記他の処理部との通信を、前記計算部による行列積と並列で実行する通信部と、
前記計算部による行列積が終了するたびに、前記通信部による通信の進行を継続させるための処理を実行する通信制御部と、
をさらに有する請求項1記載の並列計算機。 - 前記他の処理部との通信は、
次の行列積に使用する行列及び当該行列のパネル分解時に取得したピボットデータを前記他の処理部から受信するための通信、および、前記次の行列積に使用する行列及び当該行列のパネル分解時に取得したピボットデータを前記他の処理部に送信するための通信の少なくともいずれかを含む、
請求項1又は2記載の並列計算機。 - 前記変更部は、
行方向のサイズ及び列方向のサイズの少なくともいずれかを小さくすることにより、行列のサイズを前記第1サイズから前記第2サイズに変更する、
請求項1乃至3のいずれか1つ記載の並列計算機。 - 前記計測部は、
前記第1の時間を計測した後、前記第1サイズの行列で次の行列積演算を完了してから前記他の処理部との通信が完了までの時間である第2の時間をさらに計測し、
前記変更部は、
前記計測部により計測された前記第1の時間が前記所定時間以上であり且つ前記計測部により計測された前記第2の時間が前記所定時間以上である場合、行列積に使用する行列のサイズを前記第2サイズに変更する、
請求項1記載の並列計算機。 - LU分解を並列で実行する複数の処理部を有する並列計算機において実行される、並列LU分解方法であって、
前記複数の処理部の各々が、
第1サイズの行列での行列積が完了してから前記複数の処理部のうち他の処理部との通信が完了するまでの時間である第1の時間を計測し
計測された前記第1の時間が所定時間以上である場合、行列積に使用する行列のサイズを、前記第1サイズより小さい第2サイズに変更する、
処理を実行する並列LU分解方法。 - プロセッサに、
第1サイズの行列での行列積が完了してから他のプロセッサとの通信が完了するまでの時間である第1の時間を計測し、
計測された前記第1の時間が所定時間以上である場合、行列積に使用する行列のサイズを、前記第1サイズより小さい第2サイズに変更する、
処理を実行させる並列LU分解プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016032299A JP6607078B2 (ja) | 2016-02-23 | 2016-02-23 | 並列計算機、並列lu分解方法及び並列lu分解プログラム |
US15/361,887 US10417302B2 (en) | 2016-02-23 | 2016-11-28 | Parallel computer, parallel LU-factorization method, and parallel LU-factorization program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016032299A JP6607078B2 (ja) | 2016-02-23 | 2016-02-23 | 並列計算機、並列lu分解方法及び並列lu分解プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017151635A JP2017151635A (ja) | 2017-08-31 |
JP6607078B2 true JP6607078B2 (ja) | 2019-11-20 |
Family
ID=59629438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016032299A Active JP6607078B2 (ja) | 2016-02-23 | 2016-02-23 | 並列計算機、並列lu分解方法及び並列lu分解プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10417302B2 (ja) |
JP (1) | JP6607078B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11100426B1 (en) * | 2017-11-07 | 2021-08-24 | Amazon Technologies, Inc. | Distributed matrix decomposition using gossip |
US10331762B1 (en) | 2017-12-07 | 2019-06-25 | International Business Machines Corporation | Stream processing for LU decomposition |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06332931A (ja) * | 1993-05-19 | 1994-12-02 | Sumitomo Electric Ind Ltd | Lu分解の並列演算処理方法 |
JP2953929B2 (ja) | 1993-11-29 | 1999-09-27 | 日本電気株式会社 | 修正コレスキー分解計算装置 |
JP3639323B2 (ja) | 1994-03-31 | 2005-04-20 | 富士通株式会社 | メモリ分散型並列計算機による連立1次方程式計算処理方法および計算機 |
JP3983193B2 (ja) * | 2003-03-31 | 2007-09-26 | 富士通株式会社 | 行列処理方法及び装置 |
CN101533386A (zh) * | 2008-03-14 | 2009-09-16 | 国际商业机器公司 | 在多处理器系统上对矩阵进行qr分解的方法和装置 |
US8533251B2 (en) * | 2008-05-23 | 2013-09-10 | International Business Machines Corporation | Optimized corner turns for local storage and bandwidth reduction |
JP5343523B2 (ja) * | 2008-11-17 | 2013-11-13 | 富士通株式会社 | ジョブ管理装置、ジョブ管理方法およびジョブ管理プログラム |
US8572622B2 (en) * | 2009-12-30 | 2013-10-29 | International Business Machines Corporation | Reducing queue synchronization of multiple work items in a system with high memory latency between processing nodes |
JP5725446B2 (ja) * | 2011-03-25 | 2015-05-27 | 日本電気株式会社 | 分散並列プログラムの実行システム及び方法 |
US9836434B2 (en) * | 2015-08-11 | 2017-12-05 | International Business Machines Corporation | Runtime of CUBLAS matrix multiplication on GPU |
-
2016
- 2016-02-23 JP JP2016032299A patent/JP6607078B2/ja active Active
- 2016-11-28 US US15/361,887 patent/US10417302B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10417302B2 (en) | 2019-09-17 |
JP2017151635A (ja) | 2017-08-31 |
US20170242826A1 (en) | 2017-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Camara et al. | Twisted torus topologies for enhanced interconnection networks | |
US10943324B2 (en) | Data processing method, apparatus, and electronic device | |
JP2016527636A (ja) | ネットワークオンチップアーキテクチャにおけるシステムレベルシミュレーション | |
CN111932257B (zh) | 一种区块链并行化处理方法及装置 | |
JP6607078B2 (ja) | 並列計算機、並列lu分解方法及び並列lu分解プログラム | |
CN107479984B (zh) | 基于消息的分布式空间数据处理系统 | |
CN110908799A (zh) | 一种分布式训练中的通信方法、装置、设备、介质 | |
JP2004302928A (ja) | Smpノード分散メモリ型並列計算機における行列処理装置 | |
CN111885158B (zh) | 一种集群任务处理方法、装置、电子设备及存储介质 | |
JP2016224801A (ja) | 並列計算機システム、並列計算方法及びプログラム | |
JP6256167B2 (ja) | データセンターネットワークにおけるリスク軽減 | |
CN109800078A (zh) | 一种任务处理方法、任务分发终端及任务执行终端 | |
CN111985181A (zh) | 一种节点布局方法、装置、计算机设备及存储介质 | |
CN113381940B (zh) | 一种二维胖树网络拓扑的设计方法及装置 | |
CN109150628B (zh) | 一种系统网络拓扑自动生成方法以及装置 | |
JPWO2021075055A5 (ja) | ||
JP6337606B2 (ja) | 情報処理装置、経路決定方法及びプログラム | |
JP6063882B2 (ja) | 仮想マシン配置システム及び方法 | |
CN110912837B (zh) | 基于vsm系统的主备切换方法和装置 | |
CN114416329A (zh) | 计算任务部署方法、装置、电子设备及存储介质 | |
CN113938428A (zh) | 跨芯片的数据流转发方法及装置 | |
CN113485798A (zh) | 核函数生成方法、装置、设备以及存储介质 | |
CN113626164A (zh) | 一种监控平台作业调度方法、装置、终端及存储介质 | |
JP5907607B2 (ja) | 処理配置方法及びプログラム | |
JP6390322B2 (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181011 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190924 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191007 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6607078 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |