JP2016224756A - 並列演算装置、並列演算システム、ノード割当プログラム及びノード割当方法 - Google Patents
並列演算装置、並列演算システム、ノード割当プログラム及びノード割当方法 Download PDFInfo
- Publication number
- JP2016224756A JP2016224756A JP2015111287A JP2015111287A JP2016224756A JP 2016224756 A JP2016224756 A JP 2016224756A JP 2015111287 A JP2015111287 A JP 2015111287A JP 2015111287 A JP2015111287 A JP 2015111287A JP 2016224756 A JP2016224756 A JP 2016224756A
- Authority
- JP
- Japan
- Prior art keywords
- communication
- information
- node
- communication pattern
- full mesh
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/104—Peer-to-peer [P2P] networks
- H04L67/1044—Group management mechanisms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Multi Processors (AREA)
Abstract
【解決手段】Leafスイッチがフルメッシュ接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステムにおいてアプリケーションの並列演算を行う並列演算装置であって、アプリケーションを実行したときのノード間の通信回数を記録した通信記録情報と、Leafスイッチが層内又は層間の接続関係にあるノード群のいずれを割り当てるかを示す割当情報が通信パターン毎に特定された通信パターン情報とを比較する比較部と、比較した前記通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出し、該割当情報に基づき前記アプリケーションを次に実行するノード群を割り当てる割当部と、を有する並列演算装置が提供される。
【選択図】図10
Description
まず、本発明の一実施形態にかかる並列演算システムにおいてアプリケーションを並列して演算するノード群の接続方式について、図1を参照して説明する。図1は、一実施形態にかかる多層フルメッシュシステムの一例を示す。図1では、(d+1)角形のフルメッシュ(Fullmesh)システムをd層接続したトポロジの多層フルメッシュシステムにおいて、d=3の場合が示されている。
ノード間の通信は、リンクの本数に応じ、時間当たりに通信可能な量の最大値が決まる。よって、リンク数が多いファットツリートポロジの場合、フルメッシュトポロジよりも通信量の最大値が大きくなる。このため、通信量の多いジョブはLeafスイッチが層間の接続関係にあるノード群を割り当てることで、Leafスイッチが層内の接続関係にあるノード群を割り当てるよりもジョブを高性能に処理できるのではないかという仮説が立つ。この仮説に基づき、Leafスイッチが層内又は層間の接続関係にあるノード群のうちいずれがより通信スループットが高いか、すなわち高性能であるかを通信パターン毎に評価する。
ジョブスケジューラ10は、ジョブの実行にどのノード群を利用するかを選択し、選択したノード群を利用してジョブを実行する。ジョブスケジューラ10は、アプリケーションの通信パターンを判定することで、ジョブの多層フルメッシュシステムにおける適切なノード群への割当による効率的なジョブの実行を実現する。ジョブスケジューラ10は、Leafスイッチが接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステム100においてアプリケーションの並列演算を行う並列演算装置の一例である。
次に、本実施形態に係るノード割当処理について図16を参照して説明する。図16は、本実施形態にかかるノード割当処理の一例を示すフローチャートである。本処理が開始されると、まず、ジョブ情報受取部11は、ユーザからリクエストされたジョブのジョブ情報を受け付ける(ステップS10)。
(通信情報記録処理(S3))
図16のステップS16から呼び出される通信情報記録処理(S3)について、図17を参照して説明する。通信情報記録処理(S3)では、記録部13は、最初に送信先のプロセスの番号を取得する(ステップS161)。次に、記録部13は、通信記録情報テーブル21の該当する行列要素をカウントアップする(ステップS162)。記録部13は、送信元プロセスから送信先プロセスへの通信が発生するたびに通信回数をカウントアップする。通信回数のカウント方法は、アプリケーションの実行開始から実行終了までの通信回数をカウントする方法でもよいし、アプリケーションの実行中の所定時間の通信回数をカウントアップする方法でもよい。
(通信パターンの解析処理(S2))
図16のステップS18から呼び出される通信パターンの解析処理(S2)について、図18を参照して説明する。通信パターンの解析処理(S2)では、比較部14は、式(7)のxijに通信記録情報テーブル21に記録された行列の各要素を代入し、式(7)のyijに正規化された通信パターンの行列の各要素を代入することで距離を算出する(ステップS181)。
最後に、本実施形態に係るジョブスケジューラ10のハードウェア構成について、図20を参照して説明する。ジョブスケジューラ10は、入力装置101、表示装置102、外部I/F103、RAM(Random Access Memory)104、ROM(Read Only Memory)105、CPU(Central Processing Unit)106、通信I/F107、及びHDD(Hard Disk Drive)108などを備え、それぞれがバスBで相互に接続されている。
(付記1)
Leafスイッチがフルメッシュ接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステムにおいてアプリケーションの並列演算を行う並列演算装置であって、
アプリケーションを実行したときのノード間の通信回数を記録した通信記録情報と、Leafスイッチが層内又は層間の接続関係にあるノード群のいずれを割り当てるかを示す割当情報が通信パターン毎に特定された通信パターン情報とを比較する比較部と、
比較した前記通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出し、該割当情報に基づき前記アプリケーションを次に実行するノード群を割り当てる割当部と、を有する並列演算装置。
(付記2)
前記割当部は、前記アプリケーションを最初に実行したときの通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出する、
付記1に記載の並列演算装置。
(付記3)
Leafスイッチがフルメッシュ接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステムにおいてアプリケーションの並列演算を行う並列演算システムであって、
アプリケーションを実行したときのノード間の通信回数を記録した通信記録情報と、Leafスイッチが層内又は層間の接続関係にあるノード群のいずれを割り当てるかを示す割当情報が通信パターン毎に特定された通信パターン情報とを比較する比較部と、
比較した前記通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出し、該割当情報に基づき前記アプリケーションを次に実行するノード群を割り当てる割当部と、を有する並列演算装置を備える、
並列演算システム。
(付記4)
前記アプリケーションを最初に実行したときの通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出する、
付記3に記載の並列演算システム。
(付記5)
Leafスイッチがフルメッシュ接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステムにおいてアプリケーションの並列演算処理をコンピュータに実行させるためのノード割当プログラムであって、
アプリケーションを実行したときのノード間の通信回数を記録した通信記録情報と、Leafスイッチが層内又は層間の接続関係にあるノード群のいずれを割り当てるかを示す割当情報が通信パターン毎に特定された通信パターン情報とを比較し、
比較した前記通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出し、該割当情報に基づき前記アプリケーションを次に実行するノード群を割り当てる、
ノード割当プログラム。
(付記6)
前記アプリケーションを最初に実行したときの通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出する、
付記5に記載のノード割当プログラム。
(付記7)
Leafスイッチがフルメッシュ接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステムにおいてアプリケーションの並列演算処理をコンピュータが実行するノード割当方法であって、
アプリケーションを実行したときのノード間の通信回数を記録した通信記録情報と、Leafスイッチが層内又は層間の接続関係にあるノード群のいずれを割り当てるかを示す割当情報が通信パターン毎に特定された通信パターン情報とを比較し、
比較した前記通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出し、該割当情報に基づき前記アプリケーションを次に実行するノード群を割り当てる、
ノード割当方法。
(付記8)
前記アプリケーションを最初に実行したときの通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出する、
付記7に記載のノード割当方法。
11:ジョブ情報受取部
12:ジョブ実行部
13:記録部
14:比較部
15:ノード割当部
20:MPIライブラリ
21:通信記録情報テーブル
22:ジョブ管理テーブル
23:通信パターン情報テーブル
24:リソース割当テーブル
100:多層フルメッシュシステム
Claims (5)
- Leafスイッチがフルメッシュ接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステムにおいてアプリケーションの並列演算を行う並列演算装置であって、
アプリケーションを実行したときのノード間の通信回数を記録した通信記録情報と、Leafスイッチが層内又は層間の接続関係にあるノード群のいずれを割り当てるかを示す割当情報が通信パターン毎に特定された通信パターン情報とを比較する比較部と、
比較した前記通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出し、該割当情報に基づき前記アプリケーションを次に実行するノード群を割り当てる割当部と、を有する並列演算装置。 - 前記割当部は、前記アプリケーションを最初に実行したときの通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出する、
請求項1に記載の並列演算装置。 - Leafスイッチがフルメッシュ接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステムにおいてアプリケーションの並列演算を行う並列演算システムであって、
アプリケーションを実行したときのノード間の通信回数を記録した通信記録情報と、Leafスイッチが層内又は層間の接続関係にあるノード群のいずれを割り当てるかを示す割当情報が通信パターン毎に特定された通信パターン情報とを比較する比較部と、
比較した前記通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出し、該割当情報に基づき前記アプリケーションを次に実行するノード群を割り当てる割当部と、を有する並列演算装置を備える、
並列演算システム。 - Leafスイッチがフルメッシュ接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステムにおいてアプリケーションの並列演算処理をコンピュータに実行させるためのノード割当プログラムであって、
アプリケーションを実行したときのノード間の通信回数を記録した通信記録情報と、Leafスイッチが層内又は層間の接続関係にあるノード群のいずれを割り当てるかを示す割当情報が通信パターン毎に特定された通信パターン情報とを比較し、
比較した前記通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出し、該割当情報に基づき前記アプリケーションを次に実行するノード群を割り当てる、
ノード割当プログラム。 - Leafスイッチがフルメッシュ接続されたフルメッシュシステムが複数層連結される多層フルメッシュシステムにおいてアプリケーションの並列演算処理をコンピュータが実行するノード割当方法であって、
アプリケーションを実行したときのノード間の通信回数を記録した通信記録情報と、Leafスイッチが層内又は層間の接続関係にあるノード群のいずれを割り当てるかを示す割当情報が通信パターン毎に特定された通信パターン情報とを比較し、
比較した前記通信記録情報が示す通信に最も類似する通信パターンの割当情報を前記通信パターン情報に基づき抽出し、該割当情報に基づき前記アプリケーションを次に実行するノード群を割り当てる、
ノード割当方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015111287A JP6492977B2 (ja) | 2015-06-01 | 2015-06-01 | 並列演算装置、並列演算システム、ノード割当プログラム及びノード割当方法 |
US15/137,221 US10193969B2 (en) | 2015-06-01 | 2016-04-25 | Parallel processing system, method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015111287A JP6492977B2 (ja) | 2015-06-01 | 2015-06-01 | 並列演算装置、並列演算システム、ノード割当プログラム及びノード割当方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016224756A true JP2016224756A (ja) | 2016-12-28 |
JP6492977B2 JP6492977B2 (ja) | 2019-04-03 |
Family
ID=57397287
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015111287A Active JP6492977B2 (ja) | 2015-06-01 | 2015-06-01 | 並列演算装置、並列演算システム、ノード割当プログラム及びノード割当方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10193969B2 (ja) |
JP (1) | JP6492977B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018198479A1 (ja) * | 2017-04-26 | 2018-11-01 | 富士通株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2019020852A (ja) * | 2017-07-12 | 2019-02-07 | 富士通株式会社 | 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10033574B2 (en) * | 2015-03-20 | 2018-07-24 | Oracle International Corporation | System and method for efficient network reconfiguration in fat-trees |
US10084639B2 (en) | 2015-03-20 | 2018-09-25 | Oracle International Corporation | System and method for efficient network reconfiguration in fat-trees |
JP6874564B2 (ja) * | 2017-06-27 | 2021-05-19 | 富士通株式会社 | 情報処理システム、管理装置及びプログラム |
JP6915434B2 (ja) * | 2017-08-01 | 2021-08-04 | 富士通株式会社 | 情報処理システム、情報処理方法及びプログラム |
US11106439B2 (en) * | 2018-05-09 | 2021-08-31 | Nippon Telegraph And Telephone Corporation | Offload server and offload program |
US11227035B2 (en) * | 2018-11-15 | 2022-01-18 | International Business Machines Corporation | Intelligent pattern based application grouping and activating |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009020797A (ja) * | 2007-07-13 | 2009-01-29 | Hitachi Ltd | 並列計算機システム |
JP2010257056A (ja) * | 2009-04-22 | 2010-11-11 | Fujitsu Ltd | 並列処理装置、並列処理方法及び並列処理プログラム |
JP2011175573A (ja) * | 2010-02-25 | 2011-09-08 | Nec Corp | クラスタシステム、プロセス配置方法、及びプログラム |
JP2015232874A (ja) * | 2014-05-14 | 2015-12-24 | 富士通株式会社 | 並列計算機システム、並列計算機システムの制御方法、及び情報処理装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5265207A (en) * | 1990-10-03 | 1993-11-23 | Thinking Machines Corporation | Parallel computer system including arrangement for transferring messages from a source processor to selected ones of a plurality of destination processors and combining responses |
CA2293920A1 (en) * | 1999-12-31 | 2001-06-30 | Nortel Networks Corporation | Global distributed switch |
US20050080894A1 (en) * | 2003-10-09 | 2005-04-14 | John Apostolopoulos | Method and system for topology adaptation to support communication in a communicative environment |
US7486619B2 (en) * | 2004-03-04 | 2009-02-03 | International Business Machines Corporation | Multidimensional switch network |
US8117288B2 (en) | 2004-10-12 | 2012-02-14 | International Business Machines Corporation | Optimizing layout of an application on a massively parallel supercomputer |
KR20100133003A (ko) * | 2008-04-10 | 2010-12-20 | 알카텔-루센트 유에스에이 인코포레이티드 | 토폴로지 축약 방법, 토폴로지 축약 장치 및 라우트 제어기 |
US8705368B1 (en) * | 2010-12-03 | 2014-04-22 | Google Inc. | Probabilistic distance-based arbitration |
US8873385B2 (en) * | 2010-12-07 | 2014-10-28 | Microsoft Corporation | Incast congestion control in a network |
JP5617582B2 (ja) * | 2010-12-08 | 2014-11-05 | 富士通株式会社 | プログラム、情報処理装置、及び情報処理方法 |
WO2012125718A1 (en) * | 2011-03-16 | 2012-09-20 | The Trustees Of Columbia University In The City Of New York | Bi-modal arbitration nodes for a low-latency adaptive asynchronous interconnection network and methods for using the same |
US8370496B1 (en) * | 2011-03-31 | 2013-02-05 | Amazon Technologies, Inc. | Reducing average link bandwidth in an oversubscribed environment |
US9014201B2 (en) * | 2011-11-09 | 2015-04-21 | Oracle International Corporation | System and method for providing deadlock free routing between switches in a fat-tree topology |
WO2014205792A1 (zh) * | 2013-06-28 | 2014-12-31 | 华为技术有限公司 | 一种建立光旁路的方法、装置和系统 |
US9264312B2 (en) * | 2013-09-30 | 2016-02-16 | Cisco Technology, Inc. | Method and system to calculate multiple shortest path first trees |
-
2015
- 2015-06-01 JP JP2015111287A patent/JP6492977B2/ja active Active
-
2016
- 2016-04-25 US US15/137,221 patent/US10193969B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009020797A (ja) * | 2007-07-13 | 2009-01-29 | Hitachi Ltd | 並列計算機システム |
JP2010257056A (ja) * | 2009-04-22 | 2010-11-11 | Fujitsu Ltd | 並列処理装置、並列処理方法及び並列処理プログラム |
JP2011175573A (ja) * | 2010-02-25 | 2011-09-08 | Nec Corp | クラスタシステム、プロセス配置方法、及びプログラム |
JP2015232874A (ja) * | 2014-05-14 | 2015-12-24 | 富士通株式会社 | 並列計算機システム、並列計算機システムの制御方法、及び情報処理装置 |
Non-Patent Citations (1)
Title |
---|
井出聡: "PCクラスタシステムにおけるネットワークスイッチを4割削減する技術", 電子情報通信学会誌, vol. 第97巻,第12号, JPN6018051239, 1 December 2014 (2014-12-01), JP, pages 1121 - 1122, ISSN: 0003947130 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018198479A1 (ja) * | 2017-04-26 | 2018-11-01 | 富士通株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2018185650A (ja) * | 2017-04-26 | 2018-11-22 | 富士通株式会社 | 情報処理装置、情報処理方法及びプログラム |
US11018896B2 (en) | 2017-04-26 | 2021-05-25 | Fujitsu Limited | Information processing apparatus and information processing method |
JP2019020852A (ja) * | 2017-07-12 | 2019-02-07 | 富士通株式会社 | 情報処理装置、情報処理システム、情報処理方法及び情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
US10193969B2 (en) | 2019-01-29 |
JP6492977B2 (ja) | 2019-04-03 |
US20160352824A1 (en) | 2016-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6492977B2 (ja) | 並列演算装置、並列演算システム、ノード割当プログラム及びノード割当方法 | |
Shah et al. | The MDS queue: Analysing the latency performance of erasure codes | |
CN108463988B (zh) | 用于负载均衡的网络文件访问的系统 | |
Tan et al. | Delay tails in MapReduce scheduling | |
US20200364608A1 (en) | Communicating in a federated learning environment | |
Tian et al. | A dynamic and integrated load-balancing scheduling algorithm for cloud datacenters | |
Palanisamy et al. | Purlieus: locality-aware resource allocation for MapReduce in a cloud | |
Lee | Resource allocation and scheduling in heterogeneous cloud environments | |
US8185905B2 (en) | Resource allocation in computing systems according to permissible flexibilities in the recommended resource requirements | |
Chang et al. | Effective modeling approach for IaaS data center performance analysis under heterogeneous workload | |
US9535743B2 (en) | Data processing control method, computer-readable recording medium, and data processing control device for performing a Mapreduce process | |
US9483393B1 (en) | Discovering optimized experience configurations for a software application | |
JP2005235019A5 (ja) | ||
Chen et al. | Understanding TCP incast and its implications for big data workloads | |
US10013288B2 (en) | Data staging management system | |
Hou et al. | Dynamic workload balancing for hadoop mapreduce | |
Liu et al. | Fattreesim: Modeling large-scale fat-tree networks for hpc systems and data centers using parallel and discrete event simulation | |
Elshater et al. | A study of data locality in YARN | |
Gong et al. | Finding constant from change: Revisiting network performance aware optimizations on iaas clouds | |
US20150365474A1 (en) | Computer-readable recording medium, task assignment method, and task assignment apparatus | |
CN108112268B (zh) | 管理与自动扩展组相关的负载平衡器 | |
Sreedhar et al. | A survey on big data management and job scheduling | |
Voicu et al. | MOMC: multi-objective and multi-constrained scheduling algorithm of many tasks in Hadoop | |
US20170366413A1 (en) | Network evaluation program, network evaluation method, and network evaluation device | |
Nguyen et al. | A New Technical Solution for Resource Allocation in Heterogeneous Distributed Platforms. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190218 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6492977 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |