JP6450330B2 - 並列計算処理装置および並列計算処理方法 - Google Patents
並列計算処理装置および並列計算処理方法 Download PDFInfo
- Publication number
- JP6450330B2 JP6450330B2 JP2016018940A JP2016018940A JP6450330B2 JP 6450330 B2 JP6450330 B2 JP 6450330B2 JP 2016018940 A JP2016018940 A JP 2016018940A JP 2016018940 A JP2016018940 A JP 2016018940A JP 6450330 B2 JP6450330 B2 JP 6450330B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- calculation
- data
- processing
- lcx
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims description 301
- 238000000034 method Methods 0.000 claims description 59
- 230000008569 process Effects 0.000 claims description 50
- 230000005540 biological transmission Effects 0.000 claims description 45
- 238000007726 management method Methods 0.000 claims description 32
- 238000013500 data storage Methods 0.000 claims description 24
- 230000010076 replication Effects 0.000 claims description 18
- 238000003672 processing method Methods 0.000 claims description 11
- 230000001737 promoting effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 18
- 238000004088 simulation Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 230000006872 improvement Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 238000004138 cluster model Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Description
具体的には、図1(a)示すように、複数のノード(ノード1〜ノード4)のうちのいずれかのノードがデータを受信すると、そのノード(例えば、ノード1)がスーパーステップ1(SS1)において、そのデータについての計算処理(ローカル計算(LC))を実行する。続いて、スーパーステップ2(SS2)において、各ノードが保持しているローカル計算の結果であるデータについて、ノード間でのデータ交換を実行する。次に、スーパーステップ3(SS3)において、同期処理を行う、より詳細には、すべてのノード間でのデータ交換の終了を待つ。
そして、Step1として、一連のスーパーステップの処理(SS1〜SS3)が終了すると、各ノードはその計算結果を保持した上で、次の一連のスーパーステップの処理であるStep2へと進む。
具体的には、このメッシュ分割シミュレーション計算では、スーパーステップ1(SS1)において、各メッシュにおける計算処理(ローカル計算(LC))を実行する。続いて、スーパーステップ2(SS2)において、各メッシュ(隣接メッシュとの間)の計算結果の送受信(データ交換)を実行する。次に、スーパーステップ3(SS3)において、すべての隣接メッシュからのデータ(計算結果)の受信完了待ちを行う。このスーパーステップの一連の処理を繰り返すことにより、BSP計算モデルによるシミュレーション計算を実行する。
(問題1:負荷分散性の向上)
BSP計算モデルは、前ステップの計算結果を引き継いで次ステップ以降の計算を進めていく(つまり、「ステートフル」である。)ため、複数の計算ノードでクラスタを構成して処理を行う際に、信号の振分処理がボトルネック化する等の理由により、負荷分散性を向上させるのが難しい。
BSP計算モデルは、前ステップの計算結果を引き継いで次ステップ以降の計算を進めていく(つまり、「ステートフル」である。)ため、可用性(耐障害性)を高めるためには、データ保護・復旧等の仕組みが必要となる。また、BSP計算モデルは、ノードが相互にインタラクションしながら処理を進めるため、一部のノード障害が全体に波及してしまう。
図2(a)に示すようなメッシュ分割されたシミュレーション計算を複数のノードが並列実行することを前提とする。ここで、ある注目するメッシュxについて、Step nの計算時間(データが揃ってから計算が完了するまでの時間)をt(x,n)、データ送受信の通信遅延をlatency(簡易化のために定数とする。)とする。この場合、メッシュxについて、計算開始からStep nの計算とデータ送受信が完了するまでにかかる時間T(x,n)は、図1(b)の(式1)となる。
ここで、メッシュxの隣接メッシュをメッシュxnorth,メッシュxeast,メッシュxwest,メッシュxsouthとする。
(式1)および(式2)により示されるように、シミュレーション計算時間は、各ステップにおけるローカル計算(LC)の計算時間の最大値に依存する。そのため、どこか一箇所のメッシュでも著しく計算時間が延びた場合、シミュレーション全体の計算時間が著しく延び、最悪の場合には停止してしまう。つまり、一部のメッシュの処理遅延や停止により、シミュレーション全体が遅延もしくは停止することとなる(図1の符号α)。
計算処理するリソースを効率的に利用するために、処理負荷に応じたクラスタ規模の動的な拡大・縮小を可能とする必要がある。その際、クラスタ構成の変更(ノードの増減設)時の振分先決定処理のための再計算や、ノード間の処理(データ)引継ぎのコストを抑える必要がある。
BSP計算モデル等を採用する様々なアプリケーションに対し、問題1〜3を解決する汎用的なソリューションを提供する必要がある。
さらに、本発明は、BSP計算モデルをミッションクリティカルなシステムに提供可能とする、並列計算処理装置および並列計算処理方法を提供することを課題とする。
よって、計算処理を各ノード(マスタノード)に振り分けることができるので、振分処理のボトルネック化を防ぐことができるとともに、並列計算処理の負荷分散性を向上させることができる。また、並列化された処理ステップごとにデータ(処理結果)を送受信し、それを同期しながら計算する処理(BSP計算モデル)を、所定の計算ステップとして汎用化して提供することが可能となる。
また、並列計算処理装置は、ネイバノードからの処理結果が揃っていないと判定した場合に、ダミーデータを生成し、そのダミーデータを用いて並列計算処理を続行することができる。
よって、マスタノードに障害が発生した場合であっても、レプリカノードの記憶された複製データにより、並列計算処理を継続することが可能となる。
さらに、本発明によれば、BSP計算モデルをミッションクリティカルなシステムに適用可能とする、並列計算処理装置および並列計算処理方法を提供することができる。
図3は、本実施形態に係る並列計算処理装置1を含む並列計算処理システム1000の構成を示す図である。
並列計算処理システム1000では、ネットワーク上に分散配置されることによりクラスタを構成する複数の並列計算処理装置1が相互に通信接続される。この並列計算処理装置1は、上記したBSP計算モデル等の、並列化された処理のステップ毎にインタラクション(相互作用)が生じ、それを同期しながら計算を進める計算処理を用いて、分割シミュレーション計算等を実行する装置である。なお、以下の説明においては、図1(b)において示したメッシュ分割シミュレーション計算を例に説明するが、これに限定されない。
1つ目の機能として説明するノード(並列計算処理装置1)は、信号を受信しその計算処理を担当するノード、つまり、図1(b)においてメッシュxを担当するノードである。このノードを、以下「LCxマスタノード1A」(マスタノード)と記して説明する。
2つ目の機能として説明するノード(並列計算処理装置1)は、上記したBSPのスーパーステップ2(SS2)において、計算結果(データ)の交換を行う、つまり、ステップ毎にLCxマスタノード1Aと相互にインタラクションが発生するノード(図1(b)の隣接メッシュを担当するノード)である。このノードを、以下「LCxネイバノード1B)」(ネイバノード)と記して説明する。
3つ目の機能として説明するノード(並列計算処理装置1)は、LCxマスタノード1Aに格納されるデータの複製を記憶するノードである。このノードを、以下「LCxレプリカノード1C」(レプリカノード)と記して説明する。
以下、並列計算処理装置1が備える各機能について詳細に説明する。
並列計算処理装置1は、不図示の、制御手段と、通信手段と、記憶手段とを備えるコンピュータである。
通信手段は、自身以外の他の並列計算処理装置1等との間で通信接続を行うための通信インタフェース等から構成される。
また、記憶手段は、ハードディスクやフラッシュメモリ、RAM(Random Access Memory)等からなり、処理結果(データ)や、他の並列計算処理装置1との通信に必要となるアドレス(例えば、IPアドレス)等の設定情報が格納される。
また、この制御手段は、例えば、記憶手段に格納されたプログラムをCPU(Central Processing Unit:図示省略)がRAM(図示省略)に展開し実行することで実現される。
LCx計算部12は、LCx計算元データ取得部11が取得したデータセットを利用して計算処理を行う。
LCx計算結果出力部13は、LCx計算部12が計算した計算結果(データ)をデータ送受信同期部30に出力する。
この振分処理部20は、データ振分部21、データ交換部22を含んで構成される。
なお、図1(b)に示したようなメッシュ分割シミュレーション計算においては、分割したメッシュごとにID(メッシュID)が割り振られ、そのメッシュIDのメッシュの処理を担当するノード(LCxマスタノード1A(並列計算処理装置1))が予め設定される。そして、閉じたID空間上においてメッシュIDを例えば時計回りに配置しておき、信号を受信した際に、その信号に付されたキー情報から時計回りに辿った場合に最初に当たったメッシュIDのノード(並列計算処理装置1)が、その信号を担当するメッシュxに対応するLCxマスタノード1Aとなる。このとき、メッシュIDと並列計算処理装置1のアドレス(IPアドレス等)との対応表(メッシュID−ノード対応表)が予め各ノード(並列計算処理装置1)の記憶手段に記憶される。このコンシステントハッシュ法に基づく、分散処理システムでは、処理負荷に応じたノード(並列計算処理装置1)の増減設の際に、その増減設の対象となる並列計算処理装置1が保持するデータの移行処理(データの再配置)が、システム全体には及ばす一部のノード(並列計算処理装置1)に限定されるため、データ移行の処理負荷(再計算・再配置等のコスト)を軽減させ、動的な構成変更への対応を容易にすることができる。
このコンシステントハッシュ法については、「入江道生,他4名,“スケールアウトと柔軟な構成変更を実現するセッション制御サーバのクラスタモデル”,電子情報通信学会,2011年電子情報通信学会総合大会,通信講演論文集2,B−6−11」に詳しい。
なお、図1(b)に示したようなメッシュ分割シミュレーション計算においては、そのLCxマスタノード1A(並列計算処理装置1)自身が担当するメッシュxの隣接メッシュの情報が予め記憶手段に記憶される。具体的には、隣接メッシュのメッシュIDとそのメッシュIDに対応付けられたLCxネイバノード1Bのアドレス(IPアドレス等)の対応表(隣接メッシュ対応表)が、予めLCxマスタノード1A(並列計算処理装置1)の記憶手段に記憶される。データ交換部22は、この対応表(隣接メッシュ対応表)を参照することにより、LCxネイバノード1Bとそのアドレス(IPアドレス等)を特定し、計算結果を送信する。
このネイバノードデータ受信部32は、LCxマスタノード1Aの機能を実行する場合において、LCxネイバノード1Bからの計算結果(データ)を受信したときには、その計算結果(データ)をデータ格納処理部40(40A)に出力し記憶させる。また、ネイバノードデータ受信部32は、LCxネイバノード1Bの機能を実行する場合において、LCxマスタノード1Aからの計算結果(データ)を受信したときには、その計算結果(データ)をデータ格納処理部40(40B)に出力し記憶させる。
また、このレプリケーション部42は、LCxレプリカノード1Cの機能を実行する場合において、LCxマスタノード1Aから複製データ(データ100)を受信すると、データ格納部41を介して、自身の記憶手段に記憶させる。
LCxマスタノード1Aの障害管理部50Aは、ローカル計算(LC)中において、自身のノードの障害を検知した場合には、次の処理を実行する。
この場合、1つ以上のLCxレプリカノード1Cのうちのいずれか1つをLCxマスタノード1Aに昇格させる。このLCxマスタノード1A(昇格するLCxレプリカノード1C)を決定するロジックは予め設定しておく。例えば、障害管理部50Aは、コンシステントハッシュ法に基づき、自身のメッシュxのメッシュIDから閉じたID空間において時計回りに次に位置するメッシュIDのノード(LCxレプリカノード1C)を特定し、LCxマスタノード1Aに昇格するノードとして決定する。障害管理部50Aは、この決定したLCxレプリカノード1Cに、LCxマスタノード1Aに昇格する旨の通知を送信すること等により、そのLCxレプリカノード1Cを、LCxマスタノード1Aに昇格させる。
これにより、例えば、障害管理部50Aが自身のLCxマスタノード1Aの軽微な障害を検知した場合に、予備的に並行してLCxレプリカノード1Cにおいて、処理を実行しておくことができる。よって、LCxマスタノード1Aがその後処理停止等に陥った場合に、即座に処理を引き継ぐことができる。
障害管理部50Aは、例えば、同じ処理要求(信号)に対する過去の計算結果(データ)の平均値を計算し、その平均値をダミーデータとする。このダミーデータを用いて、数値計算部10Aがローカル計算(LC)を実行することにより、計算精度は低下するが、並列計算処理装置1の処置停止を防ぐことができる。
LCxマスタノード1Aの障害管理部50Aは、LCxネイバノード1Bへの処理結果(データ)送信中において、LCxマスタノード1Aに障害が発生した場合には、次の処理を実行する。
(2−2)LCxネイバノード1Bのデータ送受信同期部30B内のLCx計算元データセット判定部33が、タイムアウト(所定の時間経過)等によりLCxマスタノード1Aからの計算結果(データ)を受信できていないと判定した旨を、障害管理部50Bが受け取る。これにより、LCxネイバノード1Bの障害管理部50Bが、LCxマスタノード1Aからの計算結果のダミーデータを生成し、数値計算部10Bに処理を続行させる。
このダミーデータは、過去にLCxマスタノード1Aから受信した計算結果(データ)の平均値でもよい。また、障害が発生したLCxマスタノード1A以外の並列計算処理装置1から受信したデータの平均値等をダミーデータとして利用してもよい。
LCxマスタノード1Aの障害管理部50Aは、LCxネイバノード1Bからの処理結果(データ)受信中において、LCxマスタノード1Aに障害が発生した場合には、次の処理を実行する。
このダミーデータは、過去にそのLCxネイバノード1Bから受信した計算結果(データ)の平均値でもよいし、当該LCxネイバノード1B以外の他のLCxネイバノード1Bから受信した計算結果(データ)の平均値等でもよい。
LCxマスタノード1Aの障害管理部50Aは、LCxレプリカノード1Cの障害を検知した場合には、正常な他の並列計算処理装置1から、新たなLCxレプリカノード1Cを選出する。
この新たなLCxレプリカノード1Cを決定するロジックは予め設定しておくものとする。例えば、障害管理部50Aは、コンシステントハッシュ法に基づき、自身のメッシュxのメッシュIDから閉じたID空間において時計回りに次やその次等に位置するメッシュIDのノードとして決定(冗長度の対応して決定)したノード(LCxレプリカノード1C)のさらにその次に位置するメッシュIDのノードを、新たなLCxレプリカノード1Cとして決定してもよい。これにより、障害管理部50は、システム全体のとしての冗長度を回復することができる。
LCxネイバノード1Bに障害が発生した場合には、その並列計算処理装置1の障害管理部50Bにより、その並列計算処理装置1のLCxレプリカノード1Cを、LCxマスタノード1Aとして昇格する処理が行われる(上記したLCxマスタノード1Aにおける障害対応(1−1)と同様の処理)。これにより、障害が発生したLCxネイバノード1BのLCxレプリカノード1Cが、LCxネイバノード1Bの機能を実行することができ、処理停止を防ぐことができる。
次に、並列計算処理装置1が実行する処理の流れについて説明する。
図4は、本実施形態に係る並列計算処理装置1が実行する処理の流れを示すフローチャートである。図4においては、並列計算処理装置1がLCxマスタノード1Aである場合の処理に沿って説明するが、各並列計算処理装置1は、自身がLCxマスタノード1Aである場合の処理、LCxネイバノード1Bである場合の処理、LCxレプリカノード1Cである場合の処理のいずれも実行することができる。
また、ここでは、複数の並列計算処理装置1のいずれかが受信した信号が、その振分処理部20により、その信号を担当するメッシュxに対応する並列計算処理装置1(LCxマスタノード1A)に振り分けられたものとして説明する。
このステップS8およびステップS9の処理は、LCxネイバノード1Bから計算結果(データ)を受信する度に実行される。これにより、各LCxネイバノード1Bから計算結果(データ)を受信中にLCxマスタノード1Aに障害が発生した場合においても、それまでに受信したデータをLCxレプリカノード1Cが引継いで直ちに処理を続行させることができる。
(負荷分散性の向上)
従来のBSP計算モデルでは、複数の計算ノードでクラスタを構成して処理を行う際に、信号の振分処理がボトルネック化する等の理由により、負荷分散性を向上させるのが難しかった。しかしながら、本実施形態に係る並列計算処理装置1によれば、例えば、コンシステントハッシュ法等を用いて、信号を各計算ノードに振り分けることができる。よって、振分処理のボトルネック化を防ぐことができるとともに、並列計算処理の負荷分散性を向上させることができる。
従来のBSP計算モデルで問題であった、可用性(耐障害性)を高めるための、データの保護・復旧等の仕組みを、LCxレプリカノード1Cを設けること等により実現することができる。具体的には、LCxマスタノード1Aが障害を検知した場合に、障害管理部50により、LCxレプリカノード1CをLCxマスタノード1Aに昇格させたり、LCxレプリカノード1CをLCxマスタノード1Aと同時に予備的に実行させたり、ダミーデータを用いること等により、一部のノード障害が全体に波及しないようにして、処理を続行することができる。
本実施形態に係る並列計算処理装置1は、信号の振分処理や、LCxレプリカノード1Cの決定処理等を、コンシステントハッシュ法等を用いて実行する。これにより、クラスタ構成の変更(ノードの増減設)があった場合における、ノード間の処理(データ)の引継ぎコストを抑えることができる。よって、処理負荷に応じたクラスタ規模の動的な拡大・縮小への対応が可能となる。
本実施形態に係る並列計算処理装置1によれば、BSP計算モデル等を採用する様々なアプリケーションを、LCx計算部12に適用することができる。これにより、汎用的なソリューションを提供することが可能となる。
1A LCxマスタノード(マスタノード)
1B LCxネイバノード(ネイバノード)
1C LCxレプリカノード(レプリカノード)
10 数値計算部
11 LCx計算元データ取得部
12 LCx計算部
13 LCx計算結果出力部
20 振分処理部
21 データ振分部
22 データ交換部
30 データ送受信同期部
31 ネイバノードデータ送信部
32 ネイバノードデータ受信部
33 LCx計算元データセット判定部
34 LCx計算元データ出力部
35 LCx計算結果取得部
40 データ格納処理部
41 データ格納部
42 レプリケーション部
50 障害管理部
1000 並列計算処理システム
Claims (6)
- クラスタを構成するノードとしてネットワーク上に配置され、並列計算処理を実行する並列計算処理装置であって、
複数の前記ノードの中から、計算処理を担当するノードであるマスタノードを決定し、前記マスタノードに計算処理を振り分ける振分処理部と、
所定の計算ステップとして前記計算処理を実行する数値計算部と、
前記マスタノードの計算処理の処理結果を、前記マスタノードと計算処理を並列に実行する1つ以上のネイバノードに送信するとともに、前記ネイバノードの計算処理の処理結果を受信し、前記所定の計算ステップの次に実行する所定の計算ステップに必要な前記ネイバノードからの処理結果が揃っているか否かを判定し、揃っていると判定した場合に、受信した前記ネイバノードからの処理結果を、前記数値計算部に出力するデータ送受信同期部と、
前記データ送受信同期部が、前記ネイバノードからの処理結果が揃っていないと判定した場合に、前記次に実行する所定の計算ステップに必要となるデータとして、ダミーデータを生成し、前記数値計算部の計算処理を続行させる障害管理部と、
を備えることを特徴とする並列計算処理装置。 - 前記数値計算部が実行した前記マスタノードとしての前記計算処理の処理結果の複製データと、前記データ送受信同期部が前記ネイバノードから受信した処理結果の複製データとを生成し、前記生成した各前記複製データを、前記マスタノード以外の他のノードであるレプリカノードに送信するデータ格納処理部を、さらに備えること
を特徴とする請求項1に記載の並列計算処理装置。 - 前記マスタノードとして機能するノードの障害を検出した場合に、前記レプリカノードを前記マスタノードに昇格させる障害管理部を、さらに備えること
を特徴とする請求項2に記載の並列計算処理装置。 - クラスタを構成するノードとしてネットワーク上に配置される並列計算処理装置の並列計算処理方法であって、
前記並列計算処理装置は、
複数の前記ノードの中から、計算処理を担当するノードであるマスタノードを決定し、前記マスタノードに計算処理を振り分けるステップと、
所定の計算ステップとして前記計算処理を実行するステップと、
前記マスタノードの計算処理の処理結果を、前記マスタノードと計算処理を並列に実行する1つ以上のネイバノードに送信するとともに、前記ネイバノードの計算処理の処理結果を受信し、前記所定の計算ステップの次に実行する所定の計算ステップに必要な前記ネイバノードからの処理結果が揃っているか否かを判定するステップと、を実行し、
前記ネイバノードからの処理結果が揃っていると判定した場合に、受信した前記ネイバノードからの処理結果を用いて、次の所定の計算ステップを実行し、
前記所定の計算ステップの次に実行する所定の計算ステップに必要な前記ネイバノードからの処理結果が揃っているか否かを判定するステップにおいて、前記ネイバノードからの処理結果が揃っていないと判定した場合に、前記次に実行する所定の計算ステップに必要となるデータとして、ダミーデータを生成し、前記計算処理を続行させるステップを、さらに実行すること
を特徴とする並列計算処理方法。 - 前記マスタノードとしての前記計算処理の処理結果の複製データと、前記ネイバノードから受信した処理結果の複製データとを生成し、前記生成した各前記複製データを、前記マスタノード以外の他のノードであるレプリカノードに送信するステップを、さらに実行すること
を特徴とする請求項4に記載の並列計算処理方法。 - 前記マスタノードとして機能するノードの障害を検出した場合に、前記レプリカノードを前記マスタノードに昇格させるステップを、さらに実行すること
を特徴とする請求項5に記載の並列計算処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016018940A JP6450330B2 (ja) | 2016-02-03 | 2016-02-03 | 並列計算処理装置および並列計算処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016018940A JP6450330B2 (ja) | 2016-02-03 | 2016-02-03 | 並列計算処理装置および並列計算処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017138780A JP2017138780A (ja) | 2017-08-10 |
JP6450330B2 true JP6450330B2 (ja) | 2019-01-09 |
Family
ID=59566841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016018940A Active JP6450330B2 (ja) | 2016-02-03 | 2016-02-03 | 並列計算処理装置および並列計算処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6450330B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2569276B (en) | 2017-10-20 | 2020-10-14 | Graphcore Ltd | Compiler method |
GB201717295D0 (en) | 2017-10-20 | 2017-12-06 | Graphcore Ltd | Synchronization in a multi-tile processing array |
GB2569274B (en) | 2017-10-20 | 2020-07-15 | Graphcore Ltd | Synchronization amongst processor tiles |
GB2569271B (en) * | 2017-10-20 | 2020-05-13 | Graphcore Ltd | Synchronization with a host processor |
GB2569275B (en) | 2017-10-20 | 2020-06-03 | Graphcore Ltd | Time deterministic exchange |
US10963003B2 (en) | 2017-10-20 | 2021-03-30 | Graphcore Limited | Synchronization in a multi-tile processing array |
JP7192388B2 (ja) * | 2018-10-22 | 2022-12-20 | 富士通株式会社 | 並列処理装置、並列演算実行プログラムおよびバックアップ方法 |
GB2579412B (en) | 2018-11-30 | 2020-12-23 | Graphcore Ltd | Gateway pull model |
JP7331604B2 (ja) * | 2019-10-04 | 2023-08-23 | 富士通株式会社 | 情報処理システム、情報処理方法、および情報処理プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013069189A (ja) * | 2011-09-26 | 2013-04-18 | Hitachi Ltd | 並列分散処理方法および並列分散処理システム |
-
2016
- 2016-02-03 JP JP2016018940A patent/JP6450330B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017138780A (ja) | 2017-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6450330B2 (ja) | 並列計算処理装置および並列計算処理方法 | |
US10990561B2 (en) | Parameter server and method for sharing distributed deep learning parameter using the same | |
JP5191062B2 (ja) | ストレージ制御システム、ストレージ制御システムに関する操作方法、データ・キャリア及びコンピュータ・プログラム | |
CN102521038B (zh) | 基于分布式文件系统的虚拟机迁移方法和装置 | |
CN106899648B (zh) | 一种数据处理方法和设备 | |
CN106843745A (zh) | 容量扩展方法及装置 | |
CN106603692B (zh) | 一种分布式存储系统中的数据存储方法及装置 | |
CN106855834B (zh) | 一种数据备份方法、装置和系统 | |
KR20200080286A (ko) | 컴퓨팅 클러스터 인터페이스 관리 | |
US11243980B2 (en) | Monotonic transactions in a multi-master database with loosely coupled nodes | |
KR20210106929A (ko) | 원격 직접 메모리 접근을 통한 분산 처리 장치 및 그 방법 | |
CN104937565B (zh) | 从第一节点到第二节点的地址范围传送 | |
CN113407637A (zh) | 一种数据同步方法、装置、电子设备以及存储介质 | |
CN103428288A (zh) | 基于分区状态表和协调节点的副本同步方法 | |
CN111291062A (zh) | 数据同步写入方法、装置、计算机设备及存储介质 | |
CN105740091B (zh) | 数据备份、恢复方法和设备 | |
US20130226867A1 (en) | Apparatus and method for converting replication-based file into parity-based file in asymmetric clustering file system | |
US10169440B2 (en) | Synchronous data replication in a content management system | |
CN105279029A (zh) | 一种基于作业计算资源的局部存储动态分配方法 | |
JP6535304B2 (ja) | 分散同期処理システムおよび分散同期処理方法 | |
CN105007233A (zh) | 一种基于dhcp服务器集群负载分配地址的方法 | |
US11327785B2 (en) | Computing system including enhanced application performance based on last completed operation sequence value | |
CN109947593B (zh) | 数据容灾方法、系统、策略仲裁装置和存储介质 | |
US10666727B2 (en) | Distributed processing network operations | |
CN117290076B (zh) | 一种易扩缩容的多并发任务派发的设备管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6450330 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |