JP5369775B2 - n次元トーラス型分散処理システム、集団通信方法及び集団通信プログラム - Google Patents
n次元トーラス型分散処理システム、集団通信方法及び集団通信プログラム Download PDFInfo
- Publication number
- JP5369775B2 JP5369775B2 JP2009057352A JP2009057352A JP5369775B2 JP 5369775 B2 JP5369775 B2 JP 5369775B2 JP 2009057352 A JP2009057352 A JP 2009057352A JP 2009057352 A JP2009057352 A JP 2009057352A JP 5369775 B2 JP5369775 B2 JP 5369775B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- processor
- transfer
- dimensional
- adjacent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Multi Processors (AREA)
Description
一つの態様では、n次元トーラス型分散処理システムは、n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムであって、各プロセッサは、自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が予め所持していた元データの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送処理と、前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送処理の後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送処理と、を実行し、前記一方向及び前記他方向は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定されるn次元トーラス型分散処理システムである。
一つの態様では、n次元トーラス型分散処理システムは、n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムであって、各プロセッサは、前記n次元方向のうちの一方向一側に所定数分離れた位置に存在するプロセッサを転送目標のプロセッサと定め、自己が所有するデータのうち前記転送目標のプロセッサに対して転送すべきデータを前記一方向一側に隣接するプロセッサに転送する第1処理と、隣接するプロセッサから新たに転送されてきたデータに、自己が所有する対応するデータを加算し、加算後のデータを前記一方向一側に隣接するプロセッサに転送する処理を、前記隣接するプロセッサから自己を転送目標とするデータが送信されてくるまで繰り返す第2処理と、を前記各プロセッサに自己を転送目標とする全データが転送されてくるまで、前記転送目標のプロセッサ及びデータを転送する向きを変更しつつ繰り返す処理を、前記n次元方向全てに関して実行するn次元トーラス型分散処理システムである。
一つの態様では、集団通信方法は、n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムにおける集団通信方法であって、各プロセッサが、自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が予め所持していた元データの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送工程と、前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送工程後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送工程と、含み、前記一方向及び前記他方向は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定する集団通信方法である。
一つの態様では、集団通信方法は、n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムにおける集団通信方法であって、各プロセッサが、前記n次元方向のうちの一方向一側に所定数分離れた位置に存在するプロセッサを転送目標のプロセッサと定め、自己が所有するデータのうち前記転送目標のプロセッサに対して転送すべきデータを前記一方向一側に隣接するプロセッサに転送する第1処理と、隣接するプロセッサから新たに転送されてきたデータに、自己が所有する対応するデータを加算し、加算後のデータを前記一方向一側に隣接するプロセッサに転送する処理を、前記隣接するプロセッサから自己を転送目標とするデータが送信されてくるまで繰り返す第2処理と、を前記各プロセッサに自己を転送目標とする全データが転送されてくるまで、前記転送目標のプロセッサ及びデータを転送する向きを変更しつつ繰り返す処理を、前記n次元方向全てに関して実行する工程を含む集団通信方法である。
一つの態様では、集団通信プログラムは、n次元トーラス型分散処理システムに属するn次元(nは2以上)方向に配列された複数のプロセッサに、自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が予め所持していた元データの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送工程、及び前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送工程後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送工程、を実行させ、前記一方向及び前記他方向は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定されている集団通信プログラムである。
一つの態様では、集団通信プログラムは、n次元トーラス型分散処理システムに属するn次元(nは2以上)方向に配列された複数のプロセッサに、前記n次元方向のうちの一方向一側に所定数分離れた位置に存在するプロセッサを転送目標のプロセッサと定め、自己が所有するデータのうち前記転送目標のプロセッサに対して転送すべきデータを前記一方向一側に隣接するプロセッサに転送する第1処理と、隣接するプロセッサから新たに転送されてきたデータに、自己が所有する対応するデータを加算し、加算後のデータを前記一方向一側に隣接するプロセッサに転送する処理を、前記隣接するプロセッサから自己を転送目標とするデータが送信されてくるまで繰り返す第2処理と、を前記複数のプロセッサに自己を転送目標とする全データが転送されてくるまで、前記転送目標のプロセッサ及びデータを転送する向きを変更しつつ繰り返す処理を、前記n次元方向全てに関して実行させる集団通信プログラムである。
以下、n次元トーラス型分散処理システム、集団通信方法及び集団通信プログラムの第1の実施形態について、図1〜図10に基づいて詳細に説明する。
次に、n次元トーラス型分散処理システム、集団通信方法及び集団通信プログラムの第2の実施形態について、図15〜図31に基づいて詳細に説明する。
(付記1)n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムであって、前記各プロセッサは、自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が予め所持していた元データの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送処理と、前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送処理の後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送処理と、を実行することを特徴とするn次元トーラス型分散処理システム。
(付記2)前記n次元方向のそれぞれに配列されるプロセッサは、任意の数であることを特徴とする付記1に記載のn次元トーラス型分散処理システム。
(付記3)前記第1、第2データ転送処理では、前記各プロセッサは、自己が所持しているデータを隣接するプロセッサに転送する第1転送と、新たに転送されてきたデータを、前記隣接するプロセッサに転送する第2転送と、を実行することを特徴とする付記1又は2に記載のn次元トーラス型分散処理システム。
(付記4)前記各プロセッサは、他の全てのプロセッサそれぞれに転送する必要のあるデータを所持しており、前記第1、第2データ転送処理では、前記各プロセッサが、自己から前記一方向側又は他方向側に存在する任意の目標プロセッサに向けて転送する必要のある目標データを、前記目標プロセッサに近づく方向において隣接するプロセッサに転送する第1転送と、前記目標データを受信したプロセッサが、当該目標データと、自己が有する前記目標プロセッサに対して転送する必要のあるデータとを加算した新たな目標データを、前記目標プロセッサに近づく方向において隣接するプロセッサに転送する第2転送と、を実行することを特徴とする付記1又は2に記載のn次元トーラス型分散処理システム。
(付記5)前記各プロセッサは、前記第2データ転送処理を、前記他方向を異ならせつつ(n−1)回繰り返すことを特徴とする付記1〜4のいずれかに記載のn次元トーラス型分散処理システム。
(付記6)前記一方向及び前記他方向は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定することを特徴とする付記1〜5のいずれかに記載のn次元トーラス型分散処理システム。
(付記7)n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムにおける集団通信方法であって、
前記各プロセッサが、自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が予め所持していた元データの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送工程と、
前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送工程後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送工程と、を含む集団通信方法。
(付記8)前記n次元方向のそれぞれに配列されるプロセッサは、任意の数であることを特徴とする付記7に記載の集団通信方法。
(付記9)前記第1、第2データ転送工程では、前記各プロセッサは、自己が所持しているデータを隣接するプロセッサに転送する第1転送と、新たに転送されてきたデータを、前記隣接するプロセッサに転送する第2転送と、を実行することを特徴とする付記7又は8に記載の集団通信方法。
(付記10)前記各プロセッサは、他の全てのプロセッサそれぞれに転送する必要のあるデータを所持しており、前記第1、第2データ転送工程では、前記各プロセッサが、自己から前記一方向側又は他方向側に存在する任意の目標プロセッサに向けて転送する必要のある目標データを、前記目標プロセッサに近づく方向において隣接するプロセッサに転送する第1転送と、前記目標データを受信したプロセッサが、当該目標データと、自己が有する前記目標プロセッサに対して転送する必要のあるデータとを加算した新たな目標データを、前記目標プロセッサに近づく方向において隣接するプロセッサに転送する第2転送と、を実行することを特徴とする付記7又は8に記載の集団通信方法。
(付記11)前記第2データ転送工程は、前記他方向を異ならせつつ(n−1)回繰り返されることを特徴とする付記7〜10のいずれかに記載の集団通信方法。
(付記12)前記一方向及び前記他方向は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定されることを特徴とする付記7〜11のいずれかに記載の集団通信方法。
(付記13)n次元トーラス型分散処理システムに属するn次元(nは2以上)方向に配列された複数のプロセッサに、自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が予め所持していた元データの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送工程、及び前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送工程後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送工程、を実行させることを特徴とする集団通信プログラム。
(付記14)前記n次元方向のそれぞれに配列されるプロセッサは、任意の数であることを特徴とする付記13に記載の集団通信プログラム。
(付記15)前記第1、第2データ転送工程は、前記各プロセッサに、自己が所持しているデータを隣接するプロセッサに転送させる第1転送と、新たに転送されてきたデータを、前記隣接するプロセッサに転送させる第2転送と、を含むことを特徴とする付記13又は14に記載の集団通信プログラム。
(付記16)前記各プロセッサは、他の全てのプロセッサそれぞれに転送する必要のあるデータを所持しており、前記第1、第2データ転送工程は、前記各プロセッサに、自己から前記一方向側又は他方向側に存在する任意の目標プロセッサに向けて転送する必要のある目標データを、前記目標プロセッサに近づく方向において隣接するプロセッサに転送させる第1転送と、前記目標データを受信したプロセッサに、当該目標データと、自己が有する前記目標プロセッサに対して転送する必要のあるデータとを加算した新たな目標データを、前記目標プロセッサに近づく方向において隣接するプロセッサに転送させる第2転送と、を含むことを特徴とする付記13又は14に記載の集団通信プログラム。
(付記17)前記第2データ転送工程を、前記各プロセッサに、前記他方向を異ならせつつ(n−1)回実行させることを特徴とする付記13〜16のいずれかに記載の集団通信プログラム。
(付記18)前記一方向及び前記他方向は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定されることを特徴とする付記13〜17のいずれかに記載の集団通信プログラム。
100 2次元トーラス型分散処理システム
200 2次元トーラス型分散処理システム
Claims (13)
- n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムであって、
各プロセッサは、
前記n次元方向のうちの一方向一側に所定数分離れた位置に存在するプロセッサを転送目標のプロセッサと定め、自己が所有するデータのうち前記転送目標のプロセッサに対して転送すべきデータを前記一方向一側に隣接するプロセッサに転送する第1処理と、
隣接するプロセッサから新たに転送されてきたデータに、自己が所有する対応するデータを加算し、加算後のデータを前記一方向一側に隣接するプロセッサに転送する処理を、前記隣接するプロセッサから自己を転送目標とするデータが送信されてくるまで繰り返す第2処理と、
を前記各プロセッサに自己を転送目標とする全データが転送されてくるまで、前記転送目標のプロセッサ及びデータを転送する向きを変更しつつ繰り返す処理を、前記n次元方向全てに関して行う第1通信を実行し、
前記第1通信の後に、前記各プロセッサは、
自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が前記第1通信実行後に所持していたデータの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送処理と、
前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送処理の後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送処理と、を含む第2通信を実行することを特徴とするn次元トーラス型分散処理システム。 - n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムであって、
各プロセッサは、
自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が予め所持していた元データの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送処理と、
前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送処理の後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送処理と、を実行し、
前記一方向及び前記他方向は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定されることを特徴とするn次元トーラス型分散処理システム。 - 前記n次元方向のそれぞれに配列されるプロセッサは、任意の数であることを特徴とする請求項1又は2に記載のn次元トーラス型分散処理システム。
- 前記第1、第2データ転送処理では、
前記各プロセッサは、自己が所持しているデータを隣接するプロセッサに転送する第1転送と、新たに転送されてきたデータを、前記隣接するプロセッサに転送する第2転送と、を実行することを特徴とする請求項1〜3のいずれか一項に記載のn次元トーラス型分散処理システム。 - 前記各プロセッサは、前記第2データ転送処理を、前記他方向を異ならせつつ(n−1)回繰り返すことを特徴とする請求項1〜4のいずれか一項に記載のn次元トーラス型分散処理システム。
- n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムであって、
各プロセッサは、
前記n次元方向のうちの一方向一側に所定数分離れた位置に存在するプロセッサを転送目標のプロセッサと定め、自己が所有するデータのうち前記転送目標のプロセッサに対して転送すべきデータを前記一方向一側に隣接するプロセッサに転送する第1処理と、
隣接するプロセッサから新たに転送されてきたデータに、自己が所有する対応するデータを加算し、加算後のデータを前記一方向一側に隣接するプロセッサに転送する処理を、前記隣接するプロセッサから自己を転送目標とするデータが送信されてくるまで繰り返す第2処理と、
を前記各プロセッサに自己を転送目標とする全データが転送されてくるまで、前記転送目標のプロセッサ及びデータを転送する向きを変更しつつ繰り返す処理を、前記n次元方向全てに関して実行することを特徴とするn次元トーラス型分散処理システム。 - 前記n次元方向それぞれの処理順は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定されることを特徴とする請求項6に記載のn次元トーラス型分散処理システム。
- n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムにおける集団通信方法であって、
各プロセッサが、
前記n次元方向のうちの一方向一側に所定数分離れた位置に存在するプロセッサを転送目標のプロセッサと定め、自己が所有するデータのうち前記転送目標のプロセッサに対して転送すべきデータを前記一方向一側に隣接するプロセッサに転送する第1処理と、
隣接するプロセッサから新たに転送されてきたデータに、自己が所有する対応するデータを加算し、加算後のデータを前記一方向一側に隣接するプロセッサに転送する処理を、前記隣接するプロセッサから自己を転送目標とするデータが送信されてくるまで繰り返す第2処理と、
を前記各プロセッサに自己を転送目標とする全データが転送されてくるまで、前記転送目標のプロセッサ及びデータを転送する向きを変更しつつ繰り返す処理を、前記n次元方向全てに関して行う第1通信を実行する工程と、
前記第1通信の後に、前記各プロセッサが、
自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が前記第1通信実行後に所持していたデータの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送処理と、
前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送処理の後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送処理と、を含む第2通信を実行する工程と、を含む集団通信方法。 - n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムにおける集団通信方法であって、
各プロセッサが、自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が予め所持していた元データの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送工程と、
前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送工程後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送工程と、含み、
前記一方向及び前記他方向は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定されていることを特徴とする集団通信方法。 - n次元(nは2以上)方向に配列された複数のプロセッサを有するn次元トーラス型分散処理システムにおける集団通信方法であって、
各プロセッサが、
前記n次元方向のうちの一方向一側に所定数分離れた位置に存在するプロセッサを転送目標のプロセッサと定め、自己が所有するデータのうち前記転送目標のプロセッサに対して転送すべきデータを前記一方向一側に隣接するプロセッサに転送する第1処理と、
隣接するプロセッサから新たに転送されてきたデータに、自己が所有する対応するデータを加算し、加算後のデータを前記一方向一側に隣接するプロセッサに転送する処理を、前記隣接するプロセッサから自己を転送目標とするデータが送信されてくるまで繰り返す第2処理と、
を前記各プロセッサに自己を転送目標とする全データが転送されてくるまで、前記転送目標のプロセッサ及びデータを転送する向きを変更しつつ繰り返す処理を、前記n次元方向全てに関して実行する工程を含む集団通信方法。 - n次元トーラス型分散処理システムに属するn次元(nは2以上)方向に配列された複数のプロセッサに、
前記n次元方向のうちの一方向一側に所定数分離れた位置に存在するプロセッサを転送目標のプロセッサと定め、自己が所有するデータのうち前記転送目標のプロセッサに対して転送すべきデータを前記一方向一側に隣接するプロセッサに転送する第1処理と、
隣接するプロセッサから新たに転送されてきたデータに、自己が所有する対応するデータを加算し、加算後のデータを前記一方向一側に隣接するプロセッサに転送する処理を、前記隣接するプロセッサから自己を転送目標とするデータが送信されてくるまで繰り返す第2処理と、
を前記複数のプロセッサに自己を転送目標とする全データが転送されてくるまで、前記転送目標のプロセッサ及びデータを転送する向きを変更しつつ繰り返す処理を、前記n次元方向全てに関して行う第1通信を実行させ、
前記第1通信の後に、前記複数のプロセッサに、
自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が前記第1通信実行後に所持していたデータの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送処理と、
前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送処理の後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送処理と、を含む第2通信を実行させることを特徴とする集団通信プログラム。 - n次元トーラス型分散処理システムに属するn次元(nは2以上)方向に配列された複数のプロセッサに、
自己が所持するデータの少なくとも一部を、前記n次元方向のうちの一方向に隣接するプロセッサに順次転送して、自己が予め所持していた元データの少なくとも一部を、前記一方向に並ぶプロセッサの全てに所持させる第1データ転送工程、及び
前記n次元方向のうちの他方向に隣接するプロセッサに、自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送工程後に自己が所持していたデータの少なくとも一部を、前記他方向に並ぶプロセッサの全てに所持させる第2データ転送工程、を実行させ、
前記一方向及び前記他方向は、前記n次元方向それぞれにおける前記データの転送可能速度に応じて決定されていることを特徴とする集団通信プログラム。 - n次元トーラス型分散処理システムに属するn次元(nは2以上)方向に配列された複数のプロセッサに、
前記n次元方向のうちの一方向一側に所定数分離れた位置に存在するプロセッサを転送目標のプロセッサと定め、自己が所有するデータのうち前記転送目標のプロセッサに対して転送すべきデータを前記一方向一側に隣接するプロセッサに転送する第1処理と、
隣接するプロセッサから新たに転送されてきたデータに、自己が所有する対応するデータを加算し、加算後のデータを前記一方向一側に隣接するプロセッサに転送する処理を、前記隣接するプロセッサから自己を転送目標とするデータが送信されてくるまで繰り返す第2処理と、
を前記複数のプロセッサに自己を転送目標とする全データが転送されてくるまで、前記転送目標のプロセッサ及びデータを転送する向きを変更しつつ繰り返す処理を、前記n次元方向全てに関して実行させる集団通信プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009057352A JP5369775B2 (ja) | 2009-03-11 | 2009-03-11 | n次元トーラス型分散処理システム、集団通信方法及び集団通信プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009057352A JP5369775B2 (ja) | 2009-03-11 | 2009-03-11 | n次元トーラス型分散処理システム、集団通信方法及び集団通信プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010211553A JP2010211553A (ja) | 2010-09-24 |
JP5369775B2 true JP5369775B2 (ja) | 2013-12-18 |
Family
ID=42971628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009057352A Expired - Fee Related JP5369775B2 (ja) | 2009-03-11 | 2009-03-11 | n次元トーラス型分散処理システム、集団通信方法及び集団通信プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5369775B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5540609B2 (ja) | 2009-09-01 | 2014-07-02 | 富士通株式会社 | 並列計算システムおよび通信制御プログラム |
JP5644566B2 (ja) * | 2011-02-09 | 2014-12-24 | 富士通株式会社 | 計算システム、構成管理装置および構成管理プログラム |
JP6874564B2 (ja) | 2017-06-27 | 2021-05-19 | 富士通株式会社 | 情報処理システム、管理装置及びプログラム |
JP6911619B2 (ja) | 2017-08-02 | 2021-07-28 | 富士通株式会社 | 情報処理システム及び情報処理方法 |
JP7087953B2 (ja) * | 2018-11-22 | 2022-06-21 | 富士通株式会社 | 情報処理システム及び情報処理システムの制御方法 |
US10956357B2 (en) * | 2019-04-01 | 2021-03-23 | International Business Machines Corporation | Method for flexible, fast all-reduce on arbitrary tree topology |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100592752B1 (ko) * | 2001-02-24 | 2006-06-26 | 인터내셔널 비지네스 머신즈 코포레이션 | 토러스 및 트리 네트워크에서의 산술 기능 |
JP5056844B2 (ja) * | 2007-03-20 | 2012-10-24 | 富士通株式会社 | 一意情報集団通信プログラム、計算ノード、および一意情報集団通信方法 |
-
2009
- 2009-03-11 JP JP2009057352A patent/JP5369775B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010211553A (ja) | 2010-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5369775B2 (ja) | n次元トーラス型分散処理システム、集団通信方法及び集団通信プログラム | |
Norrie et al. | The design process for Google's training chips: TPUv2 and TPUv3 | |
CN107807819B (zh) | 一种支持离散数据表示的用于执行人工神经网络正向运算的装置及方法 | |
KR20180107869A (ko) | 머신 러닝을 수행하는 전자 장치 및 머신 러닝 수행 방법 | |
US7574466B2 (en) | Method for finding global extrema of a set of shorts distributed across an array of parallel processing elements | |
CN112840356A (zh) | 运算加速器、处理方法及相关设备 | |
CN111858465B (zh) | 大规模矩阵qr分解并行计算系统 | |
CN113469355B (zh) | 分布式系统中的多模型训练管道 | |
CN108320018B (zh) | 一种人工神经网络运算的装置及方法 | |
US11948352B2 (en) | Speculative training using partial gradients update | |
CN109840154A (zh) | 一种移动云环境下基于任务依赖的计算迁移方法 | |
KR20220015813A (ko) | 딥러닝 연산 수행 방법 및 장치 | |
CN111630505A (zh) | 深度学习加速器系统及其方法 | |
Liu et al. | WinoCNN: Kernel sharing Winograd systolic array for efficient convolutional neural network acceleration on FPGAs | |
WO2023130656A1 (zh) | 一种异构多节点互联拓扑生成方法和存储介质 | |
KR20220095532A (ko) | 네트워크 환경에서의 디바이스와 서버 간의 인공지능 처리 기능 분할방법 | |
CN111738276A (zh) | 基于多核卷积神经网络的图像处理方法、装置及设备 | |
JP2022074011A (ja) | ディープラーニング演算実行方法及び電子装置 | |
CN108399105B (zh) | 一种基于改进头脑风暴算法的软硬件划分方法 | |
US20230052942A1 (en) | Movement of tensor data during reshape operation | |
CN112732436A (zh) | 一种多核处理器-单图形处理器的深度强化学习加速方法 | |
Castelló et al. | Theoretical scalability analysis of distributed deep convolutional neural networks | |
Ma et al. | FPGA-based AI smart NICs for scalable distributed AI training systems | |
CN110020727B (zh) | 一种基于mpi多进程的单量子逻辑门实现方法 | |
KR102373802B1 (ko) | 신경망 연산 효율 증대를 위한 신경망 가속기 및 그의 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130902 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5369775 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |