JPH03204758A - 粒子運動シミュレーション処理方式 - Google Patents
粒子運動シミュレーション処理方式Info
- Publication number
- JPH03204758A JPH03204758A JP2000809A JP80990A JPH03204758A JP H03204758 A JPH03204758 A JP H03204758A JP 2000809 A JP2000809 A JP 2000809A JP 80990 A JP80990 A JP 80990A JP H03204758 A JPH03204758 A JP H03204758A
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- small space
- processing
- shared memory
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002245 particle Substances 0.000 title claims abstract description 60
- 238000012545 processing Methods 0.000 title claims abstract description 52
- 238000004088 simulation Methods 0.000 title claims description 24
- 230000033001 locomotion Effects 0.000 title claims description 16
- 238000004891 communication Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 14
- 238000003672 processing method Methods 0.000 claims description 6
- 238000012546 transfer Methods 0.000 abstract description 5
- 230000008878 coupling Effects 0.000 abstract 3
- 238000010168 coupling process Methods 0.000 abstract 3
- 238000005859 coupling reaction Methods 0.000 abstract 3
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
計算機における、粒子運動のシミュレーション処理に関
し、 並列処理システムの処理エレメント間のデータ授受量を
減少しで、並列処理性能を向上できる粒子運動シミュレ
ーション処理方式を目的とし、所与の3次元空間の粒子
データについて、所定の運動シミュレーションを実行す
る場合に、該空間をN個の小空間に分割して、各該小空
間を所与のカットオフ距離を辺の長さとする立方体のセ
ルに分割し、N個のクラスタを設け、該クラスタ間を所
要の通信手段で接続し、各該クラスタは、複数の処理エ
レメントと、共有メモリを有し、それぞれ各該小空間の
処理を分担して、該分担する小空間の該セルと、当該小
空間に隣接する該セルとに位置する、所与の粒子データ
を該共有メモリに保持し、該処理エレメントは、該クラ
スタごとに該共有メモリに保持する該データに関する所
定の処理を、該セル単位に分担して並列に実行し、該処
理の結果の、他の該小空間へ移動する該粒子と、前記小
空間に隣接するセルの粒子とに関する新データを、該通
信手段によって所要の該クラスタへ送信し、及び受信す
る該新データにより各該共有メモリ上のデータを更新し
、該処理から該データの更新までを、所与の回数繰り返
し実行するように構成する。
し、 並列処理システムの処理エレメント間のデータ授受量を
減少しで、並列処理性能を向上できる粒子運動シミュレ
ーション処理方式を目的とし、所与の3次元空間の粒子
データについて、所定の運動シミュレーションを実行す
る場合に、該空間をN個の小空間に分割して、各該小空
間を所与のカットオフ距離を辺の長さとする立方体のセ
ルに分割し、N個のクラスタを設け、該クラスタ間を所
要の通信手段で接続し、各該クラスタは、複数の処理エ
レメントと、共有メモリを有し、それぞれ各該小空間の
処理を分担して、該分担する小空間の該セルと、当該小
空間に隣接する該セルとに位置する、所与の粒子データ
を該共有メモリに保持し、該処理エレメントは、該クラ
スタごとに該共有メモリに保持する該データに関する所
定の処理を、該セル単位に分担して並列に実行し、該処
理の結果の、他の該小空間へ移動する該粒子と、前記小
空間に隣接するセルの粒子とに関する新データを、該通
信手段によって所要の該クラスタへ送信し、及び受信す
る該新データにより各該共有メモリ上のデータを更新し
、該処理から該データの更新までを、所与の回数繰り返
し実行するように構成する。
〔産業上の利用分野]
本発明は、計算機における、粒子運動のシミュレーショ
ンの処理方式に関する。
ンの処理方式に関する。
粒子の運動のシミュレーションは、半導体の結晶成長等
に関する気体・液体・個体の相転移、航空機等の乱流に
関する流体力学的運動、半導体の電子流に関する個体物
理学的運動、星雲や銀河系についての天体物理学的運動
等のシミュレーションとして、各種の分野で使用される
。
に関する気体・液体・個体の相転移、航空機等の乱流に
関する流体力学的運動、半導体の電子流に関する個体物
理学的運動、星雲や銀河系についての天体物理学的運動
等のシミュレーションとして、各種の分野で使用される
。
〔従来の技術と発明が解決しようとする課題〕前記のよ
うな粒子のシミュレーションは公知のように、所要の3
次元空間内の対象の粒子について、原理的にはすべての
2粒子間について距離の関数として求められる相互作用
を計算し、この作用力によって移動する各粒子の新しい
位置を定める計算を、所定の時間刻みによって所定の回
数繰り返す処理からなるが、実用的規模のシミュレーシ
ョンを行う場合の粒子個数N、は103個以上、時間刻
みの数は104回以上になるので、膨大な計算量が必要
になる。
うな粒子のシミュレーションは公知のように、所要の3
次元空間内の対象の粒子について、原理的にはすべての
2粒子間について距離の関数として求められる相互作用
を計算し、この作用力によって移動する各粒子の新しい
位置を定める計算を、所定の時間刻みによって所定の回
数繰り返す処理からなるが、実用的規模のシミュレーシ
ョンを行う場合の粒子個数N、は103個以上、時間刻
みの数は104回以上になるので、膨大な計算量が必要
になる。
こ\で、前記の力の計算には、通常距離対ポテンシャル
曲線の情報を与えて、粒子間の距離に対するポテンシャ
ルから、粒子間の作用力を求め、その力による粒子の移
動を算出することにより、ある時点の粒子の位置から、
次の時点の粒子の位置を決定するが、計算量を減少する
ために、粒子間の距離が離れて、ポテンシャルが所定値
以下までOに接近し始める距離をカットオフ(cut−
off)距離とし、カットオフ距離以内の粒子のみを計
算の対象とし、カットオフ距離を越える粒子の影響を無
視する計算方法がとられる。
曲線の情報を与えて、粒子間の距離に対するポテンシャ
ルから、粒子間の作用力を求め、その力による粒子の移
動を算出することにより、ある時点の粒子の位置から、
次の時点の粒子の位置を決定するが、計算量を減少する
ために、粒子間の距離が離れて、ポテンシャルが所定値
以下までOに接近し始める距離をカットオフ(cut−
off)距離とし、カットオフ距離以内の粒子のみを計
算の対象とし、カットオフ距離を越える粒子の影響を無
視する計算方法がとられる。
これにより、約N、2回の計算を、N、 X III、
回(各粒子からカットオフ距離内の平均粒子個数Nc)
に減少する。
回(各粒子からカットオフ距離内の平均粒子個数Nc)
に減少する。
この計算方法によるシミュレーションを高速化する並列
処理システムとして、空間をカットオフ距離の大きさの
セルに分割し、計算機の各処理エレメント(以下におい
てPEという)にセル単位で粒子のデータを分配して、
複数のPEで並列処理する方式がある。しかし、各PE
は担当するセルの粒子について計算するために、その粒
子からカットオフ距離以内の隣接セルの情報も必要とな
り、又計算の結果担当セルから他のPHの担当するセル
へ移動する粒子については、計算ごとに相互に通知しな
ければならないので、それらのためのPE間の情報授受
が絶えず必要になる。
処理システムとして、空間をカットオフ距離の大きさの
セルに分割し、計算機の各処理エレメント(以下におい
てPEという)にセル単位で粒子のデータを分配して、
複数のPEで並列処理する方式がある。しかし、各PE
は担当するセルの粒子について計算するために、その粒
子からカットオフ距離以内の隣接セルの情報も必要とな
り、又計算の結果担当セルから他のPHの担当するセル
へ移動する粒子については、計算ごとに相互に通知しな
ければならないので、それらのためのPE間の情報授受
が絶えず必要になる。
そのために、前記のシステムを、いわゆる疎結合の並列
計算機によって構成する場合には、PEの数を増加して
、IPHの担当するセル数が減少するに伴って、前記の
ような情報をPE間で授受するためのPE間通信量が増
加するために、PE数増大に見合う並列処理性能の上昇
を得ることが出来なくなる。又、複数のPEでメモリを
共有する、いわゆる密結合の並列計算機にすることによ
って、前記の疎結合システムの場合の通信の問題を解決
しようとすると、全PEを共有メモリに接続するための
共有バスの性能限界によって、PE数を増加する効果が
次第に減殺される。
計算機によって構成する場合には、PEの数を増加して
、IPHの担当するセル数が減少するに伴って、前記の
ような情報をPE間で授受するためのPE間通信量が増
加するために、PE数増大に見合う並列処理性能の上昇
を得ることが出来なくなる。又、複数のPEでメモリを
共有する、いわゆる密結合の並列計算機にすることによ
って、前記の疎結合システムの場合の通信の問題を解決
しようとすると、全PEを共有メモリに接続するための
共有バスの性能限界によって、PE数を増加する効果が
次第に減殺される。
本発明は、前記の問題点を除き、並列処理システムの処
理エレメント間のデータ授受量を減少して、並列処理性
能を向上できる粒子運動シミュレーション処理方式を目
的とする。
理エレメント間のデータ授受量を減少して、並列処理性
能を向上できる粒子運動シミュレーション処理方式を目
的とする。
第1図は、本発明の構成を示すブロック図である。
図は粒子運動シミュレーション処理方式の構成であって
、所与の3次元空間の粒子データについて、所定の運動
シミュレーションを実行する場合に、該空間をN個の小
空間に分割して、各該小空間を所与のカットオフ距離を
各辺の長さとする立方体のセルに分割し、N個のクラス
タ10を設け、クラスタ10間を通信手段11で接続し
、各クラスタ10は、共有メモリ12と、複数の処理エ
レメント(PE)13を有し、それぞれ各該小空間を分
担して、該分担する小空間の該セルと、当該小空間に隣
接する該セルとの、所与の粒子データを共有メモリ12
に保持し、PE13は、クラスタ10ごとに共有メモリ
12に保持する該データに関する所定の処理を、該セル
単位に分担して並列に実行し、該処理の結果の、他の該
小空間へ移動する該粒子と、前記小空間に隣接するセル
の粒子とに関する新データを、通信手段11によって所
要のクラスタ10へ送信し、及び受信する該新データに
より各共有メモリ12上のデータを更新し、該処理から
該データの更新までを、所与の回数繰り返し実行する。
、所与の3次元空間の粒子データについて、所定の運動
シミュレーションを実行する場合に、該空間をN個の小
空間に分割して、各該小空間を所与のカットオフ距離を
各辺の長さとする立方体のセルに分割し、N個のクラス
タ10を設け、クラスタ10間を通信手段11で接続し
、各クラスタ10は、共有メモリ12と、複数の処理エ
レメント(PE)13を有し、それぞれ各該小空間を分
担して、該分担する小空間の該セルと、当該小空間に隣
接する該セルとの、所与の粒子データを共有メモリ12
に保持し、PE13は、クラスタ10ごとに共有メモリ
12に保持する該データに関する所定の処理を、該セル
単位に分担して並列に実行し、該処理の結果の、他の該
小空間へ移動する該粒子と、前記小空間に隣接するセル
の粒子とに関する新データを、通信手段11によって所
要のクラスタ10へ送信し、及び受信する該新データに
より各共有メモリ12上のデータを更新し、該処理から
該データの更新までを、所与の回数繰り返し実行する。
(作 用〕
本処理方式により、前記小空間内のセル間については、
PE間で情報を転送する必要が全く無く、小空間に隣接
するセルの情報と、小空間を越えて他の小空間へ移動し
た粒子についての情報のみを、繰り返し処理の各回の初
めに、クラスタ間で授受すればよい。従って、適当な大
きさの小空間を設定することにより、転送を要する情報
量は前記従来の疎結合システムの場合より大幅に減少す
ることができる。従って、共有メモリへのアクセス競合
が並列処理性能を害さない程度のPE数で密結合システ
ムを構成してクラスタとし、小空間の数に対応する数の
クラスタを設けることにより、比較的多数のPEを使用
して、PE数に応じて並列処理性能を高めることが可能
になる。
PE間で情報を転送する必要が全く無く、小空間に隣接
するセルの情報と、小空間を越えて他の小空間へ移動し
た粒子についての情報のみを、繰り返し処理の各回の初
めに、クラスタ間で授受すればよい。従って、適当な大
きさの小空間を設定することにより、転送を要する情報
量は前記従来の疎結合システムの場合より大幅に減少す
ることができる。従って、共有メモリへのアクセス競合
が並列処理性能を害さない程度のPE数で密結合システ
ムを構成してクラスタとし、小空間の数に対応する数の
クラスタを設けることにより、比較的多数のPEを使用
して、PE数に応じて並列処理性能を高めることが可能
になる。
第1図において、各PE13はベクトル演算機構を有す
る処理装置とし、各クラスタ10は例えば8台のPE1
3を共有バス14によって、適当なアクセス速度の共有
メモi月2に接続した構成とし、同じ構成のクラスタ1
0を例えば16台(即ちN=16)設けて、IlO〜1
115クラスタとする。
る処理装置とし、各クラスタ10は例えば8台のPE1
3を共有バス14によって、適当なアクセス速度の共有
メモi月2に接続した構成とし、同じ構成のクラスタ1
0を例えば16台(即ちN=16)設けて、IlO〜1
115クラスタとする。
各クラスタ10は例えば各通信制御部16において通信
手段11に接続し、ネットワーク制御部15により通信
制御部16間の情報転送を行うように構成する。ネット
ワーク制御部15には、所要のクラスタ間における情報
転送を効率よく処理できる適当な通信網を使用すること
ができるが、例えば公知のハイパーキューブ(超立方体
)ネットワークを使用すれば、ブロッキングによる待ち
無しに、任意のクラスタ間の情報伝送を効率よく処理す
ることができる。前記のように16台のクラスタ10を
設ける場合のハイパーキューブネントワークは、第3図
に示す様に、図に黒塗り正方形で示す各クラスタ(の接
続する通信制御部16)からそれぞれ4個のクラスタへ
直通の通信路を設けた4次元超立方体のネットワークと
なる。
手段11に接続し、ネットワーク制御部15により通信
制御部16間の情報転送を行うように構成する。ネット
ワーク制御部15には、所要のクラスタ間における情報
転送を効率よく処理できる適当な通信網を使用すること
ができるが、例えば公知のハイパーキューブ(超立方体
)ネットワークを使用すれば、ブロッキングによる待ち
無しに、任意のクラスタ間の情報伝送を効率よく処理す
ることができる。前記のように16台のクラスタ10を
設ける場合のハイパーキューブネントワークは、第3図
に示す様に、図に黒塗り正方形で示す各クラスタ(の接
続する通信制御部16)からそれぞれ4個のクラスタへ
直通の通信路を設けた4次元超立方体のネットワークと
なる。
以上のシステムによって処理するシミュレーションの対
象を、例えば1(10人3の立方体空間に含まれる分子
である10’個の粒子とし、10人がカットオフ距離で
あるとすると、この空間を一辺10人の立方体に分割し
て103個のセルとする。
象を、例えば1(10人3の立方体空間に含まれる分子
である10’個の粒子とし、10人がカットオフ距離で
あるとすると、この空間を一辺10人の立方体に分割し
て103個のセルとする。
従って各セルには平均10個の粒子が存在する。
次に全体の空間を小空間に分割するために、例えば5X
5X2=50個のセルを含む種類の小空間と、5 X
5 X 3 =75個のセルを含む種類の小空間とを設
けて、両種類併せて16個の小空間で全空間をカバーす
るようにする。第2図(a)は以上のような小空間の分
割例を説明する図であって、実線で小空間の境界を示し
、破線で小空間内のセルの境界を示している。
5X2=50個のセルを含む種類の小空間と、5 X
5 X 3 =75個のセルを含む種類の小空間とを設
けて、両種類併せて16個の小空間で全空間をカバーす
るようにする。第2図(a)は以上のような小空間の分
割例を説明する図であって、実線で小空間の境界を示し
、破線で小空間内のセルの境界を示している。
#0〜1115のクラスタは、同じ態様でシミュレーシ
ョンを並列に実行するが、例えば#Oのクラスタ10は
シミュレーションの前後処理も行うものとして、入出力
線17によって外部からシミュレーション対象空間に関
するデータ等を受信し、又シミュレーション結果の所定
データを出力するようにしておく。
ョンを並列に実行するが、例えば#Oのクラスタ10は
シミュレーションの前後処理も行うものとして、入出力
線17によって外部からシミュレーション対象空間に関
するデータ等を受信し、又シミュレーション結果の所定
データを出力するようにしておく。
#0クラスタでは、所要のデータが入力されると前処理
を開始し、空間のデータについて前記の分割を行うと、
各小空間を特定のクラスタに割り付け、空間、小空間及
びセルの座標データ、及び小空間の割り付は先クラスタ
を示す情報と、割り当てた小空間の粒子の初期位置情報
とを、自身以外の各割当先のクラスタへ通信手段11を
介して配布する、又外部から指定された時間刻みの回数
等の制御情報を通知し、それらの配布を完了するとシミ
ュレーションを開始する。
を開始し、空間のデータについて前記の分割を行うと、
各小空間を特定のクラスタに割り付け、空間、小空間及
びセルの座標データ、及び小空間の割り付は先クラスタ
を示す情報と、割り当てた小空間の粒子の初期位置情報
とを、自身以外の各割当先のクラスタへ通信手段11を
介して配布する、又外部から指定された時間刻みの回数
等の制御情報を通知し、それらの配布を完了するとシミ
ュレーションを開始する。
第4図は各クラスタにおける、シミュレーション処理の
流れの一例を示し、処理ステップ20で繰り返し回数り
を0にし、その他所要の初期設定をして処理を開始して
、先ず処理ステップ21で、各クラスタが担当する小空
間に隣接するセル(これを、ある小空間の耳部分という
)で、自身が担当する小空間にあるセルの粒子の情報を
、それぞれ必要なりラスタへ宛てて通信手段IIにより
通知し、又自身に必要な耳部分の情報が通知されるのを
受信する。以上により、各クラスタlOの共用メモリ1
2には第2図(b)に示すセルの情報が保持される。
流れの一例を示し、処理ステップ20で繰り返し回数り
を0にし、その他所要の初期設定をして処理を開始して
、先ず処理ステップ21で、各クラスタが担当する小空
間に隣接するセル(これを、ある小空間の耳部分という
)で、自身が担当する小空間にあるセルの粒子の情報を
、それぞれ必要なりラスタへ宛てて通信手段IIにより
通知し、又自身に必要な耳部分の情報が通知されるのを
受信する。以上により、各クラスタlOの共用メモリ1
2には第2図(b)に示すセルの情報が保持される。
図で実線部分が担当する小空間、破線部分がその耳部分
のセルを示している。
のセルを示している。
なお、与えられた空間の外周の各面については、いわゆ
る周期境界条件を通用して、同一条件の空間が繰り返し
て存在するように扱い、従って反対側の面のセルを耳部
分とする。
る周期境界条件を通用して、同一条件の空間が繰り返し
て存在するように扱い、従って反対側の面のセルを耳部
分とする。
次に処理ステップ22で、担当する小空間の全粒子につ
いて、各粒子とカットオフ距離以内にある粒子との距離
ベクトルから、粒子間の相互作用を所与のポテンシャル
関数に基づいて計算し、その結果当該粒子が移動する位
置の新座標を求める計算を実行する。その際小空間の周
辺にあるセルの粒子について、耳部分の粒子による相互
作用を計算に入れる必要がある。
いて、各粒子とカットオフ距離以内にある粒子との距離
ベクトルから、粒子間の相互作用を所与のポテンシャル
関数に基づいて計算し、その結果当該粒子が移動する位
置の新座標を求める計算を実行する。その際小空間の周
辺にあるセルの粒子について、耳部分の粒子による相互
作用を計算に入れる必要がある。
以上を担当小空間の全粒子について終了すると、処理ス
テップ23で前ステップの処理の結果、担当する小空間
から外へ飛び出すことになった粒子についての各新座標
を、飛び出し先の小空間を担当するクラスタへ通信手段
11を経て通知し、又自身の小空間に飛び込む粒子の情
報が通知されるのを受信して、該当セルの粒子に加える
。なお、この場合も与えられた全空間の外に出る粒子に
ついては、前記の周期境界条件によって処理する。
テップ23で前ステップの処理の結果、担当する小空間
から外へ飛び出すことになった粒子についての各新座標
を、飛び出し先の小空間を担当するクラスタへ通信手段
11を経て通知し、又自身の小空間に飛び込む粒子の情
報が通知されるのを受信して、該当セルの粒子に加える
。なお、この場合も与えられた全空間の外に出る粒子に
ついては、前記の周期境界条件によって処理する。
以上で、時間刻みごとの1回の処理を終わり、処理ステ
ップ24で処理回数tを+1する。次に処理ステップ2
5で識別して、処理回数tが所定の時間刻み回数t、□
より小さければ、処理ステップ21に戻り、耳部分の新
情報を授受して前記の処理を繰り返す。このようにして
指定の時間刻み回数の処理を繰り返せばシミュレーショ
ンを終わる。
ップ24で処理回数tを+1する。次に処理ステップ2
5で識別して、処理回数tが所定の時間刻み回数t、□
より小さければ、処理ステップ21に戻り、耳部分の新
情報を授受して前記の処理を繰り返す。このようにして
指定の時間刻み回数の処理を繰り返せばシミュレーショ
ンを終わる。
各クラスタ10では各PE13が、共有メモリ12にあ
る担当小空間のデータから、それぞれが未処理のセルを
順次取り出して以上の処理を並列に実行し、適当に時間
刻みの同期を取りながら処理を進める。
る担当小空間のデータから、それぞれが未処理のセルを
順次取り出して以上の処理を並列に実行し、適当に時間
刻みの同期を取りながら処理を進める。
[発明の効果]
以上の説明から明らかなように本発明によれば、計算機
における、粒子運動のシミュレーション処理において、
並列処理システムの処理エレメント間のデータ授受量を
減少して、並列処理性能を向上できるという著しい工業
的効果がある。
における、粒子運動のシミュレーション処理において、
並列処理システムの処理エレメント間のデータ授受量を
減少して、並列処理性能を向上できるという著しい工業
的効果がある。
第1図は本発明の構成を示すブロック図、第2図は本発
明の空間分割を説明する図、第3図はハイパーキューブ
ネットワークの説明図、第4図は本発明の処理の流れ図 である。 図において、 10はクラスタ、 11は通信手段、12は共有
メモリ、 13はPE、15はネットワーク制御部
、 16は通信制御部、 17は入出力線、本発明の構
成を示すプロ、り図 第 図 (a) 本発明の空間分割を説明する図 第2図
明の空間分割を説明する図、第3図はハイパーキューブ
ネットワークの説明図、第4図は本発明の処理の流れ図 である。 図において、 10はクラスタ、 11は通信手段、12は共有
メモリ、 13はPE、15はネットワーク制御部
、 16は通信制御部、 17は入出力線、本発明の構
成を示すプロ、り図 第 図 (a) 本発明の空間分割を説明する図 第2図
Claims (1)
- 【特許請求の範囲】 所与の3次元空間の粒子データについて、所定の運動
シミュレーションを実行する場合に、該空間をN個の小
空間に分割して、各該小空間を所与のカットオフ距離を
各辺の長さとする立方体のセルに分割し、 N個のクラスタ(10)を設け、該クラスタ間を通信手
段(11)で接続し、 各該クラスタ(10)は、共有メモリ(12)と、複数
の処理エレメント(13)を有し、それぞれ各該小空間
を分担して、該分担する小空間の該セルと、当該小空間
に隣接する該セルとの、所与の粒子データを該共有メモ
リに保持し、 該処理エレメント(13)は、該クラスタ(10)ごと
に該共有メモリ(12)に保持する該データに関する所
定の処理を、該セル単位に分担して並列に実行し、該処
理の結果の、他の該小空間へ移動する該粒子と、前記小
空間に隣接するセルの粒子とに関する新データを、該通
信手段(11)によって所要の該クラスタ(10)へ送
信し、及び受信する該新データにより各該共有メモリ(
12)上のデータを更新し、該処理から該データの更新
までを、所与の回数繰り返し実行するように構成されて
いることを特徴とする粒子運動シミュレーション処理方
式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000809A JPH03204758A (ja) | 1990-01-06 | 1990-01-06 | 粒子運動シミュレーション処理方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000809A JPH03204758A (ja) | 1990-01-06 | 1990-01-06 | 粒子運動シミュレーション処理方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03204758A true JPH03204758A (ja) | 1991-09-06 |
Family
ID=11484013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000809A Pending JPH03204758A (ja) | 1990-01-06 | 1990-01-06 | 粒子運動シミュレーション処理方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03204758A (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09212471A (ja) * | 1996-01-30 | 1997-08-15 | Nec Corp | 並列処理プログラム実行装置および実行方法 |
JPH1091609A (ja) * | 1996-09-10 | 1998-04-10 | Mitsubishi Electric Corp | 分散シミュレーションシステム |
JP2008538441A (ja) * | 2005-04-19 | 2008-10-23 | ディ.イー.ショー リサーチ,エルエルシー | 距離制限のある対毎の粒子相互作用を評価するための拡張性の高い方法 |
JP2009505299A (ja) * | 2005-08-18 | 2009-02-05 | ディ.イー.ショー リサーチ,エルエルシー | 粒子相互作用を計算するための並行計算アーキテクチャ |
JP2009524161A (ja) * | 2006-01-23 | 2009-06-25 | アイティーティー マニュファクチャリング エンタープライジーズ, インコーポレイテッド | 物体相互作用シミュレーションのための区分メッシュ化および近傍検索 |
JP2012128793A (ja) * | 2010-12-17 | 2012-07-05 | Japan Agengy For Marine-Earth Science & Technology | 粒子状態計算装置及び粒子状態計算方法 |
JP2014170556A (ja) * | 2005-08-18 | 2014-09-18 | D.E. Shaw Research LLC | 粒子相互作用を計算するための並行計算アーキテクチャ |
JP2017091262A (ja) * | 2015-11-11 | 2017-05-25 | 富士通株式会社 | 粒子シミュレーションプログラム、粒子シミュレーション装置、及び計算機資源配分方法 |
-
1990
- 1990-01-06 JP JP2000809A patent/JPH03204758A/ja active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09212471A (ja) * | 1996-01-30 | 1997-08-15 | Nec Corp | 並列処理プログラム実行装置および実行方法 |
JPH1091609A (ja) * | 1996-09-10 | 1998-04-10 | Mitsubishi Electric Corp | 分散シミュレーションシステム |
US9612832B2 (en) | 2004-06-30 | 2017-04-04 | D.E. Shaw Research LLC | Parallel processing system for computing particle interactions |
JP2013168160A (ja) * | 2005-04-19 | 2013-08-29 | D.E. Shaw Research LLC | 多数の物体の相互作用を計算する計算ユニットを決定するための方法 |
US8126956B2 (en) | 2005-04-19 | 2012-02-28 | D.E. Shaw Research LLC | Determining computational units for computing multiple body interactions |
JP2012119008A (ja) * | 2005-04-19 | 2012-06-21 | D.E. Shaw Research LLC | 粒子相互作用を計算するための並行計算アーキテクチャ |
JP2008538441A (ja) * | 2005-04-19 | 2008-10-23 | ディ.イー.ショー リサーチ,エルエルシー | 距離制限のある対毎の粒子相互作用を評価するための拡張性の高い方法 |
US9747099B2 (en) | 2005-04-19 | 2017-08-29 | D.E. Shaw Research LLC | Parallel computer architecture for computation of particle interactions |
US10824422B2 (en) | 2005-04-19 | 2020-11-03 | D.E. Shaw Research, Llc | Zonal methods for computation of particle interactions |
JP2009505299A (ja) * | 2005-08-18 | 2009-02-05 | ディ.イー.ショー リサーチ,エルエルシー | 粒子相互作用を計算するための並行計算アーキテクチャ |
JP2014170556A (ja) * | 2005-08-18 | 2014-09-18 | D.E. Shaw Research LLC | 粒子相互作用を計算するための並行計算アーキテクチャ |
JP2016219044A (ja) * | 2005-08-18 | 2016-12-22 | ディ.イー.ショー リサーチ, エルエルシーD.E.Shaw Research, Llc | 粒子相互作用を計算するための並行計算アーキテクチャ |
JP2016224989A (ja) * | 2005-08-18 | 2016-12-28 | ディ.イー.ショー リサーチ, エルエルシーD.E.Shaw Research, Llc | 粒子相互作用を計算するための並行計算アーキテクチャ |
JP2009524161A (ja) * | 2006-01-23 | 2009-06-25 | アイティーティー マニュファクチャリング エンタープライジーズ, インコーポレイテッド | 物体相互作用シミュレーションのための区分メッシュ化および近傍検索 |
JP2012128793A (ja) * | 2010-12-17 | 2012-07-05 | Japan Agengy For Marine-Earth Science & Technology | 粒子状態計算装置及び粒子状態計算方法 |
JP2017091262A (ja) * | 2015-11-11 | 2017-05-25 | 富士通株式会社 | 粒子シミュレーションプログラム、粒子シミュレーション装置、及び計算機資源配分方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11960566B1 (en) | Reducing computations for data including padding | |
US11625245B2 (en) | Compute-in-memory systems and methods | |
EP3786786A1 (en) | Processing device, processing method, chip, and electronic apparatus | |
US20230023303A1 (en) | Machine learning network implemented by statically scheduled instructions | |
EP0186150A2 (en) | Parallel processing computer | |
US10109029B2 (en) | Processing of primitive blocks in parallel tiling engine pipes | |
US7236998B2 (en) | System and method for solving a large system of dense linear equations | |
CN112005251B (zh) | 运算处理装置 | |
JPH03204758A (ja) | 粒子運動シミュレーション処理方式 | |
US4543642A (en) | Data Exchange Subsystem for use in a modular array processor | |
US7581080B2 (en) | Method for manipulating data in a group of processing elements according to locally maintained counts | |
GB2580179A (en) | Tile-based scheduling | |
KR20200142200A (ko) | 신경망 연산 효율 증대를 위한 신경망 가속기 및 그의 동작 방법 | |
CN113344765B (zh) | 一种频域天文图像目标检测方法及系统 | |
US7263543B2 (en) | Method for manipulating data in a group of processing elements to transpose the data using a memory stack | |
JP7342247B2 (ja) | オンチップ動作の明示的なスケジューリング | |
US8135940B2 (en) | Method of rotating data in a plurality of processing elements | |
Ishii et al. | Cellular array processor CAP and applications | |
Siegel et al. | Parallel memory system for a partitionable SIMD/MIMD machine | |
Wen et al. | Design Exploration of An Energy-Efficient Acceleration System for CNNs on Low-Cost Resource-Constraint SoC-FPGAs | |
Weems Jr | Real-time considerations in the design of the image understanding architecture | |
CN116363480A (zh) | 一种用于图像像素处理网络的计算装置和方法 | |
GB2625583A (en) | Performing an operation on an array of values at a processing unit | |
CN112099850A (zh) | 一种多核Hourglass网络加速方法 | |
GB2393283A (en) | Load balancing for an n-dimensional array of processing elements wherein at least one line is balanced in one dimension |